Litecoin

2026 คู่มือการเรียนรู้ AI: การเรียนรู้ การใช้ ไม่สัมผัส

2026/05/03 00:54
🌐th

มันดีกว่าที่จะตัดสินว่าการเปลี่ยนแปลง คุ้มค่ากับการติดตาม มากกว่าความวิตกกังวลตาบอด

2026 คู่มือการเรียนรู้ AI: การเรียนรู้ การใช้ ไม่สัมผัส
หัว เรื่อง เดิม: ควร เรียน รู้ อะไร สร้าง และ กระโดด ใน เอ ไอ เอ พี เอส (2026)
2554. โพสต์นี้เป็นส่วนหนึ่งของการรายงานข่าวพิเศษของซีเรีย โปรสเตชัน 2011
รูปของเพ็กกี้ บล็อค บีทส์

สํานักพิมพ์บรรณาธิการ: สนามเอไอเอ กําลังเข้าสู่ระยะระเบิดของเครื่องมือ และขาดความ เห็นชอบ。

ทุกสัปดาห์, กรอบใหม่, รุ่นใหม่, ม้านั่งใหม่ และผลิตภัณฑ์ใหม่ "10 เท่าที่มีประสิทธิภาพ" ปรากฏ แต่คําถามที่สําคัญจริงๆ。

ในมุมมองของนักเขียน มันไม่ใช่โครงร่างล่าสุด แต่ต่ํากว่าความสามารถ นั่นคือ การยืดหยุ่นระยะยาวอย่างแท้จริง มันเรียกว่า "วิศวกรรมคอปเตอร์" การออกแบบเครื่องมือ ระบบประเมิน, โหมดวงออร์เคสตรา, กล่องทรายและความคิดตามธรรมชาติ ความสามารถเหล่านี้จะไม่ล้มเหลวอย่างรวดเร็วกับแบบจําลอง แต่จะสร้างพื้นฐานในการสร้าง AI ที่เชื่อถือได้。

บทความนี้กล่าวว่า เอไอ เอเจ้นท์ ได้เปลี่ยนแปลงความหมายของ "การรับรอง" ด้วย ใน อดีต ปริญญา เอก ทาง การ ศึกษา การ เรียน และ ปี ต่าง ๆ ก็ ผ่าน เข้า ไป แต่ ใน บริเวณ ที่ แม้ แต่ ยักษ์ ใหญ่ ก็ ถูก ทํา ให้ สับสน อย่าง เปิด เผย ก็ ไม่ ใช่ เอกสาร เดียว อีก ต่อ ไป. สิ่งที่คุณทํา สิ่งที่คุณส่งมอบ กลายเป็นสิ่งที่สําคัญกว่า。

ดังนั้น หนังสือพิมพ์นี้ไม่ใช่แค่การอภิปรายถึงสิ่งที่เอไอ เอเจ้นท์ได้เรียนรู้ในปี ค.ศ。

ต่อ ไป นี้ เป็น ข้อ ความ เดิม:

ทุก ๆ วัน โครงร่างใหม่ ม้านั่งใหม่ ผลิตภัณฑ์ใหม่ "กว่า 10 เท่า" ปรากฎออกมา คําถามคือ "ฉันจะตามให้ทันได้อย่างไร" แต่ : อะไรคือสัญญาณที่แท้จริงในนั้น และสิ่งที่เป็นเพียงเสียงรบกวน ในความรู้สึกของความเร่งด่วน。

แผนที่ ถนน แต่ ละ สาย หนึ่ง เดือน หลัง จาก การ พิมพ์ อาจ ล้า สมัย. กรอบที่คุณได้เมื่อไตรมาสที่ผ่านมาตอนนี้เก่า ตรา ประทับ ที่ คุณ เคย ใช้ เพื่อ ทํา ให้ เหมาะ สม นั้น ถูก ทาสี และ แทน ที่ อย่าง รวด เร็ว. ใน อดีต เรา ได้ รับ การ ฝึก อบรม ให้ ติด ตาม แนว ทาง ตาม ประเพณี: คลัง เทคโนโลยี ซึ่ง ตรง กับ กลุ่ม ของ แนว คิด และ ข้อ ความ ต่าง ๆ; ประสบการณ์ การ ทํา งาน เป็น ชุด ๆ, ปี และ ตําแหน่ง ที่ ตรง กัน; และ ก้าว ขึ้น ช้า. แต่เอไอเขียนผ้าใบใหม่ ทุก วัน นี้ ตราบ ใด ที่ คํา แนะ นํา นี้ ถูก ต้อง และ น่า ดึงดูด ใจ คน เรา สามารถ ส่ง งาน ที่ วิศวกร ซึ่ง มี ประสบการณ์ สอง ปี ต้อง ทํา。

ความสามารถของมืออาชีพยังคงสําคัญ ไม่มีตัวแทนให้คุณได้เห็นระบบลดลง 2 นาฬิกาในตอนเช้าด้วยหน่วยความจํารั่ว และไม่มีการทดแทนความจริงที่ว่าคุณสามารถได้รับออกจากสาธารณชน การ ตัดสิน ดัง กล่าว จะ มี คุณค่า เพิ่ม ขึ้น. แต่สิ่งที่ไม่ได้เพิ่มขึ้นเช่นในอดีตเป็นความคุ้นเคยของคุณกับ พื้นผิวร้อนเอพีไอของสัปดาห์นี้ หกเดือนต่อมา มันอาจจะเปลี่ยนไปอีกครั้ง สอง ปี ต่อ มา ผู้ ชนะ จริง ๆ ได้ แก่ คน เหล่า นั้น ที่ ได้ เลือก พื้น ฐาน ของ ความ ยืดหยุ่น และ ปล่อย ให้ เสียง อื่น ๆ ผ่าน ไป。

ผมสร้างผลิตภัณฑ์ในบริเวณนี้มาสองปีแล้ว ได้เงินมากกว่า $250,000 ต่อปี และตอนนี้ผมอยู่ในความดูแลของเทคโนโลยีในบริษัทที่ซ่อนอยู่ ถ้ามีใครถามผมว่า "ผมควรจะแคร์อะไร?" ผมจะส่งเขาไปเอง。

นี่ไม่ใช่แผนที่ เจ้าหน้าที่ฟิลด์ยังไม่ได้กําหนดจุดหมาย ห้อง ปฏิบัติ การ โรง งาน ขนาด ใหญ่ ยัง เปิด อยู่ ด้วย ผลัก ดัน ประเด็น การ กลับ มา สู่ ผู้ ใช้ หลาย ล้าน คน โดย การ เขียน ซ้ํา และ ติด ต่อ ทาง อินเทอร์เน็ต. ถ้าทีมที่อยู่เบื้องหลังรหัส Claude สามารถตีพิมพ์เวอร์ชันที่ก่อให้เกิด 47% ของการแสดงที่จะล่าถอย และจนกว่ากลุ่มผู้ใช้จะค้นพบปัญหา ทุกคนยังคงค้นหาอยู่ โอกาสที่จะเริ่มต้นมันพอดี เพราะยักษ์ไม่รู้คําตอบ คนที่เขียนรหัสไม่ได้ ทํางานกับแอนเจ้นท์ ส่งบางอย่างในวันศุกร์。

สิ่งที่น่าสนใจที่สุดของช่วงเวลานี้ คือมันเปลี่ยนความเข้าใจของเรา เรื่องคุณสมบัติ เส้น ทาง ดั้งเดิม ได้ รับ การ ปรับ ปรุง ให้ ดี ที่ สุด โดย คุณสมบัติ ดัง นี้: องศา, ตําแหน่ง รอง, ตําแหน่ง สูง, เสา สูง, และ เสา ที่ ค่อย ๆ สะสม ไว้. นี่ถูกต้องเมื่อไม่มีการเปลี่ยนแปลงแบบสุดขั้ว ในพื้นที่ข้างล่าง แต่ตอนนี้ พื้นข้างล่างกําลังเคลื่อนที่ด้วยอัตราเดียวกัน จากเท้าของทุกคน ช่องว่างระหว่างคนอายุ 22 ปี ที่ได้รับการปล่อยตัวสู่สาธารณชน ตัวแทนเดโมและวิศวกรอาวุโสอายุ 35 ปี วิศวกรวัย 22 ปีและอาวุโสคนนี้ กําลังเผชิญหน้ากับผ้าใบว่างเปล่าผืนเดียวกัน สําหรับ พวก เขา การ ฟื้น ตัว อย่าง แท้ จริง ของ การ เจริญ เติบโต คือ ความ เต็ม ใจ ที่ จะ ให้ โดย อาศัย พื้น ฐาน ที่ ยั่งยืน และ ความ สามารถ พื้น ฐาน ที่ เศษส่วน นั้น จะ ไม่ ล้า สมัย ภาย ใน หนึ่ง ใน สี่。

นี่คือแก่นของบทความ ต่อไป ผมจะเสนอวิธีตัดสินว่า ความสามารถพื้นฐานไหน ที่ควรค่าแก่การให้ความสนใจของคุณ เอาอะไรก็ตามที่เหมาะกับคุณ วางมันลง。

ตัวกรองที่มีประสิทธิภาพมาก

คุณตามประกาศใหม่ทุกสัปดาห์ไม่ได้ และคุณไม่ควรทํา สิ่งที่คุณต้องการไม่ใช่ข้อมูลที่ไหลมา แต่เป็นตัวกรอง。

การ ทดสอบ ห้า ครั้ง มี ผล ใน ช่วง 18 เดือน ที่ ผ่าน ไป. เรามาดูคําถาม 5 คําถามนี้กัน ก่อนที่เราจะได้อะไรใหม่ๆ ในเทคโนโลยีของคุณ。

มันสําคัญในสองปีเหรอ
ถ้ามันเป็นแค่เปลือก, พารามิเตอร์ CLI หรือ "บางรุ่นของ Devin" นอกโมเดลแถวหน้า คําตอบเกือบคือไม่ ถ้า เป็น ภาษา พื้น ฐาน เช่น โปรโตคอล, รูป แบบ ความ จํา, วิธี ใช้ กล่อง ทราย คํา ตอบ ก็ มัก จะ เป็น ใช่. ครึ่งชีวิตของผลิตภัณฑ์เปลือกหอยนั้นสั้น และครึ่งชีวิตของภาษาพื้นฐาน สามารถคํานวณได้ประจําปี。

มี คน ที่ คุณ นับถือ ซึ่ง ได้ ผลิต สินค้า จริง ๆ โดย อาศัย และ เขียน ประสบการณ์ อย่าง ซื่อ สัตย์ ไหม
บทความการตลาดไม่นับ บล็อกที่มีชื่อว่า "เราลอง X ในระบบการผลิต และมีปัญหาที่นี่" มีค่ามากกว่า 10 คําประกาศ สัญญาณ ที่ เป็น ประโยชน์ อย่าง แท้ จริง ใน บริเวณ นี้ จะ มา จาก คน ที่ สูญ เสีย วัน สุด สัปดาห์ ไป จน ถึง ที่ สุด。

นั่นหมายความว่าคุณกําลังจะสูญเสีย การต่อรอง, การทดสอบ, การปรับแต่ง, การจัดตั้ง
ถ้า เช่น นั้น ก็ เป็น โครง สร้าง ของ การ พยายาม สร้าง เวที ขึ้น เอง. พยายามเป็นโครงร่าง อัตราการตายประมาณ 90% มันเป็นภาษาพื้นฐานที่ดี ที่ควรจะฝังอยู่ในระบบปัจจุบันของคุณ ไม่ใช่บังคับให้คุณอพยพ。

ถ้าคุณข้ามมันไปหกเดือน ราคาเท่าไหร่
สําหรับ สิ่ง พิมพ์ ส่วน ใหญ่ คํา ตอบ ไม่ ใช่ อะไร. คุณจะรู้มากขึ้นในหกเดือน และรุ่นที่ชนะจะมีความชัดเจน การทดสอบนี้ช่วยให้คุณข้าม 90% ของการปล่อยโดยไม่กังวล แต่เป็นคนที่คนส่วนใหญ่ปฏิเสธที่จะใช้ เพราะการข้ามบางอย่างไปทําให้คุณรู้สึกเหมือนอยู่ข้างหลัง ก็ไม่เชิง。

คุณตัดสินได้ไหม ว่ามันทําให้ อัจฉริยะของคุณดีขึ้นหรือเปล่า
ถ้าไม่ งั้นคุณก็แค่เดา โดย ไม่ มี การ ประเมิน ค่า พวก เขา จึง วิ่ง ด้วย ความ รู้สึก และ ใน ที่ สุด ก็ กลับ ไป ใช้ อีก. กับทีมประเมิน คุณสามารถบอกตัวเอง ในรายการที่ระบุไว้ในสัปดาห์นี้ GP-5.5 ดีกว่าหรือ Opus 4.7 ดีกว่า。

ถ้าคุณใช้นิสัยเดียวจากบทความนี้ คือทุกครั้งที่คุณตีพิมพ์สิ่งใหม่ ให้เขียนสิ่งที่คุณอยากเห็นภายในหกเดือน จากนั้นกลับมาในหกเดือนเพื่อตรวจสอบ ส่วน ใหญ่ แล้ว คํา ถาม นั้น เอง ให้ คํา ตอบ และ ความ สนใจ ของ คุณ จะ ถูก ทุ่มเท ให้ กับ สิ่ง ที่ ทํา ให้ เติบโต อย่าง แท้ จริง。

ความสามารถที่แท้จริงที่อยู่เบื้องหลังการทดสอบเหล่านี้ ยากที่จะมีชื่อกว่าใด ๆ ของพวกเขา มันเป็นความสามารถในการขยาย สัปดาห์นี้ในกรอบของเหตุไฟไหม้ของ แฮกเกอร์นิวส์ พวกเขาจะมีเชียร์ลีดเดอร์ใน 14 วัน และพวกเขาทั้งหมดจะฟังดูฉลาด อย่าง ไร ก็ ตาม หก เดือน ต่อ มา ครึ่ง หนึ่ง ของ โครง สร้าง เหล่า นั้น ก็ ไม่ ได้ รับ การ บํารุง รักษา อีก ต่อ ไป และ พวก นัก เรียน นัก เรียน ก็ ได้ ย้าย ไป ยัง จุด ร้อน ถัด ไป. คนที่ไม่ได้เกี่ยวข้อง นอกจากความสนใจของพวกเขา และปล่อยให้มันอยู่กับผู้ที่ได้อยู่รอดจากการทดสอบ "ความสงบ" หลังจากความร้อนได้ผ่านไป มันเป็นทักษะอาชีพที่แท้จริงในสาขานี้ ที่ยับยั้ง ดูและพูดว่า "ฉันจะรู้ในเวลาหกเดือน." แต่ แทบ ไม่ มี ใคร ดี พอ ที่ จะ ไม่ ตอบ สนอง。

เรียนอะไร

ตาข่าย รูปแบบ รูปร่างของสิ่งต่างๆ มันเป็นสิ่งที่จ่ายได้จริงๆ พวกเขาสามารถข้ามโมเดล โครงร่าง และการเปลี่ยนแปลง ทําความรู้จักพวกเขาให้ดี คุณจะได้เครื่องมือใหม่ๆ ในสุดสัปดาห์ ถ้าคุณข้ามมัน คุณมักจะเรียนรู้ เกี่ยวกับกลไกพื้นผิว。

วิศวกรรมคอนเท็กซ์

2 ปีหลัง การเปลี่ยนชื่อชื่อที่สําคัญที่สุดคือ "วิศวกรรมโปรเตสแตนต์" เป็น "วิศวกรรมคอมพิวเตอร์" การเปลี่ยนแปลงนี้เป็นจริง ไม่ใช่แค่ใหม่。

โมเดลนี้ไม่ใช่คนที่คุณเขียนคําสั่งให้แล้ว มันกลายเป็นสิ่งที่คุณต้องรวบรวม ทุกๆขั้นตอนในการทํางาน บริบท นี้ บรรจุ ทั้ง คํา สั่ง, เครื่อง มือ, เอกสาร ที่ ได้ มา, เอกสาร ที่ ได้ รับ มา, เครื่อง มือ ที่ ออก ก่อน หน้า นี้, รัฐ เกา, และ บันทึก ทาง ประวัติศาสตร์ ที่ อัด แน่น. พฤติกรรมของเจ้าหน้าที่ คือผลขององค์ประกอบทั้งหมด ที่คุณวางไว้ในหน้าต่าง。

คุณต้องสร้างภายในนี้ บริบทคือรัฐ ทุก สัญลักษณ์ ที่ ไม่ เกี่ยว ข้อง จะ ใช้ ประโยชน์ จาก การ หา เหตุ ผล. บริบทเสื่อมสลาย การผลิตที่แท้จริงล้มเหลว เมื่อถึงขั้นตอนที่ 8 ของภารกิจ 10 ขั้น เป้าหมายแรกอาจถูกฝังโดยผลลัพธ์ ทีมที่ส่งมอบตัวแทนที่น่าเชื่อถือ จะริเริ่มสรุป บีบรัดและตัดบริบท พวกเขาจะรันรายละเอียดเครื่องมือ พวกเขาจะชะลอส่วนที่คงที่ และจะปฏิเสธส่วนการเปลี่ยนแปลงของแคช วิธีที่พวกเขามองที่บริบท หน้าต่างเป็นเหมือนวิศวกรประสบการณ์ มองที่หน่วยความจํา。

วิธี หนึ่ง ที่ เจาะจง ใน ความ รู้สึก ก็ คือ การ รับ ตัว แทน ใน สภาพ แวด ล้อม ที่ มี การ ผลิต และ เปิด บันทึก เสียง ทั้ง ตัว. ดู บริบท ของ ขั้น ตอน แรก และ ดู บริบท ของ ขั้น ตอน ที่ เจ็ด. นับจํานวนเครื่องหมายที่ยังคงใช้งานได้ คุณอาจจะอายตอนที่คุณทําแบบนี้ครั้งแรก แล้วคุณก็จะแก้ไขมัน และตัวแทนคนเดียวกันนี้ จะยิ่งน่าเชื่อถือมากขึ้น โดยไม่ต้องเปลี่ยนโมเดล。

ถ้าคุณอ่านเพียงบทความเดียวเกี่ยวกับเรื่องนี้ คุณอ่าน "วิศวกรรมการติดต่อสื่อสารของ AII" และแล้วพวกเขาก็อ่านสํานวนเกี่ยวกับระบบวิจัยที่หลากหลาย และบทความนี้ให้ตัวเลขเกี่ยวกับความสําคัญ。

ออกแบบเครื่องมือ

เครื่องมือนี้ทําหน้าที่แทนธุรกิจของคุณ รุ่นเลือกเครื่องมือตามชื่อและคําอธิบายของเครื่องมือ และกําหนดว่าจะลองอีกครั้งอย่างไร จากข้อมูลผิด สัญญาของเครื่องดนตรีสอดคล้องกับวิธีการของ LLM ที่จะแสดงมันออกมา และกําหนดให้รุ่นดังกล่าวประสบความสําเร็จหรือล้มเหลว。

ห้าถึงสิบเครื่องมือที่มีชื่อดีกว่า 20 เครื่องมือธรรมดา ชื่อเครื่องมือควรเหมือนคํากริยาในภาษาอังกฤษธรรมชาติ คํา พรรณนา ควร สะกด ออก ว่า ควร ใช้ เมื่อ ไร และ เมื่อ ไร ไม่ ควร ใช้ คํา นี้. ข้อความผิดที่ควรจะเป็น การตอบรับที่โมเดลสามารถดําเนินการได้ กว่า 500 ป้าย เพดาน กรุณาสรุปก่อนที่จะลอง หนึ่งในทีมในการวิจัยแบบเปิดได้รายงานว่า พวกเขาได้ลดวงจรการทดสอบใหม่ลง 40 เปอร์เซ็นต์ โดยเพียงแค่เขียนข้อมูลผิด。

Anthoric'thitting สิ่งสําหรับเป้าหมาย' เป็นจุดเริ่มต้นที่ดี หลัง จาก อ่าน แล้ว จง เพิ่ม เครื่อง มือ และ ข้อ สังเกต ของ คุณ เอง เพื่อ จะ เห็น การ เยี่ยม ที่ แท้ จริง. เจ้าหน้าที่ที่น่าเชื่อถือที่สุด ส่วนใหญ่จะอยู่ข้างเครื่องมือ หลาย คน ยัง คง ผัด วัน ประกัน พรุ่ง โดย เพิก เฉย ต่อ ข้อ เสนอ แนะ ที่ แท้ จริง。

โหมดออร์เคสตรา

2024 และ 2025 การโต้วาทีเกี่ยวกับหน่วยงานหลาย ๆ ถึงจุดสุดยอดในโปรแกรมประยุกต์ ซึ่งปัจจุบันถูกรับไปใช้โดยทุกคน พ.ศ. ระบบร่วมทุน nut-over-intive ระบบ, เช่น ตัวแทนหลายคนที่เขียนในรัฐร่วมกันในคู่ขนาน, จะล้มเหลวอย่างร้ายแรง, เพราะความผิดพลาดจะเพิ่มขึ้นเสมอ ขอบ เขต ที่ วัฏจักร ของ มด ตัว เดียว สามารถ ขยาย ออก ไป ได้ นั้น บ่อย ครั้ง ไกล กว่า ที่ คุณ คิด. มีตัวแทนหลายประเภทเท่านั้น ที่สามารถทํางานในสภาพแวดล้อมการผลิตได้ จริง ๆ แล้วคือ ตัวเอกของวงออร์เคสตรา。

ระบบวิจัยแอนโทรปีทํางานเช่นนี้ ตัวแทนรหัสของ Claude ทํางานเช่นนี้ ฤดูใบไม้ผลิ AI และระบบการผลิตส่วนใหญ่ กําลังมาตรฐานของโมเดลนี้ ตัวแทนย่อยมีบริบทขนาดเล็กและโฟกัส และไม่สามารถแก้ไขสถานะการแบ่งปัน การ เขียน เป็น ความ รับ ผิด ชอบ ของ นัก ร้อง ออร์ เคส ตรา。

"อย่าสร้างบริษัทหลายบริษัท" โดยโคนิเมชั่นและ "วิธีที่เราสร้างระบบวิจัยของสายลับ" โดยแอนโทรปิกดูเหมือนเป็นมุมมองที่ตรงกันข้าม ทั้งคู่ควรค่าแก่การอ่าน。

ค่าปริยายที่จะใช้anent ตัวเดียว เฉพาะเมื่อตัวแทนเดี่ยวตีพรมแดนจริง จะพิจารณาให้กับตัวแทนวงออร์เคสตรา: ตัวอย่างเช่น, ความกดหน้าต่างบริบท, ความล่าช้าเนื่องจาก มันเป็นชุดของสิ่งที่คุณไม่ต้องการ จนกว่าคุณจะรู้สึกถึงความเจ็บปวด。

การ อพยพ และ ข้อมูล ทอง

ทุกทีมที่ส่งแอนเจ้นท์ที่เชื่อถือได้ มีการประเมินผล ถ้าไม่มีทีมประเมิน ก็มักจะไม่มีการส่งที่เชื่อถือได้ มันเป็นนิสัยที่มีอิทธิพลมากที่สุดในสาขานี้ และน้อยที่สุดที่ผมเคยเห็นมาในทุกบริษัท。

วิธี การ ที่ ได้ ผล ก็ คือ เก็บ รวบ รวม ร่อง รอย ของ สิ่ง แวด ล้อม เพื่อ ระบุ ว่า เป็น กรณี ของ ความ ล้ม เหลว และ เพื่อ ทํา ให้ พวก เขา ถอย หลัง. ทุกครั้งที่เกิดความล้มเหลวขึ้น ส่วนวิชาบุคคลจะใช้ LLM-as-พิจารณา และส่วนอื่น ๆ ใช้การตรวจสอบที่แม่นยํา เรียกใช้แพกเกจทดสอบก่อนที่จะมีการเรียกทํางานใด ๆ, รุ่น หรือเครื่องมือมีการเปลี่ยนแปลง บล็อกวิศวะ ระบุว่าชั้นผู้พิพากษาของพวกเขา จะหยุดการส่งตัวแทนประมาณ 25% ก่อนที่ผลลัพธ์จะออกอากาศออนไลน์ หาก ปราศจาก มัน ผล เสีย หนึ่ง ใน สี่ อย่าง จะ ไป ถึง ผู้ ใช้。

แบบจําลองทางความคิดที่หยั่งรากจริงๆ คือการประเมินผลเป็นการทดสอบหน่วย เพื่อทําให้แน่ใจว่า angent จะไม่หันเหไปจากหน้าที่ของเขา เมื่อทุกอย่างเปลี่ยนแปลง โมเดลนี้จะสร้างรุ่นใหม่ขึ้นมา โครงข่ายจะตีพิมพ์การเปลี่ยนแปลงที่ทําลาย และผู้ผลิตจะละทิ้งจุดสิ้นสุด การประเมินของคุณเป็นสิ่งเดียวที่สามารถบอกคุณได้ ว่าแอนเจ้นท์ยังทํางานอยู่ โดยไม่ต้องประเมิน คุณเขียนระบบ ที่มีความถูกต้องขึ้นอยู่กับความเป็นมิตร ของเป้าหมายย้าย。

Eval เฟรมส์ เช่น เบรน ทรัสต์ แลงฟลายส์ แลงสมิท ดีมาก แต่พวกเขาไม่ใช่คอขวด คอขวดที่แท้จริงก็คือ คุณมีข้อมูลที่ทําเครื่องหมายไว้ครั้งแรก วันแรกควรจะเริ่มต้น ก่อนที่จะมีการขยายตัว ตัวอย่าง 50 ตัวแรกนี้ สามารถถูกทําเครื่องหมายด้วยตนเองได้ในหนึ่งบ่าย ไม่มีข้อแก้ตัว。

ปฏิบัติกับระบบไฟล์เป็นรัฐ และวงจรความคิดปฏิบัติ

สําหรับบุคคลใด ๆ ที่ทํางานบนพื้นฐานที่แท้จริงหลายขั้นตอน โครงสร้างที่ทนทานคือ : การสะท้อน, การกระทํา, การสังเกต, การทําซ้ํา ระบบเอกสารหรือที่เก็บโครงสร้าง เป็นแหล่งความจริง ทุกการเคลื่อนไหวถูกบันทึกและเล่นอีกครั้ง รหัส Claude, เคอร์เซอร์, เดวิน, เอเวอร์, OpenHands, ห่านทั้งหมด รวมเข้าด้วยกันเป็นนี้。

ตัวจําลองเองไม่อยู่ในรัฐ กรอบทํางานต้องอยู่ในสถานะ ระบบไฟล์เป็นภาษาพื้นฐานของรัฐ ที่นักพัฒนาทุกคนเข้าใจ เมื่อโครงร่างนี้ได้รับการยอมรับ วินัยทั้งหมดจะถูกเผยออกมาตามธรรมชาติ。

และส่วนที่ลึกกว่าตรงนี้คือว่า ในการผลิตใด ๆ ที่คุ้มค่าในการจ่ายบิล มันทํางานได้มากกว่าแบบจําลอง รุ่นเลือกการย้ายถัดไป, การตรวจสอบ, การเรียกใช้มันในกล่องทราย, การจับผลลัพธ์, การตัดสินใจสิ่งที่มีผลตอบรับกลับมา, ตัดสินใจว่าเมื่อไหร่ควรหยุด, ตัดสินใจว่าเมื่อไหร่ควรตรวจสอบจุด, ตัดสินใจว่าเมื่อไหร่ควรสร้างตัวแทน การ เปลี่ยน แบบ จําลอง ให้ เป็น แบบ ที่ มี คุณภาพ เท่า กัน อีก แบบ หนึ่ง การ ควบคุม ที่ ดี ยัง คง ส่ง ผล ผลิต. และแม้กระทั่งโมเดลที่ดีที่สุดในโลก ก็สามารถสร้างตัวกลาง ที่ลืมสิ่งที่เขาทําอย่างสุ่ม。

ถ้าคุณสร้างสิ่งที่ซับซ้อนกว่าเครื่องมือครั้งเดียวที่จะโทร, แล้วสถานที่ที่คุณควรใช้เวลาจริง ๆ คือ harnes รุ่นเป็นเพียงองค์ประกอบเดียว。

เข้าใจอย่างถ่องแท้

อย่าเพียงแค่เรียนรู้วิธีการโทรบริการเอ็มซีพี เพื่อเรียนรู้แบบจําลองของมัน มันสร้างความแตกแยกอย่างชัดเจน ระหว่างความสามารถ เครื่องมือและทรัพยากรของแอนเจ้นท์ และจัดหาเครื่องยืนยันที่จับต้องได้ เมื่อคุณเข้าใจเรื่องนี้ "โครงการ International International" อีกแบบหนึ่งที่คุณเห็นนั้น เหมือนกับแบบจําลองเอ็มซีพีแบบมีหน่วยเป็นพลังงานต่ํา。

ตอนนี้มูลนิธิลินุกซ์เป็นเจ้าภาพ MCP ผู้จัดจําหน่ายรายใหญ่ทุกคนสนับสนุนมัน บัด นี้ ความ จริง อยู่ ใกล้ กว่า การ พูด เหน็บ แนม。

Sandboxing เป็นคําพูดพื้นฐาน

ทุกระดับการผลิตกําลังวิ่งอยู่ในกล่องทราย annent ทุกตัวได้รับประสบการณ์ในการฉีดปัญหาทางอ้อม ทุกสารานุกรมมีอํานาจในบางขั้นตอน คุณควรใช้กล่องทรายเป็นภาษาดั้งเดิมของโครงสร้างพื้นฐาน แทนที่จะใช้เป็นฟังก์ชันเพื่อเพิ่มตามที่ลูกค้าร้องขอ。

จําเป็น ต้อง เรียน รู้ ความ รู้ พื้น ฐาน: การ แยก ตัว ของ โพรเซส, การ ควบคุม การ ส่ง ออก ของ เครือ ข่าย, การ จัด การ ระยะ ทาง สําคัญ, และ ขอบ เขต การ พิสูจน์ ความ ถูก ต้อง ระหว่าง อะ เจนต์ กับ เครื่องมือ. ทีมที่รอ การอนุมัติความปลอดภัยให้ลูกค้า ถูกแทนที่ด้วยโฆษณา ที่มักสูญเสียการค้าขาย ทีมที่ทํางานอยู่ตั้งแต่สัปดาห์แรก จะผ่านได้อย่างง่ายดาย ในกระบวนการจัดหากิจการ。

จะสร้างด้วยอะไร

ต่อ ไป นี้ เป็น ทาง เลือก ที่ เฉพาะ อย่าง ยิ่ง เมื่อ เดือน เมษายน 2026. ตัวเลือกเหล่านี้เปลี่ยน แต่ไม่เร็วเกินไป บนชั้นนี้ พยายามเลือกอะไรที่น่าเบื่อแต่มั่นคง。

ชั้น

ลังGraph เป็นตัวเลือกปริยายในสภาพแวดล้อมการผลิต ประมาณ หนึ่ง ใน สาม ของ บริษัท ใหญ่ ๆ ที่ ทํา งาน เป็น มด กําลัง ใช้ งาน. วิธีการที่เป็นนามธรรมของมัน ตรงกับรูปร่างจริง ของระบบอนิเมต์: สถานะของชนิด, ด้านเงื่อนไข, การทํางานถาวร, และจุดที่มนุษย์ในการตรวจสอบ ข้อเสียคือการเขียนมันขึ้นมา ข้อได้เปรียบก็คือ เมื่อบุคคลหนึ่งเข้าไปในสภาพแวดล้อมการผลิตจริงๆ。

ถ้าคุณใช้ประเภท Script มาสตราเป็นตัวเลือกที่แท้จริง มันเป็นสถานการณ์ที่ชัดเจนที่สุด สําหรับแบบจําลองทางประสาททางนิเวศวิทยานี้。

ถ้าทีมของคุณชอบไพแดนติก และต้องการความปลอดภัย ในฐานะพลเมืองชั้นหนึ่ง พีแดนติก เอไอ เป็นตัวเลือกสีเขียวที่สมเหตุสมผล 2525 v1.0 และโมเมนตัมนั้นมีจริง。

สําหรับการทํางานกับผู้ให้บริการ, เช่น ใช้คอมพิวเตอร์, เสียง, ปฏิสัมพันธ์แบบเรียลไทม์, Claude Agency SDK หรือ Open Agencys SDK สามารถนําไปใช้ในโหนด LangGraph ได้ อย่าพยายามที่จะทําให้มัน ชั้นบนสุดของระบบไอโซเมอร์ พวกเขาสมบูรณ์แบบสําหรับสิ่งที่พวกเขาทํา。

เลเยอร์

MCP ไม่มีอะไรอย่างอื่น。

วางเครื่องมือของคุณเข้าด้วยกัน ในเซิร์ฟเวอร์ MCP การประกอบภายนอกก็ถูกบริโภคในแบบเดียวกัน ตอนนี้ MCP ได้ผ่านขีดเส้นผ่าศูนย์กลางแล้ว: ในกรณีส่วนใหญ่ ก่อนที่คุณจะต้องสร้างตัวเอง คุณสามารถหาเซิร์ฟเวอร์ที่ติดตั้งไว้แล้วได้ 2026 เครื่องมือที่เขียนด้วยลายมือที่เขียนเองนั้นได้ถูกเพิ่มเติมขึ้น ส่วนใหญ่เพื่อฟรี。

เลเยอร์ของหน่วยความจํา

เมื่อเลือกระบบหน่วยความจํา เลือกที่จะไม่โดยความร้อน แต่โดยการอัตโนมัติของแต่ละคน。

MEM0 เหมาะกับการทําให้การสนทนาเป็นส่วนบุคคล: การปรับแต่งผู้ใช้, ประวัติแสง Zepp ตรงกับระบบกล่องโต้ตอบการผลิต โดยเฉพาะในสถานการณ์ ที่รัฐจะพัฒนาและต้องการการติดตามทางกายภาพ เลต ตา เหมาะ กับ คน ที่ ต้องการ ความ เสมอ ต้น เสมอ ปลาย ใน ไม่ กี่ วัน หรือ แม้ แต่ วงจร การ ทํา งาน. ทีมส่วนใหญ่ไม่ต้องการสิ่งนี้ แต่คนที่ต้องการมันจริงๆ พวกเขาต้องการมัน。

ความผิดพลาดทั่วไปก็คือ ไม่มีปัญหาในหน่วยความจํา แต่โครงสร้างความทรงจําก่อน เริ่มด้วยสิ่งที่หน้าต่างสามารถรองรับได้ รวมทั้งฐานข้อมูลของเวกเตอร์ด้วย คุณสามารถเพิ่มหน่วยความจําเข้าไปในระบบหน่วยความจําได้เท่านั้น ถ้าคุณระบุรูปแบบความล้มเหลวที่มันต้องการได้อย่างชัดเจน。

ไม่ เป็น ที่ ยอม รับ และ การ ประเมิน

ลังฟัวเป็นตัวเลือกปริยายของ opens มันสามารถเป็นเจ้าของตัวมันเอง โดยใช้ MIT Institute เพื่อครอบคลุมการติดตาม การจัดการรุ่นทันที และการประเมินพื้นฐาน LLM ถ้าคุณใช้ Lang Chain แล้ว การรวม LangSmith จะใกล้ชิด การเชื่อใจในสมองนั้น เหมาะสมสําหรับการประเมินปริมาณการทํางาน โดยเฉพาะงานที่ต้องใช้การเปรียบเทียบอย่างรัดกุม OpenLMetry / Traclip เหมาะสําหรับการเก็บแบบหลายภาษาที่ต้องการการรวมการจําหน่ายแบบ OpenTelemetric。

คุณจะต้องมีทั้งการติดตามและการประเมินผล เทรซี่ตอบว่า "แอนเจ้นท์ทําอะไร?" อีเวนส์บอกว่า "คุณดีกว่าเมื่อวานหรือแย่กว่า" ไม่ อย่าออนไลน์ ใน วัน แรก สิ่ง ของ เหล่า นี้ จะ ถูก ซ่อม ด้วย ราคา ที่ ต่ํา กว่า การ ซ่อม หลัง จาก ที่ ทํา ให้ ตา บอด。

เวลาวิ่งและกล่องทราย

E2B เหมาะกับการประมวลผลรหัสกล่องทรายทั่วไป Brownserbase with Stephand, เหมาะสมสําหรับเบราว์เซอร์อัตโนมัติ บริษัทแอนโทรปี ใช้ชุดสถานการณ์ที่ต้องการควบคุมพื้นที่ทํางานระดับระบบจริง โมดัลเหมาะกับงานช่วงสั้นๆ。

อย่าใช้รหัสโดยไม่มีกล่องทราย แอนติเจนที่ถูกทําลายด้วยการฉีดยาทันที และถ้ามันทํางานโดยตรงในสภาพแวดล้อมการผลิต รัศมีระเบิดจะกลายเป็นเรื่องราวที่คุณไม่อยากจะเล่า。

รุ่น

การไล่ตามม้านั่งนั้นเหนื่อยล้ามาก และส่วนใหญ่ก็ไม่ช่วยอะไรเลย 2559) เป็นวันที่ 20 เมษายน พ.ศ

คลอเดีย โอปุส 4.7 และ ซอนเน็ต 4.6 อุปกรณ์ที่เหมาะสมสําหรับการโทร ความสอดคล้องหลายขั้นตอน และการฟื้นตัวอย่างสง่างาม สําหรับงานส่วนใหญ่ สําหรับ งาน ส่วน ใหญ่ ซอน เนต เป็น จุด หวาน ๆ ระหว่าง ค่า ใช้ จ่าย กับ การ แสดง。

GPT-5.4 และ GPT-5.5 เหมาะสมกับความต้องการ ความสามารถในการหาเหตุผลแบบ CLI/terminal ที่แข็งแรงที่สุด。

Gemini 2.5 และ 3 เหมาะสมสําหรับบริบทหรืองานหลายรูปแบบ。

เมื่อค่าใช้จ่ายมีความสําคัญมากกว่า ประสิทธิภาพระดับบนสุด โดยเฉพาะเมื่อจัดการ กับงานที่ชัดเจนและจํากัด。

แบบจําลองถือเป็นส่วนประกอบทดแทน ถ้าตัวแทนของคุณสามารถทํางานเฉพาะกับนางแบบ มันไม่ใช่คูน้ํา มันเป็นกลิ่นที่ไม่ดี ใช้การประเมิน เพื่อตัดสินว่าโมเดลอะไรที่จะใช้ คัดเลือกใหม่ทุกไตรมาส ไม่ใช่ทุกสัปดาห์。

ฉันจะข้ามอะไรไปได้

คุณมักจะถูกชักจูงให้ศึกษาและใช้สิ่งเหล่านี้ ก็ไม่เชิง ค่าใช้จ่ายในการข้ามมันต่ําและประหยัดเวลามาก。

AutoGen และ AG2 ไม่สําหรับการผลิต。
โครงข่ายของไมโครซอฟต์ได้เปลี่ยนไปสู่การบํารุงรักษาชุมชน ด้วยอัตราการผลิตที่ต่อเนื่อง และวิธีการเชิงนามธรรม งานวิจัยทางวิชาการสามารถทําได้ แต่ไม่ใช่เกี่ยวกับเรื่องนี้。

เจ้าหน้าที่เอไอ ไม่ใช่งานก่อสร้างใหม่。
มันอยู่ทุกที่ เพราะมันเหมาะกับเดโม วิศวกรที่สร้างระบบการผลิตจริงๆ กําลังย้ายออกจากระบบ คุณต้องการสร้างต้นแบบ แต่อย่าผูกมันนาน。

Microsoft Semantic Cathery เว้นแต่คุณจะถูกขังไว้ลึกๆ ในเทคโนโลยีไมโครซอฟท์เอนเตอร์เทนเมนต์ และผู้ซื้อของคุณก็ใส่ใจ。
มันไม่ใช่ทิศทางที่ระบบนิเวศมุ่งหน้าไป。

DSPY เว้นแต่คุณเชี่ยวชาญ ในการปรับปรุงโปรแกรมพร้อมใช้งานขนาดใหญ่。
มันมีคุณค่าทางปรัชญา แต่ผู้ฟังค่อนข้างแคบ มันไม่ใช่กรอบพื้นฐาน และไม่ใช่กรอบพื้นฐาน。

ใช้การถอดรหัสแบบอิสระ。
Code-As-acter เป็นแนวทางการวิจัยที่น่าสนใจ แต่มันไม่ใช่ต้นแบบปริยายในสภาพแวดล้อมการผลิต คุณจะมีเครื่องมือและความปลอดภัยมากมาย ที่คู่แข่งของคุณอาจจะไม่ต้องรับมือ。

"ตัวแทนอัตโนมัติ"。
AutoGPT และ BabyAGI เสียชีวิตแล้วตามรูปแบบผลิตภัณฑ์ที่ สุดท้ายอุตสาหกรรมก็ยอมรับความซื่อสัตย์ของ "การหมั้นแบบสายลับ" การดูแล ขอบเขต การประเมิน 2026 ผู้คนที่ยังคงขาย อานนท์อัตโนมัติ หลังปฏิบัติการได้ขายในปี ค.ศ。

ร้านขายเอเจ้นท์แอพ และที่หมาย。
ตั้งแต่ปี 2023 ผู้คนได้อุทิศตนเพื่อสิ่งนี้ แต่ไม่เคยได้รับข้อเสนอทางธุรกิจ enterprises จะไม่ซื้อ annant ทั่ว ๆ ไป พวก เขา จะ ซื้อ ความ ผูก พัน ใน แนว ตั้ง กับ ผล ที่ เฉพาะ เจาะจง หรือ สร้าง ขึ้น เอง. อย่าออกแบบธุรกิจของคุณเกี่ยวกับความฝันของแอพ。

ในฐานะลูกค้า, การตัดสินใจที่ดีของแนวนอน "สร้างแพลตฟอร์มของมด"。
ตัวอย่างเช่น Google Agespace, AWS Bedrock Argantics, Microsoft Colid Studio. มันอาจมีประโยชน์ในอนาคต, แต่พวกเขายังอยู่ในช่วงแตกแยก และกระจายตัวช้า, และซื้อหนังสือของเวอร์ซุส ข้อยกเว้นคือ พนักงานขายและหน่วยบริการ ตอนนี้เป็น Asist เพราะพวกเขาชนะในระบบสายงานที่คุณใช้งานอยู่แล้ว。

อย่าตาม SWE-Binnch และ OSWorlds。
นัก วิจัย เบิร์ก ลีย์ บันทึก ไว้ ใน ปี 2025 ว่า เกือบ ทุก คน อาจ ได้ รับ การ จัด อันดับ โดย ไม่ ได้ ทํา งาน ให้ เสร็จ ภาย หลัง. ตอนนี้ทีมจะใช้เทอร์มิเตอร์-เบค 2.0 และการประเมินภายในของตัวเองเป็นสัญญาณจริงมากขึ้น โดยปริยายที่จะยังคงสงสัยของ จํานวนเดียวของม้านั่งกระโดด。

ความซื่อจะขนานกับสิ่งก่อสร้างหลายแบบ。
ห้าตัวแทนพูดคุยเกี่ยวกับการแบ่งปันหน่วยความจํา และในเดโมก็ดูดีและเมื่อมันเสร็จมันก็แบ่งขึ้น ถ้าคุณวาดแผนที่ ของเจ้าหน้าที่วงออเครสต้า บนผ้าเช็ดปาก และทําเครื่องหมายขอบเขตการอ่านและเขียน。

สินค้าใหม่ ไม่มีราคาใช้เอสเอเอส。
ตลาดได้หันไปใช้ผลลัพธ์และการใช้งาน ค่า ที่ นั่ง ไม่ เพียง ทํา ให้ คุณ มี เงิน น้อย ลง เท่า นั้น แต่ ยัง จะ ส่ง สัญญาณ ให้ ผู้ ซื้อ ด้วย ว่า คุณ ไม่ เชื่อ ว่า สินค้า นั้น จะ ส่ง ให้ คุณ。

กรอบต่อไปที่คุณเห็นใน แฮกเกอร์นิวส์อาทิตย์นี้。
รอ 6 เดือน ถ้ายังสําคัญอยู่ คุณก็รู้ ถ้ามันไม่สําคัญ คุณรักษาหนึ่งย้าย。

เราจะเดินหน้าต่อยังไง

หากคุณไม่ได้แค่พยายามตาม angent, แต่คุณต้องการใช้ angent, ลําดับต่อไปนี้จะถูกต้อง มันน่าเบื่อ แต่มีประโยชน์。

ประการ แรก ผล ที่ เป็น เรื่อง สําคัญ อยู่ แล้ว. อย่าเลือกมูนช็อต อย่าขึ้นมาทําโครงการ "เจ้าหน้าที่แพลตฟอร์ม" แบบแนวนอน เลือกสิ่งที่ธุรกิจของคุณสนใจ และวัดได้: ลดจํานวนการบริการผู้โดยสาร ความสําเร็จของเจ้าหน้าที่ขึ้นอยู่กับการปรับปรุงในผลลัพธ์นี้ มันเป็นเป้าหมายในการประเมินของคุณ ตั้งแต่วันที่หนึ่ง。

ขั้น ตอน นี้ สําคัญ ยิ่ง กว่า ขั้น ตอน อื่น ใด เพราะ เป็น การ เชื่อม โยง การ ตัดสิน ใจ ทุก อย่าง ที่ จะ เกิด ขึ้น ภาย หลัง. ด้วยผลลัพธ์ที่เป็นรูปธรรม ตัวเลือกของกรอบ ไม่ใช่ประเด็นทางปรัชญาอีกต่อไป และคุณจะเลือกกรอบความคิด ตัวเลือกของโมเดล ไม่ใช่การโต้แย้งแบบมาตรฐานอีกต่อไป แต่เป็นตัวเลือกในการประเมินของคุณ "เราไม่ต้องการความทรงจํา, ตัวแทน, ประวัติที่กําหนดเอง" ไม่ใช่การทดลองในความคิดอีกต่อไป แต่จะถูกเพิ่มเข้าไป เมื่อจําเป็นเฉพาะรูปแบบความล้มเหลว。

ทีมที่ข้ามขั้นตอนนี้ มักจบลงด้วยการสร้างแพลตฟอร์มแบบแนวนอนที่ไม่มีใครต้องการ โดย ปกติ แล้ว ทีม ที่ ทํา ขั้น ตอน นี้ จะ ทํา งาน อย่าง เอา จริง เอา จัง ซึ่ง สามารถ กลับ มา ได้ ภาย ใน หนึ่ง ใน สี่. และตัวแทนออนไลน์นี้จริงๆ จะสอนพวกเขามากกว่าสองปีที่จะอ่าน。

ก่อนที่คุณจะไปบนบรรทัดกับสิ่งใด ตั้งขั้นตอนและการประเมิน เลือก Langfuse หรือ LangSmit, รับมัน. สร้างชุดข้อมูลทองเล็กๆ ถ้าจําเป็น มีตัวอย่างที่ติดป้ายไว้ 50 ตัว คุณไม่สามารถแก้ไขสิ่งที่คุณไม่สามารถวัด มันจะประมาณ 10 เท่าของค่าใช้จ่ายในระบบ。

เริ่มด้วยวงจรแอนท์ เลือก lanGraph หรือ Pydantic AI Kaude Sonet 4.6 หรือ GPT-5 ให้แอนเจ้นท์สามถึงเจ็ดเครื่องมือออกแบบอย่างดี ให้มันเป็นระบบไฟล์หรือฐานข้อมูลเป็นรัฐ ส่งมันไปที่ผู้ใช้ขนาดเล็ก ดูแทร็ค。

คิดซะว่าแอนท์เป็นสินค้า ไม่ใช่โครงการ มันจะล้มเหลว ในแบบที่คุณไม่ได้คาดหวัง และความล้มเหลวเหล่านั้นเป็นแผนที่ถนนของคุณ สร้างผลตอบแทนด้วยการผลิตที่แท้จริง ทุกการเปลี่ยนแปลงทันที การเปลี่ยนรูปแบบ การปรับเปลี่ยนเครื่องมือได้ผ่านก่อนนําไปใช้ ส่วนใหญ่จะประเมินค่าค่าต่ําไป และความน่าเชื่อถือที่สุดมาจากที่นี่。

ก็ต่อเมื่อคุณมีสิทธิ์ที่จะขยายขอบเขต แล้วเพิ่มความซับซ้อน เมื่อ บริบท กลาย เป็น คอ ขวด จะ มี การ นํา ตัว แทน เข้า มา ใช้. แทรกกรอบหน่วยความจํา เมื่อบริบทของหน้าต่างเดี่ยวไม่สามารถนําเนื้อหาที่ต้องการไปได้ เมื่อ ป.ป.ท.ล่างไม่มีจริง ๆ แล้ว แนะนําการใช้คําสั่งหรือบราวเนอร์ใช้ อย่าออกแบบพวกนี้ล่วงหน้า ปล่อยให้โหมดล้มเหลวดึงพวกเขาเข้ามา。

เลือกโครงสร้างพื้นฐานที่น่าเบื่อ เครื่องมือที่ใช้ MCP Sandboxs ใช้ E2B หรือ Brownserbase. สถานะ Postgrest หรือคุณกําลังดําเนินการเก็บข้อมูลอยู่ นอก จาก นี้ ยัง มี การ ให้ ความ ช่วย เหลือ และ ความ ช่วย เหลือ ที่ จําเป็น แก่ ระบบ ต่าง ๆ ที่ มี อยู่ จน ถึง ขีด ที่ เป็น ไป ได้. โครงสร้างพื้นฐานที่แปลก ไม่ค่อยเป็นผู้ชนะที่แท้จริง ผู้ชนะที่แท้จริงคือวินัย。

จากวันแรกที่เราดูโมเดลเศรษฐกิจของหน่วย ค่าใช้จ่ายแต่ละการกระทํา อัตราแคช ค่าใช้จ่ายกลับมาอีกครั้ง โมเดลโทร เจ้าหน้าที่ดูราคาถูกในระยะ POC แต่ถ้าคุณไม่ได้เริ่มตรวจสอบค่าใช้จ่ายที่ออกมา มันจะระเบิดเมื่อมันมีขนาดใหญ่ขึ้น 100 เท่า 050 บาทต่อ poc อาจกลายเป็น 50,000 บาทต่อเดือน ในขนาดปานกลาง ทีมที่ไม่เห็นมันล่วงหน้า จะมีการประชุมCFO ที่พวกเขาไม่ชอบ。

โมเดลนี้ถูกปรับปรุงใหม่ทุกสัปดาห์ ล็อคไตรมาส. ในตอนท้ายของไตรมาส ทํางานโมเดลปัจจุบันกับชุดประเมินของคุณ ถ้าข้อมูลบ่งบอกถึงการเปลี่ยนแปลง เปลี่ยนแปลง ดัง นั้น คุณ จึง ได้ รับ ประโยชน์ จาก ความ ก้าว หน้า ของ แบบ จําลอง ขณะ ที่ หลีก เลี่ยง ความ สับสน ใน การ ไล่ ตาม การ ปล่อย แต่ ละ ครั้ง。

จะ ตัดสิน เรื่อง น้ํา ขึ้น ลง ได้ อย่าง ไร

ต่อ ไป นี้ เป็น สัญญาณ ที่ เจาะจง ว่า บาง สิ่ง อาจ เป็น ความ จริง: ทีมวิศวกรรม ที่ ได้ รับ ความ นับถือ ได้ เขียน โพสต์ มอร์ม แบบ ดิจิตอล ไม่ เพียง แต่ อ้าง ว่า มี คน ใช้ มัน เท่า นั้น; เป็น ภาษา พื้น ฐาน เช่น โปรโตคอล, แบบ จําลอง, หรือ โครงสร้าง ไม่ ใช่ เปลือก หรือ แพ็ค; มัน มี ปฏิกิริยา กับ ระบบ ที่ คุณ ทํา อยู่ แล้ว ไม่ ใช่ การ ใช้ แทน การ พูด ถึง สิ่ง ที่ มัน แก้ ไม่ ใช่ การ เปิด สิ่ง ที่ มัน ทํา นาน พอ ที่ จะ เขียน บล็อก ที่ ไม่ ได้ ทํา งาน。

ต่อ ไป นี้ เป็น สัญญาณ เฉพาะ ที่ บ่ง ชี้ ว่า บาง สิ่ง อาจ เป็น เพียง เสียง ดัง ดัง: 30 วัน ต่อ มา ยัง คง มี แต่ วิดีโอ โม เด็ค และ ไม่ มี กรณี การ ผลิต; การ กระโดด ม้านั่ง ไม่ สะอาด เท่า กับ ที่ เป็น ความ จริง; เสียง ดัง ลั่น ใช้ คํา ว่า " OS อัตโนมัติ ” หรือ “สร้าง โอกาส ใด ๆ ” โดย ไม่ มี การ อธิบาย; เอกสาร แบบ ฟอร์ม สัญญา ว่า คุณ จะ ทิ้ง การ สืบ ค้น หา ที่ มี อยู่, การ สืบ ค้น หา, และ การ จัด เตรียม; จํานวน ดาว กําลัง เพิ่ม ขึ้น อย่าง รวด เร็ว แต่ จํานวน ไม่ เพิ่ม ขึ้น พร้อม ๆ กัน; ทวิตเตอร์เร็วมาก แต่กิตฮับตามไม่ทัน。

นิสัย ที่ เป็น ประโยชน์ ใน แต่ ละ สัปดาห์ คือ ต้อง ใช้ เวลา 30 นาที ใน วัน ศุกร์ เพื่อ จะ เห็น ทุ่ง นา นี้. อ่าน 3 อย่าง: Anthrographic วิศวกรรมบล็อก โน้ตของไซมอน วิลลิสัน สเปซ ถ้ามีไปรษณีย์อาทิตย์นี้ ให้ทําความสะอาดเพิ่มอีกหนึ่งหรือสอง ที่เหลือก็ข้ามไปได้ บางอย่างที่สําคัญมาก คุณจะไม่พลาด。

อะไรต่อไป

สองไตรมาสต่อไปคุ้มค่าที่จะสังเกตไม่ได้เพราะพวกเขาจะ ชนะ แต่เพราะประเด็นของนี้เป็นสัญญาณหรือยังไม่ได้แก้ไขอย่างเต็มที่。

คล้ายกับการตีลังกาของเอเจ้นท์ 4。
นี่คือหนึ่งในตัวเลือกแรกๆ ที่จะลอง "งานนักสืบขนาน" โดยไม่สะดุดโดยสถานะร่วมกัน ถ้ามันสามารถคงขนาดหลังจากได้ขนาดเดิม รูปแบบปริยายนี้อาจเปลี่ยนได้。

ความเป็นผู้ใหญ่นอกกรอบ。
เส้นทางรายได้ของเซียร์ราและฮาร์วี่ ได้รับการรับรองในพื้นที่แคบ คําถามคือว่ามันสามารถขยายไปยังพื้นที่อื่น ๆ หรือเพียงเพื่อให้สถานการณ์แนวดิ่งเท่านั้น。

ความสามารถเป็นชั้นควบคุม。
การเจริญเติบโตของตัวแทน MS.md และโครงสร้างทักษะบน กิตติฮับ ระบุว่าวิธีการใหม่ในการควบคุมความสามารถของแต่ละคนกําลังเกิดขึ้น มันเป็นคําถามที่เปิดว่า จะถูกมาตรฐานในระดับความสามารถเช่นเครื่องมือมาตรฐาน MCP。

Caude Code 2026, มวลถอยและรีเซ็ต。
บริษัทชั้นนําแห่งหนึ่ง ได้ปล่อยเวอร์ชันที่ส่งผลให้การดําเนินงานลดลง 47% และได้ถูกค้นพบครั้งแรกโดยผู้ใช้ หลังจากการเฝ้าระวังภายใน นี่แสดงว่า แม้แต่ในบทนํา การปฏิบัติระดับการผลิต ก็ยังอ่อนหัดมาก ถ้าสิ่งนี้ขับเคลื่อนทั้งอุตสาหกรรม เพื่อลงทุนในการประเมินผลทางออนไลน์ที่ดีกว่า。

เสียงจะกลายเป็นส่วนติดต่อปริยายของไคลเอนต์。
ช่องเสียงของเซียร์ราเกินช่องข้อความไป 2025 ถ้าแบบจําลองนี้ยังคงทําต่อในพื้นที่แนวตั้งอื่น ๆ ข้อจํากัดการออกแบบเช่นความล่าช้า, การขัดจังหวะ และการรบกวนของเครื่องมือและเวลาจริง。

ความสามารถแบบโอเพนซอร์สยังคงลดช่องว่าง。
December-V3. ระบบนิเวศแบบ open-source ที่ใช้ความคิดเป็นหลัก Qwen 3.6 และกว้างขึ้นเป็นระบบนิเวศแบบโอเพนซอร์ส ต้นทุนของภารกิจอนิจกรรมแคบๆ กําลังเปลี่ยนไป ผลประโยชน์ปริยายของรุ่นที่ปิดไว้จะไม่ถาวร。

แต่ละสิ่งเหล่านี้สามารถตอบคําถามที่ชัดเจนได้ "สิ่งที่ฉันต้องเห็นสิ่งที่เห็นในเวลาหกเดือน นี่คือการทดสอบ แกะรอยคําตอบ ไม่ใช่ข่าว。

มันเป็นเดิมพันที่ผิดปกติ

ทุกเฟรมที่คุณไม่ได้ใช้คือการอพยพ คุณไม่ได้เป็นหนี้ในอนาคต ทุกม้านั่งที่คุณไม่ได้ไล่ล่า คือโฟกัสไตรมาส การ แข่งขัน ที่ กําลัง ชนะ วัฏจักร นี้ — เซียร์ รา, ฮาร์ วีย์, เคอร์เซอร์, แต่ ละ อัน ใน เขต ของ ตน เอง — ได้ เลือก เป้า หมาย ที่ แคบ ๆ, ตั้ง วินัย ที่ น่า เบื่อ แล้ว ก็ ปล่อย ให้ เสียง ดัง ใน บริเวณ นี้ ผ่าน ไป。

เส้นทางดั้งเดิมคือการเลือกคลังสินค้าเทคโนโลยี ใช้เวลาหลายปีกว่าจะทําได้ดี และจากนั้นก็ปีนขึ้นไปบนบันได ได้ผลเมื่อเทคโนโลยีสามารถเสถียรได้ถึงทศวรรษ แต่ตอนนี้ ห้องนิรภัยเทคโนโลยี กําลังเปลี่ยนแปลงทุกๆไตรมาส ผู้ชนะตัวจริงไม่ได้จัดอันดับ ความสามารถในการ "ควบคุมคลังสินค้าเทคโนโลยี" อีกต่อไป แต่ค่อนข้างเหมาะสมที่สุด พวก เขา สร้าง สิ่ง เล็ก ๆ และ เรียน รู้ อย่าง เปิด เผย โดย การ ส่ง ออก. คน อื่น ๆ ถูก ลาก เข้า มา ใน ห้อง เพราะ เขา ได้ ทํา อะไร บาง อย่าง. ผล งาน เอง เป็น การ ปรับ ปรุง ให้ ดี ขึ้น。

คิด อย่าง รอบคอบ เพราะ นี่ คือ สิ่ง ที่ บทความ ทั้ง หมด ต้องการ จะ พูด จริง ๆ. โมเดลการทํางานที่พวกเราส่วนใหญ่ยอมรับ ว่าโลกจะเสถียรนานพอ คุณไปโรงเรียน ได้ปริญญา ไต่บันได 2 ปีที่นี่ 3 ปีที่นั่น และประวัตินี้ค่อยๆกลายเป็นบางอย่าง ที่เปิดประตูได้ สมมุติฐานของเครื่องจักรทั้งหมดก็คือ มันเสถียรเพียงพอสําหรับอุตสาหกรรมที่อยู่ด้านข้าง。

แต่ไม่มี "พอพอยท์" ที่เสถียรในทุ่ง บริษัทที่คุณต้องการเข้าร่วม อาจจะมีอายุหกเดือน พวก เขา อาจ สร้าง โครง สร้าง ที่ มี อายุ แค่ 18 เดือน. การ ทํา ตาม ข้อ ตก ลง อาจ เป็น เพียง สอง ปี. ครึ่ง หนึ่ง ของ บทความ ที่ กล่าว ถึง บ่อย ที่ สุด ใน บริเวณ นี้ ไม่ ได้ อยู่ ใน บริเวณ นี้ ด้วย ซ้ํา เมื่อ สาม ปี ที่ แล้ว. ไม่ มี บันได ที่ จะ ปีน ได้ เนื่อง จาก อาคาร นี้ ได้ รับ การ ดัด แปลง. เมื่อบันไดเสีย ที่เหลือก็คือวิธีทําบางอย่างที่เก่ากว่า นํามันขึ้นอินเทอร์เน็ต นี่เป็นเส้นทางที่ไม่ปกติ เพราะมันจะข้ามระบบคลอง แต่ในพื้นที่ที่เคลื่อนที่ มันยังเป็นเส้นทางเดียว ที่จะเติบโตอย่างยืดหยุ่นอย่างแท้จริง。

นั่นคือสิ่งที่เราเห็นจากภายใน ขนาดยักษ์ยังอยู่ในที่โล่ง ตีพิมพ์ปัญหาผลตอบแทน การเขียนย้อนยุคและโครงข่ายออนไลน์ บางทีมที่น่าสนใจที่สุดในปีนี้ไม่ได้อยู่ในพื้นที่นี้ 18 เดือนก่อน คนที่จะไม่เขียนโค๊ด ก็ทํางานกับแอนเจ้นท์ ส่งซอฟท์แวร์ที่แท้จริง แพทย์ อาจ ติด ตาม คน เหล่า นั้น ที่ เลือก ภาษา พื้น ฐาน และ เริ่ม เคลื่อน ที่ เร็ว. ประตูเปิดแล้ว ส่วนใหญ่ยังคงมองหาใบสมัคร。

คุณต้องพัฒนาทักษะ ไม่ใช่สายลับ แทน ที่ จะ เป็น อย่าง นั้น การ ตัดสิน ว่า งาน ไหน จะ ได้ รับ ประโยชน์ จาก การ เติบโต ใน ทุ่ง นา ที่ กําลัง เปลี่ยน ไป. การเพิ่มขึ้นของบริบทจะเพิ่มขึ้น การออกแบบเครื่องมือจะเพิ่มขึ้น คาดว่ารุ่นออร์เคสตราจะเพิ่มขึ้น Evol Disciplinary จะเพิ่มมูลค่า ความคิดของฮาร์เนส จะช่วยเพิ่มการเติบโต วันอังคารเพิ่งปล่อยเอพีไอออกมา เมื่อคุณแยกความแตกต่างได้ คลื่นของปล่อยใหม่ทุกสัปดาห์ จะหยุดดูเหมือนความเครียด。

คุณไม่ต้องเรียนรู้ทุกอย่างหรอก คุณต้องเรียนรู้ว่าอะไรที่จะเติบโตและข้ามสิ่งที่จะไม่เติบโต เลือกหนึ่งผลลัพธ์ จับและประเมินผล ก่อนที่คุณจะออนไลน์ ใช้แลงกริฟ หรือเทียบเท่ากับทีมของคุณ ใช้ MCP เอาเวลาใส่กล่องทราย เริ่มการทํางานปริยายโดยใช้anent ตัวเดียว ขอบเขตจะขยายเมื่อรูปแบบความล้มเหลว ดึงในความซับซ้อน โมเดลนี้ถูกปรับเป็นรายไตรมาส อ่าน 3 อย่างวันศุกร์。

นั่นมันหนังสือเล่น สิ่งที่เหลืออยู่คือรสชาติ ความเร็วในการส่งมอบ และความอดทน ที่จะไม่ไล่ตามสิ่งที่ไม่เกี่ยวข้อง。

ไปสร้างอะไรสักอย่าง ใส่ลงในอินเตอร์เน็ต ยุค นี้ จะ ให้ ผล ตอบ แทน แก่ คน ที่ สร้าง สิ่ง ต่าง ๆ ไม่ ใช่ คน ที่ เพียง แต่ พรรณนา สิ่ง เหล่า นั้น. ตอนนี้เป็นหน้าต่างที่ดีที่สุด สําหรับ "ผู้สร้าง"。

(หัวเราะ)ส่วนเชื่อมโยงดั้งเดิม]

QQlink

無加密後門,無妥協。基於區塊鏈技術的去中心化社交和金融平台,讓私隱與自由回歸用戶手中。

© 2024 QQlink 研發團隊. 保留所有權利.