Anthropic เปิดฟีเจอร์ managed agents — dreaming, outcomes และ multi-agent orchestration
สารบัญ
สรุปให้ไว
dreaming = AI ทบทวนงานเก่า
มีกระบวนการเบื้องหลังคอยรีวิว session ที่ผ่านมา จัดระเบียบ memory หาจุดที่พลาดซ้ำ ๆ แล้วเก่งขึ้นเอง
outcomes = กรรมการให้คะแนน
ตั้ง rubric ว่างานแบบไหนถึงเรียกว่าผ่าน แล้วมีตัวให้คะแนนแยกออกมาตรวจงาน เหมือน Human Gate แบบอัตโนมัติ
multi-agent orchestration
สั่ง agent หัวหน้าให้กระจายงานไปยัง sub-agent หลายตัวที่ใช้ model/prompt/tool ต่างกันได้ ทำงานบน file system เดียวกัน
เห็นทุกขั้นตอน
ตามงานทุก agent ได้ครบใน Claude console และมี webhook ให้สั่งงานยาว ๆ แบบ fire-and-forget
01ฟีเจอร์ชุดใหม่สำหรับคนสร้าง agent
รอบนี้ Anthropic ไม่ได้แค่เพิ่มความเร็วหรือ limit แต่ปล่อยชุดเครื่องมือที่ออกแบบมาเพื่อคนที่สร้าง agent จริงโดยเฉพาะ จุดที่ต้องรู้คือ dreaming, outcomes (public beta) และ multi-agent orchestration บวกกับ webhook support สำหรับงานที่รันยาว ๆ
แก่นของทั้งชุดคือทำให้ agent ทำงานเองได้นานขึ้น ตรวจสอบงานตัวเองได้มากขึ้น และกระจายงานออกเป็นหลายตัวพร้อมกันได้ โดยที่คนยังตามดูทุกขั้นตอนได้ใน Claude console
02dreaming และ outcomes คืออะไร (ภาพจำ)
**dreaming = AI ทบทวนงานเก่าเพื่อเก่งขึ้น** — มันคือกระบวนการเบื้องหลังที่คอยรีวิว session ของ agent ที่ผ่านมา แล้วจัดระเบียบ memory ที่เก็บไว้ใหม่ เพื่อหาว่ามีจุดไหนที่พลาดซ้ำ ๆ หรือมี preference อะไรที่ควรจำ จากนั้นจะอัปเดตเองหรือให้คนรีวิวก่อนค่อยบันทึก พูดง่าย ๆ คือ AI เอางานเก่ามานั่งทบทวนตอน "ว่าง" เพื่อให้รอบหน้าทำได้ดีขึ้น
**outcomes = มีกรรมการให้คะแนนงานตัวเอง** — เราตั้ง rubric ไว้ว่างานแบบไหนถึงเรียกว่าสำเร็จ แล้วจะมีตัวให้คะแนน (grader) แยกออกมาต่างหาก คอยตรวจผลงานใน context window ของมันเอง ตัวเลขที่อ้างถึงคือช่วยให้ task success เพิ่มราว +10 แต้ม และในงานภายในได้เพิ่มประมาณ 8.4% ฝั่งเอกสาร และราว 10.1% ฝั่ง PowerPoint
ของใหม่ที่ปล่อยมา
- ★
dreaming
กระบวนการเบื้องหลังรีวิว session เก่า จัดระเบียบ memory หา mistake และ preference ที่เกิดซ้ำ แล้วอัปเดตเองหรือรอคนรีวิวก่อนบันทึก
- ★
outcomes (public beta)
ตั้ง rubric นิยามความสำเร็จ แล้วมี grader แยกให้คะแนนงานใน context ของตัวเอง อ้างผล +10 แต้ม task success และเพิ่มราว 8.4% ฝั่งเอกสาร / 10.1% ฝั่ง PowerPoint
- ★
multi-agent orchestration
agent หัวหน้ากระจายงานไปยัง sub-agent ที่มี model/prompt/tool ของตัวเอง ทำงานบน file system เดียวกัน ตามงานได้ครบใน Claude console โดย Netflix ถูกอ้างว่าใช้วิเคราะห์ log ข้าม build หลักพันตัวแบบขนาน
- ★
webhook support
สั่งงาน agent ที่รันยาว ๆ แบบ fire-and-forget ได้
03เกี่ยวอะไรกับเรา
จุดที่น่าสนใจที่สุดสำหรับคนทำงานคือ outcomes มันคือ Human Gate แบบอัตโนมัติ จากเดิมที่ต้องมีคนนั่งตรวจว่างานผ่านเกณฑ์ไหม ตอนนี้เราเขียน rubric ไว้ล่วงหน้าให้ grader ตรวจแทนได้ระดับหนึ่ง แต่ย้ำว่ามันคือด่านตรวจอัตโนมัติ ไม่ใช่ตัวแทนการตัดสินใจของคน งานที่กระทบลูกค้า เงิน หรือสัญญา คนยังต้องเป็นคนเคาะอยู่ดี
สำหรับคนที่สร้าง agent จริง ชุดนี้ตอบโจทย์ตรง ๆ multi-agent orchestration ทำให้แตกงานใหญ่ออกเป็นหลายตัวทำพร้อมกันได้ และเพราะตามทุกขั้นตอนได้ใน Claude console เราจึงเอาไปต่อยอดเข้า workflow ที่ตรวจสอบได้ ส่วน dreaming เหมาะกับงานที่ทำซ้ำบ่อย ๆ เพราะให้ AI เก็บ pattern ความพลาดมาปรับเอง
> **หมายเหตุ (เป็นการคาดเดา):** มีการเก็งใน Polymarket ว่า "Claude 5" อาจออกราวเดือนกันยายน ไม่ใช่ช่วงพฤษภาคม–มิถุนายน อันนี้เป็นแค่การคาดการณ์ ยังไม่ใช่ข้อมูลทางการ