Call Me Thanut
clockอัปเดต

Opus 4.8 กับ Ultracode/Dynamic Workflows — agent orchestration ต้องมี rubric ไม่ใช่แค่เพิ่มจำนวน

31 พ.ค. 2026อ่าน 4 นาที
Opus 4.8 กับ Ultracode/Dynamic Workflows — agent orchestration ต้องมี rubric ไม่ใช่แค่เพิ่มจำนวน
สารบัญ

สรุปให้ไว

Opus 4.8 ถูกโยงกับ workflow หลาย agent

เช่น Ultracode และ Dynamic Workflows

แนวคิดคือให้ helper agents ช่วยงานย่อย

แล้วมีตัวหลักตัดสินหรือสรุป

จำนวน agent ไม่ใช่คำตอบเสมอไป

ถ้าเกณฑ์ไม่ชัด output จะตรวจยาก

ต้องมี rubric และ budget

ก่อนเพิ่มความขนานของงาน

01มันคืออะไร

ช่วงปลายเดือนมีการพูดถึง Opus 4.8 ร่วมกับแนวทางอย่าง Ultracode และ Dynamic Workflows ซึ่งมีภาพรวมคล้ายกันคือใช้ agent หลายตัวช่วยกันทำงาน แล้วให้โมเดลหลักหรือ judge รวมผล

แนวคิดนี้เหมาะกับงานที่แตกเป็นหลายส่วน เช่นให้ helper agents สำรวจ code, เขียน test, ตรวจ security, เทียบทางเลือก แล้วให้ Opus สรุปว่าควรทำอะไร

แต่ถ้าไม่มี rubric ที่ชัด agent หลายตัวอาจแค่สร้างเสียงรบกวนมากขึ้น ไม่ได้ทำให้ตัดสินใจดีขึ้น

02Rubric คือหัวใจ

rubric คือเกณฑ์ตรวจงาน เช่น bug fix ต้องผ่าน test ใด ห้ามแก้ไฟล์ไหน UI ต้องรองรับ state อะไร หรือ proposal ต้องให้คะแนนจาก impact, effort และ risk แบบไหน

ถ้าไม่มี rubric agent จะตีความเอง คนตรวจต้องอ่านคำตอบยาว ๆ แล้วตัดสินใหม่ทั้งหมด ผลคือไม่ได้ประหยัดเวลา แค่ย้ายงานจากลงมือทำมาเป็นอ่าน output

ถ้ามี rubric ดี agent หลายตัวจะช่วยแยกมุมมองได้ เช่นตัวหนึ่งดู correctness ตัวหนึ่งดู security ตัวหนึ่งดู maintainability แล้วคนเห็นข้อดีข้อเสียชัดขึ้น

โครง workflow ที่ควรใช้กับหลาย agent

  • Planner

    แตก task และกำหนด acceptance criteria

  • Workers

    ทำงานย่อยตามขอบเขตที่กำหนด

  • Critics

    ตรวจ correctness, security และ cost

  • Synthesizer

    รวมผลเป็นแผนหรือ diff ที่อ่านง่าย

  • Human Gate

    คนตัดสินใจและอนุมัติ final action

03เกี่ยวอะไรกับเรา

ฟันธง: agent orchestration น่าลองกับงานซับซ้อน แต่ไม่ควรเริ่มจากการเพิ่ม agent จำนวนมาก ให้เริ่มจาก 3 บทบาทพอ: planner, worker, reviewer

เลือกงานหนึ่งงาน เช่น refactor module เล็ก ๆ ให้ planner แตกงาน worker ทำ diff reviewer ตรวจ แล้วคนตัดสินใจว่าจะ merge หรือให้แก้ต่อ เก็บ token และเวลาตรวจไว้ทุกครั้ง

ถ้าระบบช่วยลดเวลาคนจริงค่อยขยาย ถ้า output เยอะแต่ตรวจยาก แปลว่า rubric ยังไม่ดีพอ ไม่ใช่ต้องเพิ่ม agent อีก