Hermes Agent เพิ่ม Mixture of Agents — ผสมหลายโมเดลให้ช่วยกันคิด แล้วมีตัวรวมคำตอบ
สารบัญ
สรุปให้ไว
ฟีเจอร์ใหม่
Hermes Agent เพิ่ม Mixture of Agents (MoA) ให้หลายโมเดลช่วยกันคิดในงานเดียว
มีตัวรวมคำตอบ
โมเดลอ้างอิงหลายตัวตอบขนานกัน แล้วส่งให้โมเดลตัวรวม (aggregator) ตัดสินคำตอบสุดท้าย
ใช้ของที่มีอยู่
เลือกผู้ให้บริการ/โมเดลเองได้ ใช้ subscription หรือ API ที่มีอยู่แล้ว
ฟันธง
เหมาะกับงานยาก ดีบั๊ก รีวิวโค้ด วางสถาปัตยกรรม ไม่ใช่งานเร็ว และจ่ายแพงกว่า
01Mixture of Agents คืออะไร
Mixture of Agents หรือ MoA คือวิธีให้ "หลายสมองช่วยกันคิดหนึ่งงาน" แทนที่จะถามโมเดลเดียว ระบบจะส่งคำถามเดียวกันไปให้โมเดลอ้างอิงหลายตัวพร้อมกัน เช่นจากคนละค่าย คนละบริษัท แต่ละตัวตอบของตัวเองแบบขนานและเป็นอิสระต่อกัน ไม่ได้ถกเถียงกันเอง จากนั้นคำตอบทั้งหมดจะถูกส่งไปยังโมเดลตัวรวมหนึ่งตัว (มักเป็นตัวที่แรงที่สุด) ทำหน้าที่ชั่งน้ำหนักแล้วสรุปออกมาเป็นคำตอบสุดท้าย เปรียบเหมือนมีที่ปรึกษาหลายคนเสนอความเห็น แล้วมีคนกลางตัดสินว่าของใครเข้าท่าที่สุดในแต่ละช่วง
จุดที่ต้องแยกให้ชัดคือ MoA ไม่ใช่ Mixture of Experts ถึงชื่อจะคล้ายกัน Mixture of Experts เป็นสถาปัตยกรรมภายในของโมเดลเดียวที่แบ่งเป็นผู้เชี่ยวชาญย่อย ๆ ส่วน MoA ที่พูดถึงนี้คือการเอาโมเดลหลายตัวที่แยกขาดจากกันมาทำงานร่วมกันผ่านระบบ agent
02ทำงานยังไงใน Hermes Agent
ใน Hermes Agent ฟีเจอร์นี้จะโผล่มาเป็นเหมือน "โมเดลหนึ่งตัว" หรือ preset ทำให้ของเดิมไม่พัง ทั้งการเรียกใช้เครื่องมือ ความจำ และ session context ยังทำงานเหมือนเดิม เสมือนสลับไปใช้โมเดลที่ฉลาดขึ้นเฉย ๆ ผู้ใช้เลือกได้เองว่าจะให้โมเดลอ้างอิงเป็นตัวไหนของผู้ให้บริการเจ้าใด จึงดึง subscription หรือ API ที่มีอยู่แล้วมาใช้ได้โดยไม่ต้องจ่ายเพิ่มเป็นช่องทางใหม่
ที่ยืดหยุ่นคือสร้างได้หลาย preset เช่นชุดหนึ่งไว้เพิ่มฟีเจอร์ใหม่ อีกชุดไว้รีวิวโค้ด และยังตั้งค่า temperature แยกตามบทบาทได้ — ฝั่งโมเดลอ้างอิงตั้งให้สร้างสรรค์/หลากหลายหน่อย ส่วนตัวรวมตั้งให้นิ่งและคาดเดาได้มากกว่า ตัวอย่างชุดที่ยกกันคือใช้โมเดลอ้างอิงสี่ตัว เช่น GLM-5.2, GPT-5.5, Kimi K2.7 และ Opus 4.8 โดยให้ Opus 4.8 เป็นตัวรวม จำนวนขั้นต่ำที่เริ่มมีเหตุผลคือสองตัว
จุดที่ต้องรู้ก่อนเปิดใช้
- ★
ยิ่งหลายโมเดล ยิ่งแพงและช้า
รันหลายตัวขนานกันแปลว่า tool call และโทเค็นเพิ่ม ใช้เวลามากขึ้น ไม่เหมาะกับงานเร็วหรืองานง่าย
- ★
prompt caching ยังได้ผล
ส่วนลดจากการแคชยังใช้ได้อยู่
- ★
โมเดลอ้างอิงไม่ถกกันเอง
ต่างคนต่างตอบขนานกัน แล้วส่งให้ตัวรวมตัดสิน
- ★
เหมาะกับงานที่ยอมจ่ายเพื่อคำตอบดีสุด
ดีบั๊กยาก รีวิวโค้ด วางสถาปัตยกรรม งานเสริมความปลอดภัย
03เกี่ยวอะไรกับเรา
MoA คือทางเลือกสำหรับวันที่คุณติดงานยากจริง ๆ แล้วอยากได้ความเห็นจากหลายโมเดลมารวมกันในครั้งเดียว แทนการนั่งสลับถามทีละเจ้าเอง ฟันธงว่า "ลองเฉพาะงานหนัก" — เก็บไว้ใช้กับดีบั๊กที่แก้ไม่ตก รีวิวโค้ดก้อนใหญ่ หรือวางโครงสถาปัตยกรรม ส่วนงานเล็กงานเร็วใช้โมเดลเดียวพอ ไม่งั้นจ่ายแพงโดยไม่จำเป็น
ก่อนเปิดใช้จริงควรตั้งเพดานค่าใช้จ่ายไว้ที่ผู้ให้บริการ API เพราะฟีเจอร์นี้กินโทเค็นเร็ว และต่อยอดได้ด้วยการทำ preset ประจำงานที่ทำซ้ำบ่อย ๆ เก็บไว้ จะได้ไม่ต้องตั้งค่าใหม่ทุกครั้ง