Hermes Agent v0.18 — เวอร์ชันที่ทำให้ agent รู้ว่างานเสร็จจริงไหม แถมเห็นความจำได้
สารบัญ
สรุปให้ไว
เวอร์ชัน "ตัดสินใจ"
v0.18 ออก 1 ก.ค. 2026 เน้นให้ agent รู้ว่างานเสร็จจริงหรือแค่เดาว่าเสร็จ
ปิดบั๊กสำคัญหมดรีโป
เคลียร์ปัญหา P0/P1 ทั้งหมดราว 700 รายการ เหลือเปิดค้างศูนย์
completion contracts
กำหนดนิยาม "เสร็จ" ที่ตรวจสอบได้ ตั้งแต่ก่อนเริ่มงาน
เห็นความจำของ agent
มีไทม์ไลน์ให้ไล่ดู แก้ หรือลบสิ่งที่มันจำไว้ได้
01อะไรใหม่ใน v0.18
ทีมเรียกรุ่นนี้ว่า "judgement release" เพราะโจทย์หลักไม่ใช่การเพิ่มฟีเจอร์ แต่คือทำให้ agent คิดได้ดีขึ้นและรู้ว่าเมื่อไหร่งานเสร็จจริง ก่อนหน้านี้พอ agent บอกว่าเสร็จ เราก็ได้แต่เชื่อ แต่รุ่นนี้ agent เรียนรู้ที่จะตรวจงานตัวเองกับหลักฐานจริง แทนที่จะเดาว่าถูก
ตัวเสริมสำคัญคือคำสั่ง goal ที่รองรับ completion contracts ทำให้ agent มีนิยาม "เสร็จ" ที่ตรวจสอบได้ตั้งแต่ก่อนลงมือ นี่คือความต่างระหว่างผู้ช่วยที่ "ทำงานจบ" กับผู้ช่วยที่ "ทำงานจบอย่างถูกต้อง"
02ปิดบั๊กทั้งรีโปก่อนเพิ่มของใหม่
ราวหนึ่งสัปดาห์ครึ่ง ทีมทุ่มแรงเกือบทั้งหมดไปที่เป้าเดียว คือปิดปัญหาระดับ P0 และ P1 (บั๊กและปัญหาสำคัญที่สุดที่กระทบการใช้งานจริง) ให้หมดทั้งรีโป ณ รุ่นนี้ปิดครบ 100% เหลือเปิดค้างศูนย์รายการ คิดเป็นราว 700 รายการสำคัญ จากงานที่ปิดไปเกือบ 2,000 รายการในช่วงนั้น
นี่ไม่ใช่การเก็บกวาดเล็ก ๆ แต่คือการหยุดทุกอย่างเพื่อทำให้ตัวโปรดักต์แน่นก่อนจะไปเพิ่มของใหม่ สำหรับคนใช้งาน มันแปลว่าเครื่องมือเสถียรและน่าวางใจกว่าที่เคยเป็นเมื่อไม่กี่สัปดาห์ก่อน
03ความจำที่มองเห็นได้
Hermes มีความจำข้ามเซสชันมาตลอด แต่ที่ผ่านมามันเหมือนกล่องดำ เราดูไม่ได้ว่ามันจำอะไรเกี่ยวกับเราหรือโปรเจกต์ไว้บ้าง v0.18 เพิ่มฟีเจอร์ journey ซึ่งเป็นไทม์ไลน์ในหน้าจอเทอร์มินัลที่ไล่ดูทุกความจำและสกิลที่มันสะสม พร้อมแก้หรือลบอันที่ผิดได้ตรงนั้น ส่วนบนแอปเดสก์ท็อปมี memory graph เป็นผังเรเดียลให้เล่นดูย้อนหลัง
นอกจากนี้ gateway (ตัวเชื่อม agent เข้ากับช่องแชตต่าง ๆ) ปรับให้สเกลลงถึงศูนย์เมื่อไม่ใช้ และปิดงานอย่างสะอาดโดยไม่หลุด context กลางทาง อีกทั้งแอปเดสก์ท็อปเพิ่ม coding projects ให้จัดระเบียบงานโค้ดในแอปเดียว ไม่ต้องเด้งไปมาระหว่างเทอร์มินัลกับ editor
ของใหม่ที่ได้ในเวอร์ชันนี้
- ★
Self-verification
agent ตรวจงานกับหลักฐานจริง ไม่ใช่แค่ประกาศว่าเสร็จ
- ★
Completion contracts
นิยาม "เสร็จ" ที่ตรวจสอบได้ ตั้งแต่ก่อนเริ่มงาน
- ★
Journey timeline
ไล่ดูความจำ/สกิลที่ agent เก็บ แก้หรือลบได้จากมุมมองเดียว
- ★
Memory graph
ผังความจำแบบเรเดียลบนแอปเดสก์ท็อป
- ★
Gateway สเกลถึงศูนย์
ปิดสะอาด ไม่ดรอปงานกลางทางเมื่อเซิร์ฟเวอร์รีสตาร์ต
- ★
Coding projects
จัดโปรเจกต์โค้ดในแอปเดสก์ท็อปได้เป็นเรื่องเป็นราว
04เกี่ยวอะไรกับเรา
ฟันธง: ถ้าใช้ Hermes อยู่แล้ว รุ่นนี้ควรอัป เพราะได้ทั้งความเสถียร (บั๊กสำคัญเหลือศูนย์) และ agent ที่ตรวจงานตัวเองได้ ส่วนคนเพิ่งเริ่ม รุ่นนี้เป็นจุดเริ่มที่ดีเพราะไม่ต้องรับภาระบั๊กเก่า
จุดที่ต้องระวังและ Human Gate: อย่าเพิ่งวางใจให้ agent ตัดสินว่างานสำคัญ "เสร็จ" เองทั้งหมด — ตั้ง completion contract ให้ตรงกับเงื่อนไขงานจริงก่อน โดยเฉพาะงานที่แตะไฟล์บริษัท ลูกค้า หรือเงิน ต่อยอด: ใช้ journey ไล่ดูเป็นระยะว่ามันจำอะไรผิดแล้วลบทิ้ง เพื่อไม่ให้ความจำเพี้ยนสะสมก่อนจะมอบงานอัตโนมัติมากขึ้น
โปรเจกต์ open-source
อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย
ดูบน GitHub → →