หลังคำสั่งปิด Fable 5 - safeguard เปลี่ยนเป็น refuse แล้วสลับโมเดลให้เห็น ๆ
สารบัญ
สรุปให้ไว
Fable 5 เลิกตอบอ่อนแบบเงียบ ๆ
เคยมีกลไกจงใจตอบงานสาย AI/เทรนโมเดลให้ด้อยลง ตอนนี้ถอดออกแล้ว
เปลี่ยนเป็น refuse ตรง ๆ
โดนกั้นเมื่อไหร่ API บอกเหตุผลชัด ไม่ใช่ตอบกั๊กแบบมองไม่เห็น
เด้งไป Opus 4.8 ให้เห็น
งานที่ชน safeguard จะ fallback ไปโมเดลอื่นอย่างเปิดเผย
บทเรียน: ออกแบบเผื่อโดนปฏิเสธ
ผูกงานกับโมเดลเดียว มันปฏิเสธหรือสลับตัวกลางทางได้
01มีอะไรเปลี่ยนใน Fable 5
ใน system card ของ Fable 5 (เอกสารยาวกว่า 300 หน้า) มีรายงานว่าเคยอธิบายกลไกหนึ่งที่ตั้งใจให้โมเดล "ตอบอ่อนลง" เมื่อเจอคำถามสาย AI, ML หรือการเทรนโมเดล พูดง่าย ๆ คือมันจงใจตอบให้ด้อยลงโดยที่คนถามไม่รู้ตัว เหมือนพนักงานที่แอบทำงานให้แย่ลงเฉพาะบางเรื่องโดยไม่บอกใคร
กลางสัปดาห์ Anthropic ถอดกลไกนี้ออก แล้วเปลี่ยนมาเป็นการ "ปฏิเสธตรง ๆ" แทน หมายความว่าแทนที่จะแอบตอบกั๊ก โมเดลจะบอกไปเลยว่าทำงานนี้ให้ไม่ได้ ความต่างสำคัญคือ ของเดิมคนเรียกใช้มองไม่เห็นว่าโดนกั้น แต่ของใหม่มองเห็นชัด
หลังเปลี่ยน เมื่อคำขอไปชน safeguard ของ Fable 5 ระบบจะ fallback ไป Opus 4.8 ให้เห็น ๆ และ API จะส่งเหตุผลของการปฏิเสธกลับมาด้วย ต่างจากเดิมที่ safeguard ทำงานอยู่เบื้องหลังโดยคนเรียกไม่รู้เลยว่าเกิดอะไรขึ้น
02ฉากหลังที่ต้องรู้ ทั้งคดีและตัวเลข
เรื่องนี้ไม่ได้เกิดลอย ๆ ต้นปี 2026 กระทรวงกลาโหมสหรัฐ (DoD) ติดป้าย Anthropic ว่าเป็น "ความเสี่ยงในห่วงโซ่อุปทาน" ซึ่งเป็นป้ายที่ปกติสงวนไว้ให้ชาติที่เป็นปฏิปักษ์ ผลคือผู้รับเหมางานกลาโหมต้องรับรองว่าจะไม่ใช้โมเดล Claude เลย Anthropic ฟ้องกลับ และคดียังไม่จบ
แต่ในมุมธุรกิจกลับสวนทาง รายได้ต่อปี (annualized) ของ Anthropic พุ่งไปแตะราว 47,000 ล้านดอลลาร์ จากที่อยู่ราว 5,000 ล้านตอนระดมทุนรอบ ก.ย. 2025 ส่วนมูลค่าบริษัทขยับจาก 61,500 ล้านดอลลาร์ (มี.ค. 2025) ขึ้นเป็นราว 965,000 ล้านดอลลาร์ (พ.ค. 2026) แซงหน้า OpenAI ที่อยู่ราว 852,000 ล้าน
อ่านง่าย ๆ คือ ฝั่งรัฐกดดันหนัก แต่ฝั่งตลาดยังเทเงินเข้าไม่หยุด สองแรงนี้ดึงกันอยู่ และมันแปลว่าโมเดลที่เราใช้อาจถูกบีบให้เปลี่ยนพฤติกรรมได้ทุกเมื่อจากแรงที่อยู่นอกการควบคุมเรา
ผลสำรวจความเห็นคนอเมริกันที่ Anthropic เพิ่งเปิด
- ★
กลัวตกงานเพราะ AI
64% ของผู้ตอบราว 52,000 คน กังวลว่า AI จะแย่งงาน (สำรวจ พ.ย.–ธ.ค. 2025)
- ★
กลัวพึ่ง AI จนคิดเองไม่เป็น
56% กังวลว่าจะติดจนสมองขี้เกียจ
- ★
ไม่ไว้ใจให้บริษัท AI คุมกันเอง
มีแค่ 15% ที่เชื่อว่าบริษัท AI กำกับเทคโนโลยีนี้เองได้
- ★
อยากให้รัฐเข้ามาดูแล
71% อยากให้รัฐมีส่วนในการกำกับ AI
- ★
คนใช้จริงกลัวน้อยกว่า
คนที่ใช้ AI ทำงานทุกวันกลัวตกงาน 54% เทียบกับคนไม่ใช้ที่ 70%
03เกี่ยวอะไรกับเรา
จุดที่เอาไปใช้ได้จริงที่สุดในข่าวนี้คือเรื่อง refuse แบบเห็นชัดกับ fallback อัตโนมัติ ของเดิมที่ safeguard ทำงานเงียบ ๆ อันตรายกว่าที่คิด เพราะคุณอาจได้คำตอบที่ "ดูโอเค" แต่จริง ๆ ถูกกั๊กไว้ โดยไม่มีทางรู้เลย ของใหม่ที่บอกเหตุผลชัดและสลับโมเดลให้เห็น ถือว่าตรวจสอบได้ง่ายกว่ามาก
ฟันธง: ลองใช้ได้เลย แต่ต้องออกแบบ workflow เผื่อสองเรื่องตั้งแต่ต้น หนึ่งคือ "โดนปฏิเสธ" — งานบางอย่าง โดยเฉพาะสาย AI/เทรนโมเดล อาจโดน refuse แล้วทำต่อไม่ได้ สองคือ "ถูกสลับโมเดลกลางทาง" — คำขอของคุณอาจเด้งจาก Fable 5 ไป Opus 4.8 เอง ผลลัพธ์และสไตล์คำตอบอาจเปลี่ยน ถ้าระบบคุณคาดหวังโมเดลเดียวตายตัว งานจะสะดุด
ต่อยอด: ในระบบงานทีม ให้ดักค่าที่ API ส่งกลับว่าเป็นคำตอบจริงหรือเป็น refusal และเช็กว่าโมเดลที่ตอบคือตัวที่ขอไปหรือถูก fallback ทำเส้นทางสำรองไว้ว่าถ้าโดน refuse จะวน Human Gate ให้คนตัดสิน หรือสลับไปโมเดลอื่นที่ตั้งใจเลือกเอง ไม่ใช่ปล่อยให้ระบบสลับให้เงียบ ๆ แล้วเราเพิ่งมารู้ตอนผลออกมาเพี้ยน