ลือ — "Claude Mythos" โมเดลลับที่ข่าวว่าทำงานนานจนวัดด้วยมาตรฐานเดิมไม่ได้
สารบัญ
สรุปให้ไว (สถานะ: เป็นข่าว/ลีก ยังไม่ยืนยัน)
ยังเป็นข่าว ไม่ใช่ประกาศทางการ
ทั้งหมดนี้คือรายงาน/ลีก เรื่อง "Claude Mythos" โมเดล Anthropic ขั้นสูง อ่านแบบตั้งการ์ดไว้ก่อน
เกินเพดานการวัด
มีรายงานว่า Mythos ดันเกินมาตรฐานของ METR จนวัดต่อไม่ได้ (ที่ข่าวเรียกว่า "evaluation crisis")
ตัวเลขที่เคลม ~16 ชม.
preview เคลมแตะช่วงงานที่เทียบเท่าคนทำราว 16 ชม. — ย้ำว่าเป็นตัวเลขที่ "เคลม" ไม่ใช่ผลที่ยืนยันแล้ว
มุมไซเบอร์เป็นดาบสองคม
มีรายงานว่าช่วยย่นงาน pen-test และมีประเด็นความมั่นคงไซเบอร์ที่ต้องจับตา
01ข่าวว่าอะไร — Mythos ดันเกินเพดาน METR ราว 16 ชม.
ขอเปิดด้วยการตั้งการ์ดก่อน เรื่องนี้ทั้งหมด **ยังเป็นแค่ข่าว/ลีก ไม่ใช่ประกาศทางการจาก Anthropic** ฉะนั้นอ่านแบบ "รับรู้ไว้ ยังไม่ต้องเชื่อทั้งหมด" จะปลอดภัยสุด สิ่งที่มีรายงานคือ Anthropic มีโมเดลขั้นสูงชื่อ "Claude Mythos" ที่เคลมว่าดันเกินเพดานการวัดของ METR จนวัดด้วยมาตรฐานเดิมไม่ได้ ข่าวเรียกอาการนี้ว่า "evaluation crisis" คือเก่งเกินไม้บรรทัดที่มีอยู่
ตรงนี้ต้องแปลศัพท์ให้เห็นภาพก่อน METR ใช้ตัวชี้วัดที่เรียกว่า "50% success-rate time horizon" — ฟังดูหรู แต่ **ภาพจำง่าย ๆ คือ "งานที่ AI ทำสำเร็จ 50% นั้น ถ้าให้คนทำ ต้องใช้เวลากี่ชั่วโมง"** ยิ่งตัวเลขชั่วโมงสูง แปลว่า AI รับงานที่ยาวและซับซ้อนขึ้นได้โดยยังทำผ่านครึ่งหนึ่งของครั้งที่ลอง พูดอีกแบบคือมันวัด "ความยาวของงานที่ AI พอจะลุยไหว" ไม่ใช่วัดว่าฉลาดแค่ไหนแบบลอย ๆ
ทีนี้ตัวเลขที่ข่าวเคลมคือ Mythos preview แตะช่วงงานมนุษย์ราว 16 ชม. ที่มาคือจากชุดงานยาก 228 งาน มีแค่ 5 งานที่ระดับ ≥16 ชม. — เหลือน้อยจนวัดต่อไม่ได้ จึงเป็นที่มาของคำว่าวัดไม่ได้ ส่วนเส้นความก้าวหน้าที่ข่าวอ้างคือ ~8 วินาที (2021) ขยับเป็น ~1 ชม. (กลางปี 2024) แล้วพุ่งเป็น ~16 ชม. (Mythos, เม.ย. 2026) เร็วในระดับที่ข่าวใช้คำว่า "super-exponential" ขอย้ำอีกรอบ: ทุกตัวเลขในย่อหน้านี้คือ **ตัวเลขที่ถูกเคลมในรายงาน ยังไม่ใช่ผลที่ยืนยันต่อสาธารณะ**
02มุมความมั่นคงไซเบอร์ — ย่นงานหนึ่งปีเหลือ 3 สัปดาห์ (ตามที่เคลม)
จุดที่อยากให้โฟกัสในมุมนี้คือ "ดาบสองคม" ของ AI ที่หาช่องโหว่เก่งขึ้น ถ้าตัวเลขที่เคลมเป็นจริงแม้แต่ครึ่งเดียว การที่ AI ช่วยย่นงานวิเคราะห์ช่องโหว่จากเป็นปีเหลือไม่กี่สัปดาห์ มันช่วยทีมความปลอดภัยตรวจระบบได้เร็วขึ้นมากก็จริง แต่เครื่องมือแบบเดียวกันนี้ก็เร่งฝั่งโจมตีได้พอกัน นี่คือเหตุผลที่เรื่องระดับนี้ถึงโยงไปถึงการหารือระดับรัฐบาล และทำไม Anthropic ถึงต้องออกมาเคลมเรื่องพฤติกรรมเสี่ยงอย่าง blackmail ที่ลดลงควบคู่กันไป
อีกเรื่องที่ต้องระวังคือ ตัวเลขอย่าง "1 ปีเหลือ 3 สัปดาห์" หรือ "blackmail จาก 96% เหลือไม่แสดง" เป็นตัวเลขที่ฟังแล้วว้าว แต่ยังไม่มีรายงานสาธารณะที่ให้เราตรวจวิธีวัดได้ ฉะนั้นเก็บไว้เป็น "เรื่องที่ควรจับตา" ไม่ใช่ "ข้อสรุปที่เอาไปอ้างต่อได้"
สิ่งที่ "มีรายงาน" ในมุมไซเบอร์ (ยังไม่ยืนยัน)
- ★
Palo Alto Networks ได้ใช้ก่อน
มีรายงานว่าเอา Mythos ไปวิเคราะห์ช่องโหว่ และเคลมว่าย่นงาน pen-test ระดับท็อปจากราว 1 ปี เหลือ 3 สัปดาห์ — ตัวเลขนี้คือคำเคลมจากข่าว ไม่ใช่ผลที่ตรวจสอบได้
- ★
เกาหลีใต้เข้าหารือ
มีรายงานว่ากระทรวงวิทยาศาสตร์ฯ ของเกาหลีใต้พบ Anthropic เมื่อ 11 พ.ค. เรื่อง AI และความมั่นคงไซเบอร์
- ★
ประเด็น no-blackmail
Anthropic เคลมว่าโมเดลตั้งแต่ Haiku 4.5 เป็นต้นมา ไม่แสดงพฤติกรรม blackmail ในการทดสอบแล้ว (จากเดิมที่เคยสูงถึง 96% ในการทดสอบ)
- ★
ทั้งหมดนี้ยังเป็นข่าว/ลีก
ทุกข้อด้านบนคือรายงาน ไม่ใช่เอกสารทางการที่ยืนยันได้ ณ ตอนนี้
03เกี่ยวอะไรกับเรา — ดาบสองคม และอะไรยืนยันแล้ว/ยัง
มุมคนทำงานจริง: ตอนนี้ยัง **ไม่มีอะไรให้ลงมือทำ** เพราะ Mythos ยังเป็นข่าว/ลีก ไม่ใช่ของที่เปิดให้ใช้ ฉะนั้นข้อแรกคือ ฟันธงเลยว่า "รอก่อน" อย่าเพิ่งเอาตัวเลข ~16 ชม. ไปวางแผนงานหรือไปขายงานลูกค้า เพราะถ้ามันไม่จริงหรือเงื่อนไขต่างจากที่เข้าใจ เราจะเป็นคนรับผิดเอง สิ่งที่ทำได้ตอนนี้คือเข้าใจ "ภาพจำของ time horizon" ติดตัวไว้ — เวลาเจอข่าวโมเดลใหม่อ้างว่าทำงานยาวขึ้น ให้แปลในใจทันทีว่า "งานที่มันทำผ่านครึ่งหนึ่งของครั้งที่ลอง เทียบเท่าคนทำกี่ชั่วโมง" จะอ่านข่าว AI ได้คมขึ้นเยอะ
สรุปสถานะให้ชัด — **อะไรที่ยัง "ยังไม่ยืนยัน":** ทั้งการมีอยู่ของ Mythos, ตัวเลข 16 ชม., เส้น super-exponential, การย่นงาน pen-test เหลือ 3 สัปดาห์ และตัวเลข blackmail ทั้งหมดนี้คือคำเคลมในรายงาน **อะไรที่พอจับเป็นบริบทได้:** METR และตัวชี้วัด time horizon เป็นกรอบการวัดที่มีอยู่จริงในวงการ และประเด็นความมั่นคงไซเบอร์เป็นเรื่องที่หลายฝ่ายให้ความสำคัญจริง แต่รายละเอียดเฉพาะของ Mythos ในข่าวนี้ยังต้องรอการยืนยัน
ต่อยอดแบบไม่เสี่ยง: อย่าเพิ่งปรับ workflow ตามข่าวที่ยังไม่ยืนยัน ให้ทำสองอย่างแทน — หนึ่ง ตั้งเกณฑ์ในใจว่าจะเชื่อเมื่อเห็นรายงานทางการหรือผลทดสอบที่ตรวจวิธีวัดได้ สอง ถ้าวันหนึ่งโมเดลแบบนี้ออกจริง ของที่ต้องเตรียมไม่ใช่ความตื่นเต้น แต่คือ "จุดที่คนต้องตรวจ" (Human Gate) — ยิ่ง AI รับงานยาวและซับซ้อนขึ้น จุดตรวจของคนยิ่งสำคัญ ไม่ใช่หายไป