หมวดหมู่
ข่าวสาร
52 บทความ
หลังคำสั่งปิด Fable 5 - safeguard เปลี่ยนเป็น refuse แล้วสลับโมเดลให้เห็น ๆ
Anthropic ถอดกลไก "ตอบอ่อนลงเงียบ ๆ" ออกจาก Fable 5 แล้วเปลี่ยนเป็น refuse ตรง ๆ พร้อม fallback ไป Opus 4.8 ให้เห็นชัด บทเรียนคือถ้าผูกงานไว้กับโมเดลเดียว มันอาจปฏิเสธหรือสลับตัวกลางทางได้
รัฐบาลสหรัฐสั่งระงับ Claude Fable 5 และ Mythos 5 ทั้งหมด - บทเรียนเรื่องพึ่งโมเดลเดียว
Anthropic ถูกคำสั่ง export control ของรัฐบาลสหรัฐให้ปิดการเข้าถึง Fable 5 และ Mythos 5 สำหรับ foreign national ทุกคน จนต้องปิดให้ผู้ใช้ทั้งหมด เป็นครั้งแรกที่โมเดล frontier ถูกเรียกคืนด้วยเหตุผลความมั่นคง
Nvidia จับมือ Span ติดมินิดาต้าเซ็นเตอร์ AI ข้างบ้าน - แลกค่าไฟค่าเน็ตที่ถูกลง
สตาร์ตอัป Span ร่วมกับ Nvidia และผู้สร้างบ้าน Pulte ติดตั้งมินิดาต้าเซ็นเตอร์ AI (XFRA node) ข้างบ้าน ใช้กำลังไฟที่เหลือของบ้านมาเป็น compute กระจาย แลกกับบิลค่าไฟค่าเน็ตที่ถูกลง
GPT-5.6 กับ Fable 5 อาจเปิด price war - ผู้ใช้ได้ของถูกลง แต่ workflow ห้ามผูกกับของชั่วคราว
กระแส GPT-5.6 หลัง Fable 5 ทำให้การแข่งขัน frontier model เข้มขึ้น ทั้งความสามารถ coding/agentic/vision และข่าวเรื่องลดราคา token แต่ทีมต้องระวัง model ชั่วคราว ราคาโปร และ safeguard
NPM 12 จะปิด install scripts ของ dependency เป็นค่าเริ่มต้น - นี่คือ Human Gate ที่ package manager ควรมี
NPM 12 เตรียมไม่รัน preinstall/install/postinstall scripts ของ dependency โดย default และเพิ่ม approval flow สำหรับ script ที่เชื่อถือได้ แนวนี้สำคัญมากในยุค AI coding agent
Gemini 3.5 Pro leak สะท้อนโจทย์ใหญ่ของ Google - distribution ดี แต่ coding endurance ต้องตามให้ทัน
ข้อมูลหลุดของ Gemini 3.5 Pro ชี้ว่ารุ่นใหม่อาจดีขึ้นด้าน vision/SVG แต่ยังถูกตั้งคำถามเรื่อง coding laziness และงานยาว พร้อมมี Diffusion Gemma เป็นสัญญาณใหม่ฝั่ง local text generation
ถ้า Siri ใช้ Gemini จริง ผู้ใช้จะเริ่มสนใจน้อยลงว่า AI อยู่หลังแบรนด์ไหน
ข่าว Siri เชื่อมกับ Gemini ชี้ภาพใหญ่ของ consumer AI ว่าแบรนด์หน้าเครื่องกับโมเดลหลังบ้านอาจไม่ใช่ตัวเดียวกัน สิ่งที่ต้องถามคือข้อมูลไปไหนและควบคุมอะไรได้บ้าง
Microsoft เปิด MAI models 7 ตัว - จุดแข็งคือ distribution ไม่ใช่แค่คะแนนโมเดล
Microsoft เปิดตัวตระกูล MAI หลายงานพร้อมกัน ตั้งแต่ reasoning, coding, image, transcription ถึง voice จุดที่น่าจับตาคือการฝังเข้า Copilot, VS Code และ Microsoft stack
Nvidia ไม่ได้ปล่อยแค่โมเดล - แต่กำลังต่อ stack สำหรับยุค agent ทั้งเครื่อง
รอบนี้ Nvidia พูดพร้อมกันทั้ง Nemotron 3 Ultra, Vera CPU, Cosmos 3 และ RTX Spark ภาพรวมคือการสร้าง stack สำหรับ agent ตั้งแต่โมเดลจนถึงเครื่องส่วนตัว
Google AI glasses กับ Gemini — น่าสนใจสำหรับ hands-free workflow แต่ยังเป็นช่วงทดลอง
Google พูดถึงแว่น AI ที่ใช้ Gemini สำหรับ hands-free help และ live translation มีทั้งรุ่นเสียงกับต้นแบบ display จุดสำคัญคือ use case ชัด แต่ privacy และความพร้อมยังต้องดู
Microsoft reportedly ถอยจาก Claude Code เพราะต้นทุน — agent เก่งอย่างเดียวไม่พอ
มีรายงานว่า Microsoft ให้ทีมบางส่วนใช้ Claude Code แล้วอาจดันกลับไปหา GitHub Copilot CLI เพราะต้นทุน agentic coding สูงมาก ประเด็นนี้ควรอ่านเป็น cost signal สำหรับองค์กรใหญ่
Claude Mythos 1 Preview โผล่แยกเดี่ยว — ยังต้องติดป้าย leak ให้ชัด
Mythos 1 เริ่มมี coverage เฉพาะตัวมากขึ้น แต่ยังควรอ่านในฐานะ preview/leak ก่อน ข้อมูลที่ทีมควรรอคือ access, use case, ราคา และความต่างจาก Opus/Sonnet
Anthropic leak ชุดใหม่มี Opus 4.8, Sonnet 4.8, Mythos 1 — รอของจริงก่อนวางแผนย้าย
ชื่อโมเดลของ Anthropic หลายตัวถูกพูดถึงพร้อมกัน แต่ยังเป็นพื้นที่ leak และ preview สิ่งที่ควรทำตอนนี้คือเตรียม test set สำหรับ Claude workflow ไม่ใช่รีบเปลี่ยนระบบ
Mythos, Opus 4.8, GPT-5.6 โผล่ต่อเนื่อง — เตรียมชุดทดสอบไว้ ดีกว่ารอข่าวอย่างเดียว
กระแสโมเดลใหม่ช่วงปลายพฤษภาคมเริ่มถี่ขึ้น ทั้ง Mythos 1, Opus 4.8, GPT-5.6 และ Gemini 3.5 Pro ข่าวยังต้องอ่านแบบระวัง แต่ทีมที่ใช้ AI ควรเตรียม benchmark ของตัวเอง
Opus 4.8, GPT-5.6, Mythos 1 โผล่ในกระแส leak — อ่านเป็นสัญญาณ ไม่ใช่ release note
หลายชื่อโมเดลเริ่มถูกพูดถึงพร้อมกัน ทั้ง Claude Opus 4.8, GPT-5.6, Mythos 1 และ DeepSeek V4 Pro จุดสำคัญคือแยกข่าว leak ออกจากของที่ใช้งานจริง
Continual Harness ทำให้ agent ปรับตัวเองระหว่างงาน — น่าสนใจมาก แต่ต้องมีเบรก
Continual Harness แสดงแนวทาง agent ที่เรียนรู้จากความผิดพลาด แก้ prompt สร้าง sub-agent และเก็บ memory ระหว่างทำงานต่อเนื่อง ประโยชน์ชัด แต่ถ้าใช้กับโลกจริงต้องมี log, rollback และ approval
Claude Code แบบฟรีผ่านเครดิตและ third-party — น่าดู แต่ต้องคิดต้นทุนระยะยาว
กระแส Claude Code ผ่านเครดิตหรือ third-party ทำให้หลายคนรู้สึกว่าใช้งานได้ถูกลง แต่ทีมที่ใช้จริงต้องคิดเรื่อง quota, policy และความต่อเนื่องของ provider
Phantom Pulse ใช้ knowledge vault เป็นทางเข้า — AI workflow ต้องระวัง plugin มากขึ้น
เคส Phantom Pulse เตือนว่า note vault และ community plugin ไม่ใช่พื้นที่ปลอดภัยโดยอัตโนมัติ ยิ่งทีมใช้ vault เป็นสมองของ AI agent ยิ่งต้องมี policy ก่อน sync
Atlas ยกของหนักด้วย whole-body control — ข่าว humanoid ที่ควรดูเรื่อง deployment มากกว่าโชว์ท่า
Atlas รุ่นใหม่ถูกพูดถึงจากงานยกตู้เย็นหนักและรับมือ weight shift จุดที่น่าสนใจไม่ใช่ท่าทางแปลกตา แต่คือ sim-to-real, proprioception และชิ้นส่วนที่ซ่อมเปลี่ยนได้
Codex บนมือถือเริ่มมีประโยชน์จริง — แต่ข่าว limit ลดเตือนว่าอย่าวาง workflow บนโปร launch
Codex เริ่มขยับจากเครื่องมือบนโต๊ะไปสู่การสั่งงานจากมือถือ แต่รายงานเรื่อง usage limit ลดลงทำให้ต้องคิดเรื่องต้นทุนและ quota ตั้งแต่แรก