หมวดหมู่
อัปเดต
36 บทความ
Project Genie เปิดทั่วโลก — พิมพ์ข้อความแล้วได้โลก 3 มิติให้เดินเล่น
Google เปิด Project Genie ให้คนทั่วโลกที่อยู่แพลน AI Ultra ใช้ได้แล้ว พิมพ์ข้อความแล้วได้โลก 3 มิติให้เดินสำรวจ แต่ตอนนี้ยังเป็นเดโมมากกว่าเครื่องมือทำงาน
Gemini เพิ่ม managed agents — รันเอเจนต์ให้บนคลาวด์ ไม่ต้องเปิดเครื่องทิ้งไว้
Google เปิด managed-agents API ใน Gemini API ที่รันเอเจนต์ AI บนเครื่อง Linux บนคลาวด์ของ Google แทนเครื่องเรา สั่งครั้งเดียวแล้วปล่อยให้มันทำงานยาว ๆ เองได้
Gemini 3.5 Live Translate - แปลเสียงสด 70+ ภาษาแบบเรียลไทม์ ไม่ต้องรอพูดจบ
Google เปิดตัว Gemini 3.5 Live Translate โมเดลเสียงที่แปลคำพูดแบบ speech-to-speech กว่า 70 ภาษา ขณะที่อีกฝ่ายยังพูดอยู่ พร้อมลง Google Meet, Translate app และ Live API
OpenAI Codex เพิ่ม banked resets - เก็บลิมิตที่รีเซ็ตไว้ใช้ตอนงานเร่งได้
OpenAI อัปเดต Codex ให้เก็บ rate-limit reset ไว้ใช้ทีหลังได้ตามจังหวะของเราเอง ผู้ใช้ที่เข้าเกณฑ์ได้ฟรีหนึ่งครั้ง และมีโปรชวนเพื่อนรับเพิ่มในช่วงสองสัปดาห์
NotebookLM เริ่มรัน code บน source ได้แล้ว - จากตัวอ่านเอกสารเป็นตัวทำ analysis
NotebookLM เพิ่ม secure cloud computer ต่อ notebook ทำให้เขียนและรัน code บน source ได้ สร้าง report, spreadsheet, deck, CSV/JSON และภาพจากข้อมูลที่เราอนุมัติ
Ultracode เก่งขึ้นก็จริง แต่ต้องใช้กับงานที่มีเกณฑ์ตรวจ ไม่ใช่งานที่ยังคลุมเครือ
Ultracode และ dynamic workflow ช่วยให้ Claude Code ทำงานใหญ่ขึ้นได้ แต่ยิ่ง agent เก่งขึ้นเท่าไร เรายิ่งต้องมี acceptance criteria, test และ reviewer ที่ชัดขึ้นเท่านั้น
Antigravity 3.0 เปิด teamwork และ science skills - ใช้ agent หลายตัวได้ แต่ต้องมีงบและเกณฑ์
Antigravity อัปเดตทั้ง teamwork preview, science skills, Gemini 3.5 Flash รุ่นใหม่, low-effort mode และ session sync ภาพรวมคือ Google กำลังทำ coding agent ให้เป็น platform มากขึ้น
Hermes Agent 5.0 ทำให้ agent ops จริงจังขึ้น ทั้ง remote gateway, model picker และ safety
Hermes รอบนี้ไม่ได้เพิ่มแค่ฟีเจอร์เท่ แต่ขยับไปทาง agent operations เต็มตัว มี desktop/web admin, remote gateway, multi-profile, model picker, slash undo, skill pruning และ security fixes
Codex Mobile ทำให้ agent อยู่กับเราได้ทุกที่ แต่ remote control ต้องคุมสิทธิ์ให้แน่น
Codex Mobile และ Computer Use ทำให้เราสั่งงานจากมือถือไปยังเครื่องที่เชื่อมไว้ได้ เหมาะกับการดูแล task ระหว่างเดินทาง แต่ต้องจำกัดสิทธิ์ให้ชัด
MiniMax M3 มาในจุดที่น่าสนใจ - context ใหญ่ ราคาต่ำ แต่ต้องทดสอบกับงานจริง
MiniMax M3 ถูกวางเป็นโมเดล open-weight สำหรับ coding, agent และ multimodal พร้อม context 1M tokens จุดขายคือราคาต่อ token ที่ต่ำมาก แต่ยังควรเริ่มจาก benchmark งานของเราเองก่อนใช้จริง
Step 3.7 Flash ใช้ฟรีผ่าน Hermes Agent — น่าลอง benchmark แต่ห้ามผูก production กับของฟรี
Step 3.7 Flash ถูกพูดถึงในฐานะโมเดล agentic coding ที่มี context ใหญ่ multimodal/tool-use และเปิดให้ลองฟรีผ่าน Hermes Agent จุดนี้ดีสำหรับ benchmark งานจริง แต่ free access อาจเปลี่ยนได้
Opus 4.8 กับ Ultracode/Dynamic Workflows — agent orchestration ต้องมี rubric ไม่ใช่แค่เพิ่มจำนวน
กระแส Opus 4.8 ต่อกับ Ultracode และ Dynamic Workflows ทำให้เห็นภาพ agent หลายตัวช่วยกันทำงาน แต่จำนวน agent ไม่ใช่คำตอบถ้าไม่มี rubric, budget และ Human Gate
Codex 4.0 ถูกพูดถึงเรื่อง upgrade — อย่าเชื่อแค่ชื่อรุ่น ให้ดูงานที่ผ่านจริง
กระแส Codex 4.0 ทำให้คนใช้ OpenAI coding workflow ต้องจับตา แต่สิ่งที่สำคัญกว่าชื่อรุ่นคือ agent ทำงานกับ repo จริงได้ดีขึ้นแค่ไหนและมี limit แบบใด
Qwen 3.7 Max มีมุม free API — ดีสำหรับลอง แต่ต้องดูต้นทุนหลังทดลอง
Qwen 3.7 Max ถูกพูดถึงต่อในมุม API ที่เข้าถึงง่ายหรือฟรีมากขึ้น เหมาะกับการทดลอง agent/coding model แต่ยังต้องคิดเรื่อง quota, latency และ policy ก่อนใช้จริง
Nvidia แจก token ใช้ AI ฟรี — น่าลอง แต่ต้องอ่านเงื่อนไขให้ครบ
Nvidia มีข้อเสนอ token สำหรับเข้าถึงโมเดลหรือบริการ AI แต่ของฟรีในงาน dev ต้องดู limit, model access และ data policy ก่อนเอาไปผูกกับ workflow จริง
Codex remote control เริ่มแตะเครื่องจริง — สะดวกขึ้น แต่ permission ต้องคมกว่าเดิม
Codex เริ่มถูกทดสอบในภาพ remote computer-use และการควบคุมเครื่องจากระยะไกล จุดนี้มีประโยชน์มาก แต่เสี่ยงมากถ้า permission กับ audit log ไม่ชัด
Google I/O รอบนี้เริ่มเห็นงานจริง — Gemini, Antigravity และ Flow ต้องแยกบทบาทให้ชัด
หลัง Google I/O ภาพของ Gemini ecosystem ชัดขึ้นกว่าเดิม จุดสำคัญไม่ใช่มีฟีเจอร์เยอะ แต่คือเราต้องรู้ว่าอะไรเหมาะกับงานเอกสาร งาน agent และงานครีเอทีฟ
ChatGPT real-time translation เริ่มน่าใช้กับงานไทย — แต่ศัพท์เฉพาะต้องมีคนตรวจ
การแปลสดจากภาษาไทยไปอังกฤษหรือจีนเริ่มมี use case ชัดสำหรับประชุม เทรนนิง และ customer support แต่ domain terms ยังต้องมี glossary และคนตรวจ
Google I/O รอบนี้ไม่ใช่แค่ Gemini ใหม่ — แต่คือ ecosystem AI ทั้ง video, agent, Search และ glasses
Google เปิดชุด AI ใหญ่ทั้ง Gemini Omni, Spark, Flow, Antigravity 2 และ AI glasses ภาพรวมคือ Gemini กำลังย้ายจาก chatbot ไปเป็น stack ทำงานหลายสื่อและหลายอุปกรณ์
Gemini 3.5 Flash เริ่มโผล่ใน Antigravity — เร็วขึ้นจริงไหม ต้องวัดกับงานของเรา
มีสัญญาณว่า Gemini Flash ใน Antigravity คุณภาพดีขึ้นจนหลายคนสงสัยว่าเป็น Gemini 3.5 Flash แล้ว แต่ข้อมูลยังเป็น early test จึงควรอ่านแบบระวังและทดสอบกับงานจริง