แบรนด์
Gemini
35 โพสต์
Project Genie เปิดทั่วโลก — พิมพ์ข้อความแล้วได้โลก 3 มิติให้เดินเล่น
Google เปิด Project Genie ให้คนทั่วโลกที่อยู่แพลน AI Ultra ใช้ได้แล้ว พิมพ์ข้อความแล้วได้โลก 3 มิติให้เดินสำรวจ แต่ตอนนี้ยังเป็นเดโมมากกว่าเครื่องมือทำงาน
Gemini เพิ่ม managed agents — รันเอเจนต์ให้บนคลาวด์ ไม่ต้องเปิดเครื่องทิ้งไว้
Google เปิด managed-agents API ใน Gemini API ที่รันเอเจนต์ AI บนเครื่อง Linux บนคลาวด์ของ Google แทนเครื่องเรา สั่งครั้งเดียวแล้วปล่อยให้มันทำงานยาว ๆ เองได้
DiffusionGemma ของ Google - โมเดลข้อความที่สร้างทั้งก้อนพร้อมกัน เร็วทะลุพันโทเคนต่อวินาที
Google ปล่อย DiffusionGemma โมเดล open-source ที่สร้างข้อความแบบ diffusion แทนการไล่ทีละโทเคน เคลมเร็วได้เกิน 1,000 tokens ต่อวินาทีบน GPU แรง เหมาะกับงาน local ที่เน้นความเร็ว
Gemini 3.5 Live Translate - แปลเสียงสด 70+ ภาษาแบบเรียลไทม์ ไม่ต้องรอพูดจบ
Google เปิดตัว Gemini 3.5 Live Translate โมเดลเสียงที่แปลคำพูดแบบ speech-to-speech กว่า 70 ภาษา ขณะที่อีกฝ่ายยังพูดอยู่ พร้อมลง Google Meet, Translate app และ Live API
Gemini 3.5 Pro leak สะท้อนโจทย์ใหญ่ของ Google - distribution ดี แต่ coding endurance ต้องตามให้ทัน
ข้อมูลหลุดของ Gemini 3.5 Pro ชี้ว่ารุ่นใหม่อาจดีขึ้นด้าน vision/SVG แต่ยังถูกตั้งคำถามเรื่อง coding laziness และงานยาว พร้อมมี Diffusion Gemma เป็นสัญญาณใหม่ฝั่ง local text generation
ถ้า Siri ใช้ Gemini จริง ผู้ใช้จะเริ่มสนใจน้อยลงว่า AI อยู่หลังแบรนด์ไหน
ข่าว Siri เชื่อมกับ Gemini ชี้ภาพใหญ่ของ consumer AI ว่าแบรนด์หน้าเครื่องกับโมเดลหลังบ้านอาจไม่ใช่ตัวเดียวกัน สิ่งที่ต้องถามคือข้อมูลไปไหนและควบคุมอะไรได้บ้าง
NotebookLM เริ่มรัน code บน source ได้แล้ว - จากตัวอ่านเอกสารเป็นตัวทำ analysis
NotebookLM เพิ่ม secure cloud computer ต่อ notebook ทำให้เขียนและรัน code บน source ได้ สร้าง report, spreadsheet, deck, CSV/JSON และภาพจากข้อมูลที่เราอนุมัติ
Antigravity 3.0 เปิด teamwork และ science skills - ใช้ agent หลายตัวได้ แต่ต้องมีงบและเกณฑ์
Antigravity อัปเดตทั้ง teamwork preview, science skills, Gemini 3.5 Flash รุ่นใหม่, low-effort mode และ session sync ภาพรวมคือ Google กำลังทำ coding agent ให้เป็น platform มากขึ้น
Gemma 4 12B เหมาะเป็น local coding worker มากกว่าพระเอกคนเดียว
Gemma 4 12B ถูกพูดถึงมากขึ้นในฐานะโมเดล local สำหรับ coding และ agent งานที่เหมาะคือเป็น worker ราคาต่ำ/ส่วนตัว แล้วให้คนหรือโมเดลหลักตรวจต่อ
Gemma 4 กับ AI Edge ทำให้ local agent ดูจริงจังกว่าเดิม
Gemma 4 และแนวทาง Google AI Edge ทำให้ local model เริ่มเป็น worker ที่ใช้ได้จริงใน agent workflow ไม่ใช่แค่ของเล่นเพื่อความเป็นส่วนตัว
Google AI glasses กับ Gemini — น่าสนใจสำหรับ hands-free workflow แต่ยังเป็นช่วงทดลอง
Google พูดถึงแว่น AI ที่ใช้ Gemini สำหรับ hands-free help และ live translation มีทั้งรุ่นเสียงกับต้นแบบ display จุดสำคัญคือ use case ชัด แต่ privacy และความพร้อมยังต้องดู
Local fine-tuning เริ่มง่ายขึ้น — แต่ dataset ยังเป็นของจริงที่ต้องคุม
เครื่องมือ local fine-tuning เริ่มทำให้การเลือกโมเดล สร้าง dataset และ train บนเครื่องตัวเองง่ายขึ้นมาก แต่คุณภาพข้อมูล policy และ hardware ยังเป็นตัวตัดสินว่างานนี้คุ้มไหม
NotebookLM + Gemini 3.5 Flash ทำเว็บจาก sources — ดีสำหรับ knowledge site แต่ต้องตรวจ fact
Gemini 3.5 Flash ถูกพูดถึงว่าสามารถช่วยแปลง sources ใน NotebookLM เป็นเว็บไซต์ได้ จุดนี้น่าสนใจสำหรับ internal knowledge base แต่ต้องมี fact check และ permission
Gemini Omni น่าใช้ตรงไหน — เริ่มจากงานที่ต้องเห็น ฟัง และสรุปพร้อมกัน
Gemini Omni น่าสนใจเพราะขยับจาก chat text ไปสู่งาน multimodal มากขึ้น เหมาะกับประชุม training support และงาน creative draft แต่ต้องคุมข้อมูลและตรวจผล
Claude Code, Codex, Antigravity เลือกยังไง — อย่าหาผู้ชนะตัวเดียว ให้จับคู่กับงาน
การเทียบ AI coding stack ต้องดูประเภทงาน ไม่ใช่ถามว่าเครื่องมือไหนดีที่สุดเสมอไป Claude Code, Codex และ Antigravity มีจุดแข็งคนละแบบและต้องมี test ของทีม
Mythos, Opus 4.8, GPT-5.6 โผล่ต่อเนื่อง — เตรียมชุดทดสอบไว้ ดีกว่ารอข่าวอย่างเดียว
กระแสโมเดลใหม่ช่วงปลายพฤษภาคมเริ่มถี่ขึ้น ทั้ง Mythos 1, Opus 4.8, GPT-5.6 และ Gemini 3.5 Pro ข่าวยังต้องอ่านแบบระวัง แต่ทีมที่ใช้ AI ควรเตรียม benchmark ของตัวเอง
Opus 4.8, GPT-5.6, Mythos 1 โผล่ในกระแส leak — อ่านเป็นสัญญาณ ไม่ใช่ release note
หลายชื่อโมเดลเริ่มถูกพูดถึงพร้อมกัน ทั้ง Claude Opus 4.8, GPT-5.6, Mythos 1 และ DeepSeek V4 Pro จุดสำคัญคือแยกข่าว leak ออกจากของที่ใช้งานจริง
Continual Harness ทำให้ agent ปรับตัวเองระหว่างงาน — น่าสนใจมาก แต่ต้องมีเบรก
Continual Harness แสดงแนวทาง agent ที่เรียนรู้จากความผิดพลาด แก้ prompt สร้าง sub-agent และเก็บ memory ระหว่างทำงานต่อเนื่อง ประโยชน์ชัด แต่ถ้าใช้กับโลกจริงต้องมี log, rollback และ approval
Google I/O รอบนี้เริ่มเห็นงานจริง — Gemini, Antigravity และ Flow ต้องแยกบทบาทให้ชัด
หลัง Google I/O ภาพของ Gemini ecosystem ชัดขึ้นกว่าเดิม จุดสำคัญไม่ใช่มีฟีเจอร์เยอะ แต่คือเราต้องรู้ว่าอะไรเหมาะกับงานเอกสาร งาน agent และงานครีเอทีฟ
Google I/O รอบนี้ไม่ใช่แค่ Gemini ใหม่ — แต่คือ ecosystem AI ทั้ง video, agent, Search และ glasses
Google เปิดชุด AI ใหญ่ทั้ง Gemini Omni, Spark, Flow, Antigravity 2 และ AI glasses ภาพรวมคือ Gemini กำลังย้ายจาก chatbot ไปเป็น stack ทำงานหลายสื่อและหลายอุปกรณ์