Gemini Interactions API มาแล้ว — จำบทสนทนาฝั่ง server สั่งงานแบบ background และมี managed agent
สารบัญ
สรุปให้ไว
จำให้ฝั่ง server
ไม่ต้องส่งประวัติแชททั้งหมดซ้ำทุกครั้งที่ถาม
สั่งงาน background
ตั้ง background=true แล้วปิดหน้าต่างไปได้ มันรันฝั่ง server เอง
managed agent
agent ที่ Google โฮสต์ให้ คิด ใช้ tool เขียนและรันโค้ดในแซนด์บ็อกซ์
deep research ในตัว
รับเป้าหมาย ค้นเว็บ คืน report พร้อมกราฟและรูป
01Interactions API คืออะไร
Google เปิด Gemini Interactions API ออกมาให้ใช้แล้ว ให้นึกภาพง่าย ๆ ว่าก่อนหน้านี้การคุยกับ Gemini ผ่าน API เหมือนคุยกับคนที่ลืมทุกอย่างทันทีที่เราหยุดพูด ทุกครั้งที่ถามใหม่เราต้องส่งบทสนทนาเก่าทั้งหมดกลับไปย้ำให้มันจำ ซึ่งเปลืองทั้งเวลาและ token
Interactions API เปลี่ยนตรงนี้ จุดใหญ่ที่สุดคือ server-side memory คือ Google เก็บประวัติบทสนทนาไว้ให้ฝั่ง server เราเลยไม่ต้องแบกประวัติทั้งก้อนส่งไปส่งมา สั่งให้มันทำงานยาว ๆ ต่อเนื่องได้โดยไม่ต้องคอยจับมือ เหมาะกับงานที่เป็นขั้นเป็นตอนหลายรอบ
02background work กับ managed agents
ฟีเจอร์ที่สองคือ background work เราตั้งค่า background=true ให้ task ไปรันฝั่ง server ได้เลย ไม่ต้องเปิดหน้าต่างค้างรอ พูดง่าย ๆ คือสั่งงานแล้วเดินไปทำอย่างอื่น พอกลับมาผลก็เสร็จรออยู่ เหมือนมีพนักงานทำงานน่าเบื่อให้ระหว่างที่เราโฟกัสงานใหญ่
ฟีเจอร์ที่สามคือ managed agents แปลตรงตัวคือ agent ที่ Google โฮสต์ให้พร้อมใช้ มันคิดเอง ใช้ tool เขียนโค้ด รันโค้ด และทดสอบโค้ดได้ในพื้นที่แซนด์บ็อกซ์ฝั่ง Google จากเดิมที่ถ้าอยากได้ agent ต้องประกอบเองทั้งตัว ตอนนี้ Google ยื่นตัวสำเร็จมาให้ เราแค่บอกว่าให้ทำอะไร
มีอะไรใหม่อีก
- ★
deep research agent
อัปเกรดแล้ว รับ "เป้าหมาย" ไม่ใช่แค่คำถาม ออกไปค้นเว็บ อ่านเยอะ ๆ แล้วคืน report เต็มพร้อมกราฟและรูป
- ★
เรียกหลาย tool ในครั้งเดียว
Google Search, Google Maps และ tool ของเราเองทำงานพร้อมกันในรอบเดียว และ tool คืนรูปกลับมาได้ ไม่ใช่แค่ข้อความ
- ★
รองรับ MCP
มาตรฐานต่อ tool ที่ทุกเจ้ากำลังมุ่งไป เปรียบเหมือนช่อง USB ให้ AI เสียบต่อแอปอื่นได้ง่าย
- ★
Gemini Omni
Google teaser ไว้ว่ากำลังจะมา เป็นแนว any-to-any แปลงข้ามได้ทั้งข้อความ รูป เสียง วิดีโอ (ยังไม่มีรายละเอียดครบ)
03เกี่ยวอะไรกับเรา
สำหรับนักพัฒนาไทยที่ต่อ Gemini เข้ากับงานตัวเอง นี่คือจุดเปลี่ยนที่ช่วยลดงานจุกจิกได้จริง ไม่ต้องเขียนโค้ดแบกประวัติแชทเอง สั่งงานยาวแบบ background ได้ และมี agent ที่รันโค้ดฝั่ง Google ให้ ส่วนมุม MCP ก็ตอกย้ำว่าการต่อ tool กำลังกลายเป็นมาตรฐานเดียวกันทั้งวงการ
ฟันธง: dev ที่ทำ workflow ยาว ๆ หรืองาน agentic ลองได้เลย โดยเฉพาะถ้าเคยปวดหัวกับการจัดการ state และประวัติแชทเอง แต่มีจุดต้องระวังให้ชัด การที่ memory ไปอยู่ฝั่ง server ของ Google แปลว่าข้อมูลบทสนทนาไปนั่งอยู่ที่ Google ด้วย ฉะนั้นงานที่เกี่ยวกับข้อมูลบริษัทหรือลูกค้า ให้ไปอ่านนโยบายข้อมูลและการเก็บรักษาของเขาก่อนตัดสินใจ และเริ่มทดลองด้วยข้อมูลทดสอบหรือข้อมูลสาธารณะไปก่อน เมื่อมั่นใจแล้วค่อยวางมันลงในจุดที่เหมาะใน workflow จริง