Call Me Thanut
newspaperข่าวสาร

หลุดโมเดลเสียง OpenAI "Bidi 1" — พูดและฟังพร้อมกัน ขัดจังหวะได้เหมือนคุยกับคน

26 มิ.ย. 2026อ่าน 3 นาที
หลุดโมเดลเสียง OpenAI "Bidi 1" — พูดและฟังพร้อมกัน ขัดจังหวะได้เหมือนคุยกับคน
สารบัญ

สรุปให้ไว

ข่าวหลุด ยังไม่ทางการ

มีคนพบโมเดลเสียงใหม่ชื่อ Bidi 1 โผล่ในการทดสอบกับผู้ใช้บางกลุ่ม

พูดและฟังพร้อมกัน

Bidi ย่อมาจาก bidirectional คือทำงานสองทางพร้อมกัน ไม่ใช่ผลัดกันพูดทีละฝั่ง

ขัดจังหวะได้

รับการพูดแทรกกลางประโยคโดยไม่ค้าง และสลับงานทันที

อาจไปอยู่ใน Codex

มีรายงานว่าอาจมาถึง Codex 2 ให้สั่งโค้ดด้วยเสียงแบบคุยโต้ตอบ แต่ยังไม่ยืนยัน

01มันคืออะไร

มีแหล่งที่ตามจับฟีเจอร์ทดสอบพบโมเดลเสียงใหม่ของ OpenAI ชื่อ Bidi 1 โผล่ให้ผู้ใช้บางกลุ่มในช่วงทดสอบ ย้ำก่อนว่ายังไม่มีประกาศทางการ ให้ถือเป็นข่าวหลุด ไม่ใช่การเปิดตัวจริง

ชื่อ Bidi ย่อมาจาก bidirectional แปลง่าย ๆ คือทำงานสองทางพร้อมกัน ไม่ได้นั่งเงียบรอจนเราพูดจบ และไม่ได้เพิกเฉยตอนมันกำลังพูด แต่พูด ฟัง และปรับตัวได้พร้อมกันแบบเรียลไทม์ ซึ่งเป็นจุดที่โมเดลเสียงรุ่นก่อนมักทำได้ไม่ดี

สิ่งที่มีคนเห็นในการทดสอบ

  • พูดและฟังพร้อมกัน

    ขณะที่มันกำลังพูด ก็ยังได้ยินเราอยู่ ทำงานแบบ full-duplex

  • รับการขัดจังหวะ

    พูดแทรกกลางประโยคได้ มันไม่ค้าง แล้วสลับไปทำตามคำสั่งใหม่ทันที เช่น สั่งนับ 1 ถึง 10 แล้วแทรกว่าให้นับถอยหลัง มันเปลี่ยนทันที

  • จำบริบทดีขึ้น

    จดจำสิ่งที่คุยมาก่อนหน้าได้มากขึ้น

  • แปลและถอดเสียงสด

    ทำการแปลและถอดข้อความได้ระหว่างสนทนา

02จุดที่ต้องระวัง

ทั้งหมดยังเป็นข่าวหลุดจากการทดสอบ ไม่ใช่ของที่เปิดใช้จริง ยังไม่รู้วันเปิดตัว ชื่อสุดท้าย ประเทศที่จะได้ก่อน ว่าผู้ใช้ฟรีจะได้ไหม หรือมันคุยต่อเนื่องได้นานแค่ไหน รวมถึงเรื่องที่ว่าจะมาอยู่ใน Codex 2 จริงหรือเปล่าก็ยังไม่ยืนยัน

ฉะนั้นใครที่คิดจะทำสินค้าหรือบริการรอบ ๆ ฟีเจอร์นี้ ควรรอให้มีประกาศทางการก่อน อย่าเพิ่งวางแผนยาวจากสเปกที่เห็นในช่วงทดสอบ เพราะรายละเอียดอาจเปลี่ยนได้

03เกี่ยวอะไรกับเรา

ถ้า Bidi 1 ออกมาทำงานได้ตามที่เห็นในการทดสอบ จุดที่กระทบงานจริงคือเรื่อง "ขัดจังหวะ AI ได้เหมือนคุยกับคน" ซึ่งจะเปลี่ยนงานสาย voice agent ผู้ช่วยเสียง คอลเซ็นเตอร์ และการสอนผ่านเสียง เพราะบทสนทนาจะลื่นขึ้น ไม่ต้องรอผลัดกันพูดแบบหุ่นยนต์

ฟันธง: น่าจับตา แต่รอก่อน อย่าเพิ่งลงทุนปรับ flow งานเสียงทั้งระบบจากข่าวหลุด ให้รอประกาศทางการว่ามาจริง มาที่ไหน และคิดราคายังไง ระหว่างนี้ถ้าอยากเตรียมตัว ก็แค่ออกแบบ flow การคุยให้รองรับการขัดจังหวะไว้ พอของจริงมาจะได้ต่อยอดเข้า workflow ได้ทันที