หลุดโมเดลเสียง OpenAI "Bidi 1" — พูดและฟังพร้อมกัน ขัดจังหวะได้เหมือนคุยกับคน
สารบัญ
สรุปให้ไว
ข่าวหลุด ยังไม่ทางการ
มีคนพบโมเดลเสียงใหม่ชื่อ Bidi 1 โผล่ในการทดสอบกับผู้ใช้บางกลุ่ม
พูดและฟังพร้อมกัน
Bidi ย่อมาจาก bidirectional คือทำงานสองทางพร้อมกัน ไม่ใช่ผลัดกันพูดทีละฝั่ง
ขัดจังหวะได้
รับการพูดแทรกกลางประโยคโดยไม่ค้าง และสลับงานทันที
อาจไปอยู่ใน Codex
มีรายงานว่าอาจมาถึง Codex 2 ให้สั่งโค้ดด้วยเสียงแบบคุยโต้ตอบ แต่ยังไม่ยืนยัน
01มันคืออะไร
มีแหล่งที่ตามจับฟีเจอร์ทดสอบพบโมเดลเสียงใหม่ของ OpenAI ชื่อ Bidi 1 โผล่ให้ผู้ใช้บางกลุ่มในช่วงทดสอบ ย้ำก่อนว่ายังไม่มีประกาศทางการ ให้ถือเป็นข่าวหลุด ไม่ใช่การเปิดตัวจริง
ชื่อ Bidi ย่อมาจาก bidirectional แปลง่าย ๆ คือทำงานสองทางพร้อมกัน ไม่ได้นั่งเงียบรอจนเราพูดจบ และไม่ได้เพิกเฉยตอนมันกำลังพูด แต่พูด ฟัง และปรับตัวได้พร้อมกันแบบเรียลไทม์ ซึ่งเป็นจุดที่โมเดลเสียงรุ่นก่อนมักทำได้ไม่ดี
สิ่งที่มีคนเห็นในการทดสอบ
- ★
พูดและฟังพร้อมกัน
ขณะที่มันกำลังพูด ก็ยังได้ยินเราอยู่ ทำงานแบบ full-duplex
- ★
รับการขัดจังหวะ
พูดแทรกกลางประโยคได้ มันไม่ค้าง แล้วสลับไปทำตามคำสั่งใหม่ทันที เช่น สั่งนับ 1 ถึง 10 แล้วแทรกว่าให้นับถอยหลัง มันเปลี่ยนทันที
- ★
จำบริบทดีขึ้น
จดจำสิ่งที่คุยมาก่อนหน้าได้มากขึ้น
- ★
แปลและถอดเสียงสด
ทำการแปลและถอดข้อความได้ระหว่างสนทนา
02จุดที่ต้องระวัง
ทั้งหมดยังเป็นข่าวหลุดจากการทดสอบ ไม่ใช่ของที่เปิดใช้จริง ยังไม่รู้วันเปิดตัว ชื่อสุดท้าย ประเทศที่จะได้ก่อน ว่าผู้ใช้ฟรีจะได้ไหม หรือมันคุยต่อเนื่องได้นานแค่ไหน รวมถึงเรื่องที่ว่าจะมาอยู่ใน Codex 2 จริงหรือเปล่าก็ยังไม่ยืนยัน
ฉะนั้นใครที่คิดจะทำสินค้าหรือบริการรอบ ๆ ฟีเจอร์นี้ ควรรอให้มีประกาศทางการก่อน อย่าเพิ่งวางแผนยาวจากสเปกที่เห็นในช่วงทดสอบ เพราะรายละเอียดอาจเปลี่ยนได้
03เกี่ยวอะไรกับเรา
ถ้า Bidi 1 ออกมาทำงานได้ตามที่เห็นในการทดสอบ จุดที่กระทบงานจริงคือเรื่อง "ขัดจังหวะ AI ได้เหมือนคุยกับคน" ซึ่งจะเปลี่ยนงานสาย voice agent ผู้ช่วยเสียง คอลเซ็นเตอร์ และการสอนผ่านเสียง เพราะบทสนทนาจะลื่นขึ้น ไม่ต้องรอผลัดกันพูดแบบหุ่นยนต์
ฟันธง: น่าจับตา แต่รอก่อน อย่าเพิ่งลงทุนปรับ flow งานเสียงทั้งระบบจากข่าวหลุด ให้รอประกาศทางการว่ามาจริง มาที่ไหน และคิดราคายังไง ระหว่างนี้ถ้าอยากเตรียมตัว ก็แค่ออกแบบ flow การคุยให้รองรับการขัดจังหวะไว้ พอของจริงมาจะได้ต่อยอดเข้า workflow ได้ทันที