Gemini-SQL 2 ของ Google ขึ้นนำเบนช์มาร์ก BIRD ที่ 80% — ถามเป็นภาษาคน ได้ SQL ที่รันจริง
สารบัญ
สรุปให้ไว
ถามเป็นภาษาคน ได้ SQL ที่รันจริง
Gemini-SQL 2 แปลงคำถามภาษาธรรมดาเป็น query แล้วสั่งรันกับฐานข้อมูลให้เลย
ขึ้นอันดับหนึ่ง
ทำ execution accuracy 80.04% บนเบนช์มาร์ก BIRD นำ single-model leaderboard ในตอนนั้น
ยังตามคนอยู่
มนุษย์ทำได้ราว 92.96% บน BIRD ห่างกันราว 13 จุด
ยังไม่ใช่สินค้า
ยังไม่มี API, model card, รายงานเทคนิค หรือวันปล่อย เป็นผลวิจัย/เบนช์มาร์กเป็นหลัก
01มันคืออะไร
Gemini-SQL 2 คือระบบ text-to-SQL ของ Google แปลเป็นภาพจำคือ "ล่ามแปลคำถามคนเป็นภาษาฐานข้อมูล" — เราพิมพ์คำถามเป็นภาษาธรรมดา เช่น อยากรู้ยอดขายเดือนที่แล้วแยกตามจังหวัด ระบบจะแปลงเป็นคำสั่ง SQL แล้วสั่งรันกับฐานข้อมูลจริง คืนคำตอบกลับมาให้
ของแบบนี้ตอบโจทย์คนที่ต้องดึงข้อมูลจากฐานข้อมูลแต่เขียน SQL ไม่คล่อง หรือไม่อยากรอทีม data ทุกครั้งที่อยากได้ตัวเลข จุดที่ Google เคลมว่าทำได้ดีคือ "query ที่ออกมารันได้จริงและคืนผลถูก" ไม่ใช่แค่เขียนออกมาดูดี
02ตัวเลขบนเบนช์มาร์ก BIRD
BIRD คือชุดทดสอบ text-to-SQL ขนาดใหญ่ มีคู่คำถาม-SQL ทั้งหมด 12,751 คู่ ครอบคลุม 95 ฐานข้อมูล ใน 37 สาขาวิชาชีพ จุดสำคัญคือมันวัด "execution accuracy" คือดูว่า SQL ที่สร้างขึ้นรันแล้วได้ผลถูกต้องไหม ไม่ใช่แค่หน้าตา query ถูก ทำให้เป็นเบนช์มาร์กที่ใกล้งานจริงพอสมควร
Gemini-SQL 2 ทำได้ 80.04% ขึ้นอันดับหนึ่งของ single-model leaderboard ในตอนนั้น เทียบกับของเดิม Gemini-SQL ตัวก่อนอยู่ราว 77.2% ระบบ text-to-SQL ของ AWS ราว 76.5% และ Claude Opus ราว 70.1% แต่ถ้าเทียบกับมนุษย์ที่ทำได้ราว 92.96% ก็ยังห่างอยู่ราว 13 จุด แปลว่าเก่งขึ้นจริง แต่ยังไม่ถึงขั้นวางใจแทนคนได้เต็มที่
สรุปคะแนนที่อ้างถึง
- ★
Gemini-SQL 2
80.04% execution accuracy บน BIRD (อันดับ 1 single-model ในตอนนั้น)
- ★
Gemini-SQL (ตัวก่อน)
ราว 77.2%
- ★
ระบบ text-to-SQL ของ AWS
ราว 76.5%
- ★
Claude Opus
ราว 70.1%
- ★
มนุษย์
ราว 92.96% (ยังนำ AI อยู่ราว 13 จุด)
03สถานะตอนนี้และทำอะไรได้เลยวันนี้
ต้องเน้นให้ชัด: ตอนที่มีข่าวนี้ Gemini-SQL 2 ยังไม่มี API, model card, รายงานเทคนิค หรือวันปล่อยที่ชัดเจน มันเป็นผลวิจัย/เบนช์มาร์กมากกว่าสินค้าที่ใช้ได้จริง Google วางทิศทางว่าจะเอาความสามารถนี้ไปฝังในชุดเครื่องมือข้อมูลของตัวเอง เช่น BigQuery และ Looker ในระดับ enterprise (อ้างถึงช่วง Cloud Next 2026)
แต่ถ้าอยากได้ workflow แบบนี้ตอนนี้เลยก็ทำเองได้ วิธีคือเอา Gemini 3.1 Pro มาใช้ ป้อน schema ของฐานข้อมูลเราเข้าไปในพรอมป์ (ให้มันรู้ว่ามีตารางอะไร คอลัมน์อะไร) แล้วให้มันช่วยเขียน SQL จากคำถามภาษาคน จากนั้นวางอีกชั้นไว้ตีความผลลัพธ์ ก็ได้ระบบ text-to-SQL เวอร์ชันทำเองที่ใช้งานได้จริงโดยไม่ต้องรอ Gemini-SQL 2
04เกี่ยวอะไรกับเรา
ฟันธง: ตัว Gemini-SQL 2 เอง "รอก่อน" เพราะยังไม่มีของให้ใช้จริง และตัวเลขมาจากแหล่งเดียว อย่าเพิ่งปักใจว่ามันพร้อม รอ API กับรายงานทางการก่อนค่อยตื่นเต้น แต่แนวคิด text-to-SQL ทั้งก้อน "ลองได้เลย" ด้วย Gemini 3.1 Pro + schema ของเรา เริ่มจากฐานข้อมูลทดสอบหรือ report ภายในก่อน
จุดที่ต้องระวังหนักคือเรื่องข้อมูลและความปลอดภัย — SQL ที่ AI สร้างต้องมีคนตรวจก่อนรันกับข้อมูลจริงเสมอ โดยเฉพาะคำสั่งที่แก้หรือลบข้อมูล (UPDATE/DELETE) และยิ่งเป็นข้อมูลบริษัทหรือลูกค้าต้องระวังเป็นพิเศษ ทางที่ปลอดภัยคือให้ AI เขียน query แต่รันบนสิทธิ์แบบอ่านอย่างเดียว (read-only) ก่อน แล้วให้คนตรวจว่า query ตรงกับที่ต้องการจริงไหม นี่คือ Human Gate ที่ห้ามข้าม
มุมต่อยอด: ทำเป็น skill ภายในทีม — รวบ schema ที่ใช้บ่อยไว้ในที่เดียว แล้วทำพรอมป์มาตรฐานให้คนในทีมถามข้อมูลเป็นภาษาคนได้ ลดงานที่ต้องรอทีม data ตลอดเวลา แต่ยังคงให้คนตรวจ query ก่อนเอาตัวเลขไปใช้ตัดสินใจจริง