Call Me Thanut
newspaperข่าวสาร

Gemini-SQL 2 ของ Google ขึ้นนำเบนช์มาร์ก BIRD ที่ 80% — ถามเป็นภาษาคน ได้ SQL ที่รันจริง

15 มิ.ย. 2026อ่าน 4 นาที
Gemini-SQL 2 ของ Google ขึ้นนำเบนช์มาร์ก BIRD ที่ 80% — ถามเป็นภาษาคน ได้ SQL ที่รันจริง
สารบัญ

สรุปให้ไว

ถามเป็นภาษาคน ได้ SQL ที่รันจริง

Gemini-SQL 2 แปลงคำถามภาษาธรรมดาเป็น query แล้วสั่งรันกับฐานข้อมูลให้เลย

ขึ้นอันดับหนึ่ง

ทำ execution accuracy 80.04% บนเบนช์มาร์ก BIRD นำ single-model leaderboard ในตอนนั้น

ยังตามคนอยู่

มนุษย์ทำได้ราว 92.96% บน BIRD ห่างกันราว 13 จุด

ยังไม่ใช่สินค้า

ยังไม่มี API, model card, รายงานเทคนิค หรือวันปล่อย เป็นผลวิจัย/เบนช์มาร์กเป็นหลัก

01มันคืออะไร

Gemini-SQL 2 คือระบบ text-to-SQL ของ Google แปลเป็นภาพจำคือ "ล่ามแปลคำถามคนเป็นภาษาฐานข้อมูล" — เราพิมพ์คำถามเป็นภาษาธรรมดา เช่น อยากรู้ยอดขายเดือนที่แล้วแยกตามจังหวัด ระบบจะแปลงเป็นคำสั่ง SQL แล้วสั่งรันกับฐานข้อมูลจริง คืนคำตอบกลับมาให้

ของแบบนี้ตอบโจทย์คนที่ต้องดึงข้อมูลจากฐานข้อมูลแต่เขียน SQL ไม่คล่อง หรือไม่อยากรอทีม data ทุกครั้งที่อยากได้ตัวเลข จุดที่ Google เคลมว่าทำได้ดีคือ "query ที่ออกมารันได้จริงและคืนผลถูก" ไม่ใช่แค่เขียนออกมาดูดี

02ตัวเลขบนเบนช์มาร์ก BIRD

BIRD คือชุดทดสอบ text-to-SQL ขนาดใหญ่ มีคู่คำถาม-SQL ทั้งหมด 12,751 คู่ ครอบคลุม 95 ฐานข้อมูล ใน 37 สาขาวิชาชีพ จุดสำคัญคือมันวัด "execution accuracy" คือดูว่า SQL ที่สร้างขึ้นรันแล้วได้ผลถูกต้องไหม ไม่ใช่แค่หน้าตา query ถูก ทำให้เป็นเบนช์มาร์กที่ใกล้งานจริงพอสมควร

Gemini-SQL 2 ทำได้ 80.04% ขึ้นอันดับหนึ่งของ single-model leaderboard ในตอนนั้น เทียบกับของเดิม Gemini-SQL ตัวก่อนอยู่ราว 77.2% ระบบ text-to-SQL ของ AWS ราว 76.5% และ Claude Opus ราว 70.1% แต่ถ้าเทียบกับมนุษย์ที่ทำได้ราว 92.96% ก็ยังห่างอยู่ราว 13 จุด แปลว่าเก่งขึ้นจริง แต่ยังไม่ถึงขั้นวางใจแทนคนได้เต็มที่

สรุปคะแนนที่อ้างถึง

  • Gemini-SQL 2

    80.04% execution accuracy บน BIRD (อันดับ 1 single-model ในตอนนั้น)

  • Gemini-SQL (ตัวก่อน)

    ราว 77.2%

  • ระบบ text-to-SQL ของ AWS

    ราว 76.5%

  • Claude Opus

    ราว 70.1%

  • มนุษย์

    ราว 92.96% (ยังนำ AI อยู่ราว 13 จุด)

03สถานะตอนนี้และทำอะไรได้เลยวันนี้

ต้องเน้นให้ชัด: ตอนที่มีข่าวนี้ Gemini-SQL 2 ยังไม่มี API, model card, รายงานเทคนิค หรือวันปล่อยที่ชัดเจน มันเป็นผลวิจัย/เบนช์มาร์กมากกว่าสินค้าที่ใช้ได้จริง Google วางทิศทางว่าจะเอาความสามารถนี้ไปฝังในชุดเครื่องมือข้อมูลของตัวเอง เช่น BigQuery และ Looker ในระดับ enterprise (อ้างถึงช่วง Cloud Next 2026)

แต่ถ้าอยากได้ workflow แบบนี้ตอนนี้เลยก็ทำเองได้ วิธีคือเอา Gemini 3.1 Pro มาใช้ ป้อน schema ของฐานข้อมูลเราเข้าไปในพรอมป์ (ให้มันรู้ว่ามีตารางอะไร คอลัมน์อะไร) แล้วให้มันช่วยเขียน SQL จากคำถามภาษาคน จากนั้นวางอีกชั้นไว้ตีความผลลัพธ์ ก็ได้ระบบ text-to-SQL เวอร์ชันทำเองที่ใช้งานได้จริงโดยไม่ต้องรอ Gemini-SQL 2

04เกี่ยวอะไรกับเรา

ฟันธง: ตัว Gemini-SQL 2 เอง "รอก่อน" เพราะยังไม่มีของให้ใช้จริง และตัวเลขมาจากแหล่งเดียว อย่าเพิ่งปักใจว่ามันพร้อม รอ API กับรายงานทางการก่อนค่อยตื่นเต้น แต่แนวคิด text-to-SQL ทั้งก้อน "ลองได้เลย" ด้วย Gemini 3.1 Pro + schema ของเรา เริ่มจากฐานข้อมูลทดสอบหรือ report ภายในก่อน

จุดที่ต้องระวังหนักคือเรื่องข้อมูลและความปลอดภัย — SQL ที่ AI สร้างต้องมีคนตรวจก่อนรันกับข้อมูลจริงเสมอ โดยเฉพาะคำสั่งที่แก้หรือลบข้อมูล (UPDATE/DELETE) และยิ่งเป็นข้อมูลบริษัทหรือลูกค้าต้องระวังเป็นพิเศษ ทางที่ปลอดภัยคือให้ AI เขียน query แต่รันบนสิทธิ์แบบอ่านอย่างเดียว (read-only) ก่อน แล้วให้คนตรวจว่า query ตรงกับที่ต้องการจริงไหม นี่คือ Human Gate ที่ห้ามข้าม

มุมต่อยอด: ทำเป็น skill ภายในทีม — รวบ schema ที่ใช้บ่อยไว้ในที่เดียว แล้วทำพรอมป์มาตรฐานให้คนในทีมถามข้อมูลเป็นภาษาคนได้ ลดงานที่ต้องรอทีม data ตลอดเวลา แต่ยังคงให้คนตรวจ query ก่อนเอาตัวเลขไปใช้ตัดสินใจจริง