DeepMind โชว์ AI co-clinician คุยวิดีโอ ดูอาการ และทำคะแนนสูสีหมอจริง
สารบัญ
สรุปให้ไว
คุยวิดีโอได้จริง
AI การแพทย์ตัวนี้ทำ video consult แบบ low-latency เห็นคนไข้ สังเกตอาการ และนำตรวจร่างกายไปทีละขั้น
หมอจริงเลือกมันมากกว่า
ในการทดสอบแบบ blind หมอชอบงานของมันมากกว่า agent การแพทย์ตัวเดิม 67% ต่อ 26%
พลาดน้อยมาก
98 เคสปฐมภูมิ ไม่มี critical error เลย 97 เคส และชนะระบบอื่นบน benchmark เรื่องยา
ยังเป็นผู้ช่วย ไม่ใช่แทนหมอ
ทีมวางตัวเป็น supportive tool งานวิจัยล้วน ยังไม่ใช่ของใช้ในคลินิกทั่วไป
01มันทำอะไรได้
DeepMind โชว์สิ่งที่เรียกว่า AI co-clinician คือ AI การแพทย์แบบ multimodal ที่ไม่ได้แค่พิมพ์ถาม-ตอบ แต่เข้าไปคุยกับคนไข้ผ่านวิดีโอแบบ real-time และ low-latency หมายความว่ามันตอบโต้ได้ทันแบบคุยสด ไม่หน่วงจนเสียจังหวะการซักประวัติ
ที่น่าสนใจคือมันไม่ได้ฟังอย่างเดียว แต่ "มอง" คนไข้ด้วย มันสังเกตอาการที่เห็นจากภาพ และนำคนไข้ให้ตรวจร่างกายตัวเองทีละขั้น เช่นบอกว่าให้ขยับตรงไหน กดตรงไหน ดูอะไร ทำให้มันได้ข้อมูลมากกว่าแชทบอตการแพทย์แบบเดิมที่อาศัยแค่ตัวอักษร
02ผลทดสอบเทียบกับหมอจริง
ทีมทดสอบแบบ blind คือให้หมอประเมินงานโดยไม่รู้ว่าอันไหนเป็นของ AI ตัวไหน ผลคือหมอเลือกงานของ co-clinician มากกว่า clinician agent ตัวที่มีอยู่เดิมที่ 67% ต่อ 26% และเมื่อเทียบกับ GPT-5.4 ที่ต่อ web search ก็ยังถูกเลือกมากกว่าที่ 63% ต่อ 30%
ด้านความปลอดภัย ในชุดคำถามปฐมภูมิ 98 ข้อ มันไม่มี critical error เลยถึง 97 ข้อ และทำคะแนนเหนือกว่าระบบ frontier ตัวอื่นบน RXQA ซึ่งเป็น benchmark วัดความแม่นเรื่องยา
แต่จุดที่ต้องอ่านให้ครบคือชุดทดสอบ 20 สถานการณ์จำลอง ที่แตกย่อยเป็น 140 แง่มุม AI เสมอหรือเหนือกว่าหมอปฐมภูมิแค่ 68 จาก 140 แง่มุม แปลว่าโดยรวมหมอยังชนะ โดยเฉพาะเรื่องการจับ red flag หรือสัญญาณอันตรายที่ต้องส่งต่อด่วน
ตัวเลขสำคัญ
- ★
67% ต่อ 26%
สัดส่วนที่หมอเลือกงานของ co-clinician มากกว่า clinician agent ตัวเดิมในการประเมินแบบ blind
- ★
63% ต่อ 30%
สัดส่วนที่ถูกเลือกมากกว่า GPT-5.4 ที่ต่อ web search
- ★
97 จาก 98
เคสคำถามปฐมภูมิที่ไม่มี critical error เลย
- ★
68 จาก 140
แง่มุมที่ AI เสมอหรือเหนือหมอปฐมภูมิ (โดยรวมหมอยังชนะ)
- ★
6 ประเทศ
ทดสอบเฉพาะงานวิจัยกับพาร์ตเนอร์ใน US, India, Australia, NZ, Singapore, UAE
03เกี่ยวอะไรกับเรา
ตัวเลขชุดนี้เก่งจริงและน่าตื่นเต้น แต่สิ่งที่ทีมพูดชัดที่สุดคือมันเป็น supportive tool ผู้ช่วย ไม่ใช่ตัวแทนหมอ ตอนนี้ยังเป็นงานวิจัยที่ทดลองกับพาร์ตเนอร์ในไม่กี่ประเทศ ยังไม่ใช่ของที่จะมาเปิดให้ใครก็โหลดใช้รักษาคนได้ทันที
มองแบบคนทำงานจริง บทเรียนที่ข้ามมาใช้ได้เลยคือเรื่อง Human Gate คือจุดที่คนต้องเป็นคนตรวจและตัดสินใจขั้นสุดท้าย ยิ่งงานที่ผลพลาดแล้วกระทบชีวิตคนหรือเงิน ยิ่งต้องมีคนคุมท้ายเสมอ ข้อมูลของ DeepMind เองก็ยืนยันมุมนี้ ที่ว่าหมอยังจับ red flag ได้ดีกว่า เพราะของแบบนั้นพลาดไม่ได้
ต่อยอดกับงานเรา ถ้าคุณอยากเอา AI multimodal แบบนี้มาใช้ในสายงานตัวเอง ให้คิดเป็น workflow ที่ AI ทำงานหนักช่วงรวบรวมและร่าง แล้ววางคนไว้ที่ Human Gate ก่อนส่งออกจริงทุกครั้ง ไม่ใช่เรื่องการแพทย์อย่างเดียว แต่เป็นหลักเดียวกับงานลูกค้า งานเอกสารสำคัญ หรืออะไรก็ตามที่ตัดสินใจผิดแล้วแก้ยาก เก่งแค่ไหนก็ยังต้องมีคนเซ็นรับท้ายงาน