MAMMAL — โมเดล foundation ด้านชีววิทยาที่รวมเคมี พันธุกรรม และโปรตีนไว้ในตัวเดียว
สารบัญ
สรุปให้ไว
MAMMAL คือ foundation model ด้านชีววิทยา
รวมสามโลกที่ปกติแยกกัน คือ เคมี พันธุกรรม และโครงสร้างโปรตีน ไว้ในโมเดลเดียว เทรนด้วยข้อมูลราว 2 พันล้านตัวอย่างจากหลายฐานข้อมูล
ทำ state-of-the-art บน 11 benchmark ด้านค้นพบยา
ไม่ใช่เก่งงานเดียว แต่ทำได้ดีระดับนำในหลายงานพร้อมกัน
ทำนายยามะเร็งได้ตรงผลทดลองจริง
ทำนายว่ายา carfilzomib แรงสุดกับเนื้องอกแข็ง ตรงกับผลแล็บจริงราว 95% ของชนิดเซลล์ ทั้งที่ยานี้ถูกอนุมัติใช้กับมะเร็งเลือดเท่านั้น
เอาชนะ AlphaFold 3 ในบางงาน
จับคู่ antibody กับเป้าหมายได้ถูก 5 จาก 7 เป้า เพราะจัดการส่วนโปรตีนที่ "ยืดหยุ่น" ได้ดีกว่า — แต่ย้ำว่ายังเป็นงานวิจัย ไม่ใช่ของใช้ทั่วไป
01MAMMAL คืออะไร — รวมเคมี พันธุกรรม และโปรตีนไว้ในโมเดลเดียว
ภาพจำง่าย ๆ ของ MAMMAL คือ "ผู้เชี่ยวชาญหลายสาขาในคนเดียว" — ปกติงานด้านชีววิทยาจะแยกกันอยู่คนละโลก คือฝั่งเคมี (ตัวยา โมเลกุล) ฝั่งพันธุกรรม (DNA) และฝั่งโครงสร้างโปรตีน ต่างมีโมเดลเฉพาะทางของตัวเอง MAMMAL จับสามโลกนี้มารวมเป็น foundation model ตัวเดียวที่เข้าใจทั้งสามแบบไปพร้อมกัน คำว่า foundation model ในที่นี้คือโมเดลฐานขนาดใหญ่ที่เทรนกับข้อมูลกว้าง แล้วเอาไปต่อยอดทำงานย่อยได้หลายอย่าง คล้ายกับ LLM ฝั่งภาษา แต่นี่เป็นฝั่งชีววิทยา
คำว่า "หลายโหมด" (multimodal) ก็มาจากตรงนี้ — มันไม่ได้อ่านข้อมูลแค่ชนิดเดียว แต่รับได้ทั้งโครงสร้างเคมี ลำดับพันธุกรรม และโครงสร้างโปรตีนในตัวเดียวกัน ความได้เปรียบคือเมื่อทุกอย่างอยู่ในโมเดลเดียว มันมองเห็นความเชื่อมโยงข้ามสาขาที่โมเดลแยกส่วนมองไม่เห็น ตัวเลขที่บอกขนาดของงานนี้คือมันถูกเทรนด้วยตัวอย่างราว 2 พันล้านตัวอย่างจากหลายฐานข้อมูล ซึ่งเป็นเหตุผลหนึ่งที่ทำให้มันครอบคลุมงานได้กว้าง
02ทำอะไรได้ — 11 SOTA, ทำนายยามะเร็งตรงผลจริง, ชนะ AlphaFold 3 บางงาน
จุดที่ทำให้ MAMMAL น่าสนใจไม่ใช่แค่ "ทำได้" แต่คือ "ทำได้ดีระดับนำในหลายงานพร้อมกัน" — มันทำ state-of-the-art (คือผลดีที่สุดเท่าที่มีในตอนนี้) บน 11 benchmark ด้านค้นพบยา การที่โมเดลตัวเดียวขึ้นนำได้ถึง 11 งานคือสัญญาณว่ามันไม่ได้เก่งแบบเฉพาะทางแคบ ๆ แต่เก่งกว้าง
ตัวอย่างที่จับต้องได้สุดคือการทดสอบยามะเร็ง — MAMMAL ทำนายว่ายา carfilzomib จะออกฤทธิ์แรงสุดกับเนื้องอกแข็ง ซึ่งน่าสนใจเพราะยาตัวนี้ถูกอนุมัติให้ใช้กับมะเร็งเลือดเท่านั้น แล้วผลทำนายของมันตรงกับผลทดลองจริงราว 95% ของชนิดเซลล์ที่ทดสอบ พูดง่าย ๆ คือมันชี้เป้าได้ว่า "ยาที่มีอยู่แล้วอาจใช้กับมะเร็งชนิดอื่นได้" ซึ่งเป็นโจทย์ใหญ่ของวงการค้นพบยา
อีกงานที่เด่นคือการเทียบกับ AlphaFold 3 ในเรื่องจับคู่ antibody กับเป้าหมาย (antibody-target) MAMMAL จับคู่ได้ถูก 5 จาก 7 เป้า เหตุผลที่มันทำได้ดีกว่าในงานนี้คือมันจัดการส่วนของโปรตีนที่ "ยืดหยุ่น" คือบิดงอเปลี่ยนรูปได้ ซึ่งเป็นจุดที่ทำนายยาก ได้ดีกว่า ภาพจำคือ ถ้าโปรตีนเป็นกุญแจกับแม่กุญแจ ส่วนที่ยืดหยุ่นนี้เหมือนกุญแจที่เปลี่ยนรูปได้ตลอด การทายว่ามันจะเข้าล็อกไหนจึงยากเป็นพิเศษ
03เกี่ยวอะไรกับเรา — ทำไม AI กับการค้นพบยาถึงสำคัญ
ถึงเราส่วนใหญ่จะไม่ได้ทำงานสายวิจัยยา แต่เรื่องนี้สำคัญในมุมภาพรวม — มันคือตัวอย่างชัด ๆ ว่า AI กำลังขยับจาก "ช่วยเขียนงาน ตอบคำถาม" ไปสู่ "ช่วยงานวิทยาศาสตร์ที่จับต้องได้จริง" อย่างการค้นพบยา การค้นพบยาปกติเป็นงานที่ใช้เวลานานและแพงมาก ทุกครั้งที่ AI ช่วยชี้เป้าได้แม่นขึ้น เช่นบอกได้ว่ายาที่มีอยู่แล้วน่าจะใช้กับโรคอื่นได้ มันคือการประหยัดทั้งเวลาและทรัพยากรของวงการ
มุมที่เชื่อมกับวิธีทำงานของเราคือแนวคิด "รวมหลายอย่างไว้ในโมเดลเดียวแล้วได้เปรียบ" — MAMMAL เก่งขึ้นเพราะเห็นความเชื่อมโยงข้ามสาขาที่โมเดลแยกส่วนมองไม่เห็น เป็นบทเรียนเดียวกับการวาง workflow ของเรา คือบางทีการรวมบริบทให้ครบในที่เดียวให้ผลดีกว่าการแยกชิ้นทำทีละส่วน
ฟันธงแบบคนทำจริง — เรื่องนี้ "ยังเป็นงานวิจัย ไม่ใช่ของใช้ทั่วไป" ไม่มีอะไรให้เรากดลองวันนี้ และไม่ควรเอาตัวเลขอย่าง 95% หรือ "ชนะ AlphaFold 3" ไปสรุปว่าใช้รักษาคนได้แล้ว ผลทดลองในแล็บกับการใช้จริงกับคนไข้ยังห่างกันอีกหลายขั้น ใช้ข่าวนี้เป็นเข็มทิศว่า AI สายวิทยาศาสตร์กำลังโตในทิศไหน ส่วนของที่ใช้ได้จริงค่อยตามเมื่อมันออกจากเฟสวิจัยมา
จุดเด่นของ MAMMAL แบบสรุป
- ★
รวมสามสาขาในโมเดลเดียว
เคมี พันธุกรรม และโครงสร้างโปรตีน เป็น foundation model หลายโหมด (multimodal)
- ★
เทรนด้วยข้อมูลราว 2 พันล้านตัวอย่าง
จากหลายฐานข้อมูล ทำให้ครอบคลุมงานได้กว้าง
- ★
state-of-the-art บน 11 benchmark ด้านค้นพบยา
เก่งกว้างหลายงาน ไม่ใช่เฉพาะทางแคบ
- ★
ทำนายยา carfilzomib กับเนื้องอกแข็ง ตรงผลจริงราว 95% ของชนิดเซลล์
ทั้งที่ยานี้อนุมัติใช้กับมะเร็งเลือดเท่านั้น
- ★
ชนะ AlphaFold 3 เรื่องจับคู่ antibody-target 5 จาก 7 เป้า
เพราะจัดการส่วนโปรตีนที่ยืดหยุ่นได้ดีกว่า
- ★
ยังเป็นงานวิจัย
ไม่ใช่ของใช้ทั่วไป ของใช้จริงกับคนไข้ยังอีกหลายขั้น