puzzleOpen Source

Meituan LongCat 2.0 — โมเดลเปิด 1.6 ล้านล้านพารามิเตอร์ ฝึกบนชิปนอกค่าย Nvidia

30 มิ.ย. 2026อ่าน 5 นาที

สารบัญ

สรุปให้ไว

บริษัทส่งอาหารทำโมเดลยักษ์

Meituan (เจ้าของแอปส่งอาหารและบริการในจีน) ปล่อย LongCat 2.0 โมเดลภาษาแบบ MoE ขนาด 1.6 ล้านล้านพารามิเตอร์

ใหญ่ระดับสถิติ

active ราว 48 พันล้านพารามิเตอร์ต่อโทเค็น ถ้า weights ขึ้นครบจริง อาจเป็นโมเดลเปิด (open weights) ที่ใหญ่ที่สุดเท่าที่เคยมี

ประเด็นเด็ดอยู่ที่ชิป

ฝึกและดีพลอยบนฮาร์ดแวร์เร่งความเร็วที่ไม่ใช่สาย Nvidia ฝึกบนข้อมูลกว่า 35 ล้านล้านโทเค็น

ของจริงยังต้องรอ

weights ยังทยอยอัปขึ้น Hugging Face และ API/coding plan เปิดเฉพาะในจีน เทสต์ผ่านเว็บแชตฟรีแล้วงาน oneshot ยังไม่น่าประทับใจ

01LongCat 2.0 คืออะไร

LongCat 2.0 คือโมเดลภาษาเปิดรุ่นใหม่จาก Meituan บริษัทที่คนส่วนใหญ่รู้จักในฐานะแพลตฟอร์มส่งอาหารและบริการในเมืองของจีน ไม่ใช่แล็บ AI แบบ OpenAI, Anthropic, Google หรือ DeepSeek แต่กลับเดินหน้าปั้นโมเดลขนาดมหึมาออกมาเรื่อย ๆ รุ่นแรก (LongCat) ก็ใหญ่อยู่แล้วที่ราว 560 พันล้านพารามิเตอร์ และรอบนี้กระโดดขึ้นอีกหลายเท่าตัว

ตัวเลขที่ทำให้คนพูดถึงคือ 1.6 ล้านล้านพารามิเตอร์รวม โดยเป็นสถาปัตยกรรมแบบ mixture of experts (MoE) ที่จริง ๆ แล้ว active เพียงราว 48 พันล้านพารามิเตอร์ต่อโทเค็น — แปลว่าตัวโมเดลใหญ่มหาศาล แต่เวลาทำงานจริงจะเรียกใช้ "ผู้เชี่ยวชาญ" เฉพาะส่วนที่เกี่ยวข้อง เพื่อคุมต้นทุนการประมวลผล ตอนนี้หน้า Hugging Face มีอยู่แล้วแต่ model card ระบุว่า weights "coming soon" จึงยังโหลดตัวเต็มมารันเองไม่ได้

02มีอะไรในเชิงเทคนิค

นอกจากขนาด Meituan ยังปรับสถาปัตยกรรมหลายอย่างเพื่อเน้นงาน context ยาวและงานแบบ agent พวกเขาใส่กลไกชื่อ LongCat sparse attention เพื่อทำให้การจัดการ context ยาวมีประสิทธิภาพขึ้น และบอกว่าฝึกบนข้อมูล context ขนาด 1 ล้านโทเค็นหลายแสนล้านโทเค็น ชี้ชัดว่าโมเดลถูกผลักไปทางงานยาว ๆ อย่าง coding, agent และ research

อีกชิ้นที่น่าสนใจคือ engram embedding module ที่ขยายพื้นที่ embedding และช่วยให้ใช้พารามิเตอร์คุ้มขึ้น โดยมีพารามิเตอร์ราว 135 พันล้านมาจากส่วนนี้ส่วนเดียว แต่จุดที่เป็นข่าวใหญ่ที่สุดอาจไม่ใช่ตัวเลขโมเดล หากเป็นเรื่อง "ฝึกที่ไหน" — Meituan บอกว่าการฝึกเต็มรูปและการดีพลอยขนาดใหญ่ไม่ได้ใช้ชุด GPU แบบ Nvidia ที่ทุกคนพูดถึง แต่สร้างบน super pod ที่ใช้ตัวเร่งความเร็วทางเลือก และพรีเทรนบนข้อมูลกว่า 35 ล้านล้านโทเค็น

สรุปสเปกสำคัญ

★
พารามิเตอร์รวม
ราว 1.6 ล้านล้าน (MoE), active ~48 พันล้านต่อโทเค็น
★
โฟกัส context ยาว
LongCat sparse attention + ฝึกบนข้อมูล context 1 ล้านโทเค็น
★
engram embedding
ขยาย embedding space ราว 135 พันล้านพารามิเตอร์มาจากส่วนนี้
★
ฮาร์ดแวร์
ฝึก/ดีพลอยบน super pod ที่ไม่ใช่ Nvidia, พรีเทรน 35 ล้านล้านโทเค็น
★
สถานะการเข้าถึง
weights ทยอยอัปขึ้น Hugging Face, API และ coding plan เปิดเฉพาะในจีน, มีเว็บแชตฟรีให้ลอง

03ของจริงเทสต์แล้วเป็นยังไง

ตรงนี้ต้องอ่านแบบมีสติ เพราะเบนช์มาร์กของ Meituan เองที่เทียบกับ GPT-5.5, Claude Opus, Gemini 3.1 Pro และตัวอื่น ๆ ออกมาดูดี โดยเฉพาะงาน agentic coding และ long context แต่เบนช์มาร์กหลายตัวเป็นแบบ agentic ที่ให้โมเดลทำงานผ่าน harness เช่น Claude Code, OpenClaw หรือ Hermes ได้แก้ไฟล์ รันคำสั่ง และเดินงานต่อเนื่อง

ปัญหาคือคนนอกจีนยังเทสต์แบบนั้นไม่ได้ เพราะ API และ coding plan เปิดเฉพาะในจีน เหลือแค่เว็บแชตฟรีให้ลอง และผลจากการทดสอบแบบ oneshot ผ่านเว็บแชต โมเดลทำได้ไม่ดีนัก — บนชุดทดสอบ creative coding หนึ่ง LongCat 2.0 ได้ราว 21.6% อยู่เหนือ MiMo V2.5 เพียงเล็กน้อยและต่ำกว่าโมเดลแรง ๆ ส่วนใหญ่บนกระดาน ข้อสังเกตคือโมเดลที่เทรนมาเพื่องาน agent มักไม่โดดเด่นเวลาสั่งทำงานจบในคำตอบเดียว แต่จะดีขึ้นมากเมื่ออยู่ในลูป agent ที่ได้วางแผน เขียนไฟล์ รันคำสั่ง และแก้ทีละรอบ — ซึ่งยังต้องรอพิสูจน์เมื่อ weights หรือ API เปิดให้คนนอกจีนใช้

04เกี่ยวอะไรกับเรา

ฟันธงแบบคนทำงาน: ตอนนี้ยัง "รอก่อน" สำหรับการใช้งานจริง เพราะ weights ยังไม่ครบและช่องทางที่ใช้ได้นอกจีนคือเว็บแชตฟรีที่ผลยังไม่น่าประทับใจ อย่าเพิ่งย้ายงานสำคัญมาพึ่งมันในตอนนี้ ให้ติดตามวันที่ weights ขึ้น Hugging Face ครบ แล้วค่อยลองเสียบเข้า agent harness ที่เราใช้อยู่เพื่อวัดของจริง

แต่ในเชิงทิศทางอุตสาหกรรม นี่คือสัญญาณที่ควรจับตา — ถ้าบริษัทส่งอาหารปล่อยโมเดลเปิดเกือบ 2 ล้านล้านพารามิเตอร์ที่ฝึกบนชิปนอกค่าย Nvidia ได้จริง มันกดดันทั้งแล็บที่ปิดโมเดลและตอกย้ำว่า frontier-scale training ไม่จำเป็นต้องผูกกับฮาร์ดแวร์เจ้าเดียว สำหรับคนไทยที่วางแผนระยะยาว นี่แปลว่าโมเดลเปิดที่ใหญ่และฟรีจะมีให้เลือกมากขึ้นเรื่อย ๆ ซึ่งเป็นข่าวดีต่อต้นทุนและความเป็นส่วนตัวของข้อมูล วิธีเตรียมตัวที่คุ้มที่สุดคือทำ workflow ของเราให้สลับโมเดลได้ง่าย (ผ่าน Ollama หรือ harness ที่รองรับหลายโมเดล) เพื่อพอของแรง ๆ แบบเปิดมาถึง จะได้ทดสอบและสลับมาใช้ได้ทันทีโดยไม่ต้องรื้อระบบ