puzzleOpen Source

Kimi K2.7 Code - โมเดลโค้ด 1T MoE, context 256K, ใช้ thinking token น้อยลง 30%

13 มิ.ย. 2026อ่าน 4 นาที

สารบัญ

สรุปให้ไว

Kimi K2.7 Code โผล่แล้ว

โมเดลสายโค้ดแบบ MoE ~1 ล้านล้านพารามิเตอร์

context window 256K

รับงาน long-horizon ได้

ใช้ thinking token น้อยลง ~30%

เทียบ K2.6 แต่คะแนนสูงกว่า

benchmark เป็นของผู้ผลิตเอง

ยังไม่มีผลทดสอบอิสระ

01มันคืออะไร

Moonshot ปล่อย Kimi K2.7 หรือที่เรียกว่า K2.7 Code โมเดลแบบ mixture-of-experts ขนาดราว 1 ล้านล้านพารามิเตอร์ พร้อม context window 256K โทเคน วางตำแหน่งเป็น "builder" ที่เน้นสร้างงานจริงมากกว่าเป็นแชตบอตตอบคำถาม

โมเดลเปิดให้ใช้ผ่าน coding subscription plan และใช้ได้กับ agent หลายตัว โดย harness ยอดนิยมที่ใช้ร่วมกับมันได้แก่ Sakura, Hermes, Cline, Open Claw และ Pi

02benchmark บอกอะไร

ตัวเลขที่ออกมาเป็น benchmark ของ Moonshot เอง ยังไม่มีผลทดสอบอิสระมายืนยัน โดยเทียบกับ K2.6 พบว่าดีขึ้นในหลายตัว เช่น benchmark สาย agentic coding ขยับจาก 50.9 เป็น 62.0 และบน benchmark สาย agentic tool-use ตัว K2.7 Code ทำได้ 81.1% เทียบกับ Claude Opus 4.8 ที่ 76.4%

จุดที่น่าสนใจคือ Moonshot ระบุว่า K2.7 Code ใช้ thinking token น้อยลงราว 30% เทียบ K2.6 แต่กลับทำคะแนนได้สูงกว่าในชุด benchmark โค้ดของตัวเอง หมายถึงทำงานได้มากขึ้นในต้นทุนโทเคนที่น้อยลง

ตรงนี้ต้องย้ำว่าเป็นตัวเลขฝั่งผู้ผลิต ควรรอผลทดสอบจากสำนักอิสระก่อนเชื่อทั้งหมด

จุดที่ควรรู้ก่อนลอง

★
โครงสร้าง MoE ~1T พารามิเตอร์
เน้นงานโค้ดแบบ agentic
★
context 256K
รองรับ task ยาว ๆ
★
อยู่บน subscription plan
จ่ายรายเดือนแทนจ่ายตาม token
★
ใช้ข้าม harness ได้
Hermes, Cline, Open Claw, Pi และอื่น ๆ
★
ตัวเลขเป็นของผู้ผลิต
ยังไม่มี benchmark อิสระ

03เกี่ยวอะไรกับเรา

เสน่ห์ของ K2.7 Code คือความรู้สึกใกล้ Claude เวลาเขียนโค้ด แต่จ่ายเป็น subscription รายเดือนแทนจ่ายตาม token ทำให้เหมาะกับงาน long-horizon ที่ปล่อยให้มันทำเองหลังบ้านได้นาน ๆ โดยไม่ต้องกลัวบิลพุ่ง

ฟันธง: ลองเป็นตัว coder ราคาประหยัดสำหรับงานสร้างจริง แต่อย่าเพิ่งปักใจกับตัวเลข benchmark เพราะเป็นของผู้ผลิตเอง รอผลอิสระมายืนยันก่อน และอย่าลืม Human Gate ตรงจุดที่ agent ทำงานเองยาว ๆ โดยเฉพาะงานที่แตะไฟล์สำคัญ

ต่อยอด: วางไว้เป็นโมเดลหลักสำหรับงานโค้ดที่ใช้ปริมาณมาก ตั้ง budget และ checkpoint ให้มีคนตรวจเป็นระยะ แล้วเก็บ frontier ตัวแพงไว้เฉพาะตอนต้องการคุณภาพสูงสุดจริง ๆ