GLM 5.2 มีผลทดสอบอิสระแล้ว — แรงสุดในกลุ่ม open model พร้อม Z-Code ฟรี 5 ล้าน token/วัน
สารบัญ
สรุปให้ไว
ผลอิสระมาแล้ว
Artificial Analysis ให้ GLM 5.2 (max) ที่ 51 เป็น open-weights คะแนนสูงสุด ห่างรุ่นปิดไม่กี่แต้ม
เร็วและราคารู้แล้ว
วัดได้ราว 106 token/วินาที, API $1.40/ล้าน input และ $4.40/ล้าน output
งานโค้ดใกล้รุ่นท็อป
Terminal Bench 2.1 ได้ 81 ตาม Opus 4.8 (85) และ GPT-5.5 (84) ไม่ไกล
Z-Code ฟรี
harness สไตล์ Codex สำหรับ GLM ให้ลองฟรี 5 ล้าน token ต่อวันบน GLM 5.2
01ใหม่ตรงไหนจากตอนเปิดตัว
ตอน GLM 5.2 เปิดตัว ตัวเลขที่เห็นยังเป็นของฝั่งผู้ผลิตเอง รอบนี้มีผลจากสำนักทดสอบอิสระออกมาแล้ว บน Artificial Analysis Intelligence Index ซึ่งรวมเก้าการทดสอบทั้งโค้ด วิทยาศาสตร์ ความรู้ การใช้ tool และ long context รุ่น max ของ GLM 5.2 ทำได้ 51 คะแนน ขึ้นเป็นโมเดล open-weights ที่คะแนนสูงสุด และห่างจากรุ่นปิดชั้นนำแค่ไม่กี่แต้ม
ฝั่งความเร็วและราคาก็มีตัวเลขที่วัดจริงแล้ว Artificial Analysis วัดได้ราว 106 output token ต่อวินาที ซึ่งเร็วกว่าค่าเฉลี่ยของ open model ที่เทียบกันได้ ส่วนโหมด max ค่อนข้างพูดเยอะ และราคา API ที่วัดได้คือ $1.40 ต่อล้าน input กับ $4.40 ต่อล้าน output ถือว่าแพงเมื่อเทียบกับ open-weights หลายตัว แต่ยังถูกกว่ารุ่นปิดชั้นนำ
02ตัวเลขงานโค้ดที่ทดสอบอิสระ
บน Terminal Bench 2.1 GLM 5.2 ได้ 81 กระโดดจาก 63.5 ของ GLM 5.1 เทียบกับ Opus 4.8 ที่ 85, GPT-5.5 ที่ 84 และ Gemini 3.1 Pro ที่ 74 แปลว่าตามรุ่นปิดชั้นนำมาไม่กี่แต้ม ส่วน SWE-Bench Pro ได้ 62.1 ขณะที่ Opus อยู่ที่ 69.2
แต่พอเป็นงานยาว ๆ ช่องว่างเริ่มเห็น บน Frontier Sway ที่วัดงานหลายชั่วโมง GLM 5.2 ได้ 74 ใกล้ Opus ที่ 75 มาก แต่บน SE Marathon ที่เป็นงานยาวและยุ่งสุด เช่น สร้าง compiler หรือ optimize kernel GLM 5.2 ได้ 13 ขณะที่ Opus ได้ 26 หรือเท่าตัว สรุปคือเก่งจริงในหลายด้าน แต่รุ่นปิดยังนำชัดในงานวิศวกรรมที่ยาวและซับซ้อนสุด
Z-Code — harness ฟรีสำหรับ GLM
- ★
ฟรี 5 ล้าน token/วัน
ใช้กับ GLM 5.2 ได้ทุกวัน และให้ลิมิตดีกว่าเครื่องมืออื่นเมื่ออยู่บน coding plan
- ★
หน้าตาแบบ Codex
มี skills marketplace, MCP servers, plugins, preview เบราว์เซอร์ในตัว, แก้โดยอ้างอิง element
- ★
สั่งงานทางไกล
เชื่อมแพลตฟอร์มแชตอย่าง WeChat แล้วสั่งงานจากที่ไหนก็ได้
- ★
ข้อจำกัด
ยังไม่มี file explorer ในตัว ไม่มีมุมมอง change-log เต็ม และไม่มี worktree/git-init จาก UI
03เกี่ยวอะไรกับเรา
ใครติดตาม GLM 5.2 มาตั้งแต่เปิดตัวแล้วยังไม่กล้าตัดสินเพราะมีแต่ตัวเลขผู้ผลิต รอบนี้คือจังหวะที่ผลอิสระเริ่มออก และยืนยันว่ามันแรงจริงในกลุ่ม open-weights แถมยังมี Z-Code ให้ลองฟรี 5 ล้าน token ต่อวัน ซึ่งเปลี่ยนสมการความคุ้มไปเลยสำหรับงานรายวัน
ฟันธง: ลองผ่าน Z-Code ฟรี — เอางาน coding จริงในมือมาเทียบกับเครื่องมือที่ใช้อยู่ จุดที่ต้องยอมรับคือรุ่นปิดยังนำในงานยาวและซับซ้อนสุด และราคา API ของ GLM 5.2 เองก็ไม่ได้ถูกเท่า open-weights ตัวอื่น ดังนั้นถ้าใช้หนัก ๆ ให้คิดเรื่อง coding plan หรือรันเองผ่าน open weights แทนการจ่าย API ตรง
โปรเจกต์ open-source
อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย
ดูบน Hugging Face → →