Call Me Thanut
puzzleOpen Source

เปิดสเปก GLM 5.2 — เก่งงานดีไซน์ แต่ไฟล์โต ไม่มี vision

17 มิ.ย. 2026อ่าน 4 นาที
เปิดสเปก GLM 5.2 — เก่งงานดีไซน์ แต่ไฟล์โต ไม่มี vision
สารบัญ

สรุปให้ไว

ปล่อยจริงแบบ MIT

GLM 5.2 เป็น open-weight ใต้ MIT license รันเองได้หรือใช้ผ่าน coding plan ราคาถูก

ไฟล์โตมาก

753B parameters ราว 1.51 TB บนดิสก์ เครื่องบ้านรันไม่ไหว ต้องพึ่ง API หรือเช่าเครื่อง

เด่นงานดีไซน์

ขึ้นอันดับ 1 บน Design Arena งานหน้าบ้าน/UI แรงสุดในกลุ่ม open model (ผลจากกระดานเดียว)

ไม่มี vision ในตัว

อ่านภาพเองไม่ได้ ต้องต่อ vision model แยกถ้าจะให้ดูรูป

01สเปกและสถาปัตยกรรมที่เพิ่งเปิด

รอบนี้ตัวเลขออกมาครบขึ้น GLM 5.2 มีขนาด 753B total parameters กินพื้นที่ราว 1.51 TB บนดิสก์ พูดง่าย ๆ คือใหญ่เกินกว่าจะโหลดลงเครื่องที่บ้านได้ การใช้งานจริงเลยวนอยู่ที่ API, coding plan หรือเช่าฮาร์ดแวร์มารัน ใครคิดจะ self-host ต้องเผื่อใจเรื่องนี้ไว้ก่อน

ฝั่งสถาปัตยกรรมมีของใหม่สองจุด อันแรกคือดีไซน์ที่เรียกว่า index share ซึ่งเอา indexer มาใช้ซ้ำข้าม sparse-attention layers ผู้ผลิตอ้างว่าช่วยลด compute ลงราว 2.9 เท่า อีกจุดคือ MTP (multi-token-prediction) layer ที่ปรับใหม่ อ้างว่าทำ decoding ได้ยาว/ไวขึ้นสูงสุดราว 20% ตัวเลขพวกนี้เป็นของฝั่งผู้ผลิตเอง ยังไม่ใช่ผลทดสอบอิสระ

02โหมดคิดและผลทดสอบงานดีไซน์

GLM 5.2 มี reasoning-effort สองระดับให้เลือก ระดับ high เป็นค่าเริ่มต้น คุม token ให้สมดุล ส่วน max แนะนำสำหรับงาน coding หลายขั้นที่ยาก ๆ ใครเจองานที่ต้องไล่ตรรกะเป็นสเต็ปยาว ๆ ก็ขยับไปใช้ max ได้

มุมที่น่าสนใจสุดของรอบนี้คือเรื่องงานหน้าบ้าน มีรายงานว่า GLM 5.2 ขึ้นอันดับ 1 บน Design Arena ซึ่งเป็นการประมือกันแบบ head-to-head ด้านดีไซน์/front-end โดยแซง Claude Fable 5 และ Opus 4.6 บนกระดานนั้น และถูกอธิบายว่าแรงสุดในกลุ่ม open model สำหรับงาน visual/UI ย้ำว่านี่เป็นผลทดสอบจากสำนักเดียว ไม่ใช่ค่าเฉลี่ยจากหลายแหล่ง

03ข้อจำกัดที่ต้องรู้ก่อนเอาไปใช้

จุดที่ต้องเตือนกันตรง ๆ คือ GLM 5.2 ไม่มี vision ในตัว ต่างจาก MiniMax M3 ที่อ่านภาพเองได้ ถ้าอยากให้มันเข้าใจรูปต้องไปต่อ vision model แยกเอง และในการทดสอบมีโจทย์แบบซ่อนภาพที่ต้องใช้ vision ในตัว GLM 5.2 ก็ทำไม่ผ่าน ใครวางแผนงานที่ต้องอ่าน screenshot หรือ mockup ตรง ๆ ให้เผื่อ stack ส่วนนี้ไว้

ส่วน coding benchmark ที่เห็นกันยังเป็นตัวเลขจากผู้ผลิตและจำกันมาแบบหลวม ๆ ข้ามหลายแหล่ง เช่น SWE-Bench Pro อยู่ราวช่วงต้น 60 ถึง ~74 เทียบกับ Opus 4.8 ที่ราวต้น 70 ส่วน Terminal Bench ใกล้เคียง Opus ทั้งหมดนี้ถือเป็นตัวเลขฝั่งผู้ผลิต/สำนักเดียว ยังไม่ใช่ผลอิสระ อย่าเพิ่งเชื่อเต็มร้อย

ช่องทางเอา GLM 5.2 มาใช้

  • Zcode

    agentic harness ฟรีจาก Z.ai ใช้ได้ทั้ง Mac/Windows/Linux เป็น coding CLI สไตล์ Codex

  • ต่อกับ tool เดิม

    เสียบเข้า Claude Code, Codex, OpenCode, OpenClaw และ Hermes ได้ผ่าน API key + settings

  • ไม่ต้องจ่าย frontier API

    ใช้ผ่าน coding plan ราคาถูกได้เลย ไม่ต้องพึ่ง API แพง ๆ ของเจ้าใหญ่

  • รันเองหรือเช่าเครื่อง

    เพราะ open-weight ใต้ MIT จะ self-host หรือเช่าฮาร์ดแวร์มารันก็ได้ตามงบ

04เกี่ยวอะไรกับเรา

มุมที่ทำให้รอบนี้น่าลองคือสองอย่าง: มันออกมาเป็น MIT จริง ๆ และจุดเด่นชัดอยู่ที่งานดีไซน์/front-end ใครทำงาน UI แล้วอยากได้ตัวช่วยถูก ๆ มาลองผ่าน coding plan หรือ Zcode ได้เลย ต่อเข้า Claude Code หรือ tool ที่ใช้อยู่ก็ไม่ยาก ลองเอางาน front-end จริง ๆ ในมือมาให้มันร่างดู แล้วเทียบกับของที่ใช้ประจำ

แต่ต้องรู้ลิมิตด้วย ตัวมันใหญ่มากจน self-host เองลำบาก และไม่มี vision ในตัว ถ้างานต้องอ่านรูปต้องเตรียมโมเดลอีกตัวมาเสริม ส่วนตัวเลข benchmark ทั้งหมดยังเป็นของผู้ผลิต

ฟันธง: ลอง — คุ้มที่จะหยิบมาทดสอบงาน coding + design ราคาประหยัดผ่าน coding plan หรือ Zcode แต่อย่าเพิ่งปักใจเชื่อตัวเลข รอผลทดสอบอิสระออกมาก่อนค่อยตัดสินใจย้ายงานจริงมาเต็มตัว

โปรเจกต์ open-source

อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย

ดูบน Hugging Face →