Call Me Thanut
puzzleOpen Source

Mistral Medium 3.5 รวมหลายโมเดลเป็นตัวเดียว พร้อมดีล self-host กับ HSBC

4 พ.ค. 2026อ่าน 4 นาที
Mistral Medium 3.5 รวมหลายโมเดลเป็นตัวเดียว พร้อมดีล self-host กับ HSBC
สารบัญ

สรุปให้ไว

รวมร่างเป็นตัวเดียว

Medium 3.5 ยุบ Medium 3.1, Magistral และ Devstral 2 มาเป็นโมเดลเดียวที่ปรับระดับการ reasoning ได้

สเปกระดับงานจริง

dense 128B-param, context 256K, มี agentic features ในตัว

ตัวเลือกฝั่งยุโรป

HSBC เซ็นดีล self-host หลายปี เหมาะกับองค์กรที่กังวลเรื่อง data sovereignty

ราคายังถูกตั้งคำถาม

โดนเทียบกับ Qwen 3.6 ของจีนที่ตัวเล็กกว่าและถูกกว่า

01มีอะไรใหม่

Mistral ปล่อย Medium 3.5 เมื่อ 29 เม.ย. จุดเปลี่ยนหลักคือการรวมหลายโมเดลที่เคยแยกกัน ทั้ง Medium 3.1, Magistral และ Devstral 2 เข้ามาเป็น weights ชุดเดียวที่ปรับระดับ reasoning ได้ตามงาน แทนที่จะต้องสลับโมเดลไปมา

ตัวโมเดลเป็น dense ขนาด 128B-param รองรับ context 256K และมี agentic features ติดมาในตัว หมายความว่าใช้สั่งงานแบบหลายขั้นตอนได้โดยไม่ต้องต่อระบบเสริมเยอะ

พร้อมกันนี้ Mistral ยังออกเครื่องมือสายโค้ดดิ้งคือ Mistral Vibe CLI ที่เป็น cloud coding agents เปิด GitHub PRs ได้ และเพิ่มโหมด "work mode" ใน Le Chat สำหรับงานองค์กร

02จุดขายและข้อจำกัด

ด้านผลทดสอบ Medium 3.5 ทำ SWE-bench verified ได้ 77.6% และ tau-squared telecom 91.4% ส่วนราคาอยู่ที่ $1.50 ต่อล้าน token ขาเข้า และ $7.50 ต่อล้าน token ขาออก

จุดที่โดนวิจารณ์คือเรื่องความคุ้มค่า เมื่อเทียบกับ Qwen 3.6 ของ Alibaba ที่ตัวเล็กกว่ามากแค่ 27B แต่ทำ SWE-bench ได้ 72.4% และเป็น Apache 2.0 ทำให้คำถามเรื่องราคาต่อผลลัพธ์ยังค้างอยู่

ฝั่งดีลธุรกิจถือว่าน่าสนใจ HSBC เซ็นสัญญา self-host แบบหลายปี ซึ่งเป็นสัญญาณว่าโมเดลตัวนี้เล็งกลุ่มองค์กรที่ต้องเอาโมเดลมารันในบ้านตัวเองเป็นหลัก

สเปกสำคัญ

  • สถาปัตยกรรม

    dense 128B-param พร้อม configurable-reasoning weights

  • Context window

    256K token

  • โมเดลที่ยุบรวม

    Medium 3.1 + Magistral + Devstral 2 เป็นตัวเดียว

  • Benchmarks

    SWE-bench verified 77.6%, tau-squared telecom 91.4%

  • ราคา

    $1.50/M ขาเข้า, $7.50/M ขาออก

  • เครื่องมือที่มาด้วย

    Mistral Vibe CLI และ Le Chat work mode

03เกี่ยวอะไรกับเรา

ค่าหลักของ Medium 3.5 สำหรับเราไม่ใช่ตัวเลข benchmark แต่คือมุม data sovereignty องค์กรที่ติดเงื่อนไขว่าข้อมูลห้ามออกนอกบ้าน หรือไม่อยากผูกกับผู้ให้บริการสหรัฐหรือจีน จะมีตัวเลือกฝั่งยุโรปที่ self-host ได้จริง ดีล HSBC เป็นหลักฐานว่ามันเอาไปรันในองค์กรใหญ่ได้ ไม่ใช่แค่ทดลอง

แต่ฟันธงตรงๆ ถ้าวัดที่ราคาต่อผลทดสอบล้วนๆ Medium 3.5 ยังสู้ open-weight จากจีนยาก Qwen 3.6 ตัวเล็กกว่าหลายเท่า ถูกกว่า และคะแนนตามมาติดๆ สำหรับทีมที่ไม่ได้มีข้อบังคับเรื่องที่ตั้งข้อมูล การจ่ายแพงกว่าเพื่อโมเดลยุโรปอาจไม่คุ้ม

วิธีคิดที่ใช้ได้คือแยกโจทย์ก่อน ถ้าโจทย์คือ "ข้อมูลห้ามออกนอกประเทศ ต้อง self-host" ให้เอา Medium 3.5 เข้าลิสต์ทดสอบเทียบกับ Qwen 3.6 แล้ววัดทั้งราคาและผลงานบนงานจริงของเราเอง แต่ถ้าโจทย์คือ "เอาถูกและเก่ง" โดยไม่มีเงื่อนไข sovereignty ก็ยังไม่จำเป็นต้องรีบย้ายมา รอดูรอบหน้าก่อนได้

โปรเจกต์ open-source

อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย

ดูบน Hugging Face →