Mistral Medium 3.5 รวมหลายโมเดลเป็นตัวเดียว พร้อมดีล self-host กับ HSBC
สารบัญ
สรุปให้ไว
รวมร่างเป็นตัวเดียว
Medium 3.5 ยุบ Medium 3.1, Magistral และ Devstral 2 มาเป็นโมเดลเดียวที่ปรับระดับการ reasoning ได้
สเปกระดับงานจริง
dense 128B-param, context 256K, มี agentic features ในตัว
ตัวเลือกฝั่งยุโรป
HSBC เซ็นดีล self-host หลายปี เหมาะกับองค์กรที่กังวลเรื่อง data sovereignty
ราคายังถูกตั้งคำถาม
โดนเทียบกับ Qwen 3.6 ของจีนที่ตัวเล็กกว่าและถูกกว่า
01มีอะไรใหม่
Mistral ปล่อย Medium 3.5 เมื่อ 29 เม.ย. จุดเปลี่ยนหลักคือการรวมหลายโมเดลที่เคยแยกกัน ทั้ง Medium 3.1, Magistral และ Devstral 2 เข้ามาเป็น weights ชุดเดียวที่ปรับระดับ reasoning ได้ตามงาน แทนที่จะต้องสลับโมเดลไปมา
ตัวโมเดลเป็น dense ขนาด 128B-param รองรับ context 256K และมี agentic features ติดมาในตัว หมายความว่าใช้สั่งงานแบบหลายขั้นตอนได้โดยไม่ต้องต่อระบบเสริมเยอะ
พร้อมกันนี้ Mistral ยังออกเครื่องมือสายโค้ดดิ้งคือ Mistral Vibe CLI ที่เป็น cloud coding agents เปิด GitHub PRs ได้ และเพิ่มโหมด "work mode" ใน Le Chat สำหรับงานองค์กร
02จุดขายและข้อจำกัด
ด้านผลทดสอบ Medium 3.5 ทำ SWE-bench verified ได้ 77.6% และ tau-squared telecom 91.4% ส่วนราคาอยู่ที่ $1.50 ต่อล้าน token ขาเข้า และ $7.50 ต่อล้าน token ขาออก
จุดที่โดนวิจารณ์คือเรื่องความคุ้มค่า เมื่อเทียบกับ Qwen 3.6 ของ Alibaba ที่ตัวเล็กกว่ามากแค่ 27B แต่ทำ SWE-bench ได้ 72.4% และเป็น Apache 2.0 ทำให้คำถามเรื่องราคาต่อผลลัพธ์ยังค้างอยู่
ฝั่งดีลธุรกิจถือว่าน่าสนใจ HSBC เซ็นสัญญา self-host แบบหลายปี ซึ่งเป็นสัญญาณว่าโมเดลตัวนี้เล็งกลุ่มองค์กรที่ต้องเอาโมเดลมารันในบ้านตัวเองเป็นหลัก
สเปกสำคัญ
- ★
สถาปัตยกรรม
dense 128B-param พร้อม configurable-reasoning weights
- ★
Context window
256K token
- ★
โมเดลที่ยุบรวม
Medium 3.1 + Magistral + Devstral 2 เป็นตัวเดียว
- ★
Benchmarks
SWE-bench verified 77.6%, tau-squared telecom 91.4%
- ★
ราคา
$1.50/M ขาเข้า, $7.50/M ขาออก
- ★
เครื่องมือที่มาด้วย
Mistral Vibe CLI และ Le Chat work mode
03เกี่ยวอะไรกับเรา
ค่าหลักของ Medium 3.5 สำหรับเราไม่ใช่ตัวเลข benchmark แต่คือมุม data sovereignty องค์กรที่ติดเงื่อนไขว่าข้อมูลห้ามออกนอกบ้าน หรือไม่อยากผูกกับผู้ให้บริการสหรัฐหรือจีน จะมีตัวเลือกฝั่งยุโรปที่ self-host ได้จริง ดีล HSBC เป็นหลักฐานว่ามันเอาไปรันในองค์กรใหญ่ได้ ไม่ใช่แค่ทดลอง
แต่ฟันธงตรงๆ ถ้าวัดที่ราคาต่อผลทดสอบล้วนๆ Medium 3.5 ยังสู้ open-weight จากจีนยาก Qwen 3.6 ตัวเล็กกว่าหลายเท่า ถูกกว่า และคะแนนตามมาติดๆ สำหรับทีมที่ไม่ได้มีข้อบังคับเรื่องที่ตั้งข้อมูล การจ่ายแพงกว่าเพื่อโมเดลยุโรปอาจไม่คุ้ม
วิธีคิดที่ใช้ได้คือแยกโจทย์ก่อน ถ้าโจทย์คือ "ข้อมูลห้ามออกนอกประเทศ ต้อง self-host" ให้เอา Medium 3.5 เข้าลิสต์ทดสอบเทียบกับ Qwen 3.6 แล้ววัดทั้งราคาและผลงานบนงานจริงของเราเอง แต่ถ้าโจทย์คือ "เอาถูกและเก่ง" โดยไม่มีเงื่อนไข sovereignty ก็ยังไม่จำเป็นต้องรีบย้ายมา รอดูรอบหน้าก่อนได้
โปรเจกต์ open-source
อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย
ดูบน Hugging Face → →