puzzleOpen Source

Agents A1 โมเดล agent 35B ของ InternScience — เล็ก รันในเครื่อง แต่ล้มโมเดลระดับล้านล้านพารามิเตอร์

4 ก.ค. 2026อ่าน 5 นาที

สารบัญ

สรุปให้ไว

เล็กแต่แรง

MoE 35B ที่ active จริงแค่ราว 3B ได้ความรู้ระดับ 35B แต่วิ่งเร็วเท่าโมเดล 3B รันในเครื่องได้สบาย

เกิดมาเป็น agent

เทรนบน trajectory ยาว ๆ เฉลี่ยราว 45,000 โทเค็นต่อชุด มีทั้ง action, observation และ verification ไม่ใช่แค่แชต

คะแนน search ระดับ SOTA

Seal-0 ได้ 56.4 แซง Kimi K2.6, DeepSeek V4 Pro และ GPT-5.5 ในสนามค้นหาระยะยาว

เปิดจริง

Apache 2.0 ใช้เชิงพาณิชย์ได้ มี quant พร้อมลง LM Studio, Ollama, llama.cpp และเปิด eval framework ให้ทำซ้ำได้

01มันคืออะไร

Agents A1 คือโมเดลภาษาแบบ Mixture-of-Experts ขนาด 35B ที่สร้างโดย InternScience ซึ่งเป็นทีมจาก Shanghai AI Laboratory ปล่อยออกมาภายใต้สัญญาอนุญาต Apache 2.0 หมายความว่าเอาไปใช้ทำอะไรก็ได้แม้แต่งานเชิงพาณิชย์ ตัวโมเดลต่อยอดจากฐาน Qwen 3.5 35B A3B โดยคำว่า A3B บอกว่าถึงพารามิเตอร์รวมจะ 35 พันล้าน แต่ที่ทำงานจริงพร้อมกันมีแค่ราว 3 พันล้าน นี่คือเหตุผลที่มันรันเร็วในเครื่อง เหมือนได้ความรู้ของโมเดล 35B ด้วยความเร็วของโมเดล 3B

02เก่งแค่ไหน

ตัวเลขที่เด่นที่สุดอยู่ที่งานค้นหาระยะยาว บน Seal-0 ซึ่งเป็นเบนช์มาร์กสาย long-horizon search มันทำได้ 56.4 ซึ่งเป็น state-of-the-art โดยรวม แซงทั้ง Kimi K2.6, DeepSeek V4 Pro และแม้แต่ GPT-5.5 ในโหมด reasoning สูง การที่โมเดล 35B ล้มโมเดลระดับล้านล้านพารามิเตอร์ในสนามนี้ถือว่าน่าตกใจ บน GAIA ได้ราว 96 ตามหลัง DeepSeek V4 Pro ที่ 98 มานิดเดียวและนำ GPT-5.5 ที่ 87 ส่วน BrowseComp ได้ 75.5 ซึ่งดีที่สุดในกลุ่มโมเดลคลาส 35B แม้โมเดล frontier จะยังนำอยู่ในสนามนี้

ลงเครื่องยังไง

★
ผ่าน LM Studio ง่ายสุด
มี quant พร้อมสำหรับ LM Studio, Ollama และ llama.cpp ไม่ต้องโหลด weight BF16 เต็ม
★
แรมพอไหว
quant 4-bit ลงบน Mac ที่มี unified memory 32GB ได้สบาย
★
ตั้งค่าให้ถูก
แนะนำ context ราว 128K แทนที่จะเต็ม 256K และตั้ง temperature 0.85, top-p 0.95, presence penalty 1.1 กันโมเดลตอบวน
★
ต่อกับ agent ได้
ใช้ร่วมกับ Hermes และ Zed ได้เลย เสิร์ฟจริงจังก็รองรับ SGLang และ vLLM แบบ OpenAI-compatible
★
ข้อจำกัด
ไม่ใช่โมเดล multimodal และไม่ใช่โมเดล frontier คำถามยาก ๆ ยังคิดวนได้แต่มักจบเอง

03เกี่ยวอะไรกับเรา

ฟันธง: ถ้าอยากได้ผู้ช่วยสาย agent ที่รันในเครื่องเพื่อความเป็นส่วนตัว ตัวนี้ควรลอง เพราะงานอย่างค้นข้อมูล สรุปเอกสาร ร่างเมล หรือแก้ไฟล์โค้ดในไดเรกทอรีเดิม ล้วนเป็นงานที่มักมีข้อมูลอ่อนไหวและเราไม่อยากส่งขึ้น API ของใคร การมีโมเดลระดับนี้รันบนเครื่องตัวเองจึงมีประโยชน์จริง แต่อย่าคาดหวังให้มันแทนโมเดล frontier ในงานยากสุด ๆ ให้มองเป็นม้างานสายทำตามคำสั่งและเรียกใช้เครื่องมือมากกว่าสายคิดหนัก เอาไปต่อยอดได้ทันทีถ้าจะวาง workflow ที่ให้ agent ทำงานซ้ำ ๆ แบบตรวจสอบได้บนเครื่องที่คุมข้อมูลเองทั้งหมด