Agents A1 โมเดล agent 35B ของ InternScience — เล็ก รันในเครื่อง แต่ล้มโมเดลระดับล้านล้านพารามิเตอร์
สารบัญ
สรุปให้ไว
เล็กแต่แรง
MoE 35B ที่ active จริงแค่ราว 3B ได้ความรู้ระดับ 35B แต่วิ่งเร็วเท่าโมเดล 3B รันในเครื่องได้สบาย
เกิดมาเป็น agent
เทรนบน trajectory ยาว ๆ เฉลี่ยราว 45,000 โทเค็นต่อชุด มีทั้ง action, observation และ verification ไม่ใช่แค่แชต
คะแนน search ระดับ SOTA
Seal-0 ได้ 56.4 แซง Kimi K2.6, DeepSeek V4 Pro และ GPT-5.5 ในสนามค้นหาระยะยาว
เปิดจริง
Apache 2.0 ใช้เชิงพาณิชย์ได้ มี quant พร้อมลง LM Studio, Ollama, llama.cpp และเปิด eval framework ให้ทำซ้ำได้
01มันคืออะไร
Agents A1 คือโมเดลภาษาแบบ Mixture-of-Experts ขนาด 35B ที่สร้างโดย InternScience ซึ่งเป็นทีมจาก Shanghai AI Laboratory ปล่อยออกมาภายใต้สัญญาอนุญาต Apache 2.0 หมายความว่าเอาไปใช้ทำอะไรก็ได้แม้แต่งานเชิงพาณิชย์ ตัวโมเดลต่อยอดจากฐาน Qwen 3.5 35B A3B โดยคำว่า A3B บอกว่าถึงพารามิเตอร์รวมจะ 35 พันล้าน แต่ที่ทำงานจริงพร้อมกันมีแค่ราว 3 พันล้าน นี่คือเหตุผลที่มันรันเร็วในเครื่อง เหมือนได้ความรู้ของโมเดล 35B ด้วยความเร็วของโมเดล 3B
02เก่งแค่ไหน
ตัวเลขที่เด่นที่สุดอยู่ที่งานค้นหาระยะยาว บน Seal-0 ซึ่งเป็นเบนช์มาร์กสาย long-horizon search มันทำได้ 56.4 ซึ่งเป็น state-of-the-art โดยรวม แซงทั้ง Kimi K2.6, DeepSeek V4 Pro และแม้แต่ GPT-5.5 ในโหมด reasoning สูง การที่โมเดล 35B ล้มโมเดลระดับล้านล้านพารามิเตอร์ในสนามนี้ถือว่าน่าตกใจ บน GAIA ได้ราว 96 ตามหลัง DeepSeek V4 Pro ที่ 98 มานิดเดียวและนำ GPT-5.5 ที่ 87 ส่วน BrowseComp ได้ 75.5 ซึ่งดีที่สุดในกลุ่มโมเดลคลาส 35B แม้โมเดล frontier จะยังนำอยู่ในสนามนี้
ลงเครื่องยังไง
- ★
ผ่าน LM Studio ง่ายสุด
มี quant พร้อมสำหรับ LM Studio, Ollama และ llama.cpp ไม่ต้องโหลด weight BF16 เต็ม
- ★
แรมพอไหว
quant 4-bit ลงบน Mac ที่มี unified memory 32GB ได้สบาย
- ★
ตั้งค่าให้ถูก
แนะนำ context ราว 128K แทนที่จะเต็ม 256K และตั้ง temperature 0.85, top-p 0.95, presence penalty 1.1 กันโมเดลตอบวน
- ★
ต่อกับ agent ได้
ใช้ร่วมกับ Hermes และ Zed ได้เลย เสิร์ฟจริงจังก็รองรับ SGLang และ vLLM แบบ OpenAI-compatible
- ★
ข้อจำกัด
ไม่ใช่โมเดล multimodal และไม่ใช่โมเดล frontier คำถามยาก ๆ ยังคิดวนได้แต่มักจบเอง
03เกี่ยวอะไรกับเรา
ฟันธง: ถ้าอยากได้ผู้ช่วยสาย agent ที่รันในเครื่องเพื่อความเป็นส่วนตัว ตัวนี้ควรลอง เพราะงานอย่างค้นข้อมูล สรุปเอกสาร ร่างเมล หรือแก้ไฟล์โค้ดในไดเรกทอรีเดิม ล้วนเป็นงานที่มักมีข้อมูลอ่อนไหวและเราไม่อยากส่งขึ้น API ของใคร การมีโมเดลระดับนี้รันบนเครื่องตัวเองจึงมีประโยชน์จริง แต่อย่าคาดหวังให้มันแทนโมเดล frontier ในงานยากสุด ๆ ให้มองเป็นม้างานสายทำตามคำสั่งและเรียกใช้เครื่องมือมากกว่าสายคิดหนัก เอาไปต่อยอดได้ทันทีถ้าจะวาง workflow ที่ให้ agent ทำงานซ้ำ ๆ แบบตรวจสอบได้บนเครื่องที่คุมข้อมูลเองทั้งหมด
โปรเจกต์ open-source
อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย
ดูบน Hugging Face → →