Nvidia NIM แจกโมเดล AI ฟรีเป็นสิบ เสียบ OpenCode ใช้ได้ในไม่กี่คำสั่ง
สารบัญ
สรุปให้ไว
โมเดลให้ลองนับร้อย
แคตาล็อก build.nvidia.com ผ่าน NIM มีโมเดล 139 ตัว รวม endpoint ฟรีสำหรับนักพัฒนา 77 ตัว ทุกตัวต่อแบบ OpenAI-compatible
ตัวเด่นคือ Nemotron 3 Ultra
โมเดล 550B แบบ hybrid Mamba-transformer MoE, active 55B, context 1 ล้าน token เปิดให้ใช้ฟรี
เสียบ OpenCode ง่ายมาก
สั่ง /connect เลือก Nvidia วาง API key แล้ว /models เสร็จ key ขึ้นต้นด้วย nvapi
ฟรีสำหรับลอง ไม่ใช่ production
มี rate limit อาจช้าตอนคนใช้เยอะ และหลายตัวเป็น non-commercial
01มันคืออะไร
NIM ย่อมาจาก Nvidia Inference Microservices แปลเป็นภาพจำคือ "ตู้โมเดลสำเร็จรูป" ของ Nvidia ที่เปิดให้เราเรียกใช้ผ่านเน็ตได้เลย ไม่ต้องโหลดโมเดลมาลงเครื่องเอง เข้าไปที่ build.nvidia.com จะเจอแคตาล็อกโมเดล 139 ตัว ในนั้นมี endpoint ฟรีสำหรับนักพัฒนา 77 ตัว
จุดที่ทำให้ใช้ง่ายคือทุก endpoint เป็นแบบ OpenAI-compatible แปลว่าเครื่องมือหรือโค้ดที่เคยต่อกับ API ของ OpenAI อยู่แล้ว แค่เปลี่ยน base URL กับ key ก็ใช้ได้ทันที ไม่ต้องเขียนใหม่
02มีโมเดลอะไรให้ใช้บ้าง
ตัวที่โดดเด่นสุดคือ Nvidia Nemotron 3 Ultra เป็นโมเดล 550B แบบ hybrid Mamba-transformer MoE มี active 55B และ context หน้าต่างยาวถึง 1 ล้าน token วางไว้สำหรับงาน agent ที่ต้องให้เหตุผล วางแผน เขียนโค้ด เรียกใช้เครื่องมือ และอ่านข้อมูลยาว ๆ และเปิดเป็น endpoint ฟรี
นอกจากนี้ยังมี MiniMax M3 (เวอร์ชัน preview) เป็น multimodal MoE รับทั้งข้อความ ภาพ และวิดีโอ 428B total / 22B active, context 512K เข้าใจวิดีโอได้ยาวถึงราว 30 นาที — แต่ตัวนี้ระบุเป็น non-commercial และมี Step 3.7 Flash โมเดล multimodal สาย reasoning ที่เน้นความเร็วสำหรับรอบงานนักพัฒนา (refactor, เขียน docs, แก้บั๊ก, เขียนเทสต์)
ในแคตาล็อกยังมีตัวอื่นให้เลือกอีก เช่น DeepSeek V4 Flash/Pro, GLM 5.1, Kimi K2.6, Mistral Medium 3.5, MiniMax M2.7 รวมถึงตระกูล Qwen, Gemma, Cosmos และโมเดลเฉพาะทางอย่าง OCR, retrieval, speech
โมเดลฟรีตัวเด่นในแคตาล็อก
- ★
Nemotron 3 Ultra
550B hybrid Mamba-transformer MoE, active 55B, context 1M, สำหรับงาน agent + long-context (ฟรี)
- ★
MiniMax M3 preview
multimodal 428B/22B, context 512K, เข้าใจวิดีโอ ~30 นาที (non-commercial)
- ★
Step 3.7 Flash
multimodal reasoning เน้นเร็ว สำหรับรอบงานนักพัฒนา (commercial + non-commercial)
- ★
อื่น ๆ
DeepSeek V4 Flash/Pro, GLM 5.1, Kimi K2.6, Mistral Medium 3.5, MiniMax M2.7, Qwen, Gemma
03ต่อเข้า OpenCode และเครื่องมืออื่นยังไง
ถ้าใช้ OpenCode รองรับ Nvidia แบบ native เลย ขั้นตอนคือสั่ง /connect ค้นหา Nvidia วาง API key แล้วสั่ง /models ก็เลือกโมเดลได้ ตัว key ของ Nvidia จะขึ้นต้นด้วย nvapi สังเกตง่าย
ถ้าเครื่องมือที่ใช้ไม่รองรับ native (เช่น Cline, RooCode, Kilo Code, Continue, Aider หรือสคริปต์ที่เขียนด้วย OpenAI SDK) ก็ตั้ง base URL เป็น https://integrate.api.nvidia.com/v1 ใส่ key ของ Nvidia และระบุ model ID ให้ตรงตามหน้าโมเดล เท่านี้ก็ใช้ได้ และถ้าใครมี GPU ของตัวเอง NIM ยังมีแบบ self-host ผ่าน container ให้รันบนเครื่องเราเองได้ด้วย
04เกี่ยวอะไรกับเรา
ฟันธง: "ลองเลย" สำหรับงานทดสอบ นี่คือทางถูกที่สุดในการลองโมเดลแรง ๆ อย่าง Nemotron 3 Ultra หรือ MiniMax M3 โดยไม่ต้องจ่ายค่า API — เสียบเข้า OpenCode หรือ agent ที่เราใช้อยู่ได้ในไม่กี่คำสั่ง เหมาะมากกับการเทียบว่าโมเดลตัวไหนเข้ากับงานเรา ก่อนจะตัดสินใจเสียเงินกับตัวที่ใช่
แต่จุดที่ต้องระวังชัด ๆ คือ "อย่าเอาขึ้น production" endpoint ฟรีพวกนี้มีไว้สำหรับ development มี rate limit อาจช้าลงตอนคนใช้เยอะ และโมเดลอาจถูกย้ายไป partner หรือถูกถอดเมื่อไหร่ก็ได้ ที่สำคัญหลายตัวระบุเป็น non-commercial — เช็กสิทธิ์การใช้งานให้ชัดก่อนเอาไปใช้กับงานบริษัทหรืองานลูกค้า ไม่งั้นเสี่ยงผิดเงื่อนไข
มุมต่อยอด: วาง NIM เป็น "สนามซ้อม" ของทีม — ให้คนในทีมลองโมเดลใหม่ ๆ ฟรีในนี้ก่อน พอเจอตัวที่เวิร์กกับงานจริงค่อยย้ายไปใช้ endpoint แบบเสียเงินที่มี SLA รองรับ production และอย่าลืม Human Gate ตรวจ output ของโมเดลฟรีให้ดีก่อนเชื่อ เพราะคุณภาพและความเสถียรยังไม่การันตี