wrenchเครื่องมือ

Nvidia NIM แจกโมเดล AI ฟรีเป็นสิบ เสียบ OpenCode ใช้ได้ในไม่กี่คำสั่ง

15 มิ.ย. 2026อ่าน 4 นาที

สารบัญ

สรุปให้ไว

โมเดลให้ลองนับร้อย

แคตาล็อก build.nvidia.com ผ่าน NIM มีโมเดล 139 ตัว รวม endpoint ฟรีสำหรับนักพัฒนา 77 ตัว ทุกตัวต่อแบบ OpenAI-compatible

ตัวเด่นคือ Nemotron 3 Ultra

โมเดล 550B แบบ hybrid Mamba-transformer MoE, active 55B, context 1 ล้าน token เปิดให้ใช้ฟรี

เสียบ OpenCode ง่ายมาก

สั่ง /connect เลือก Nvidia วาง API key แล้ว /models เสร็จ key ขึ้นต้นด้วย nvapi

ฟรีสำหรับลอง ไม่ใช่ production

มี rate limit อาจช้าตอนคนใช้เยอะ และหลายตัวเป็น non-commercial

01มันคืออะไร

NIM ย่อมาจาก Nvidia Inference Microservices แปลเป็นภาพจำคือ "ตู้โมเดลสำเร็จรูป" ของ Nvidia ที่เปิดให้เราเรียกใช้ผ่านเน็ตได้เลย ไม่ต้องโหลดโมเดลมาลงเครื่องเอง เข้าไปที่ build.nvidia.com จะเจอแคตาล็อกโมเดล 139 ตัว ในนั้นมี endpoint ฟรีสำหรับนักพัฒนา 77 ตัว

จุดที่ทำให้ใช้ง่ายคือทุก endpoint เป็นแบบ OpenAI-compatible แปลว่าเครื่องมือหรือโค้ดที่เคยต่อกับ API ของ OpenAI อยู่แล้ว แค่เปลี่ยน base URL กับ key ก็ใช้ได้ทันที ไม่ต้องเขียนใหม่

02มีโมเดลอะไรให้ใช้บ้าง

ตัวที่โดดเด่นสุดคือ Nvidia Nemotron 3 Ultra เป็นโมเดล 550B แบบ hybrid Mamba-transformer MoE มี active 55B และ context หน้าต่างยาวถึง 1 ล้าน token วางไว้สำหรับงาน agent ที่ต้องให้เหตุผล วางแผน เขียนโค้ด เรียกใช้เครื่องมือ และอ่านข้อมูลยาว ๆ และเปิดเป็น endpoint ฟรี

นอกจากนี้ยังมี MiniMax M3 (เวอร์ชัน preview) เป็น multimodal MoE รับทั้งข้อความ ภาพ และวิดีโอ 428B total / 22B active, context 512K เข้าใจวิดีโอได้ยาวถึงราว 30 นาที — แต่ตัวนี้ระบุเป็น non-commercial และมี Step 3.7 Flash โมเดล multimodal สาย reasoning ที่เน้นความเร็วสำหรับรอบงานนักพัฒนา (refactor, เขียน docs, แก้บั๊ก, เขียนเทสต์)

ในแคตาล็อกยังมีตัวอื่นให้เลือกอีก เช่น DeepSeek V4 Flash/Pro, GLM 5.1, Kimi K2.6, Mistral Medium 3.5, MiniMax M2.7 รวมถึงตระกูล Qwen, Gemma, Cosmos และโมเดลเฉพาะทางอย่าง OCR, retrieval, speech

โมเดลฟรีตัวเด่นในแคตาล็อก

★
Nemotron 3 Ultra
550B hybrid Mamba-transformer MoE, active 55B, context 1M, สำหรับงาน agent + long-context (ฟรี)
★
MiniMax M3 preview
multimodal 428B/22B, context 512K, เข้าใจวิดีโอ ~30 นาที (non-commercial)
★
Step 3.7 Flash
multimodal reasoning เน้นเร็ว สำหรับรอบงานนักพัฒนา (commercial + non-commercial)
★
อื่น ๆ
DeepSeek V4 Flash/Pro, GLM 5.1, Kimi K2.6, Mistral Medium 3.5, MiniMax M2.7, Qwen, Gemma

03ต่อเข้า OpenCode และเครื่องมืออื่นยังไง

ถ้าใช้ OpenCode รองรับ Nvidia แบบ native เลย ขั้นตอนคือสั่ง /connect ค้นหา Nvidia วาง API key แล้วสั่ง /models ก็เลือกโมเดลได้ ตัว key ของ Nvidia จะขึ้นต้นด้วย nvapi สังเกตง่าย

ถ้าเครื่องมือที่ใช้ไม่รองรับ native (เช่น Cline, RooCode, Kilo Code, Continue, Aider หรือสคริปต์ที่เขียนด้วย OpenAI SDK) ก็ตั้ง base URL เป็น https://integrate.api.nvidia.com/v1 ใส่ key ของ Nvidia และระบุ model ID ให้ตรงตามหน้าโมเดล เท่านี้ก็ใช้ได้ และถ้าใครมี GPU ของตัวเอง NIM ยังมีแบบ self-host ผ่าน container ให้รันบนเครื่องเราเองได้ด้วย

04เกี่ยวอะไรกับเรา

ฟันธง: "ลองเลย" สำหรับงานทดสอบ นี่คือทางถูกที่สุดในการลองโมเดลแรง ๆ อย่าง Nemotron 3 Ultra หรือ MiniMax M3 โดยไม่ต้องจ่ายค่า API — เสียบเข้า OpenCode หรือ agent ที่เราใช้อยู่ได้ในไม่กี่คำสั่ง เหมาะมากกับการเทียบว่าโมเดลตัวไหนเข้ากับงานเรา ก่อนจะตัดสินใจเสียเงินกับตัวที่ใช่

แต่จุดที่ต้องระวังชัด ๆ คือ "อย่าเอาขึ้น production" endpoint ฟรีพวกนี้มีไว้สำหรับ development มี rate limit อาจช้าลงตอนคนใช้เยอะ และโมเดลอาจถูกย้ายไป partner หรือถูกถอดเมื่อไหร่ก็ได้ ที่สำคัญหลายตัวระบุเป็น non-commercial — เช็กสิทธิ์การใช้งานให้ชัดก่อนเอาไปใช้กับงานบริษัทหรืองานลูกค้า ไม่งั้นเสี่ยงผิดเงื่อนไข

มุมต่อยอด: วาง NIM เป็น "สนามซ้อม" ของทีม — ให้คนในทีมลองโมเดลใหม่ ๆ ฟรีในนี้ก่อน พอเจอตัวที่เวิร์กกับงานจริงค่อยย้ายไปใช้ endpoint แบบเสียเงินที่มี SLA รองรับ production และอย่าลืม Human Gate ตรวจ output ของโมเดลฟรีให้ดีก่อนเชื่อ เพราะคุณภาพและความเสถียรยังไม่การันตี