puzzleOpen Source

Kimi K2.6 เปิดให้ลองฟรีผ่าน Nvidia NIM — โมเดลจีน 1T พารามิเตอร์

3 พ.ค. 2026อ่าน 4 นาที

สารบัญ

สรุปให้ไว

ลองฟรีได้เลย

Kimi K2.6 ของ Moonshot AI เปิดเป็น free NIM endpoint บน Nvidia build ต่อ API ได้ทันที

สเปกแรง

MoE ~1T พารามิเตอร์ active ~32B ต่อ token, context 256K, มีทั้งโหมด thinking และ non-thinking

ต่อง่าย

เป็น OpenAI-compatible API เปลี่ยนแค่ base URL กับ model id แล้วใส่ Nvidia key

จุดต้องระวัง

"ฟรี" คือเงื่อนไข dev/trial ของ Nvidia เอาไว้ทดสอบ ไม่ใช่ production

01มีอะไรให้ลอง

Kimi K2.6 จาก Moonshot AI ตอนนี้มาอยู่บน Nvidia NIM ในฐานะ free endpoint แปลว่าใครอยากเทสต์โมเดลจีนตัวแรงตัวนี้ ไม่ต้องไปหาเครื่องแรง ๆ มารันเอง แค่ยิง API เข้าไปก็ลองได้เลย

ตัวโมเดลเป็น MoE (Mixture of Experts) ขนาดราว 1T พารามิเตอร์ แต่ตอนทำงานจริงจะ active แค่ราว 32B ต่อ token — พูดง่าย ๆ คือโมเดลตัวใหญ่มากแต่หยิบมาใช้เฉพาะส่วนที่จำเป็น เลยทั้งใหญ่และยังไหวอยู่ มี context ยาว 256K รองรับทั้งโหมด thinking และ non-thinking และเป็น multimodal มาตั้งแต่ต้น

ฝั่งของที่ Moonshot บอกว่าปรับปรุงมา คือเรื่อง long-horizon coding (งานโค้ดที่ยาวหลายขั้น), การทำตาม instruction และความสามารถ self-correction หรือแก้คำตอบตัวเองระหว่างทาง

02เริ่มใช้ยังไง

ต่อแบบ OpenAI-compatible API ได้เลย ไม่ต้องเรียนรู้ SDK ใหม่ ของที่ต้องเซ็ตมีสามอย่าง

ตั้ง base URL เป็น integrate.api.nvidia.com/v1 ใช้ model id เป็น moonshotai/kimi-k2.6 แล้วใส่ Nvidia key ของคุณเข้าไป — เท่านี้ก็ยิงคำสั่งเข้าไปลองได้ ใครเคยเขียนโค้ดต่อ OpenAI อยู่แล้วก็แทบจะก็อปโครงเดิมมาเปลี่ยนแค่สามค่านี้

สเปกที่ควรรู้

★
สถาปัตยกรรม
MoE ราว 1T พารามิเตอร์ active ~32B ต่อ token
★
Context window
ยาว 256K
★
โหมดการทำงาน
มีทั้ง thinking และ non-thinking เลือกตามงาน
★
Multimodal
รองรับ multimodal มาแต่ต้น (natively)
★
การต่อใช้งาน
OpenAI-compatible API ผ่าน Nvidia NIM
★
จุดที่ปรับปรุง (ตามที่เคลม)
long-horizon coding, instruction following, self-correction

03เกี่ยวอะไรกับเรา

ฟันธงสั้น ๆ คือ ลองเลยสำหรับงานทดสอบ ใครอยากเอา Kimi K2.6 มาเทียบกับโมเดลที่ใช้อยู่ ว่าฝีมือโค้ดหรือการทำตาม instruction เป็นยังไง อันนี้เป็นทางที่ลองได้แบบไม่ต้องจ่าย เซ็ตไม่กี่นาทีก็เริ่มได้

แต่ต้องระวังคำว่า "ฟรี" ให้ดี — มันคือเงื่อนไข dev/trial ของ Nvidia ไว้สำหรับลองและพัฒนา ไม่ใช่ของฟรีสำหรับเอาไปรัน production จริง ถ้าจะเอาไปใช้ในงานที่มีคนใช้จริง มีโหลดจริง ต้องไปอ่านเงื่อนไขการใช้งานและแผนราคาให้ชัดก่อนเสมอ อย่าเผลอเอา trial endpoint ไปแบกงานจริงแล้วเจอลิมิตหรือเงื่อนไขทีหลัง

ต่อยอดในงานเรา ให้มองตัวนี้เป็น "สนามทดสอบ" — เอาไว้คัดว่าโมเดลตัวนี้คุ้มที่จะเอาเข้า workflow จริงไหม ลองกับงาน coding ที่ยาวหลายขั้นหรือ task ที่ต้องทำตาม instruction เป๊ะ ๆ ดูก่อน ถ้าผลเข้าตาแล้วค่อยวางแผนย้ายไปใช้ช่องทางที่รองรับ production พร้อมคิดต้นทุนให้ครบ