เลือกโมเดลให้ตรงงาน ลดค่า token ได้จริง
สารบัญ
สรุปให้ไว
ไม่ต้องแพงสุดทุกงาน
งานร่าง งานแปลง coding ง่าย ๆ ส่งไปโมเดลถูกได้ ประหยัดแบบเห็นตัวเลข
ราคามีสองส่วน
input price คือค่า token ที่เราส่งเข้าไป, output price คือค่า token ที่โมเดลสร้างกลับมา และ output มักแพงกว่า
โมเดลถูกที่น่าจับตา
DeepSeek V4 Pro, MiniMax M3, Kimi K2.6 ราคา input/output ต่างกันชัด เลือกตามงาน
route ผ่าน OpenRouter
API เดียวอยู่หน้าหลายเจ้า สลับโมเดลเทียบกันได้โดยไม่ต้องรื้อโค้ด
01ทำไมไม่ต้องใช้โมเดลแพงสุดทุกงาน
จุดที่หลายคนพลาดคือเปิดโมเดล frontier ตัวแพงสุดทิ้งไว้ใช้กับทุกงาน ตั้งแต่ร่างอีเมลยันเขียนโค้ดยาก ทั้งที่งานส่วนใหญ่ไม่ได้ต้องการสมองระดับนั้น การจับคู่โมเดลให้ตรงกับงาน (match a model to the task) ตัดค่าใช้จ่ายลงได้แบบเห็นผลทันที
ก่อนเทียบราคาต้องเข้าใจก่อนว่าค่า token แบ่งเป็นสองส่วน **input price คือค่า token ที่เราส่งเข้าไป** เช่น prompt กับเอกสารแนบ ส่วน **output price คือค่า token ที่โมเดลสร้างกลับมา** และฝั่ง output มักแพงกว่าเพราะการสร้างข้อความใช้ compute มากกว่าการอ่าน
ลองคิดเป็นตัวเลขจริง งานที่ส่ง input ราว 100k token แล้วได้ output กลับมาราว 20k token ถ้ารันบนโมเดลถูกจะตกอยู่ที่ประมาณ 0.06 ดอลลาร์ต่อครั้ง เห็นชัดว่าถ้างานนั้นไม่ได้ยากจนต้องใช้ตัวแพง การส่งไปโมเดลถูกคือการประหยัดที่ทำซ้ำได้ทุกวัน
02วิธีเลือกโมเดลให้ตรงงาน
เช็กลิสต์เลือกโมเดลมีอยู่ไม่กี่ข้อ เริ่มจากจับคู่งานกับโมเดลก่อน (task fit) แล้วค่อยไล่เทียบสี่อย่าง คือ input price, output price, context window และ benchmark เฉพาะงานนั้น ๆ ไม่ใช่ benchmark รวม ๆ เพราะโมเดลที่เก่งเขียนข้อความอาจไม่ได้เก่ง coding เท่ากัน
benchmark เฉพาะงานสำคัญตรงนี้ ตัวอย่างจาก index วัดงาน coding/agentic ตัว DeepSeek อยู่อันดับราว 4 ด้าน coding ที่คะแนนราว 47.5 เมื่อตั้ง max effort นั่นแปลว่ามันใช้งาน coding ได้ในราคาที่ถูกกว่าตัว frontier มาก เหมาะกับงานเขียนโค้ดที่ไม่ได้ซับซ้อนสุด ๆ
ส่วนเรื่อง context window ก็ต้องดูให้พอกับงาน DeepSeek V4 Pro มี context window ขนาด 1M token และในเดโมหนึ่งมันสร้างหน้า landing page ทั้งหน้าได้โดยใช้ context ราว 64,000 token เวลาจะสลับไปลองโมเดลอื่นเทียบ ให้ใช้ตัวรวมอย่าง OpenRouter ที่เป็น API เดียวอยู่หน้าผู้ให้บริการหลายเจ้า เปลี่ยนโมเดลเทียบราคาและผลลัพธ์ได้โดยไม่ต้องรื้อ integration ใหม่
| รายการ | โมเดล | input ($/1M) | output ($/1M) | context |
|---|---|---|---|---|
| DeepSeek V4 Pro | ~0.435 | ~0.87 | 1M | |
| MiniMax M3 | ~0.30 | ~1.20 | — | |
| Kimi K2.6 | — | ~4 | — |
03เกี่ยวอะไรกับเรา
ฟันธง นี่คือทักษะคุมต้นทุนที่คนทำงานควรมีติดตัว ไม่ใช่ทุกงานต้องจ่ายแพงสุด งานร่าง งานแปลงไฟล์ หรือ coding ง่าย ๆ ส่งไปโมเดลถูกได้สบาย ขอแค่ฝึกให้คล่อง อ่าน input/output price ดู context window แล้วเทียบ benchmark เฉพาะงานก่อนเลือก จากนั้น route ผ่าน OpenRouter เพื่อสลับเทียบได้ง่าย
ต่อยอด ลองทำ routing table ของทีมขึ้นมา งานง่ายส่งโมเดลถูก งานยากส่งโมเดลแพง แล้ววางคนตรวจ (reviewer) ไว้หน้างานสำคัญก่อนปล่อยจริง โดยเฉพาะงานที่แตะไฟล์ลูกค้า เงิน หรือสัญญา ราคาถูกลงได้ แต่จุดที่คนต้องตรวจยังต้องอยู่