Call Me Thanut
puzzleOpen Source

DeepSeek V4 หั่นราคา API สูงสุด 90% และเริ่ม validate บนชิป Huawei

2 พ.ค. 2026อ่าน 4 นาที
DeepSeek V4 หั่นราคา API สูงสุด 90% และเริ่ม validate บนชิป Huawei
สารบัญ

สรุปให้ไว

ราคาหั่นแรง

DeepSeek ลดค่า API ของ V4 สูงสุดถึง 90% โดย V4 Pro ฝั่ง input ลงจากราว 14.5 เหลือ 3.6 cents ต่อล้าน token

ไม่ผูกกับ Nvidia เจ้าเดียว

โมเดล validate ทั้งบน Nvidia และ Huawei Ascend แล้ว พร้อมค่ายชิปจีนอีกหลายรายประกาศรองรับ

ยังไม่ใช่ที่หนึ่งทุกด้าน

DeepSeek ยอมรับเองว่า V4 ยังตามหลัง Claude 4.6 และ Gemini 3.1 Pro ในบางงาน

จังหวะของ open-source

เมื่อราคาถูกลงขนาดนี้ แรงกดดันไปตกที่เจ้าตลาดที่ตั้งราคาแบบ premium

01สงครามราคาเริ่มแล้ว

ถ้าคุณรู้จัก DeepSeek V4 อยู่แล้วจากตอนเปิดตัว รอบนี้ข่าวที่ต้องโฟกัสไม่ใช่ว่ามันคืออะไร แต่คือ "ราคา" ที่ขยับจนเขย่าตลาดได้จริง

DeepSeek ประกาศลดค่า API ของ V4 สูงสุดถึง 90% โดยฝั่ง input ของ V4 Pro ลงจากราว 14.5 cents เหลือประมาณ 3.6 cents ต่อล้าน token นี่คือการตัดราคาแบบเต็มแรง ไม่ใช่ลดเล็กน้อยเพื่อโปรโมต

ฝั่งราคาในจีน (ประกาศ 26 เม.ย.) ยิ่งเห็นภาพชัด V4 Flash คิดค่า cached input ที่ 0.02 หยวนต่อล้าน token ส่วน V4 Pro มีโปรช่วง cached input ที่ 0.025 หยวนต่อล้าน token ตัวเลขระดับนี้แปลว่าต้นทุนต่อการเรียกใช้งานถูกลงจนเปลี่ยนสมการการเลือกโมเดลของหลายทีมได้เลย

02ไม่ผูกกับ Nvidia เจ้าเดียว

อีกมุมที่สำคัญไม่แพ้ราคาคือเรื่องชิป ปกติเวลาพูดถึงการรันโมเดลใหญ่ ทุกคนจะนึกถึง Nvidia เป็นค่าเริ่มต้น แต่รอบนี้ DeepSeek validate V4 ทั้งบน Nvidia และ Huawei Ascend แล้ว

นอกจากนั้นยังมีค่ายชิปจีนอีกหลายรายอย่าง MetaX, Cambricon และ Moore Threads ประกาศรองรับตามมา พูดง่าย ๆ คือโมเดลนี้ไม่ได้ล็อกอยู่กับฮาร์ดแวร์เจ้าเดียว ซึ่งเป็นนัยเชิงโครงสร้างว่าฝั่งจีนกำลังลดการพึ่งพา Nvidia ลงเรื่อย ๆ

สิ่งที่ตามมาคือความยืดหยุ่นในการ deploy และแรงกดดันด้านราคา เมื่อมีตัวเลือกชิปมากขึ้น ต้นทุนการรันก็มีโอกาสถูกลง และนั่นคือเหตุผลหนึ่งที่ทำให้การหั่นราคา API ครั้งนี้เป็นไปได้

ทั้งนี้ต้องบอกตรง ๆ ว่า DeepSeek เองยอมรับว่า V4 ยังตามหลัง Claude 4.6 และ Gemini 3.1 Pro ในบางด้าน เพราะฉะนั้นเรื่องนี้เป็นเรื่องของ "ราคาต่อคุณภาพ" ไม่ใช่การเคลมว่าดีที่สุดทุกมิติ

ตัวเลขที่ต้องรู้

  • ลดราคา API สูงสุด 90%

    V4 Pro ฝั่ง input ลงจากราว 14.5 เหลือ 3.6 cents ต่อล้าน token

  • ราคาในจีน V4 Flash

    cached input ที่ 0.02 หยวนต่อล้าน token (ประกาศ 26 เม.ย.)

  • ราคาในจีน V4 Pro

    โปร cached input ที่ 0.025 หยวนต่อล้าน token

  • รันได้หลายชิป

    validate ทั้ง Nvidia และ Huawei Ascend, มี MetaX/Cambricon/Moore Threads รองรับ

  • ยังไม่ใช่อันดับหนึ่งทุกงาน

    ตามหลัง Claude 4.6 และ Gemini 3.1 Pro ในบางด้านตามที่ DeepSeek ระบุเอง

  • งานวิจัยใหม่ Thinking with Visual Primitives

    ใช้ visual-memory entries น้อยกว่าคู่แข่งมาก ทำ maze navigation ได้ 66.9% เทียบกับ GPT-5.4 ที่ 50.6%

03เกี่ยวอะไรกับเรา

สำหรับทีมไทยที่ต้องคิดเรื่องต้นทุนเป็นหลัก ราคาที่ลงระดับนี้คือสิ่งที่ควรหยิบมาคำนวณใหม่ทันที งานที่เคยรู้สึกว่าเรียก API บ่อย ๆ แล้วบิลบาน เช่น สรุปเอกสารจำนวนมาก จัดหมวดข้อมูล หรือ workflow ที่วน loop หลายรอบ พอต้นทุนต่อ token ถูกลงขนาดนี้ ก็เปิดทางให้ลองงานที่เมื่อก่อนไม่คุ้มได้

มุมที่น่าจับตาในเชิงตลาดคือ นี่เป็นจังหวะที่ฝั่ง open-source เริ่มกดดันเจ้าตลาดที่ตั้งราคาแบบ premium จริง ๆ เมื่อมีตัวเลือกที่ถูกลงมากและรันได้หลายชิป เจ้าอื่นก็ต้องตอบ ซึ่งสุดท้ายคนได้ประโยชน์คือทีมที่เป็นผู้ใช้

แต่ฟันธงให้ชัด: อย่าย้ายทุกอย่างมาเพราะราคาอย่างเดียว วิธีที่ปลอดภัยคือทดสอบเป็นงาน ๆ เอางานที่ไม่ใช่ข้อมูลอ่อนไหวมาเทียบคุณภาพ V4 กับโมเดลที่ใช้อยู่ก่อน ถ้าได้คุณภาพที่รับได้ในงานนั้นแล้วต้นทุนถูกกว่ามาก ค่อยขยับ ส่วนงานที่ต้องการความแม่นสูงสุดก็ยังควรอยู่กับตัวที่นำหน้าตามที่ DeepSeek เองก็ยอมรับ

ต่อยอด: ลองตั้งเป็น cost-router ง่าย ๆ ในระบบของเรา คือกำหนดให้งานหนัก ๆ ที่ทนคุณภาพระดับกลางได้วิ่งไป V4 ส่วนงานสำคัญส่งไปโมเดลตัวท็อป แล้วใส่ Human Gate ตรงจุดที่ผลลัพธ์มีผลกับลูกค้าหรือเงิน วิธีนี้ได้ทั้งประหยัดต้นทุนและคุมคุณภาพไปพร้อมกัน

โปรเจกต์ open-source

อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย

ดูบน Hugging Face →