Call Me Thanut
puzzleOpen Source

DeepSeek-V4-Flash มาแล้ว — โมเดลเปิด MoE context 1M เปิดให้ใช้ฟรีช่วงสั้น ๆ

23 มิ.ย. 2026อ่าน 5 นาที
DeepSeek-V4-Flash มาแล้ว — โมเดลเปิด MoE context 1M เปิดให้ใช้ฟรีช่วงสั้น ๆ
สารบัญ

สรุปให้ไว

โมเดลเปิดตัวใหม่

DeepSeek-V4-Flash เป็นโมเดลแบบ mixture-of-experts ขนาดรวม 284B แต่ปลุกใช้จริงแค่ ~13B ต่อคำถาม

context 1 ล้าน token

โยนเอกสารกองโตเข้าไปได้ทั้งก้อนโดยไม่ลืมต้นเรื่อง

สามโหมดคิด

quick สำหรับงานง่าย, thinking และ deeper thinking สำหรับงานยาก เลือกความหนักได้

ลองฟรีช่วงสั้น ๆ

เปิดให้ใช้ฟรีทั้งขาเข้าขาออกบนแพลตฟอร์มหนึ่ง มีกำหนดเวลา + จำกัด ~10 คำขอต่อนาที

01DeepSeek-V4-Flash คืออะไร

DeepSeek ปล่อยโมเดลเปิดตัวใหม่ชื่อ DeepSeek-V4-Flash ออกมา จุดเด่นคือสถาปัตยกรรมแบบ mixture-of-experts หรือ MoE ให้นึกภาพง่าย ๆ ว่าแทนที่จะมีสมองก้อนเดียวมาทำทุกงาน โมเดลถูกสร้างเป็น "ทีมผู้เชี่ยวชาญ" หลายคน เวลาเราถามอะไร มันจะปลุกเฉพาะผู้เชี่ยวชาญไม่กี่คนที่จำเป็นกับงานนั้น ที่เหลือนอนพักไว้

ตัวเลขสะท้อนเรื่องนี้ชัด โมเดลมีพารามิเตอร์รวมราว 284 พันล้าน แต่สำหรับคำถามหนึ่งครั้งมันปลุกใช้จริงแค่ราว 13 พันล้านเท่านั้น ผลคือได้ความฉลาดของโมเดลตัวใหญ่ แต่เร็วและกินทรัพยากรน้อยเหมือนตัวเล็ก นั่นคือหัวใจของ MoE

02มีอะไรใหม่ที่น่าสนใจ

อย่างแรกคือ context window ที่ยาวถึง 1 ล้าน token context window คือ "ความจำในหัว" ของโมเดลว่ารับข้อมูลได้มากแค่ไหนในคราวเดียว โมเดลทั่วไปพอข้อความยาว ๆ มักลืมตอนต้นไปแล้วก่อนถึงตอนจบ แต่ตัวนี้ถือข้อมูลกองใหญ่ได้ทั้งก้อนและตามเรื่องได้ตลอด เหมาะกับงานอ่านเอกสารยาว สรุปไฟล์เยอะ ๆ หรือทำงานทั้งโปรเจกต์พร้อมกัน

อย่างที่สองคือมีสามโหมดความคิดให้เลือก โหมด quick สำหรับงานง่ายที่ต้องการคำตอบไว, โหมด thinking เมื่ออยากให้มันคิดเป็นขั้นตอน และโหมด deeper thinking สำหรับโจทย์ยากจริง ๆ ข้อดีคือเราเลือกได้ว่าจะให้มันคิดหนักแค่ไหน ไม่เปลืองเวลากับงานง่าย และไม่ลวก ๆ กับงานยาก

DeepSeek เคลมว่าเก่งตรงไหน

  • agentic coding

    เคลมว่าทำคะแนนนำกลุ่มโมเดลเปิดด้วยกันในงานโค้ดแบบ agentic ที่รับเป้าหมายแล้วลุยเป็นขั้น ๆ เองได้

  • ความรู้รอบตัว

    เคลมว่านำกลุ่มโมเดลเปิดด้านความรู้ทั่วไป ตามหลังแค่โมเดลปิดระดับท็อปตัวเดียว

  • เร็วเพราะ MoE

    ปลุกพารามิเตอร์แค่ ~13B ต่อครั้ง จึงตอบไวและประหยัดกว่าตัวที่ใหญ่เท่ากันแต่ทำงานทั้งก้อน

  • (ข้อควรจำ)

    ตัวเลขเก่งทั้งหมดนี้ยังเป็นเคลมของผู้ผลิตเอง ยังไม่มีผลทดสอบอิสระยืนยัน

03จุดที่ต้องระวัง

เรื่องแรกคือ "ฟรี" มีกำหนดเวลา โมเดลเปิดให้ใช้ฟรีทั้งขาเข้าและขาออกบนแพลตฟอร์มโมเดลแห่งหนึ่ง โดยมีแหล่งข่าวระบุว่าหน้าต่างฟรีจะปิดราวปลายเดือนมิถุนายน ขณะที่ตัวแพลตฟอร์มเองบอกว่าจะประกาศวันสิ้นสุดที่แน่นอนแยกอีกที ฉะนั้นให้ถือว่าวันที่เป็นแค่การเตือนล่วงหน้า ไม่ใช่คำมั่น และยังมีลิมิตการยิงราว 10 คำขอต่อนาที พอสำหรับเรียนรู้และทดลอง แต่ไม่เหมาะเอาไปรันงานโปรดักชันจริง

เรื่องที่สองคือตัวเลขความเก่งยังเป็นของผู้ผลิตเอง ช่วงนี้มีหลายเคสที่ benchmark ของเจ้าของโมเดลสวยกว่าที่ใช้จริง ฉะนั้นก่อนเชื่อ ลองยิงโจทย์ของตัวเองเทียบดูก่อนเสมอ

04เกี่ยวอะไรกับเรา

สำหรับคนทำงานที่อยากลองโมเดลแรง ๆ โดยไม่ต้องจ่ายเงิน นี่คือจังหวะดี เพราะได้ทั้งความเร็วแบบ MoE และ context 1 ล้าน token ที่เอาไว้โยนเอกสารยาวหรือทั้งโปรเจกต์เข้าไปได้

ฟันธง: ลองได้เลยช่วงฟรี เอาไว้เทสต์งานอ่าน-สรุปเอกสารยาว ๆ หรืองานโค้ดแบบ agentic แต่ยึดสองข้อนี้ไว้ หนึ่ง อย่าผูกงานจริงไว้กับหน้าต่างฟรีที่มีวันปิด ถ้าจะใช้ระยะยาวต้องวางแผนค่าใช้จ่ายเผื่อ และสอง อย่าเพิ่งยัดข้อมูลบริษัทหรือลูกค้าเข้าโมเดลฟรีบนแพลตฟอร์มที่เรายังไม่รู้นโยบายข้อมูลของเขา ให้ใช้ข้อมูลทดสอบหรือข้อมูลสาธารณะไปก่อน เมื่อพิสูจน์ว่าโมเดลทำงานได้ดีกับโจทย์เราจริง ค่อยตัดสินใจว่าจะวางมันไว้ตรงไหนใน workflow