DeepSeek-V4-Flash มาแล้ว — โมเดลเปิด MoE context 1M เปิดให้ใช้ฟรีช่วงสั้น ๆ
สารบัญ
สรุปให้ไว
โมเดลเปิดตัวใหม่
DeepSeek-V4-Flash เป็นโมเดลแบบ mixture-of-experts ขนาดรวม 284B แต่ปลุกใช้จริงแค่ ~13B ต่อคำถาม
context 1 ล้าน token
โยนเอกสารกองโตเข้าไปได้ทั้งก้อนโดยไม่ลืมต้นเรื่อง
สามโหมดคิด
quick สำหรับงานง่าย, thinking และ deeper thinking สำหรับงานยาก เลือกความหนักได้
ลองฟรีช่วงสั้น ๆ
เปิดให้ใช้ฟรีทั้งขาเข้าขาออกบนแพลตฟอร์มหนึ่ง มีกำหนดเวลา + จำกัด ~10 คำขอต่อนาที
01DeepSeek-V4-Flash คืออะไร
DeepSeek ปล่อยโมเดลเปิดตัวใหม่ชื่อ DeepSeek-V4-Flash ออกมา จุดเด่นคือสถาปัตยกรรมแบบ mixture-of-experts หรือ MoE ให้นึกภาพง่าย ๆ ว่าแทนที่จะมีสมองก้อนเดียวมาทำทุกงาน โมเดลถูกสร้างเป็น "ทีมผู้เชี่ยวชาญ" หลายคน เวลาเราถามอะไร มันจะปลุกเฉพาะผู้เชี่ยวชาญไม่กี่คนที่จำเป็นกับงานนั้น ที่เหลือนอนพักไว้
ตัวเลขสะท้อนเรื่องนี้ชัด โมเดลมีพารามิเตอร์รวมราว 284 พันล้าน แต่สำหรับคำถามหนึ่งครั้งมันปลุกใช้จริงแค่ราว 13 พันล้านเท่านั้น ผลคือได้ความฉลาดของโมเดลตัวใหญ่ แต่เร็วและกินทรัพยากรน้อยเหมือนตัวเล็ก นั่นคือหัวใจของ MoE
02มีอะไรใหม่ที่น่าสนใจ
อย่างแรกคือ context window ที่ยาวถึง 1 ล้าน token context window คือ "ความจำในหัว" ของโมเดลว่ารับข้อมูลได้มากแค่ไหนในคราวเดียว โมเดลทั่วไปพอข้อความยาว ๆ มักลืมตอนต้นไปแล้วก่อนถึงตอนจบ แต่ตัวนี้ถือข้อมูลกองใหญ่ได้ทั้งก้อนและตามเรื่องได้ตลอด เหมาะกับงานอ่านเอกสารยาว สรุปไฟล์เยอะ ๆ หรือทำงานทั้งโปรเจกต์พร้อมกัน
อย่างที่สองคือมีสามโหมดความคิดให้เลือก โหมด quick สำหรับงานง่ายที่ต้องการคำตอบไว, โหมด thinking เมื่ออยากให้มันคิดเป็นขั้นตอน และโหมด deeper thinking สำหรับโจทย์ยากจริง ๆ ข้อดีคือเราเลือกได้ว่าจะให้มันคิดหนักแค่ไหน ไม่เปลืองเวลากับงานง่าย และไม่ลวก ๆ กับงานยาก
DeepSeek เคลมว่าเก่งตรงไหน
- ★
agentic coding
เคลมว่าทำคะแนนนำกลุ่มโมเดลเปิดด้วยกันในงานโค้ดแบบ agentic ที่รับเป้าหมายแล้วลุยเป็นขั้น ๆ เองได้
- ★
ความรู้รอบตัว
เคลมว่านำกลุ่มโมเดลเปิดด้านความรู้ทั่วไป ตามหลังแค่โมเดลปิดระดับท็อปตัวเดียว
- ★
เร็วเพราะ MoE
ปลุกพารามิเตอร์แค่ ~13B ต่อครั้ง จึงตอบไวและประหยัดกว่าตัวที่ใหญ่เท่ากันแต่ทำงานทั้งก้อน
- ★
(ข้อควรจำ)
ตัวเลขเก่งทั้งหมดนี้ยังเป็นเคลมของผู้ผลิตเอง ยังไม่มีผลทดสอบอิสระยืนยัน
03จุดที่ต้องระวัง
เรื่องแรกคือ "ฟรี" มีกำหนดเวลา โมเดลเปิดให้ใช้ฟรีทั้งขาเข้าและขาออกบนแพลตฟอร์มโมเดลแห่งหนึ่ง โดยมีแหล่งข่าวระบุว่าหน้าต่างฟรีจะปิดราวปลายเดือนมิถุนายน ขณะที่ตัวแพลตฟอร์มเองบอกว่าจะประกาศวันสิ้นสุดที่แน่นอนแยกอีกที ฉะนั้นให้ถือว่าวันที่เป็นแค่การเตือนล่วงหน้า ไม่ใช่คำมั่น และยังมีลิมิตการยิงราว 10 คำขอต่อนาที พอสำหรับเรียนรู้และทดลอง แต่ไม่เหมาะเอาไปรันงานโปรดักชันจริง
เรื่องที่สองคือตัวเลขความเก่งยังเป็นของผู้ผลิตเอง ช่วงนี้มีหลายเคสที่ benchmark ของเจ้าของโมเดลสวยกว่าที่ใช้จริง ฉะนั้นก่อนเชื่อ ลองยิงโจทย์ของตัวเองเทียบดูก่อนเสมอ
04เกี่ยวอะไรกับเรา
สำหรับคนทำงานที่อยากลองโมเดลแรง ๆ โดยไม่ต้องจ่ายเงิน นี่คือจังหวะดี เพราะได้ทั้งความเร็วแบบ MoE และ context 1 ล้าน token ที่เอาไว้โยนเอกสารยาวหรือทั้งโปรเจกต์เข้าไปได้
ฟันธง: ลองได้เลยช่วงฟรี เอาไว้เทสต์งานอ่าน-สรุปเอกสารยาว ๆ หรืองานโค้ดแบบ agentic แต่ยึดสองข้อนี้ไว้ หนึ่ง อย่าผูกงานจริงไว้กับหน้าต่างฟรีที่มีวันปิด ถ้าจะใช้ระยะยาวต้องวางแผนค่าใช้จ่ายเผื่อ และสอง อย่าเพิ่งยัดข้อมูลบริษัทหรือลูกค้าเข้าโมเดลฟรีบนแพลตฟอร์มที่เรายังไม่รู้นโยบายข้อมูลของเขา ให้ใช้ข้อมูลทดสอบหรือข้อมูลสาธารณะไปก่อน เมื่อพิสูจน์ว่าโมเดลทำงานได้ดีกับโจทย์เราจริง ค่อยตัดสินใจว่าจะวางมันไว้ตรงไหนใน workflow