GPT-5.5 Instant ขึ้นเป็นโมเดลหลักของ ChatGPT แทน GPT-5.3
สารบัญ
สรุปให้ไว
default เปลี่ยนเงียบ ๆ
ถ้าคุณเปิด ChatGPT แล้วไม่ได้เลือกโมเดลเอง ตอนนี้คุณกำลังคุยกับ GPT-5.5 Instant แทน GPT-5.3 Instant แล้ว
เคลมว่าแม่นขึ้น
OpenAI บอกว่าตอบมั่ว (hallucination) น้อยลง 52.5% และเคลมผิดในบทสนทนายาก ๆ น้อยลง 37.3% เทียบกับ GPT-5.3
จำคุณได้มากขึ้น
ดึง memory และ personalization จากแชตเก่า ไฟล์ และ Gmail ที่เชื่อมไว้มาใช้ พร้อมตัวควบคุม "memory sources" ให้ดูที่มา
ทยอยปล่อย
เริ่มที่ Plus/Pro บนเว็บก่อน แล้วค่อยขยับไป mobile และ free/Business/Enterprise
01เปลี่ยนอะไร
OpenAI สลับโมเดลหลัก (default) ของ ChatGPT มาเป็น **GPT-5.5 Instant** แทนที่ **GPT-5.3 Instant** ตัวเดิม จุดสำคัญคือคนส่วนใหญ่ไม่ได้กดเลือกโมเดลเองอยู่แล้ว เปิดมาก็พิมพ์ใช้เลย ดังนั้นการเปลี่ยน default จึงกระทบคนที่ใช้ ChatGPT ทุกวันโดยที่อาจไม่ทันสังเกตว่าโมเดลข้างหลังเปลี่ยนไปแล้ว
นอกจากตัวโมเดล GPT-5.5 Instant ยังเพิ่มความสามารถด้าน memory และ personalization คือดึงบริบทจากแชตเก่า ไฟล์ที่เคยให้ และ Gmail ที่เชื่อมบัญชีไว้มาประกอบการตอบ พร้อมมีตัวควบคุมชื่อ **"memory sources"** ให้ผู้ใช้เห็นว่าคำตอบนั้นอ้างอิงข้อมูลส่วนตัวจากแหล่งไหนบ้าง ถือเป็นการเพิ่มความโปร่งใสมาคู่กับฟีเจอร์ที่ดึงข้อมูลส่วนตัวมาใช้มากขึ้น
การปล่อยเป็นแบบทยอย (rollout) ไม่ได้สลับให้ทุกคนพร้อมกัน เริ่มที่ผู้ใช้ **Plus/Pro บนเว็บ** ก่อน จากนั้นค่อยไป **mobile** แล้วถึงจะถึง **free/Business/Enterprise** ใครยังไม่เห็นการเปลี่ยนแปลงก็แปลว่าคิวยังมาไม่ถึง
02เคลมว่าแม่นขึ้นแค่ไหน
ตัวเลขที่ OpenAI ยกมาเทียบกับ GPT-5.3 ค่อนข้างเน้นเรื่อง "ตอบผิดน้อยลง" เป็นหลัก โดยเคลมว่า hallucination หรือการตอบมั่วลดลง **52.5%** และการเคลมข้อมูลไม่ถูกต้องในบทสนทนายาก ๆ (hard conversations) ลดลง **37.3%** ซึ่งเป็นสองตัวเลขที่ตรงกับปัญหาที่คนทำงานเจอบ่อยเวลาเอา ChatGPT ไปใช้กับงานจริง คือมันตอบลื่นแต่ดันใส่ข้อมูลผิดมาให้
ฝั่ง benchmark วัดความสามารถ OpenAI เคลมคะแนน **GPQA ที่ 85.6%** (จากเดิม 78.5%) และงานคณิตศาสตร์ (math) ที่ **81.2%** (จากเดิม 65.4%) จุดที่ขยับชัดที่สุดคือคณิตศาสตร์ที่กระโดดขึ้นมาเยอะ ส่วน memory/personalization ที่เพิ่มเข้ามาก็ช่วยให้คำตอบเข้ากับบริบทของผู้ใช้แต่ละคนมากขึ้น เพราะมันเห็นทั้งแชตเก่า ไฟล์ และ Gmail ที่เชื่อมไว้
ย้ำว่าตัวเลขทั้งหมดนี้เป็น **เคลมของผู้ผลิตเอง** ไม่ใช่ผลทดสอบจากกลางที่เป็นอิสระ
ตัวเลขที่ผู้ผลิตเคลม
- ★
Hallucination ลดลง 52.5%
ตอบมั่วน้อยลงเมื่อเทียบกับ GPT-5.3
- ★
เคลมผิดลดลง 37.3%
ในบทสนทนายาก ๆ (hard conversations) มีข้อมูลไม่ถูกต้องน้อยลง
- ★
GPQA 85.6%
ขึ้นจาก 78.5% ของ GPT-5.3
- ★
Math 81.2%
ขึ้นจาก 65.4% ของ GPT-5.3 เป็นจุดที่ขยับมากที่สุด
- ★
Memory/personalization
ดึงบริบทจากแชตเก่า ไฟล์ และ Gmail ที่เชื่อมไว้ พร้อมตัวควบคุม memory sources
03เกี่ยวอะไรกับเรา
ข่าวนี้กระทบคนที่ใช้ ChatGPT เป็นเครื่องมือทำงานประจำวันโดยตรง เพราะ default เปลี่ยนแบบที่เราไม่ต้องไปกดอะไร เปิดมาก็ได้โมเดลใหม่เลย ข้อดีคือถ้าเคลมเรื่องตอบมั่วน้อยลงเป็นจริง งานสาย research ตอบลูกค้า หรือสรุปเอกสารก็ควรพลาดน้อยลง แต่จุดที่ต้องชัดคือ **"แม่นขึ้น" ไม่ได้แปลว่า "ไม่ต้องตรวจ"** ตัวเลขทั้งหมดเป็นเคลมของผู้ผลิตเอง การลด hallucination 52.5% หมายความว่ามันยังมั่วได้อยู่ แค่ถี่น้อยลง งานที่กระทบเงิน ลูกค้า สัญญา หรือข้อมูล HR ยังต้องมี Human Gate คือจุดที่คนตรวจก่อนส่งเสมอ
อีกมุมที่ต้องคิดคือ personalization ที่ดึงแชตเก่า ไฟล์ และ Gmail มาใช้ ในแง่ความสะดวกมันช่วยให้ตอบเข้าบริบทเราจริง แต่ในแง่ความเป็นส่วนตัว แปลว่าโมเดลกำลังเห็นข้อมูลส่วนตัวของเรามากขึ้น โดยเฉพาะคนที่เชื่อม Gmail ที่ทำงานไว้ ควรไปดูตัวควบคุม memory sources ว่ามันดึงอะไรมาใช้บ้าง และระวังเป็นพิเศษถ้าในกล่องเมลมีข้อมูลลูกค้าหรือเรื่องภายในบริษัท
ส่วนการต่อยอด แนะนำให้ลองวางมันเป็น default ในงานที่ความเสี่ยงต่ำก่อน เช่น ร่างอีเมล สรุปประชุม ระดมไอเดีย แล้วค่อยขยับไปงานที่ซีเรียสขึ้นเมื่อเห็นว่าผลแม่นพอ ใครจะวางเป็น workflow หรือ skill ของทีมก็ควรล็อกขั้นตอน "คนตรวจก่อนใช้จริง" ไว้ในนั้นด้วย เพื่อให้ของใหม่ที่แม่นขึ้นช่วยให้งานเบาลงโดยที่ยังตรวจสอบได้