ลด token และ context ใน Claude Code ไม่ให้ชน usage limit
สารบัญ
สรุปให้ไว
เช็กก่อนด้วย /context
สั่ง `/context` ดูว่า token หมดไปกับอะไรบ้างก่อนจะไปแก้
MCP tool-search ช่วยได้เยอะ
เปิด lazy load ตัวอย่างหนึ่ง context เริ่มต้นลดจาก 11.3% เหลือ 6%
CLI กินที่น้อยกว่า MCP
สลับ third-party app มาเรียกผ่าน CLI ตัวอย่างหนึ่งประหยัดได้ราว 64,000 tokens
ตัด skills กับ claude.md
ของสองอย่างนี้โหลดทุกครั้ง ถ้าไม่จำเป็นให้ย่อหรือตัดทิ้ง
01ทำไม context ถึงบวมจนชน limit
context window คือพื้นที่ความจำที่ Claude Code เอาไว้ถือทุกอย่างในงานหนึ่งรอบ ทั้งคำสั่ง ไฟล์ที่อ่าน เครื่องมือที่ต่อไว้ และไฟล์ความจำต่าง ๆ ปัญหาคือของพวกนี้หลายอย่างถูกโหลดเข้ามาตั้งแต่ก่อนเริ่มงานจริง ยังไม่ทันพิมพ์อะไร context ก็เต็มไปแล้วส่วนหนึ่ง
พอ context บวม จะเจอสองอย่าง คือชน usage limit ไวขึ้น และ session เริ่ม auto-compact (บีบอัดความจำ) บ่อยขึ้น ซึ่งทั้งคู่ทำให้ทำงานยาว ๆ ได้ลำบาก หัวใจของการแก้คือ ตัดของที่ไม่ได้ใช้ออกตั้งแต่ต้นทาง ไม่ใช่รอให้เต็มแล้วค่อยมาบีบ
02ลด token ยังไง (วิธีหลักทีละ step)
step แรก สั่ง `/context` เพื่อดูว่าตอนนี้ token ถูกใช้ไปกับ category ไหนบ้าง อันนี้คือการตรวจก่อนผ่าตัด จะได้รู้ว่าตัวที่กินที่จริง ๆ คืออะไร ไม่ใช่เดามั่ว
step ต่อมา เปิด MCP tool-search หรือโหมด lazy load ของ tool แทนที่จะโหลดรายละเอียดของทุก tool เข้ามาตั้งแต่แรก ระบบจะค่อยดึงเฉพาะตอนที่ต้องใช้ ในตัวอย่างหนึ่ง context เริ่มต้นลดจาก 11.3% เหลือ 6%
step ที่สาม สำหรับ third-party app อย่าง Supabase, Sentry, Vercel, Jira, Firecrawl และ Google Calendar ให้เลี่ยงการต่อผ่าน MCP server แล้วหันมาเรียกผ่าน CLI แทน เพราะ MCP server จะโหลด schema ของ tool ทั้งชุดเข้ามากิน context ส่วน CLI เรียกเท่าที่ใช้ ตัวอย่างหนึ่งวิธีนี้ประหยัดไปได้ราว 64,000 tokens
step สุดท้าย ไล่ตรวจ skills กับไฟล์ claude.md เพราะสองอย่างนี้ถูกโหลดเข้า context ทุกครั้งที่เปิดงาน ถ้ามี skill ที่ไม่ค่อยได้ใช้หรือเขียนยืดเกินไป ให้ย่อหรือตัดออก ตัวอย่างที่ทำได้คือ skills จาก 2.3% เหลือ 1.7% และ claude.md จากราว 1.6% เหลือ 0.7%
เช็กลิสต์ลด token
- ★
สั่ง /context ก่อนเสมอ
ดูว่า token หมดไปกับอะไรก่อนตัดสินใจตัดอะไร
- ★
เปิด MCP tool-search (lazy load)
โหลด tool เฉพาะตอนใช้ ตัวอย่างลด context เริ่มต้นจาก 11.3% เหลือ 6%
- ★
ใช้ CLI แทน MCP server
สำหรับ Supabase, Sentry, Vercel, Jira, Firecrawl, Google Calendar ตัวอย่างประหยัดราว 64,000 tokens
- ★
ย่อ skills
ตัดของที่ไม่ได้ใช้ ตัวอย่างลดจาก 2.3% เหลือ 1.7%
- ★
ย่อ claude.md
เก็บเฉพาะที่จำเป็น ตัวอย่างลดจากราว 1.6% เหลือ 0.7%
- ★
ปรับ settings.json
ลด auto-compact threshold ไปราว 50-75%, ขยาย cap ของ bash output, ใส่ deny rule ให้ node_modules, dist, build และไฟล์ lock
03เกี่ยวอะไรกับเรา
ทริกชุดนี้ลุยได้ทันที ไม่ต้องรอใคร และคุ้มที่สุดถ้าทำให้เป็นนิสัย คือก่อนเริ่มงานใหญ่ที่รู้ว่าจะยาว ให้สั่ง `/context` ตรวจสักรอบหนึ่งก่อนเสมอ เหมือนเช็กว่าโต๊ะทำงานโล่งพอจะกางของจริงไหม ถ้าเห็นว่า MCP server หรือ skill ไหนกินที่โดยไม่ได้ใช้ในงานนี้ ก็จัดการก่อนลงมือ จะได้ทำงานต่อเนื่องยาว ๆ โดยไม่ต้องมานั่งลุ้นว่าจะชน limit กลางทาง
ต่อยอดได้อีกขั้นด้วยการเซ็ต settings.json ครั้งเดียวให้เป็นค่าเริ่มต้นของทุกงาน ทั้ง deny rule กันไม่ให้ Claude Code ไปอ่านโฟลเดอร์ที่ไม่จำเป็นอย่าง node_modules หรือ build และตั้ง threshold ของ auto-compact ไว้ พอวางระบบไว้ดีตั้งแต่ต้น งานถัด ๆ ไปก็ context ผอมโดยไม่ต้องมาคอยตัดมือทุกครั้ง