Call Me Thanut
book-openวิธีใช้

ลดการเผา token ใน Claude Fable 5 — 10 วิธีจัดการก่อนหมดโควตา

4 ก.ค. 2026อ่าน 6 นาที
ลดการเผา token ใน Claude Fable 5 — 10 วิธีจัดการก่อนหมดโควตา
สารบัญ

สรุปให้ไว

ทำไมต้องสน

Fable 5 กิน token หนักและใช้ได้แค่ราว 50% ของ subscription แถมหลัง 7 ก.ค. งานที่ทำจะไม่นับผ่าน subscription แล้ว

จัดโมเดลให้ถูกงาน

ให้ Fable 5 เป็นสถาปนิกวางแผน แล้วให้ Opus 4.8/Haiku หรือ GLM 5.2 ลงมือโค้ด ประหยัดได้ครึ่งหนึ่ง

สองเครื่องมือฟรี

Headroom บีบ context อัตโนมัติ ลด token ได้ 60–95% ส่วน Ponytail เป็น skill ที่ทำให้เขียนโค้ดน้อยลง 54–94%

นิสัยเล็ก ๆ

ตัด CLAUDE.md ให้สั้น ปิด web search เป็นค่าเริ่มต้น ใช้ /compact ที่ราว 60% และ /clear ทุกสองชั่วโมงพร้อมโน้ตส่งต่อ

01ทำไมเรื่องนี้ถึงสำคัญตอนนี้

Fable 5 เป็นโมเดลที่เก่งมาก แต่ถ้าใช้ไม่ระวังจะเผาโควตา token ที่มีในแพ็กเกจหมดเร็วอย่างน่าตกใจ บางคนใช้จนเต็มเพดานภายในไม่กี่ชั่วโมง ที่ต้องรีบคิดเรื่องนี้เพราะมันกิน token มากกว่าปกติและใช้ได้แค่ราวครึ่งหนึ่งของ subscription อีกทั้งตั้งแต่วันที่ 7 กรกฎาคมเป็นต้นไป งานที่ทำจะไม่ผ่านช่องทาง subscription เดิมแล้ว ช่วงนี้จึงเป็นจังหวะดีที่จะจัดระเบียบการใช้ token ให้อยู่มือ

02จัดโมเดลให้ถูกงาน

หลักคิดง่าย ๆ คือ "อย่าจ้างสถาปนิกมาแบกอิฐ" ทุกงานไม่จำเป็นต้องวิ่งผ่าน Fable 5 เสมอไป งานที่ยากจริง ๆ อย่างวางแผน ตัดสินใจ หรือไล่บั๊กหิน ๆ ให้ Fable 5 เป็นสถาปนิก แต่งานทั่วไปให้ Opus 4.8 เป็นคนลงมือเขียนโค้ด เพราะ Opus กิน token น้อยกว่า ส่วนงานย่อย ๆ ของ sub agent ใช้ Haiku หรือของที่ถูกกว่าอย่าง GLM 5.2 ก็ได้ (เช่นรัน Claude Code เวอร์ชันที่ต่อกับ GLM 5.2)

เครื่องมือและปุ่มที่ช่วยประหยัด

  • Effort dial

    ปรับระดับความพยายามได้ตั้งแต่ต่ำถึงสูงมาก งานเบา ๆ อย่างเขียนบล็อกตั้งต่ำ เก็บระดับสูงไว้ให้บั๊กหิน ๆ

  • Headroom (ฟรี โอเพนซอร์ส)

    บีบสิ่งที่ Claude Code ส่งในทุก session อัตโนมัติ ทีมผู้ทำระบุว่าลด token ได้ 60–95%

  • Ponytail (ฟรี โอเพนซอร์ส)

    skill ที่ทำตัวเหมือน senior dev ขี้เกียจ อ่านเฉพาะโค้ดที่จำเป็น เขียนน้อยลง 54% โดยเฉลี่ย สูงสุดถึง 94%

  • ตัด CLAUDE.md

    ยิ่งกฎเยอะ ยิ่งกิน token ทุกเทิร์น เก็บเฉพาะกฎที่สำคัญจริง ๆ

  • ปิด web search เป็นค่าเริ่มต้น

    หนึ่งครั้งค้นเว็บกิน token เยอะ เปิดเฉพาะตอนต้องใช้จริง

03จัดการ context ระหว่างทาง

สองคำสั่งที่คนมองข้ามคือ /compact และ /clear เมื่อคุยไปนาน ๆ บทสนทนาจะสะสมของที่ไม่จำเป็น ทำให้ทุกเทิร์นแพงขึ้น การพิมพ์ /compact จะย่อบทสนทนาให้เป็นสรุป ทำให้เทิร์นถัด ๆ ไปถูกลง เคล็ดลับคืออย่ารอให้ auto compact เด้งเองตอนชนเพดาน แต่ให้ compact เองที่ราว 60% แล้วต่อด้วย post-compact brief คือฉีดสรุปห้าบรรทัดของสิ่งที่ทำอยู่กลับเข้าไป เพื่อไม่ให้ agent ลืมงานและไฟล์ที่คุยกันมา

04เกี่ยวอะไรกับเรา

ฟันธง: ถ้าใช้ Fable 5 อยู่แล้วรู้สึกว่าโควตาหมดไว ลองหยิบวิธีเหล่านี้มาผสมกัน จัดโมเดลให้ถูกงาน ปรับ effort ให้พอดี ติด Headroom และ Ponytail แล้วคุม context ด้วย /compact กับ /clear รวม ๆ แล้วช่วยยืดการใช้งานได้หลายเท่าตัวโดยยังได้คุณภาพงานเท่าเดิม สิ่งที่ควรทำก่อนคือเริ่มจากการจัดโมเดล เพราะได้ผลชัดสุดและตั้งครั้งเดียวใช้ยาว ส่วนเครื่องมือโอเพนซอร์สให้ตรวจก่อนใช้กับงานจริงว่ามันไม่ตัด context ที่จำเป็นทิ้ง เอาไปวางเป็นกฎมาตรฐานของทีมได้เลย เพื่อให้ทุกคนใช้โมเดลแพง ๆ อย่างคุ้มค่าที่สุด