Call Me Thanut
puzzleOpen Source

Caveman สกิลฟรีที่สั่งให้ Claude Code พูดสั้นลง — ลด output token ราว 65%

5 ก.ค. 2026อ่าน 5 นาที
Caveman สกิลฟรีที่สั่งให้ Claude Code พูดสั้นลง — ลด output token ราว 65%
สารบัญ

สรุปให้ไว

Caveman คืออะไร

สกิลโอเพนซอร์สที่สั่งให้ AI agent ตอบสั้น ตัดคำน้ำท่วมทุ่ง เพื่อลด output token

ลดได้เท่าไร

เฉลี่ยราว 65% (ตั้งแต่ 22% ถึง 87%) วัดจากการตอบจริงหลายสิบครั้ง

ติดตั้งยากไหม

คำสั่งบรรทัดเดียว รองรับ Claude Code, Codex, Gemini CLI, Cursor และอีกหลายสิบตัว

จุดที่ต้องรู้

ลดเฉพาะ token ตอน "ตอบ" ไม่แตะ token ตอน "คิด" (reasoning)

01มันคืออะไร

ลองนึกภาพว่าเวลา AI ตอบเรา ทุกคำที่มันพิมพ์กลับมาคือ output token ที่เราต้องจ่าย ยิ่งมันขึ้นต้นด้วย "ได้เลยครับ ยินดีช่วยเหลือ" แล้วต่อด้วยเกริ่นสามย่อหน้าก่อนเข้าเรื่อง เรายิ่งจ่ายค่าคำพวกนั้นฟรี ๆ

Caveman คือ "ไฟล์กติกา" (skill) ตัวเล็ก ๆ ที่ agent อ่านหนึ่งครั้งตอนเริ่มแชต แล้วเปลี่ยนวิธีพูดของมันให้สั้น ตรง เหมือนมนุษย์ถ้ำ — ตัดคำทักทาย ตัดคำเชื่อมเยิ่นเย้อ เหลือแต่เนื้อจริงเป็นท่อน ๆ ในรูปแบบ "ปัญหา–สิ่งที่ต้องทำ–เหตุผล–ขั้นต่อไป" มันไม่ได้ทำให้ AI "โง่ลง" เพราะสมองยังคิดเหมือนเดิม แค่ปากพูดน้อยลงเท่านั้น

02มีอะไรใหม่ / ทำอะไรได้

หัวใจของมันคือกฎสามข้อ: หนึ่ง โค้ด คำสั่ง path และ error message ห้ามแตะเด็ดขาด สั้นได้เฉพาะคำอธิบายเท่านั้น สอง รู้จังหวะที่ต้องพูดยาว เช่นเรื่องความปลอดภัยมันจะยอมอธิบายเพิ่ม สาม บีบแค่ "สำนวน" ไม่บีบ "ความหมาย" คำตอบเลยยังครบเท่าเดิม

ตัวเลขที่วัดได้จริงคือลด output token เฉลี่ยราว 65% ในการทดสอบสิบคำถาม ต่ำสุด 22% สูงสุด 87% และที่น่าสนใจคือมีงานวิจัยเดือนมีนาคม 2026 พบว่าการบังคับให้โมเดลตอบสั้นกลับช่วยเพิ่มความแม่นยำได้ถึง 26 จุดในบาง benchmark — พูดน้อยบางทีก็ตอบถูกกว่า

ฟีเจอร์ที่ใช้ได้จริง

  • ติดตั้งบรรทัดเดียว

    รันคำสั่งเดียวบน Mac/Linux/WSL (หรือ PowerShell บน Windows) ต้องมี Node 18 ขึ้นไป มันจะไล่หา agent ทุกตัวในเครื่องแล้วตั้งค่าให้เอง

  • สี่ระดับความสั้น

    light แค่ตัดคำเกริ่น, full โหมดมาตรฐาน, ultra สั้นแบบโทรเลข ปรับได้ตามงาน

  • เปิด/ปิดได้ทุกเมื่อ

    สั่ง /caveman เพื่อเปิด หรือ normal mode เพื่อกลับปกติ บน Claude Code มี hook เปิดอัตโนมัติตั้งแต่ข้อความแรก

  • /caveman-compress

    เอาไปบีบไฟล์ memory อย่าง CLAUDE.md ให้สั้นลง โดยเก็บโค้ด/URL/path ครบทุกตัวอักษร ลด input token ได้ราว 46% และประหยัดซ้ำทุกเซสชัน

  • /caveman-stats

    อ่าน log เซสชันจริง บอกว่าประหยัด token และเงินไปเท่าไร พร้อมป้ายสรุปยอดสะสมบน statusline

03เกี่ยวอะไรกับเรา

ฟันธง: ถ้าคุณใช้ Claude Code โดยเฉพาะกับ Fable 5 ที่ค่า output แพงระดับ 50 ดอลลาร์ต่อล้าน token (แพงกว่า Opus 4.8 เท่าตัว) อันนี้ควรลอง เพราะฟรี ติดตั้งครั้งเดียว และปิดได้ตลอดถ้าไม่ชอบ ความเสี่ยงต่ำ ผลตอบแทนชัด และช่วงที่ subscription Fable 5 กำลังจะเปลี่ยนไปคิดเงินแบบ API พอดี การรีดค่า output ออกทุกบาทยิ่งคุ้ม

จุดที่ต้องเข้าใจให้ตรงคือมันลดเฉพาะ token ตอนตอบ ส่วน token ตอนคิดหรือ reasoning ไม่ได้ลด งานที่ให้ AI คิดหนัก ๆ บิลจึงไม่ได้หายไปครึ่งหนึ่ง และตัวสกิลเองก็บวก input เพิ่มเล็กน้อยทุกเทิร์น ถ้าจะเอาไปใช้จริง อย่าลืม Human Gate สั้น ๆ: หลังสั่ง /caveman-compress กับไฟล์ memory ให้เปิดอ่านสักรอบว่าคำสั่งสำคัญยังอยู่ครบ เพราะไฟล์นั้นถูกโหลดเข้าใช้ทุกเซสชัน

04จุดที่ต้องระวัง

คำตอบที่สั้นลงเหมาะกับงานโค้ดและงานที่อยากได้คำตอบตรง ๆ แต่ถ้าเป็นงานที่ต้องการคำอธิบายละเอียดให้คนอื่นอ่านต่อ อาจต้องสลับกลับ normal mode เป็นบางครั้ง มองมันเป็นสวิตช์ที่เปิดตอนไล่โค้ดเร็ว ๆ แล้วปิดตอนต้องเขียนอธิบายยาว จะได้ประโยชน์ทั้งสองทางโดยไม่ต้องเลือกอย่างใดอย่างหนึ่ง

โปรเจกต์ open-source

อยากลองเองไหม? โปรเจกต์นี้เป็น open-source โหลด repo ทางการมาลองได้เลย

ดูบน GitHub →