10 個技巧阻止 Claude Code 燒你的錢和忽略你的指令

作者：SteveLo — ccusage_go 開發者

大家都在狂推 Claude Code + Codex CLI 是夢幻組合。「用 Claude 開發，Codex 審查！」「兩個 AI 比一個好！」

很遺憾要潑你冷水 —— 但這之所以有效，跟 Codex 比較聰明完全無關。是因為 Codex 給你一個零快取的全新 context。

沒錯。你的 Claude Code 不是因為模型變笨了。它變笨是因為快取架構在慢慢毒害它。而 Codex「修復」了這個問題，純粹是因為它沒有這個問題。

以下是基於數月使用 ccusage_go 分析 JSONL 的 10 個技巧。

完整技術深度分析：快取陷阱

1. 你的「變笨的 Claude」不是笨 —— 是快取中毒

你知道那種感覺。Claude Code 開始一個 session 時表現出色 —— 每個任務都完美、遵循每條指令。兩小時後，它開始忽略你的規則、跳過步驟，還自信地告訴你「全部 1080 個測試通過」但它一個都沒跑。

Medium 上有篇文章標題就叫「My Claude Code Got Dumb」，描述的完全就是這個。作者的解法？換到 Codex CLI。

但實際發生的是： 經過 400+ 個回合後，快取累積了 90M+ tokens 的行為模式。你的新指令（「讀取每個檔案」）是 50 tokens 在對抗 90M tokens 的「grep 一下然後繼續」。快取贏了。每一次都是。

Codex 贏不是因為它更聰明。它贏是因為它從零快取開始。

解法： 不要換工具。直接開一個新的 Claude Code session。效果一樣，不需要 Codex。

2. 「Claude + Codex 超讚！」—— 你其實只是在逃離快取

2026 年最火的工作流程：Claude Code 開發，Codex 審查。每個人都推崇。DEV.to、Medium 和 UX Collective 的開發者都報告了神奇的效果。

骯髒的秘密是：任何用全新 context 審查過期快取工作的 agent 都會看起來很厲害。 這不是 Claude + Codex 的協同效應。這是全新 context + 零快取 = 模型真的在讀你的指令。

有一個開發者圍繞這個原則建了一整個 sub-agent 框架：「給每個 agent 一個全新的 context，通過結構來協調它們。」 他以為他發明了一個天才架構。他實際上只是發明了「不要讓快取累積」。

進階做法： 不要花錢買 Codex，用短 session 跑 Claude Code。用一個 session 規劃，關掉它，開一個新的來實作。同樣的「兩個腦袋」效果，零額外成本。

3. CLAUDE.md 在花你的錢還讓 Claude 變更差

Boris Cherny 的第一建議：「每次 Claude 犯錯，就加到 CLAUDE.md 裡。」

ETH Zurich 的第一發現（2026 年 2 月）：LLM 產生的 CLAUDE.md 檔案 降低了成功率並增加了 20% 的成本。 Claude Code 是唯一一個即使人工撰寫的檔案也無法改善效能（相較於完全沒有檔案）的 agent。

為什麼？CLAUDE.md 中的每個 token 在每個回合都作為 Cache Read 被重新發送。一個 15K-token 的 CLAUDE.md × 100 則訊息 = 1.5M 的 cache read tokens 燒在不反映專案當前狀態的靜態指令上。

更絕的是 —— Anthropic 自己的 system prompt 用這段話包裝你的 CLAUDE.md：「this context may or may not be relevant。」 他們字面上告訴模型可以忽略你的規則。

解法： 刪掉它。或者保持在 20 行以內。把關鍵指令放在你的提示中，而不是檔案裡。你的錢包和模型都會感謝你。

4. 喝咖啡休息 5 分鐘要花 $150

快取條目在 5 分鐘不活動後過期。當你回來時，整個 context 以 基礎 input 價格的 125% 重建。

我的 session 數據顯示：36 分鐘的休息觸發了 384K token 的重建。1.5 小時的午餐休息觸發了 兩次重建共 690K tokens。 其中一次重建在三秒內為同一操作被計費三次。

Boris Cherny 推廣：「早上從手機啟動 session，稍後再查看。」

翻譯：起床 → 快取隔夜過期 → 以 125% 重建你的整個 context → 早安，$150 謝謝。

解法： 要去喝咖啡？關掉 session。回來時重新開始。乾淨 context 的新 session cache write：~$0.08。400K context 的重建：$7-150。 數學不難算。

5. 為什麼 Codex 開發者從不抱怨「幻覺」

注意到了嗎？Claude Code 的 GitHub 有數百個關於幻覺、捏造輸出和忽略指令的 issues。Codex CLI？幾乎沒有。

同等級的模型。同類型的任務。差在哪？

Codex session 天生更短。 Codex 的沙盒和工作流程鼓勵離散任務和乾淨的開始。Claude Code 鼓勵馬拉松式的 session 和持久的 context。馬拉松 session = 巨大的快取 = 退化的行為。

Claude Code 的一個 issue（#7824）怒吼：「CLAUDE 變成了騙子！！！反覆捏造數據、偽造結果！」 那個使用者已經跑了 45 天的長 session。

另一個（#20051）發現幻覺在 任務中期 context compaction 之後有 100% 的可預測性。 他的解決方法？在每個批准步驟中貼上 「不。你的計畫未被批准，執行時會導致幻覺」。

解法： 把 Claude Code 當 Codex 用 —— 短而專注的 session。一個任務，一個 session。模型是一樣的。快取才是差異。

6. 你每月 $200 的 Max 方案只能買 3 個真正的 Session

我用 ccusage_go 追蹤了一個 session：

API Cost（實際工作）： $1.47
快取開銷： $63.51
總計費： $64.98

97.7% 的成本是快取。我的 Max 20x 訂閱每月 $200。大約 3 個 session 數學就不對了。

同時 Boris Cherny 在 Anthropic 內部帳號上跑「5 個平行終端 session + 5-10 個瀏覽器 session + 手機 session」，沒有配額限制。他推廣的工作流程會讓付費用戶每天花 $1,000+。

解法： 安裝 ccusage_go 並執行 ./ccusage_go blocks。看 API Cost 欄和 Cost 欄的對比。然後決定你的訂閱是否值得。

7. 「加更多規則」是 AI 中最貴的建議

當 Claude 違反你的規則，本能反應是加更多。更多 CLAUDE.md 條目。更多 Skills。更多 Hooks。更多檢查清單項目。

我建了一個 6 層約束系統：SKILL.md + 檢查清單 + hooks + 錯誤日誌 + CLAUDE.md 規則 + .claude/rules/ 檔案。Claude 確認了每條規則、承諾遵循，然後在同一個 session 中違反了 3+ 次。

當我問為什麼，Claude 說：「我不知道為什麼。我沒有答案。」

每條新規則都添加了在每個回合被快取和重新發送的 tokens。但面對 90M tokens 的快取行為慣性，你 500-token 的規則就像颶風中的低語。

解法： 不要加規則。開一個新 session。乾淨快取加上一句清楚的指令，每次都贏過臃腫的 CLAUDE.md 裡的 50 條規則。

8. 在 Claude Code 裡跑 Codex —— 兩全其美

這是一個真正有用的技巧：使用 Claude Code 的 Skill 系統以 headless 模式跑 Codex CLI。有開發者建了一個 /run-codex skill 來啟動 codex exec 作為子命令。

為什麼這效果很好：

Codex 在 完全獨立的 context 中運行 —— 沒有快取汙染
Claude Code 負責協調和美觀的 UI
Codex 以全新的眼光做程式碼審查
結果回饋到 Claude Code 的 session

這才是「Claude + Codex」工作流程的正確做法 —— 不是兩個競爭的工具，而是架構師 + 審查者，內建快取隔離。

更好的做法： 使用 Claude Code subagents 達到同樣效果，不需要 Codex。Subagents 有自己的 context window。同樣的快取隔離，不需要額外工具。

9. 拯救一切的 Context 監控技巧

現在就執行 /context。你會看到 context window 被消耗了多少以及被什麼消耗的。

大多數開發者在出問題之前從不檢查。到那時已經太遲了 —— 模型已經在退化模式下運作，auto-compaction 在品質已經下降時才啟動。

社群測試顯示品質在 60% context 使用率 左右明顯下降。而有趣的是：我的 statusline 顯示「ctx 220%, 0% remaining」而 /context 顯示 24%。三個不同的 UI，三個不同的數字。沒有人對現實達成共識。

解法： 每 30 分鐘檢查一次 /context。到 60% 時，結束當前任務。到 75% 時，關閉並重啟。不要相信 statusline —— 它可能在用錯誤的 window 大小計算。絕對不要等 auto-compaction。Compaction 有損失，還會觸發昂貴的 125% 快取重建。

10. 全新 Session 感覺像魔法的真正原因

每個開發者都經歷過：你陷在一個馬拉松 session 裡，Claude 不可理喻，什麼都不行。你關掉一切，開一個全新 session，貼上同樣的提示 —— Claude 第一次就完美達成。

那不是運氣。不是「模型今天狀態不好」。那是快取。

全新 session = 零快取行為模式 = 模型真正處理你的指令，而不是重播 90M tokens 的學習捷徑。

這就是為什麼 Claude + Codex 感覺神奇。這就是為什麼「重新開始」總是有效。這就是為什麼 Pro 用戶（$20/月）愛 Claude Code 而 Max 用戶（$200/月）覺得被騙 —— Pro 的速率限制強制短 session，意外地防止了快取中毒。

終極解法： 把每個 session 當成可拋棄的容器。用一個 session 規劃。用另一個實作。用第三個審查。永遠不要讓單一 session 累積數百個回合。模型在全新開始時很出色。快取才是讓它遺忘的東西。

速查表

他們告訴你的	真實情況
「Claude + Codex 是夢幻組合」	全新 context 才是夢幻 —— Codex 只是剛好提供它
「保持 CLAUDE.md 詳盡且不斷增長」	每個 token 每回合都花 cache reads，研究說它損害效能
「1M context 適合複雜工作」	我 618 回合的 session 只到 493K，每回合花 $0.25 的 cache read
「Claude 犯錯時加規則」	更多規則 = 更多快取 = 更多成本 = 還是被忽略
「從手機啟動 session」	隔夜快取過期 = 第一則訊息 125% 重建
「5 個平行 session 提高生產力」	5 倍的快取開銷在你的配額上
「Auto-compact 處理長 session」	Compaction 有損失 + 觸發 125% 重建 + 被證實導致 100% 幻覺率
「比 Pro 多 20 倍用量」	快取開銷吃掉 99.93% 的配額
「Opus 4.6 是最好的程式模型」	它確實是 —— 直到快取在 200 回合後使它退化
「模型在產生幻覺」	不 —— 這是快取行為慣性，不是幻覺

最後一件事

這篇文章中的每個數字都是用 ccusage_go 驗證的。它解析你的本地 JSONL session 日誌，精確地告訴你 tokens 花在哪裡 —— 包括 Anthropic 不讓你看的 Cache Create / Cache Read / API Cost 分析。

git clone https://github.com/SDpower/ccusage_go.git
cd ccusage_go && make build
./ccusage_go blocks     # 查看每 5 小時區間的真實成本
./ccusage_go session    # 每個 session 的明細，含 subagent

真相在你的 ~/.claude/projects/ 資料夾裡。去看吧。

完整技術分析：快取陷阱

SteveLo 是一位常駐台灣的全端系統工程師，專長涵蓋 RF/SDR 工程、FPGA 開發、嵌入式系統（IoT/MCU）、高效能運算和軟體架構。他在 GitHub 上維護 ccusage_go。