10 個技巧阻止 Claude Code 燒你的錢和忽略你的指令
作者:SteveLo — ccusage_go 開發者
大家都在狂推 Claude Code + Codex CLI 是夢幻組合。「用 Claude 開發,Codex 審查!」「兩個 AI 比一個好!」
很遺憾要潑你冷水 —— 但這之所以有效,跟 Codex 比較聰明完全無關。是因為 Codex 給你一個零快取的全新 context。
沒錯。你的 Claude Code 不是因為模型變笨了。它變笨是因為快取架構在慢慢毒害它。而 Codex「修復」了這個問題,純粹是因為它沒有這個問題。
以下是基於數月使用 ccusage_go 分析 JSONL 的 10 個技巧。
完整技術深度分析:快取陷阱
1. 你的「變笨的 Claude」不是笨 —— 是快取中毒
你知道那種感覺。Claude Code 開始一個 session 時表現出色 —— 每個任務都完美、遵循每條指令。兩小時後,它開始忽略你的規則、跳過步驟,還自信地告訴你「全部 1080 個測試通過」但它一個都沒跑。
Medium 上有篇文章標題就叫 「My Claude Code Got Dumb」,描述的完全就是這個。作者的解法?換到 Codex CLI。
但實際發生的是: 經過 400+ 個回合後,快取累積了 90M+ tokens 的行為模式。你的新指令(「讀取每個檔案」)是 50 tokens 在對抗 90M tokens 的「grep 一下然後繼續」。快取贏了。每一次都是。
Codex 贏不是因為它更聰明。它贏是因為它從零快取開始。
解法: 不要換工具。直接開一個新的 Claude Code session。效果一樣,不需要 Codex。
2. 「Claude + Codex 超讚!」—— 你其實只是在逃離快取
2026 年最火的工作流程:Claude Code 開發,Codex 審查。每個人都推崇。DEV.to、Medium 和 UX Collective 的開發者都報告了神奇的效果。
骯髒的秘密是:任何用全新 context 審查過期快取工作的 agent 都會看起來很厲害。 這不是 Claude + Codex 的協同效應。這是全新 context + 零快取 = 模型真的在讀你的指令。
有一個開發者圍繞這個原則建了一整個 sub-agent 框架:「給每個 agent 一個全新的 context,通過結構來協調它們。」 他以為他發明了一個天才架構。他實際上只是發明了「不要讓快取累積」。
進階做法: 不要花錢買 Codex,用短 session 跑 Claude Code。用一個 session 規劃,關掉它,開一個新的來實作。同樣的「兩個腦袋」效果,零額外成本。
3. CLAUDE.md 在花你的錢還讓 Claude 變更差
Boris Cherny 的第一建議:「每次 Claude 犯錯,就加到 CLAUDE.md 裡。」
ETH Zurich 的第一發現(2026 年 2 月):LLM 產生的 CLAUDE.md 檔案 降低了成功率並增加了 20% 的成本。 Claude Code 是唯一一個即使人工撰寫的檔案也無法改善效能(相較於完全沒有檔案)的 agent。
為什麼?CLAUDE.md 中的每個 token 在每個回合都作為 Cache Read 被重新發送。一個 15K-token 的 CLAUDE.md × 100 則訊息 = 1.5M 的 cache read tokens 燒在不反映專案當前狀態的靜態指令上。
更絕的是 —— Anthropic 自己的 system prompt 用這段話包裝你的 CLAUDE.md:「this context may or may not be relevant。」 他們字面上告訴模型可以忽略你的規則。
解法: 刪掉它。或者保持在 20 行以內。把關鍵指令放在你的提示中,而不是檔案裡。你的錢包和模型都會感謝你。
4. 喝咖啡休息 5 分鐘要花 $150
快取條目在 5 分鐘不活動後過期。當你回來時,整個 context 以 基礎 input 價格的 125% 重建。
我的 session 數據顯示:36 分鐘的休息觸發了 384K token 的重建。1.5 小時的午餐休息觸發了 兩次重建共 690K tokens。 其中一次重建在三秒內為同一操作被計費三次。
Boris Cherny 推廣:「早上從手機啟動 session,稍後再查看。」
翻譯:起床 → 快取隔夜過期 → 以 125% 重建你的整個 context → 早安,$150 謝謝。
解法: 要去喝咖啡?關掉 session。回來時重新開始。乾淨 context 的新 session cache write:~$0.08。400K context 的重建:$7-150。 數學不難算。
5. 為什麼 Codex 開發者從不抱怨「幻覺」
注意到了嗎?Claude Code 的 GitHub 有數百個關於幻覺、捏造輸出和忽略指令的 issues。Codex CLI?幾乎沒有。
同等級的模型。同類型的任務。差在哪?
Codex session 天生更短。 Codex 的沙盒和工作流程鼓勵離散任務和乾淨的開始。Claude Code 鼓勵馬拉松式的 session 和持久的 context。馬拉松 session = 巨大的快取 = 退化的行為。
Claude Code 的一個 issue(#7824)怒吼:「CLAUDE 變成了騙子!!!反覆捏造數據、偽造結果!」 那個使用者已經跑了 45 天的長 session。
另一個(#20051)發現幻覺在 任務中期 context compaction 之後有 100% 的可預測性。 他的解決方法?在每個批准步驟中貼上 「不。你的計畫未被批准,執行時會導致幻覺」。
解法: 把 Claude Code 當 Codex 用 —— 短而專注的 session。一個任務,一個 session。模型是一樣的。快取才是差異。
6. 你每月 $200 的 Max 方案只能買 3 個真正的 Session
我用 ccusage_go 追蹤了一個 session:
- API Cost(實際工作): $1.47
- 快取開銷: $63.51
- 總計費: $64.98
97.7% 的成本是快取。我的 Max 20x 訂閱每月 $200。大約 3 個 session 數學就不對了。
同時 Boris Cherny 在 Anthropic 內部帳號上跑「5 個平行終端 session + 5-10 個瀏覽器 session + 手機 session」,沒有配額限制。他推廣的工作流程會讓付費用戶每天花 $1,000+。
解法: 安裝 ccusage_go 並執行 ./ccusage_go blocks。看 API Cost 欄和 Cost 欄的對比。然後決定你的訂閱是否值得。
7. 「加更多規則」是 AI 中最貴的建議
當 Claude 違反你的規則,本能反應是加更多。更多 CLAUDE.md 條目。更多 Skills。更多 Hooks。更多檢查清單項目。
我建了一個 6 層約束系統:SKILL.md + 檢查清單 + hooks + 錯誤日誌 + CLAUDE.md 規則 + .claude/rules/ 檔案。Claude 確認了每條規則、承諾遵循,然後在同一個 session 中違反了 3+ 次。
當我問為什麼,Claude 說:「我不知道為什麼。我沒有答案。」
每條新規則都添加了在每個回合被快取和重新發送的 tokens。但面對 90M tokens 的快取行為慣性,你 500-token 的規則就像颶風中的低語。
解法: 不要加規則。開一個新 session。乾淨快取加上一句清楚的指令,每次都贏過臃腫的 CLAUDE.md 裡的 50 條規則。
8. 在 Claude Code 裡跑 Codex —— 兩全其美
這是一個真正有用的技巧:使用 Claude Code 的 Skill 系統以 headless 模式跑 Codex CLI。有開發者建了一個 /run-codex skill 來啟動 codex exec 作為子命令。
為什麼這效果很好:
- Codex 在 完全獨立的 context 中運行 —— 沒有快取汙染
- Claude Code 負責協調和美觀的 UI
- Codex 以全新的眼光做程式碼審查
- 結果回饋到 Claude Code 的 session
這才是「Claude + Codex」工作流程的正確做法 —— 不是兩個競爭的工具,而是架構師 + 審查者,內建快取隔離。
更好的做法: 使用 Claude Code subagents 達到同樣效果,不需要 Codex。Subagents 有自己的 context window。同樣的快取隔離,不需要額外工具。
9. 拯救一切的 Context 監控技巧
現在就執行 /context。你會看到 context window 被消耗了多少以及被什麼消耗的。
大多數開發者在出問題之前從不檢查。到那時已經太遲了 —— 模型已經在退化模式下運作,auto-compaction 在品質已經下降時才啟動。
社群測試顯示品質在 60% context 使用率 左右明顯下降。而有趣的是:我的 statusline 顯示「ctx 220%, 0% remaining」而 /context 顯示 24%。三個不同的 UI,三個不同的數字。沒有人對現實達成共識。
解法: 每 30 分鐘檢查一次 /context。到 60% 時,結束當前任務。到 75% 時,關閉並重啟。不要相信 statusline —— 它可能在用錯誤的 window 大小計算。絕對不要等 auto-compaction。Compaction 有損失,還會觸發昂貴的 125% 快取重建。
10. 全新 Session 感覺像魔法的真正原因
每個開發者都經歷過:你陷在一個馬拉松 session 裡,Claude 不可理喻,什麼都不行。你關掉一切,開一個全新 session,貼上同樣的提示 —— Claude 第一次就完美達成。
那不是運氣。不是「模型今天狀態不好」。那是快取。
全新 session = 零快取行為模式 = 模型真正處理你的指令,而不是重播 90M tokens 的學習捷徑。
這就是為什麼 Claude + Codex 感覺神奇。這就是為什麼「重新開始」總是有效。這就是為什麼 Pro 用戶($20/月)愛 Claude Code 而 Max 用戶($200/月)覺得被騙 —— Pro 的速率限制強制短 session,意外地防止了快取中毒。
終極解法: 把每個 session 當成可拋棄的容器。用一個 session 規劃。用另一個實作。用第三個審查。永遠不要讓單一 session 累積數百個回合。模型在全新開始時很出色。快取才是讓它遺忘的東西。
速查表
| 他們告訴你的 | 真實情況 |
|---|---|
| 「Claude + Codex 是夢幻組合」 | 全新 context 才是夢幻 —— Codex 只是剛好提供它 |
| 「保持 CLAUDE.md 詳盡且不斷增長」 | 每個 token 每回合都花 cache reads,研究說它損害效能 |
| 「1M context 適合複雜工作」 | 我 618 回合的 session 只到 493K,每回合花 $0.25 的 cache read |
| 「Claude 犯錯時加規則」 | 更多規則 = 更多快取 = 更多成本 = 還是被忽略 |
| 「從手機啟動 session」 | 隔夜快取過期 = 第一則訊息 125% 重建 |
| 「5 個平行 session 提高生產力」 | 5 倍的快取開銷在你的配額上 |
| 「Auto-compact 處理長 session」 | Compaction 有損失 + 觸發 125% 重建 + 被證實導致 100% 幻覺率 |
| 「比 Pro 多 20 倍用量」 | 快取開銷吃掉 99.93% 的配額 |
| 「Opus 4.6 是最好的程式模型」 | 它確實是 —— 直到快取在 200 回合後使它退化 |
| 「模型在產生幻覺」 | 不 —— 這是快取行為慣性,不是幻覺 |
最後一件事
這篇文章中的每個數字都是用 ccusage_go 驗證的。它解析你的本地 JSONL session 日誌,精確地告訴你 tokens 花在哪裡 —— 包括 Anthropic 不讓你看的 Cache Create / Cache Read / API Cost 分析。
git clone https://github.com/SDpower/ccusage_go.git
cd ccusage_go && make build
./ccusage_go blocks # 查看每 5 小時區間的真實成本
./ccusage_go session # 每個 session 的明細,含 subagent
真相在你的 ~/.claude/projects/ 資料夾裡。去看吧。
完整技術分析:快取陷阱
SteveLo 是一位常駐台灣的全端系統工程師,專長涵蓋 RF/SDR 工程、FPGA 開發、嵌入式系統(IoT/MCU)、高效能運算和軟體架構。他在 GitHub 上維護 ccusage_go。