四月底 Anthropic 帳單郵件跳出來:$812.47。我盯著數字愣了幾秒——訂閱明明只有 Claude Pro,多出來的全是 Claude Code 走 API Key 的按量費用。接下來四週,我沒有少寫一行業務程式碼,只是把「預設 Opus + 無限上下文 + 讓 Agent 自己逛倉庫」這套豪華設定拆了,月支出穩定在 $140–$165。下面是可複用的拆解與動作清單。
一、$800 帳單解剖:錢燒在哪
先把情緒放一邊。匯出 Anthropic Console 的 Usage 明細(按天、按模型、按 workspace),我把 $812 拆成四塊——比例會因你的倉庫大小浮動,但結構高度相似:
| 吞金獸 | 占帳單(約) | 典型場景 |
|---|---|---|
| 預設 Opus 長工作階段 | 38% | 一個 PR 從頭聊到尾不換模型,輸入輸出都走最貴檔 |
| 上下文滾雪球 | 27% | 20+ 輪對話後,每輪重傳完整歷史 + 工具輸出 |
| 工具循環 / 誤探索 | 22% | Agent 反覆 glob、grep 全倉庫,或 build 失敗多輪盲試 |
| 計費模式與重跑 | 13% | 本可用 Max 包住的量走了 API;筆電休眠導致任務中斷重開 |
定價錨點見 Anthropic Pricing 與 Claude Code 文件。2026 年 6 月,Opus 檔 API 單價仍是 Sonnet 的數倍;Agent 場景裡「輸入 token」往往比「輸出 token」更嚇人,因為每輪都要把歷史、工具結果、檔案片段再餵一遍。
1.1 預設 Opus 的隱性稅
Claude Code 安裝後很多人(包括我)圖省事,全域 opus。寫單元測試、改 typo、產生 changelog——全用最貴模型。四週用量日誌裡,71% 的 API 呼叫其實不需要 Opus 推理深度,但每一輪都按旗艦價結帳。
1.2 上下文滾雪球
Agent 讀過的檔案、命令輸出、diff 都會進工作階段。第 5 輪可能還好,第 25 輪時單輪輸入就突破 80k token,而你還只是在改同一個模組。這不是模型「變貴了」,是工作階段設計問題。
別和 Context Window 百分比混淆
終端機裡顯示的上下文占用,是當前工作階段體積,不是月度配額。降本要看 Console 的 token 明細與模型分項,而不是只看「還剩 62%」。
1.3 工具循環與誤探索
對陌生 monorepo,Agent 會先「摸底」:列目錄、搜符號、讀設定。若 CLAUDE.md 空白、權限過寬,摸底成本可能超過真正寫 patch 的成本。我有一晚燒掉 $47,其中 $31 發生在 Agent 反覆嘗試錯誤 build 命令上。
1.4 計費模式選錯
Claude Pro($20/月)適合輕量;全職 Claude Code 開發者往往該看 Max 檔位($100 / $200 檔,以官方當期說明為準)。我那段時間日均 6+ 小時終端 Agent,卻仍用 API Key 按量——等於自費當企業客戶。
二、8 條降本動作(按收益排序)
下列動作按「對我帳單的邊際收益」排序。你可以從 1、2、5 開始,通常一週就能看見曲線掉頭。
2.1 動作 1:模型分層路由
改法:預設 sonnet;僅在任務描述含「架構 / 並發 / 安全 / 陌生倉庫冷啟動」時手動 /model opus。在 CLAUDE.md 裡寫清規則,減少誤升檔。
收益:單項最大,約占總降幅 35%。Sonnet 對日常 patch、測試產生、文件同步足夠;Opus 留給真正會卡你半天的問題。
# 我的 CLAUDE.md 片段
預設模型:Sonnet
以下情況請求切換 Opus:
- 跨 3 個以上 package 的介面變更
- 生產級 race condition / 死鎖
- 首次克隆倉庫的模組地圖繪製(僅第一輪)
2.2 動作 2:收窄 Agent 預設視野
改法:用 --add-dir 或權限設定,把 Agent 限制在子目錄;禁止無目標的全域 grep。大倉庫先讓人類指定「改 packages/billing/」。
收益:工具呼叫次數降 40%,上下文膨脹速度明顯放緩。
2.3 動作 3:任務粒度從「改全倉」到「改一個面」
改法:一個工作階段只做一個可驗證目標,例如「修 flaky test #1842」而非「優化整個 CI」。完成即 /clear 或開新工作階段。
收益:減少無效歷史攜帶;review 也更清晰。
2.4 動作 4:寫好 CLAUDE.md,少讓模型探索
改法:在倉庫根維護精簡的 CLAUDE.md(建議 < 200 行):構建命令、測試入口、目錄地圖、禁止觸碰的路徑。Agent 少逛迷宮,你就少付「探索稅」。
- 寫清「一條命令跑通測試」——避免 Agent 猜
npm/pnpm/bun - 標明產生程式碼目錄與手寫程式碼邊界
- 列出常見陷阱(例如必須先
export FOO=bar)
2.5 動作 5:/compact 與工作階段切分
探索階段結束後、進入實作階段前,執行 /compact,把已確認的結論壓成摘要。我的長工作階段在 compact 後,單輪輸入 token 平均降 52%。
經驗法則:對話超過 15 輪或上下文條超過 60k,就 compact 或切新工作階段,並把必要上下文貼進首條 prompt(只貼結論,不貼全文 log)。
2.6 動作 6:重算 Max 訂閱 vs API
用兩週真實 token 量代入單價表(可參考本站 大模型 API 價格指南)。我的交叉結論是:
- 日均 < 2h Claude Code:Pro + 少量 API 溢出最省
- 日均 4–8h:Max $100 檔通常優於裸 API
- 要把 Claude 嵌進自家 SaaS:繼續 API,但須疊加快取與批次處理
切到 Max 後,我 API 溢出從月均 $680 降到 $40 以內(僅 CI 腳本與自動化仍走 API Key)。
2.7 動作 7:API 使用者啟用 Prompt Caching
若你因合規或整合必須走 API,把穩定的系統提示、CLAUDE.md 大塊、介面說明設為可快取內容。多次工作階段命中快取時,重複輸入塊費用顯著下降(見 Anthropic 文件中的 Prompt Caching 說明)。
適合:同一倉庫上每天開 10+ 次新工作階段的團隊;不適合:每次 prompt 都大幅變動的一次性腳本。
2.8 動作 8:穩定執行節點,消滅重跑稅
這筆帳不在 Anthropic 發票上,但會回流成 token:筆電合蓋、SSH 斷線、本機休眠導致 Agent 中斷,你只能把上下文簡述重來一遍——重跑 ≈ 再付一輪輸入。
我的做法:長任務放到 Cloud Mac,tmux 工作階段過夜;筆電只用來 review diff。中斷次數從每週 4–5 次降到接近 0,等效省下約 $60–$90/月(按重跑規模估算)。這與「捲模型」無關,是執行節點層面的成本。
三、優化前後對照
| 指標 | 優化前(4 月) | 優化後(5 月均值) |
|---|---|---|
| 月度總支出 | $812 | $152 |
| Opus 占比 | 78% 呼叫量 | 12% 呼叫量 |
| 單工作階段平均輪次 | 23 | 11 |
| 合併 PR 數 / 月 | 31 | 33 |
| 平均 review 輪次 | 2.8 | 2.3 |
| 任務中斷重跑 | 18 次 / 月 | 2 次 / 月 |
產出沒塌,帳單先塌——說明之前大量花費買的是無效探索與錯誤檔位,不是能力本身。
四、我刻意保留的「必要奢侈」
降本不是苦行。下面幾項我仍願意付錢:
- 每週 2–3 次 Opus 深潛:架構債、詭異並發、安全稽核
- Max 訂閱:買斷高頻互動的可預期成本
- 獨享 Cloud Mac 節點:比 token 便宜得多的「不中斷」保險
- 一份維護良好的 CLAUDE.md:人力時間換 Agent 探索稅,ROI 極高
省下的 $650 不是讓你少用 AI,是把子彈留給值得 Opus 的那 15% 問題。
五、每週 15 分鐘的帳單巡檢
- Console 匯出 7 天用量 → 按模型分列,看 Opus 是否異常偏高
- 抽查 3 個最貴工作階段:是任務太大、沒 compact,還是探索失控?
- 檢查預設模型與
CLAUDE.md是否被同事改回opus - 長任務是否仍在筆電上跑(中斷 = 隱性帳單)
把巡檢記在日曆裡,比一次性「降本專案」有效得多。Agent 工作流變得太順手之後,預設設定很容易悄悄滑回豪華模式。
常見問題(FAQ)
Claude Code 月花 $800 正常嗎?
API 按量 + 預設 Opus + 長工作階段,衝到 $500–$1000 並不罕見。先拆用量結構,再判斷是「真需求」還是「設定奢侈」。
Max 訂閱和 API 哪個更省?
全職終端開發者多數情況下 Max 更省;整合到自己產品或用量波動大,用 API + 快取。用兩週真實資料代入單價,不要憑直覺。
Sonnet 會明顯變笨嗎?
對大多數 patch 與測試任務不會。硬骨頭手動升 Opus,比全域 Opus 聰明。
/compact 能省多少?
本文實測單輪輸入 token 降 40%–65%;省的是重複攜帶的歷史,不是模型打折。
Prompt Caching 有用嗎?
API 模式、重複系統提示與文件塊時有效。Max 使用者主要受益於工作流規範,而非快取單價。
降本後產出會掉嗎?
作者四週對比 PR 數略升、review 輪次下降。關鍵是分層與切工作階段,不是降級逃避。
Cloud Mac 和帳單有什麼關係?
減少 Agent 中斷重跑,間接少燒 token。執行節點穩定是隱性降本槓桿。
結語
Claude Code 的 $800 帳單,多半不是「你太依賴 AI」,而是用旗艦模型的價格買了入門模型該幹的活,再疊加上下文滾雪球與探索稅。模型分層、收窄視野、compact 切工作階段、重算 Max vs API、穩定執行節點——八條動作拆開都樸素,疊在一起就是把月帳單拉回三位數。
下個月若 Anthropic 調價或 Claude Code 改配額,優先動「預設模型」和「工作階段粒度」兩處,通常比急著換工具見效快。
Agent 要省錢,先別讓它半夜斷在半截
Vuncloud 獨享 Mac mini M4 Cloud Mac:Claude Code 長跑、tmux 過夜、Xcode 構建不斷線。美東 / 美西 / APAC 節點——限額和帳單可控,任務不用從頭再來。
相關閱讀
最後更新:2026 年 6 月 23 日。定價與 Claude Code 能力以 Anthropic 官方 當期說明為準;文中金額為作者個人帳單復盤,僅供參考。