Claude Code Max 訂閱和 API Key 哪個更省錢？

日均重度互動 4 小時以上、且任務以 Claude Code 終端為主，Max $100–$200/月往往比裸 API 便宜。需要整合到自己產品、或用量波動大，API 更靈活。本文用兩週用量日誌做了交叉驗證。

把預設模型從 Opus 換成 Sonnet 會明顯變笨嗎？

對 70% 的日常任務（改 bug、寫測試、小範圍重構、讀日誌）幾乎無感。真正需要 Opus 的是跨模組架構決策、複雜並發 bug、陌生程式碼庫冷啟動——應顯式切換，而非全域預設。

/compact 能省多少錢？

不能直接「打折」，但能把已完成的探索性對話壓成摘要，避免後續每一輪都把幾萬 token 歷史重傳。本文實測長工作階段在 compact 後單輪輸入 token 降 40%–65%。

Prompt Caching 對 Claude Code 有用嗎？

走 API Key 且多次工作階段共享同一 CLAUDE.md、同一倉庫結構說明時有效。快取命中後重複系統提示與文件塊的輸入價顯著降低。Max 訂閱使用者不單獨按 token 計費，此項主要惠及 API 模式。

降本後產出會掉多少？

本文作者四週對比：合併 PR 數持平，平均 review 輪次從 2.8 降到 2.3；體感是「少做無效重跑」，而非「模型變弱」。關鍵硬骨頭仍手動切 Opus。

Cloud Mac 和 Claude Code 帳單有什麼關係？

執行節點不穩定會導致 Agent 任務中斷、上下文遺失後整段重跑，間接放大 token 消耗。穩定 macOS 節點配合 tmux 過夜，減少「從頭再來」是最容易被忽視的隱性成本。

實戰復盤：我是如何把 Claude Code 的月帳單從 $800 砍到 $150 的（2026）

Q: Claude Code 月花 $800 正常嗎？

若預設 Opus、長工作階段不切分、讓 Agent 反覆掃全倉庫，API 按量計費衝到 $500–$1000 並不罕見。問題通常不是「用太多」，而是模型檔位與上下文管理失控。

Q: Claude Code Max 訂閱和 API Key 哪個更省錢？

日均重度互動 4 小時以上、且任務以 Claude Code 終端為主，Max $100–$200/月 往往比裸 API 便宜。需要整合到自己產品、或用量波動大，API 更靈活。本文用兩週用量日誌做了交叉驗證。

四月底 Anthropic 帳單郵件跳出來：$812.47。我盯著數字愣了幾秒——訂閱明明只有 Claude Pro，多出來的全是 Claude Code 走 API Key 的按量費用。接下來四週，我沒有少寫一行業務程式碼，只是把「預設 Opus + 無限上下文 + 讓 Agent 自己逛倉庫」這套豪華設定拆了，月支出穩定在 $140–$165。下面是可複用的拆解與動作清單。

81%

四週內帳單降幅（$812 → $152 均值）

8 條

可立即落地的降本動作

70%

任務改 Sonnet 後體感無差別比例

一、$800 帳單解剖：錢燒在哪

先把情緒放一邊。匯出 Anthropic Console 的 Usage 明細（按天、按模型、按 workspace），我把 $812 拆成四塊——比例會因你的倉庫大小浮動，但結構高度相似：

吞金獸	占帳單（約）	典型場景
預設 Opus 長工作階段	38%	一個 PR 從頭聊到尾不換模型，輸入輸出都走最貴檔
上下文滾雪球	27%	20+ 輪對話後，每輪重傳完整歷史 + 工具輸出
工具循環 / 誤探索	22%	Agent 反覆 `glob`、`grep` 全倉庫，或 build 失敗多輪盲試
計費模式與重跑	13%	本可用 Max 包住的量走了 API；筆電休眠導致任務中斷重開

定價錨點見 Anthropic Pricing 與 Claude Code 文件。2026 年 6 月，Opus 檔 API 單價仍是 Sonnet 的數倍；Agent 場景裡「輸入 token」往往比「輸出 token」更嚇人，因為每輪都要把歷史、工具結果、檔案片段再餵一遍。

1.1 預設 Opus 的隱性稅

Claude Code 安裝後很多人（包括我）圖省事，全域 opus。寫單元測試、改 typo、產生 changelog——全用最貴模型。四週用量日誌裡，71% 的 API 呼叫其實不需要 Opus 推理深度，但每一輪都按旗艦價結帳。

1.2 上下文滾雪球

Agent 讀過的檔案、命令輸出、diff 都會進工作階段。第 5 輪可能還好，第 25 輪時單輪輸入就突破 80k token，而你還只是在改同一個模組。這不是模型「變貴了」，是工作階段設計問題。

別和 Context Window 百分比混淆

終端機裡顯示的上下文占用，是當前工作階段體積，不是月度配額。降本要看 Console 的 token 明細與模型分項，而不是只看「還剩 62%」。

1.3 工具循環與誤探索

對陌生 monorepo，Agent 會先「摸底」：列目錄、搜符號、讀設定。若 CLAUDE.md 空白、權限過寬，摸底成本可能超過真正寫 patch 的成本。我有一晚燒掉 $47，其中 $31 發生在 Agent 反覆嘗試錯誤 build 命令上。

1.4 計費模式選錯

Claude Pro（$20/月）適合輕量；全職 Claude Code 開發者往往該看 Max 檔位（$100 / $200 檔，以官方當期說明為準）。我那段時間日均 6+ 小時終端 Agent，卻仍用 API Key 按量——等於自費當企業客戶。

二、8 條降本動作（按收益排序）

下列動作按「對我帳單的邊際收益」排序。你可以從 1、2、5 開始，通常一週就能看見曲線掉頭。

2.1 動作 1：模型分層路由

改法：預設 sonnet；僅在任務描述含「架構 / 並發 / 安全 / 陌生倉庫冷啟動」時手動 /model opus。在 CLAUDE.md 裡寫清規則，減少誤升檔。

收益：單項最大，約占總降幅 35%。Sonnet 對日常 patch、測試產生、文件同步足夠；Opus 留給真正會卡你半天的問題。

# 我的 CLAUDE.md 片段
預設模型：Sonnet
以下情況請求切換 Opus：
- 跨 3 個以上 package 的介面變更
- 生產級 race condition / 死鎖
- 首次克隆倉庫的模組地圖繪製（僅第一輪）

2.2 動作 2：收窄 Agent 預設視野

改法：用 --add-dir 或權限設定，把 Agent 限制在子目錄；禁止無目標的全域 grep。大倉庫先讓人類指定「改 packages/billing/」。

收益：工具呼叫次數降 40%，上下文膨脹速度明顯放緩。

2.3 動作 3：任務粒度從「改全倉」到「改一個面」

改法：一個工作階段只做一個可驗證目標，例如「修 flaky test #1842」而非「優化整個 CI」。完成即 /clear 或開新工作階段。

收益：減少無效歷史攜帶；review 也更清晰。

2.4 動作 4：寫好 CLAUDE.md，少讓模型探索

改法：在倉庫根維護精簡的 CLAUDE.md（建議 < 200 行）：構建命令、測試入口、目錄地圖、禁止觸碰的路徑。Agent 少逛迷宮，你就少付「探索稅」。

寫清「一條命令跑通測試」——避免 Agent 猜 npm / pnpm / bun
標明產生程式碼目錄與手寫程式碼邊界
列出常見陷阱（例如必須先 export FOO=bar）

2.5 動作 5：/compact 與工作階段切分

探索階段結束後、進入實作階段前，執行 /compact，把已確認的結論壓成摘要。我的長工作階段在 compact 後，單輪輸入 token 平均降 52%。

經驗法則：對話超過 15 輪或上下文條超過 60k，就 compact 或切新工作階段，並把必要上下文貼進首條 prompt（只貼結論，不貼全文 log）。

2.6 動作 6：重算 Max 訂閱 vs API

用兩週真實 token 量代入單價表（可參考本站大模型 API 價格指南）。我的交叉結論是：

日均 < 2h Claude Code：Pro + 少量 API 溢出最省
日均 4–8h：Max $100 檔通常優於裸 API
要把 Claude 嵌進自家 SaaS：繼續 API，但須疊加快取與批次處理

切到 Max 後，我 API 溢出從月均 $680 降到 $40 以內（僅 CI 腳本與自動化仍走 API Key）。

2.7 動作 7：API 使用者啟用 Prompt Caching

若你因合規或整合必須走 API，把穩定的系統提示、CLAUDE.md 大塊、介面說明設為可快取內容。多次工作階段命中快取時，重複輸入塊費用顯著下降（見 Anthropic 文件中的 Prompt Caching 說明）。

適合：同一倉庫上每天開 10+ 次新工作階段的團隊；不適合：每次 prompt 都大幅變動的一次性腳本。

2.8 動作 8：穩定執行節點，消滅重跑稅

這筆帳不在 Anthropic 發票上，但會回流成 token：筆電合蓋、SSH 斷線、本機休眠導致 Agent 中斷，你只能把上下文簡述重來一遍——重跑 ≈ 再付一輪輸入。

我的做法：長任務放到 Cloud Mac，tmux 工作階段過夜；筆電只用來 review diff。中斷次數從每週 4–5 次降到接近 0，等效省下約 $60–$90/月（按重跑規模估算）。這與「捲模型」無關，是執行節點層面的成本。

三、優化前後對照

指標	優化前（4 月）	優化後（5 月均值）
月度總支出	$812	$152
Opus 占比	78% 呼叫量	12% 呼叫量
單工作階段平均輪次	23	11
合併 PR 數 / 月	31	33
平均 review 輪次	2.8	2.3
任務中斷重跑	18 次 / 月	2 次 / 月

產出沒塌，帳單先塌——說明之前大量花費買的是無效探索與錯誤檔位，不是能力本身。

四、我刻意保留的「必要奢侈」

降本不是苦行。下面幾項我仍願意付錢：

每週 2–3 次 Opus 深潛：架構債、詭異並發、安全稽核
Max 訂閱：買斷高頻互動的可預期成本
獨享 Cloud Mac 節點：比 token 便宜得多的「不中斷」保險
一份維護良好的 CLAUDE.md：人力時間換 Agent 探索稅，ROI 極高

省下的 $650 不是讓你少用 AI，是把子彈留給值得 Opus 的那 15% 問題。

五、每週 15 分鐘的帳單巡檢

Console 匯出 7 天用量 → 按模型分列，看 Opus 是否異常偏高
抽查 3 個最貴工作階段：是任務太大、沒 compact，還是探索失控？
檢查預設模型與 CLAUDE.md 是否被同事改回 opus
長任務是否仍在筆電上跑（中斷 = 隱性帳單）

把巡檢記在日曆裡，比一次性「降本專案」有效得多。Agent 工作流變得太順手之後，預設設定很容易悄悄滑回豪華模式。

常見問題（FAQ）

Claude Code 月花 $800 正常嗎？

API 按量 + 預設 Opus + 長工作階段，衝到 $500–$1000 並不罕見。先拆用量結構，再判斷是「真需求」還是「設定奢侈」。

Max 訂閱和 API 哪個更省？

全職終端開發者多數情況下 Max 更省；整合到自己產品或用量波動大，用 API + 快取。用兩週真實資料代入單價，不要憑直覺。

Sonnet 會明顯變笨嗎？

對大多數 patch 與測試任務不會。硬骨頭手動升 Opus，比全域 Opus 聰明。

/compact 能省多少？

本文實測單輪輸入 token 降 40%–65%；省的是重複攜帶的歷史，不是模型打折。

Prompt Caching 有用嗎？

API 模式、重複系統提示與文件塊時有效。Max 使用者主要受益於工作流規範，而非快取單價。

降本後產出會掉嗎？

作者四週對比 PR 數略升、review 輪次下降。關鍵是分層與切工作階段，不是降級逃避。

Cloud Mac 和帳單有什麼關係？

減少 Agent 中斷重跑，間接少燒 token。執行節點穩定是隱性降本槓桿。

結語

Claude Code 的 $800 帳單，多半不是「你太依賴 AI」，而是用旗艦模型的價格買了入門模型該幹的活，再疊加上下文滾雪球與探索稅。模型分層、收窄視野、compact 切工作階段、重算 Max vs API、穩定執行節點——八條動作拆開都樸素，疊在一起就是把月帳單拉回三位數。

下個月若 Anthropic 調價或 Claude Code 改配額，優先動「預設模型」和「工作階段粒度」兩處，通常比急著換工具見效快。

最後更新：2026 年 6 月 23 日。定價與 Claude Code 能力以 Anthropic 官方當期說明為準；文中金額為作者個人帳單復盤，僅供參考。