4 月末、Anthropic の請求メールが届く:$812.47。数字を見て数秒呆然——サブスクは Claude Pro だけのはずなのに、超過分はすべて Claude Code の API Key 従量課金だった。続く 4 週間、業務コードは一行も減らさず、「デフォルト Opus + 無制限コンテキスト + Agent にリポジトリを自由探索させる」という贅沢設定だけを解体し、月支出は $140–$165 に安定した。以下、再現可能な分解とアクションリスト。
一、$800 請求の解剖:どこで燃えているか
まず感情は横に。Anthropic Console から Usage 明細(日別・モデル別・workspace 別)をエクスポートし、$812 を 4 ブロックに分解した——比率はリポジトリ規模で変動するが、構造はほぼ同型:
| コスト要因 | 請求占比(目安) | 典型シナリオ |
|---|---|---|
| デフォルト Opus の長セッション | 38% | 1 PR を最初から最後までモデル変更なし——入出力とも最上位档 |
| コンテキストの雪だるま | 27% | 20+ ターン後、毎ターン完全履歴 + ツール出力を再送 |
| ツールループ / 誤探索 | 22% | Agent が glob、grep で全リポを反復、または build 失敗の盲目リトライ |
| 課金モードと再実行 | 13% | Max でカバーできる量が API 経由;ノートPC スリープでタスク中断・再開 |
価格の基準は Anthropic Pricing と Claude Code ドキュメント。2026 年 6 月時点、Opus 档の API 単価は Sonnet の数倍;Agent シーンでは「入力 token」が「出力 token」より怖いことが多い——毎ターン履歴・ツール結果・ファイル断片を再投入するから。
1.1 デフォルト Opus の隠れコスト
Claude Code 導入後、多くの人(私も)が手抜きでグローバル opus。ユニットテスト、typo 修正、changelog 生成——すべて最上位モデル。4 週間の利用ログでは、API 呼び出しの 71% は Opus 級の推論深度を要さなかったのに、毎ターン旗艦価格で精算。
1.2 コンテキストの雪だるま
Agent が読んだファイル、コマンド出力、diff はすべてセッションに入る。5 ターン目はまだマシ、25 ターン目には1 ターンの入力だけで 80k token を突破——同じモジュールを直しているだけなのに。モデルが「高くなった」のではなく、セッション設計の問題。
Context Window の % と混同しない
ターミナルに表示されるコンテキスト占有率は現在のセッション体積であり、月間クォータではない。コスト削減は Console の token 明細とモデル内訳を見る。「残り 62%」だけ見ても意味が薄い。
1.3 ツールループと誤探索
未知の monorepo では Agent がまず「下調べ」:ディレクトリ列挙、シンボル検索、設定読み。CLAUDE.md が空、権限が広すぎると、下調べコストが本番の patch 作成を上回る。ある夜 $47 を消費し、その $31 は Agent が誤った build コマンドを繰り返した時間に発生。
1.4 課金モードの選択ミス
Claude Pro($20/月)はライト利用向け;フルタイム Claude Code 開発者は Max 档($100 / $200 档、公式の当期説明に準拠)を検討すべき。私は当時 1 日 6 時間以上ターミナル Agent なのに API Key 従量のまま——自腹でエンタープライズ顧客を演じていた。
二、8 つのコスト削減アクション(効果順)
以下は「請求への限界効果」順。1・2・5 から始めれば、通常 1 週間で曲線が反転する。
2.1 アクション 1:モデル分档ルーティング
変更:デフォルト sonnet;タスク説明に「アーキテクチャ / 並行 / セキュリティ / 未知リポのコールドスタート」が含まれるときだけ手動 /model opus。CLAUDE.md にルールを明記し、誤った档上げを防ぐ。
効果:単体最大、総削減の約 35%。Sonnet で日常 patch、テスト生成、ドキュメント同期は十分;Opus は半日詰まる問題に温存。
# 私の CLAUDE.md 抜粋
デフォルトモデル:Sonnet
以下の場合 Opus へ切替を要求:
- 3 つ以上の package を跨ぐインターフェース変更
- 本番級 race condition / デッドロック
- 初回クローンリポのモジュールマップ作成(第 1 ターンのみ)
2.2 アクション 2:Agent のデフォルト視野を狭める
変更:--add-dir や権限設定で Agent をサブディレクトリに制限;目的のないグローバル grep を禁止。大規模リポでは人間が先に「packages/billing/ を直す」と指定。
効果:ツール呼び出し回数 40% 減、コンテキスト膨張速度が明らかに緩和。
2.3 アクション 3:タスク粒度を「全リポ」から「1 面」へ
変更:1 セッション 1 つの検証可能な目標——「flaky test #1842 を直す」まで。「CI 全体を最適化」は避ける。完了したら /clear または新セッション。
効果:無駄な履歴の持ち越しを削減;review も明確に。
2.4 アクション 4:CLAUDE.md を整備し探索を減らす
変更:リポジトリルートに簡潔な CLAUDE.md(推奨 < 200 行)を維持:ビルドコマンド、テスト入口、ディレクトリマップ、触ってはいけないパス。Agent の迷路探索が減り、「探索税」を払わなくてよくなる。
- 「1 コマンドでテスト完走」を明記——
npm/pnpm/bunの推測を防ぐ - 生成コードディレクトリと手書きコードの境界を示す
- よくある罠を列挙(例:先に
export FOO=barが必要)
2.5 アクション 5:/compact とセッション分割
探索フェーズ終了後、実装フェーズ前に /compact を実行し、確定した結論を要約に圧縮。長セッションでは compact 後、1 ターンあたりの入力 token が平均 52% 減少。
経験則:対話 15 ターン超、またはコンテキスト 60k 超なら compact か新セッション。必要なコンテキストは最初の prompt に貼る(結論のみ、全文 log は貼らない)。
2.6 アクション 6:Max サブスク vs API の再計算
2 週間の実 token 量を単価表に代入(当サイトの LLM API 価格ガイド 参照)。私のクロス検証結論:
- 1 日 < 2h Claude Code:Pro + 少量 API オーバーフローが最安
- 1 日 4–8h:Max $100 档は裸 API より有利なことが多い
- Claude を自社 SaaS に組み込む:API 継続、ただしキャッシュとバッチ処理を重ねる
Max に切替後、API オーバーフローは月平均 $680 から $40 以内に(CI スクリプトと自動化のみ API Key 継続)。
2.7 アクション 7:API ユーザーは Prompt Caching を有効化
コンプライアンスや統合の都合で API 必須なら、安定したシステムプロンプト、CLAUDE.md の大ブロック、インターフェース説明をキャッシュ対象に。複数セッションでキャッシュヒットすると、繰り返し入力ブロックの費用が大幅低下(Anthropic ドキュメントの Prompt Caching 参照)。
向く:同一リポで 1 日 10+ 新セッションを開くチーム。向かない:毎回 prompt が大きく変わる使い捨てスクリプト。
2.8 アクション 8:安定実行ノードで再実行税を消す
この勘定は Anthropic の請求書には載らないが、token に逆流する:ノートPC のフタ閉じ、SSH 切断、ローカルスリープで Agent が中断——コンテキスト要約からやり直すしかない。再実行 ≈ もう 1 ラウンド分の入力代。
私のやり方:長タスクは Cloud Mac に載せ、tmux セッションで夜間実行;ノートPC は diff review のみ。中断は週 4–5 回からほぼ 0 に——換算で月 $60–$90 節約(再実行規模による試算)。これは「モデル競争」とは無関係、実行ノード層のコスト。
三、最適化前後の対照
| 指標 | 最適化前(4 月) | 最適化後(5 月平均) |
|---|---|---|
| 月間総支出 | $812 | $152 |
| Opus 占比 | 呼び出し量 78% | 呼び出し量 12% |
| 1 セッション平均ターン数 | 23 | 11 |
| マージ PR 数 / 月 | 31 | 33 |
| 平均 review ラウンド | 2.8 | 2.3 |
| タスク中断による再実行 | 18 回 / 月 | 2 回 / 月 |
アウトプットは崩れず、請求だけ先に崩れた——以前の多額支出は無駄な探索と誤った档への支払いであり、能力そのものではなかった。
四、意図的に残した「必要な贅沢」
コスト削減は苦行ではない。以下には依然としてお金を払う:
- 週 2–3 回の Opus 深掘り:技術的負債、アーキテクチャ、奇妙な並行処理、セキュリティ監査
- Max サブスク:高頻度インタラクションの予測可能コストを買い切り
- 専用 Cloud Mac ノード:token よりずっと安い「中断しない」保険
- 手入れされた CLAUDE.md:人の時間で Agent 探索税を買い替え——ROI 極めて高い
節約した $650 は AI を使わなくするためではなく、Opus に値する 15% の問題に弾丸を残すため。
五、週 15 分の請求チェック
- Console から 7 日分の利用をエクスポート → モデル別に並べ、Opus が異常に高くないか
- 最も高かったセッション 3 件を spot チェック:タスクが大きすぎ、compact していない、探索が暴走?
- デフォルトモデルと
CLAUDE.mdが同僚にopusに戻されていないか - 長タスクがまだノートPC で走っていないか(中断 = 隠れ請求)
カレンダーにチェックを入れる。一度きりの「コスト削減プロジェクト」より効く。Agent ワークフローが快適になりすぎると、デフォルト設定は静かに贅沢モードへ滑り戻る。
FAQ
Claude Code で月 $800 は普通?
API 従量 + デフォルト Opus + 長セッションなら $500–$1000 は珍しくない。まず利用構造を分解し、「本当の需要」か「設定の贅沢」かを判断。
Max サブスクと API、どちらが安い?
フルタイムターミナル開発者の多くは Max が有利。自社プロダクト統合や用量変動が大きいなら API + キャッシュ。2 週間の実データで単価代入、直感に頼らない。
Sonnet は明らかに弱くなる?
大多数の patch とテストタスクではならない。硬い問題は手動で Opus に上げる方が、グローバル Opus より賢い。
/compact でどれくらい節約?
本稿実測で 1 ターン入力 token 40%–65% 減。削減対象は繰り返し運ぶ履歴であり、モデル割引ではない。
Prompt Caching は有効?
API モードで、繰り返しのシステムプロンプトとドキュメントブロックに有効。Max ユーザーは主にワークフロー規律の恩恵であり、キャッシュ単価ではない。
コスト削減後、アウトプットは落ちる?
著者の 4 週間比較で PR 数は微増、review ラウンドは減少。鍵は分档とセッション分割であり、ダウングレード逃避ではない。
Cloud Mac と請求の関係は?
Agent の中断再実行を減らし、間接的に token 消費を抑える。実行ノードの安定は隠れコスト削減のレバー。
おわりに
Claude Code の $800 請求は、多くの場合「AI 依存しすぎ」ではなく、旗艦モデルの価格で入門モデルがやるべき仕事を買い、コンテキストの雪だるまと探索税を重ねた結果。モデル分档、視野の狭め、compact とセッション分割、Max vs API の再計算、安定実行ノード——8 アクションは個別には地味だが、重なると月額を三位数に戻す。
来月 Anthropic が値上げしたり Claude Code のクォータが変わっても、まず「デフォルトモデル」と「セッション粒度」の 2 点を動かす。ツールを急いで替えるより効くことが多い。
Agent を安く使うなら、まず夜中に途中で切らすな
Vuncloud 専用 Mac mini M4 Cloud Mac:Claude Code 長時間実行、tmux 夜間タスク、Xcode ビルド不断線。US East / West / APAC ノード——上限と請求をコントロールし、タスクを最初からやり直さない。
関連記事
- 2026年 最新LLMの料金・設定・性能・向いている人
- Codexの週間上限に達したら:7つの対処法・上限の仕組み・代替API(2026)
- モデル競争はもう終わり——Macコンピュートノードが取れない理由
最終更新:2026 年 6 月 23 日。価格と Claude Code の機能は Anthropic 公式 の当期説明に準拠;文中の金額は著者個人の請求振り返りであり、参考情報。