Claude Code Max サブスクと API Key、どちらが安い？

1 日 4 時間以上の重度利用で、タスクが Claude Code ターミナル中心なら、Max $100–$200/月は裸の API より安いことが多い。自社プロダクトへの組み込みや用量の変動が大きいなら API が柔軟。本稿は 2 週間の利用ログでクロス検証した。

デフォルトを Opus から Sonnet に変えると明らかに弱くなる？

日常タスクの 70%（バグ修正、テスト作成、小規模リファクタ、ログ読み）ではほぼ差を感じない。Opus が要るのはモジュール横断のアーキ判断、複雑な並行バグ、未知リポジトリのコールドスタート——グローバルデフォルトではなく明示的に切り替えるべき場面。

/compact でどれくらい節約できる？

直接「割引」ではないが、探索フェーズの対話を要約に圧縮し、以降の各ターンで数万 token の履歴を再送しない。本稿の実測では長セッション compact 後、1 ターンあたりの入力 token が 40%–65% 減少。

Prompt Caching は Claude Code に有効？

API Key 利用で、複数セッションが同一 CLAUDE.md とリポジトリ構造説明を共有する場合に有効。キャッシュヒット後、繰り返しのシステムプロンプトとドキュメントブロックの入力単価が大幅に下がる。Max サブスクは token 単位課金ではないため、主に API モード向け。

コスト削減後、アウトプットはどれくらい落ちる？

著者の 4 週間比較：マージ PR 数は横ばい、平均 review ラウンドは 2.8 から 2.3 に低下。体感は「モデルが弱くなった」より「無駄な再実行が減った」。本当に硬い問題は手動で Opus に切り替えている。

Cloud Mac と Claude Code の請求は何の関係？

実行ノードが不安定だと Agent タスクが中断し、コンテキスト喪失後に丸ごと再実行——間接的に token 消費を増幅する。安定した macOS ノードで tmux 夜間実行し、「最初からやり直し」を減らすのは見落とされがちな隠れコスト。

実戦振り返り：Claude Code の月額請求を $800 から $150 に下げた方法（2026）

Q: Claude Code で月 $800 は普通？

デフォルト Opus、長セッションのまま分割せず、Agent にリポジトリ全体を走査させると、API 従量課金で $500–$1000 に達するのは珍しくない。問題は「使いすぎ」より、モデル档とコンテキスト管理の暴走であることが多い。

4 月末、Anthropic の請求メールが届く：$812.47。数字を見て数秒呆然——サブスクは Claude Pro だけのはずなのに、超過分はすべて Claude Code の API Key 従量課金だった。続く 4 週間、業務コードは一行も減らさず、「デフォルト Opus + 無制限コンテキスト + Agent にリポジトリを自由探索させる」という贅沢設定だけを解体し、月支出は $140–$165 に安定した。以下、再現可能な分解とアクションリスト。

81%

4 週間での請求削減（$812 → $152 平均）

8 つ

すぐ実行できるコスト削減アクション

70%

Sonnet 切替後に体感差なしのタスク比率

一、$800 請求の解剖：どこで燃えているか

まず感情は横に。Anthropic Console から Usage 明細（日別・モデル別・workspace 別）をエクスポートし、$812 を 4 ブロックに分解した——比率はリポジトリ規模で変動するが、構造はほぼ同型：

コスト要因	請求占比（目安）	典型シナリオ
デフォルト Opus の長セッション	38%	1 PR を最初から最後までモデル変更なし——入出力とも最上位档
コンテキストの雪だるま	27%	20+ ターン後、毎ターン完全履歴 + ツール出力を再送
ツールループ / 誤探索	22%	Agent が `glob`、`grep` で全リポを反復、または build 失敗の盲目リトライ
課金モードと再実行	13%	Max でカバーできる量が API 経由；ノートPC スリープでタスク中断・再開

価格の基準は Anthropic Pricing と Claude Code ドキュメント。2026 年 6 月時点、Opus 档の API 単価は Sonnet の数倍；Agent シーンでは「入力 token」が「出力 token」より怖いことが多い——毎ターン履歴・ツール結果・ファイル断片を再投入するから。

1.1 デフォルト Opus の隠れコスト

Claude Code 導入後、多くの人（私も）が手抜きでグローバル opus。ユニットテスト、typo 修正、changelog 生成——すべて最上位モデル。4 週間の利用ログでは、API 呼び出しの 71% は Opus 級の推論深度を要さなかったのに、毎ターン旗艦価格で精算。

1.2 コンテキストの雪だるま

Agent が読んだファイル、コマンド出力、diff はすべてセッションに入る。5 ターン目はまだマシ、25 ターン目には1 ターンの入力だけで 80k token を突破——同じモジュールを直しているだけなのに。モデルが「高くなった」のではなく、セッション設計の問題。

Context Window の % と混同しない

ターミナルに表示されるコンテキスト占有率は現在のセッション体積であり、月間クォータではない。コスト削減は Console の token 明細とモデル内訳を見る。「残り 62%」だけ見ても意味が薄い。

1.3 ツールループと誤探索

未知の monorepo では Agent がまず「下調べ」：ディレクトリ列挙、シンボル検索、設定読み。CLAUDE.md が空、権限が広すぎると、下調べコストが本番の patch 作成を上回る。ある夜 $47 を消費し、その $31 は Agent が誤った build コマンドを繰り返した時間に発生。

1.4 課金モードの選択ミス

Claude Pro（$20/月）はライト利用向け；フルタイム Claude Code 開発者は Max 档（$100 / $200 档、公式の当期説明に準拠）を検討すべき。私は当時 1 日 6 時間以上ターミナル Agent なのに API Key 従量のまま——自腹でエンタープライズ顧客を演じていた。

二、8 つのコスト削減アクション（効果順）

以下は「請求への限界効果」順。1・2・5 から始めれば、通常 1 週間で曲線が反転する。

2.1 アクション 1：モデル分档ルーティング

変更：デフォルト sonnet；タスク説明に「アーキテクチャ / 並行 / セキュリティ / 未知リポのコールドスタート」が含まれるときだけ手動 /model opus。CLAUDE.md にルールを明記し、誤った档上げを防ぐ。

効果：単体最大、総削減の約 35%。Sonnet で日常 patch、テスト生成、ドキュメント同期は十分；Opus は半日詰まる問題に温存。

# 私の CLAUDE.md 抜粋
デフォルトモデル：Sonnet
以下の場合 Opus へ切替を要求：
- 3 つ以上の package を跨ぐインターフェース変更
- 本番級 race condition / デッドロック
- 初回クローンリポのモジュールマップ作成（第 1 ターンのみ）

2.2 アクション 2：Agent のデフォルト視野を狭める

変更：--add-dir や権限設定で Agent をサブディレクトリに制限；目的のないグローバル grep を禁止。大規模リポでは人間が先に「packages/billing/ を直す」と指定。

効果：ツール呼び出し回数 40% 減、コンテキスト膨張速度が明らかに緩和。

2.3 アクション 3：タスク粒度を「全リポ」から「1 面」へ

変更：1 セッション 1 つの検証可能な目標——「flaky test #1842 を直す」まで。「CI 全体を最適化」は避ける。完了したら /clear または新セッション。

効果：無駄な履歴の持ち越しを削減；review も明確に。

2.4 アクション 4：CLAUDE.md を整備し探索を減らす

変更：リポジトリルートに簡潔な CLAUDE.md（推奨 < 200 行）を維持：ビルドコマンド、テスト入口、ディレクトリマップ、触ってはいけないパス。Agent の迷路探索が減り、「探索税」を払わなくてよくなる。

「1 コマンドでテスト完走」を明記——npm / pnpm / bun の推測を防ぐ
生成コードディレクトリと手書きコードの境界を示す
よくある罠を列挙（例：先に export FOO=bar が必要）

2.5 アクション 5：/compact とセッション分割

探索フェーズ終了後、実装フェーズ前に /compact を実行し、確定した結論を要約に圧縮。長セッションでは compact 後、1 ターンあたりの入力 token が平均 52% 減少。

経験則：対話 15 ターン超、またはコンテキスト 60k 超なら compact か新セッション。必要なコンテキストは最初の prompt に貼る（結論のみ、全文 log は貼らない）。

2.6 アクション 6：Max サブスク vs API の再計算

2 週間の実 token 量を単価表に代入（当サイトの LLM API 価格ガイド参照）。私のクロス検証結論：

1 日 < 2h Claude Code：Pro + 少量 API オーバーフローが最安
1 日 4–8h：Max $100 档は裸 API より有利なことが多い
Claude を自社 SaaS に組み込む：API 継続、ただしキャッシュとバッチ処理を重ねる

Max に切替後、API オーバーフローは月平均 $680 から $40 以内に（CI スクリプトと自動化のみ API Key 継続）。

2.7 アクション 7：API ユーザーは Prompt Caching を有効化

コンプライアンスや統合の都合で API 必須なら、安定したシステムプロンプト、CLAUDE.md の大ブロック、インターフェース説明をキャッシュ対象に。複数セッションでキャッシュヒットすると、繰り返し入力ブロックの費用が大幅低下（Anthropic ドキュメントの Prompt Caching 参照）。

向く：同一リポで 1 日 10+ 新セッションを開くチーム。向かない：毎回 prompt が大きく変わる使い捨てスクリプト。

2.8 アクション 8：安定実行ノードで再実行税を消す

この勘定は Anthropic の請求書には載らないが、token に逆流する：ノートPC のフタ閉じ、SSH 切断、ローカルスリープで Agent が中断——コンテキスト要約からやり直すしかない。再実行 ≈ もう 1 ラウンド分の入力代。

私のやり方：長タスクは Cloud Mac に載せ、tmux セッションで夜間実行；ノートPC は diff review のみ。中断は週 4–5 回からほぼ 0 に——換算で月 $60–$90 節約（再実行規模による試算）。これは「モデル競争」とは無関係、実行ノード層のコスト。

三、最適化前後の対照

指標	最適化前（4 月）	最適化後（5 月平均）
月間総支出	$812	$152
Opus 占比	呼び出し量 78%	呼び出し量 12%
1 セッション平均ターン数	23	11
マージ PR 数 / 月	31	33
平均 review ラウンド	2.8	2.3
タスク中断による再実行	18 回 / 月	2 回 / 月

アウトプットは崩れず、請求だけ先に崩れた——以前の多額支出は無駄な探索と誤った档への支払いであり、能力そのものではなかった。

四、意図的に残した「必要な贅沢」

コスト削減は苦行ではない。以下には依然としてお金を払う：

週 2–3 回の Opus 深掘り：技術的負債、アーキテクチャ、奇妙な並行処理、セキュリティ監査
Max サブスク：高頻度インタラクションの予測可能コストを買い切り
専用 Cloud Mac ノード：token よりずっと安い「中断しない」保険
手入れされた CLAUDE.md：人の時間で Agent 探索税を買い替え——ROI 極めて高い

節約した $650 は AI を使わなくするためではなく、Opus に値する 15% の問題に弾丸を残すため。

五、週 15 分の請求チェック

Console から 7 日分の利用をエクスポート → モデル別に並べ、Opus が異常に高くないか
最も高かったセッション 3 件を spot チェック：タスクが大きすぎ、compact していない、探索が暴走？
デフォルトモデルと CLAUDE.md が同僚に opus に戻されていないか
長タスクがまだノートPC で走っていないか（中断 = 隠れ請求）

カレンダーにチェックを入れる。一度きりの「コスト削減プロジェクト」より効く。Agent ワークフローが快適になりすぎると、デフォルト設定は静かに贅沢モードへ滑り戻る。

FAQ

Claude Code で月 $800 は普通？

API 従量 + デフォルト Opus + 長セッションなら $500–$1000 は珍しくない。まず利用構造を分解し、「本当の需要」か「設定の贅沢」かを判断。

Max サブスクと API、どちらが安い？

フルタイムターミナル開発者の多くは Max が有利。自社プロダクト統合や用量変動が大きいなら API + キャッシュ。2 週間の実データで単価代入、直感に頼らない。

Sonnet は明らかに弱くなる？

大多数の patch とテストタスクではならない。硬い問題は手動で Opus に上げる方が、グローバル Opus より賢い。

/compact でどれくらい節約？

本稿実測で 1 ターン入力 token 40%–65% 減。削減対象は繰り返し運ぶ履歴であり、モデル割引ではない。

Prompt Caching は有効？

API モードで、繰り返しのシステムプロンプトとドキュメントブロックに有効。Max ユーザーは主にワークフロー規律の恩恵であり、キャッシュ単価ではない。

コスト削減後、アウトプットは落ちる？

著者の 4 週間比較で PR 数は微増、review ラウンドは減少。鍵は分档とセッション分割であり、ダウングレード逃避ではない。

Cloud Mac と請求の関係は？

Agent の中断再実行を減らし、間接的に token 消費を抑える。実行ノードの安定は隠れコスト削減のレバー。

おわりに

Claude Code の $800 請求は、多くの場合「AI 依存しすぎ」ではなく、旗艦モデルの価格で入門モデルがやるべき仕事を買い、コンテキストの雪だるまと探索税を重ねた結果。モデル分档、視野の狭め、compact とセッション分割、Max vs API の再計算、安定実行ノード——8 アクションは個別には地味だが、重なると月額を三位数に戻す。

来月 Anthropic が値上げしたり Claude Code のクォータが変わっても、まず「デフォルトモデル」と「セッション粒度」の 2 点を動かす。ツールを急いで替えるより効くことが多い。

最終更新：2026 年 6 月 23 日。価格と Claude Code の機能は Anthropic 公式の当期説明に準拠；文中の金額は著者個人の請求振り返りであり、参考情報。