В конце апреля пришёл счёт Anthropic: $812,47. Я несколько секунд смотрел на цифру — подписка покрывала только Claude Pro, остальное целиком шло с Claude Code по API Key. Четыре недели я не написал строки кода меньше, просто разобрал связку «Opus по умолчанию + бесконечный контекст + агент бродит по всему репо». Месячные расходы стабилизировались на $140–$165. Ниже — разбор и список действий, которые можно повторить.
I. Анатомия счёта $800: куда уходят деньги
Отложим эмоции. Экспорт детализации Usage из Anthropic Console (по дням, моделям, workspace) разбил $812 на четыре блока — доли плавают от размера репо, но структура похожа:
| Пожиратель бюджета | Доля (прим.) | Типичный сценарий |
|---|---|---|
| Длинные сессии Opus по умолчанию | 38% | Один PR от начала до конца без смены модели — вход и выход по самому дорогому тарифу |
| Снежный ком контекста | 27% | После 20+ ходов каждый запрос снова отправляет всю историю + вывод инструментов |
| Циклы инструментов / ошибочная разведка | 22% | Агент снова и снова запускает glob, grep по всему репо или тупит на упавших build |
| Режим тарификации и перезапуски | 13% | Объём, который покрывает Max, идёт через API; сон ноутбука обрывает задачу |
Ориентиры по ценам: Anthropic Pricing и документация Claude Code. В июне 2026 API Opus по-прежнему в разы дороже Sonnet; в режиме агента «входные токены» часто пугают больше выходных, потому что каждый ход снова подаёт историю, результаты инструментов и фрагменты файлов.
1.1 Скрытый налог Opus по умолчанию
После установки многие (и я) из лени ставят везде opus. Юнит-тесты, опечатки, changelog — всё на самой дорогой модели. За четыре недели логов 71% вызовов API не требовали глубины рассуждений Opus, но каждый ход тарифицировался по flagship-цене.
1.2 Снежный ком контекста
Прочитанные файлы, вывод команд и diff попадают в сессию. На 5-м ходу ещё терпимо; на 25-м один вход превышает 80k токенов, хотя вы правите тот же модуль. Дело не в том, что модель «подорожала», а в дизайне сессии.
Не путайте с процентом окна контекста
Процент в терминале — это объём текущей сессии, не месячная квота. Для снижения расходов смотрите детализацию токенов и разбивку по моделям в Console — а не только «осталось 62%».
1.3 Циклы инструментов и лишняя разведка
В незнакомом monorepo агент сначала «щупает» почву: каталоги, символы, конфиги. Пустой CLAUDE.md и широкие права — стоимость разведки может превысить сам patch. Одна ночь сожгла $47, из них $31 — на повторные неверные команды build.
1.4 Неверный режим тарификации
Claude Pro ($20/мес) для лёгкой нагрузки; разработчику Claude Code на полную ставку стоит смотреть Max ($100 / $200 по актуальной сетке). У меня 6+ ч/день в терминальном агенте при API Key по токенам — как платить как enterprise без enterprise-контракта.
II. 8 шагов по снижению расходов (по убыванию эффекта)
Отсортированы по маржинальному эффекту на мой счёт. Начните с 1, 2 и 5 — кривая часто ломается за неделю.
2.1 Шаг 1: маршрутизация по уровням модели
Изменение: по умолчанию sonnet; /model opus только если в задаче архитектура, конкурентность, безопасность или первый контакт с чужим репо. Правило в CLAUDE.md, чтобы не поднимать уровень случайно.
Эффект: самый крупный, ~35% общего снижения. Sonnet хватает для ежедневных patch, генерации тестов и синка доков; Opus — для того, что блокирует полдня.
# Фрагмент моего CLAUDE.md
Модель по умолчанию: Sonnet
Переключать на Opus если:
- изменение интерфейса в 3+ пакетах
- race condition / deadlock уровня production
- первая карта модулей свежесклонированного репо (только раунд 1)
2.2 Шаг 2: сузить поле зрения агента
Изменение: --add-dir или права, ограничивающие агента подкаталогом; запретить глобальный grep без цели. На большом репо человек сначала указывает «правим packages/billing/».
Эффект: −40% вызовов инструментов, заметное замедление роста контекста.
2.3 Шаг 3: одна «грань» репо на сессию
Изменение: одна сессия = одна проверяемая цель, напр. «починить flaky test #1842», а не «оптимизировать весь CI». По завершении — /clear или новая сессия.
Эффект: меньше мёртвой истории; review понятнее.
2.4 Шаг 4: хороший CLAUDE.md — меньше разведки
Изменение: компактный CLAUDE.md в корне (< 200 строк): команды сборки, вход в тесты, карта каталогов, запретные пути. Меньше лабиринта — меньше «налога на разведку».
- Одна команда для тестов — агент не угадывает
npm/pnpm/bun - Граница сгенерированного и ручного кода
- Частые ловушки (напр. перед build нужен
export FOO=bar)
2.5 Шаг 5: /compact и разбиение сессий
После фазы исследования, перед реализацией — /compact, чтобы сжать подтверждённые выводы. В длинных сессиях входные токены за ход в среднем −52%.
Эмпирическое правило: больше 15 ходов или 60k контекста — compact или новая сессия; в первый prompt только выводы, не полные логи.
2.6 Шаг 6: пересчитать Max vs API
Подставить две недели реальных токенов в тарифную сетку (см. наш гид по ценам LLM API). Мой перекрёстный вывод:
- < 2 ч/день Claude Code: Pro + немного API overflow — дешевле всего
- 4–8 ч/день: Max за $100 часто выгоднее голого API
- Встраивание Claude в свой SaaS: оставаться на API, но с кэшем и batch
После Max overflow API упал с ~$680/мес до менее $40 (только CI-скрипты и автоматизация на API Key).
2.7 Шаг 7: Prompt Caching для API-пользователей
Если нужен API (комплаенс, интеграция), пометьте кэшируемыми стабильный системный промпт, крупные блоки CLAUDE.md и описания API. При повторных попаданиях стоимость дублирующихся входных блоков падает (см. документацию Anthropic по Prompt Caching).
Подходит: команды с 10+ новыми сессиями в день на одном репо. Мало пользы: одноразовые скрипты с меняющимся prompt.
2.8 Шаг 8: стабильный узел — конец налога на перезапуск
Эта строка не в счёте Anthropic, но возвращается в токенах: крышка ноутбука, обрыв SSH, локальный сон — агент останавливается, вы кратко пересказываете и начинаете снова. Перезапуск ≈ ещё один раунд входа.
Моя практика: длинные задачи на Cloud Mac, сессия tmux на ночь; ноутбук только для review diff. Обрывы: с 4–5 в неделю до почти нуля, ~$60–$90/мес сэкономлено (оценка по объёму перезапусков). Это не про модель, а про узел выполнения.
III. До и после оптимизации
| Показатель | До (апрель) | После (среднее за май) |
|---|---|---|
| Месячные расходы всего | $812 | $152 |
| Доля Opus | 78% вызовов | 12% вызовов |
| Среднее число ходов в сессии | 23 | 11 |
| Смерженных PR / месяц | 31 | 33 |
| Среднее число раундов review | 2,8 | 2,3 |
| Перезапуски после обрыва | 18 / месяц | 2 / месяц |
Продуктивность не рухнула, счёт — да. Значит, большая часть бюджета покупала бесполезную разведку и неверный уровень модели, а не саму способность.
IV. «Необходимая роскошь», которую я оставил
Снижать расходы — не аскеза. За это я по-прежнему готов платить:
- 2–3 погружения Opus в неделю: архитектурный долг, странная конкурентность, аудит безопасности
- Подписка Max: предсказуемая стоимость интенсивного взаимодействия
- Выделенный узел Cloud Mac: страховка «без обрыва» дешевле токенов
- Ухоженный CLAUDE.md: человеческое время против налога на разведку агента — высокий ROI
Сэкономленные $650 — не чтобы меньше пользоваться ИИ, а чтобы сосредоточить ресурсы на 15% задач, которым нужен Opus.
V. 15 минут в неделю на проверку счёта
- Экспорт 7 дней Usage из Console → разбивка по моделям, Opus аномально высок?
- Выборка 3 самых дорогих сессий: задача слишком широкая, не было compact, разведка сорвалась?
- Проверить, что модель по умолчанию и
CLAUDE.mdколлега не вернул наopus - Длинные задачи всё ещё на ноутбуке (обрыв = скрытый счёт)?
Запись в календарь эффективнее разового «проекта снижения расходов». Когда agent-workflow становится слишком удобным, дефолтная конфигурация тихо скатывается в роскошный режим.
FAQ
Нормально ли тратить $800 в месяц на Claude Code?
API по токенам + Opus по умолчанию + длинные сессии: $500–$1000 не редкость. Сначала разберите структуру usage, потом решайте — «реальная потребность» или «роскошная конфигурация».
Max или API — что дешевле?
Для full-time terminal-разработчика Max часто выгоднее; для встраивания в продукт или сильных колебаний — API + кэш. Две недели реальных данных, не интуиция.
Sonnet сильно «тупеет»?
Для большинства patch и тестов — нет. Вручную поднимать Opus на сложных задачах умнее, чем Opus везде.
Сколько экономит /compact?
В статье: −40%–−65% входных токенов за ход; экономия на повторной истории, не скидка на модель.
Полезен ли Prompt Caching?
В API-режиме при повторяющихся системных промптах и док-блоках. Подписчики Max выигрывают в основном дисциплиной workflow, не тарифом кэша.
Падает ли продуктивность?
За четыре недели: PR чуть выросли, раунды review снизились. Ключ — уровни моделей и разбиение сессий, не ленивый downgrade.
Как связаны Cloud Mac и счёт?
Меньше обрывов и перезапусков — меньше сожжённых токенов. Стабильный узел выполнения — скрытый рычаг экономии.
Заключение
Счёт Claude Code $800 — не всегда «слишком зависим от ИИ». Чаще это плата flagship-ценой за работу entry-уровня плюс снежный ком контекста и налог на разведку. Маршрутизация моделей, узкое поле, compact и короткие сессии, пересчёт Max vs API, стабильный узел — восемь простых шагов вместе возвращают месячный счёт к трём цифрам.
Если Anthropic пересмотрит цены или квоты Claude Code в следующем месяце, сначала трогайте «модель по умолчанию» и «гранулярность сессии» — обычно быстрее, чем смена инструмента.
Чтобы сэкономить на агенте, не обрывайте его в полночь
Выделенный Vuncloud Mac mini M4 Cloud Mac: марафон Claude Code, tmux на ночь, сборки Xcode без обрыва. Узлы US East / US West / APAC — квоты и счёт под контролем, без «сначала с нуля».
Читать также
- Цены, конфиг, производительность и аудитории LLM 2026—полный разбор
- Исчерпан недельный лимит Codex? 7 решений, механика квот и альтернативные API (2026)
- Гонка моделей закончилась—почему Mac-узлы так трудно достать
Обновлено: 23 июня 2026. Тарифы и возможности Claude Code — по официальным данным Anthropic на момент публикации; суммы из личного разбора счёта, только для ориентира.