Vuncloud Блог
← Назад к полевым заметкам

Практический разбор: как я снизил месячный счёт Claude Code с $800 до $150

Снижение расходов Claude Code · Opus / Sonnet · сжатие контекста · /compact · Max · API Key · Prompt Caching · узел Cloud Mac ·~12 мин чтения

Ноутбук на столе разработчика с графиками затрат и кодом — оптимизация месячного счёта Claude Code и контроль токенов

В конце апреля пришёл счёт Anthropic: $812,47. Я несколько секунд смотрел на цифру — подписка покрывала только Claude Pro, остальное целиком шло с Claude Code по API Key. Четыре недели я не написал строки кода меньше, просто разобрал связку «Opus по умолчанию + бесконечный контекст + агент бродит по всему репо». Месячные расходы стабилизировались на $140–$165. Ниже — разбор и список действий, которые можно повторить.

81%
Снижение счёта за четыре недели ($812 → $152 в среднем)
8 шагов
Меры по снижению расходов, которые можно внедрить сразу
70%
Задач без ощутимой разницы после перехода на Sonnet

I. Анатомия счёта $800: куда уходят деньги

Отложим эмоции. Экспорт детализации Usage из Anthropic Console (по дням, моделям, workspace) разбил $812 на четыре блока — доли плавают от размера репо, но структура похожа:

Пожиратель бюджета Доля (прим.) Типичный сценарий
Длинные сессии Opus по умолчанию 38% Один PR от начала до конца без смены модели — вход и выход по самому дорогому тарифу
Снежный ком контекста 27% После 20+ ходов каждый запрос снова отправляет всю историю + вывод инструментов
Циклы инструментов / ошибочная разведка 22% Агент снова и снова запускает glob, grep по всему репо или тупит на упавших build
Режим тарификации и перезапуски 13% Объём, который покрывает Max, идёт через API; сон ноутбука обрывает задачу

Ориентиры по ценам: Anthropic Pricing и документация Claude Code. В июне 2026 API Opus по-прежнему в разы дороже Sonnet; в режиме агента «входные токены» часто пугают больше выходных, потому что каждый ход снова подаёт историю, результаты инструментов и фрагменты файлов.

1.1 Скрытый налог Opus по умолчанию

После установки многие (и я) из лени ставят везде opus. Юнит-тесты, опечатки, changelog — всё на самой дорогой модели. За четыре недели логов 71% вызовов API не требовали глубины рассуждений Opus, но каждый ход тарифицировался по flagship-цене.

1.2 Снежный ком контекста

Прочитанные файлы, вывод команд и diff попадают в сессию. На 5-м ходу ещё терпимо; на 25-м один вход превышает 80k токенов, хотя вы правите тот же модуль. Дело не в том, что модель «подорожала», а в дизайне сессии.

Не путайте с процентом окна контекста

Процент в терминале — это объём текущей сессии, не месячная квота. Для снижения расходов смотрите детализацию токенов и разбивку по моделям в Console — а не только «осталось 62%».

1.3 Циклы инструментов и лишняя разведка

В незнакомом monorepo агент сначала «щупает» почву: каталоги, символы, конфиги. Пустой CLAUDE.md и широкие права — стоимость разведки может превысить сам patch. Одна ночь сожгла $47, из них $31 — на повторные неверные команды build.

1.4 Неверный режим тарификации

Claude Pro ($20/мес) для лёгкой нагрузки; разработчику Claude Code на полную ставку стоит смотреть Max ($100 / $200 по актуальной сетке). У меня 6+ ч/день в терминальном агенте при API Key по токенам — как платить как enterprise без enterprise-контракта.

II. 8 шагов по снижению расходов (по убыванию эффекта)

Отсортированы по маржинальному эффекту на мой счёт. Начните с 1, 2 и 5 — кривая часто ломается за неделю.

2.1 Шаг 1: маршрутизация по уровням модели

Изменение: по умолчанию sonnet; /model opus только если в задаче архитектура, конкурентность, безопасность или первый контакт с чужим репо. Правило в CLAUDE.md, чтобы не поднимать уровень случайно.

Эффект: самый крупный, ~35% общего снижения. Sonnet хватает для ежедневных patch, генерации тестов и синка доков; Opus — для того, что блокирует полдня.

# Фрагмент моего CLAUDE.md
Модель по умолчанию: Sonnet
Переключать на Opus если:
- изменение интерфейса в 3+ пакетах
- race condition / deadlock уровня production
- первая карта модулей свежесклонированного репо (только раунд 1)

2.2 Шаг 2: сузить поле зрения агента

Изменение: --add-dir или права, ограничивающие агента подкаталогом; запретить глобальный grep без цели. На большом репо человек сначала указывает «правим packages/billing/».

Эффект: −40% вызовов инструментов, заметное замедление роста контекста.

2.3 Шаг 3: одна «грань» репо на сессию

Изменение: одна сессия = одна проверяемая цель, напр. «починить flaky test #1842», а не «оптимизировать весь CI». По завершении — /clear или новая сессия.

Эффект: меньше мёртвой истории; review понятнее.

2.4 Шаг 4: хороший CLAUDE.md — меньше разведки

Изменение: компактный CLAUDE.md в корне (< 200 строк): команды сборки, вход в тесты, карта каталогов, запретные пути. Меньше лабиринта — меньше «налога на разведку».

  • Одна команда для тестов — агент не угадывает npm / pnpm / bun
  • Граница сгенерированного и ручного кода
  • Частые ловушки (напр. перед build нужен export FOO=bar)

2.5 Шаг 5: /compact и разбиение сессий

После фазы исследования, перед реализацией — /compact, чтобы сжать подтверждённые выводы. В длинных сессиях входные токены за ход в среднем −52%.

Эмпирическое правило: больше 15 ходов или 60k контекста — compact или новая сессия; в первый prompt только выводы, не полные логи.

2.6 Шаг 6: пересчитать Max vs API

Подставить две недели реальных токенов в тарифную сетку (см. наш гид по ценам LLM API). Мой перекрёстный вывод:

  • < 2 ч/день Claude Code: Pro + немного API overflow — дешевле всего
  • 4–8 ч/день: Max за $100 часто выгоднее голого API
  • Встраивание Claude в свой SaaS: оставаться на API, но с кэшем и batch

После Max overflow API упал с ~$680/мес до менее $40 (только CI-скрипты и автоматизация на API Key).

2.7 Шаг 7: Prompt Caching для API-пользователей

Если нужен API (комплаенс, интеграция), пометьте кэшируемыми стабильный системный промпт, крупные блоки CLAUDE.md и описания API. При повторных попаданиях стоимость дублирующихся входных блоков падает (см. документацию Anthropic по Prompt Caching).

Подходит: команды с 10+ новыми сессиями в день на одном репо. Мало пользы: одноразовые скрипты с меняющимся prompt.

2.8 Шаг 8: стабильный узел — конец налога на перезапуск

Эта строка не в счёте Anthropic, но возвращается в токенах: крышка ноутбука, обрыв SSH, локальный сон — агент останавливается, вы кратко пересказываете и начинаете снова. Перезапуск ≈ ещё один раунд входа.

Моя практика: длинные задачи на Cloud Mac, сессия tmux на ночь; ноутбук только для review diff. Обрывы: с 4–5 в неделю до почти нуля, ~$60–$90/мес сэкономлено (оценка по объёму перезапусков). Это не про модель, а про узел выполнения.

III. До и после оптимизации

Показатель До (апрель) После (среднее за май)
Месячные расходы всего $812 $152
Доля Opus 78% вызовов 12% вызовов
Среднее число ходов в сессии 23 11
Смерженных PR / месяц 31 33
Среднее число раундов review 2,8 2,3
Перезапуски после обрыва 18 / месяц 2 / месяц

Продуктивность не рухнула, счёт — да. Значит, большая часть бюджета покупала бесполезную разведку и неверный уровень модели, а не саму способность.

IV. «Необходимая роскошь», которую я оставил

Снижать расходы — не аскеза. За это я по-прежнему готов платить:

  • 2–3 погружения Opus в неделю: архитектурный долг, странная конкурентность, аудит безопасности
  • Подписка Max: предсказуемая стоимость интенсивного взаимодействия
  • Выделенный узел Cloud Mac: страховка «без обрыва» дешевле токенов
  • Ухоженный CLAUDE.md: человеческое время против налога на разведку агента — высокий ROI
Сэкономленные $650 — не чтобы меньше пользоваться ИИ, а чтобы сосредоточить ресурсы на 15% задач, которым нужен Opus.

V. 15 минут в неделю на проверку счёта

  1. Экспорт 7 дней Usage из Console → разбивка по моделям, Opus аномально высок?
  2. Выборка 3 самых дорогих сессий: задача слишком широкая, не было compact, разведка сорвалась?
  3. Проверить, что модель по умолчанию и CLAUDE.md коллега не вернул на opus
  4. Длинные задачи всё ещё на ноутбуке (обрыв = скрытый счёт)?

Запись в календарь эффективнее разового «проекта снижения расходов». Когда agent-workflow становится слишком удобным, дефолтная конфигурация тихо скатывается в роскошный режим.

FAQ

Нормально ли тратить $800 в месяц на Claude Code?

API по токенам + Opus по умолчанию + длинные сессии: $500–$1000 не редкость. Сначала разберите структуру usage, потом решайте — «реальная потребность» или «роскошная конфигурация».

Max или API — что дешевле?

Для full-time terminal-разработчика Max часто выгоднее; для встраивания в продукт или сильных колебаний — API + кэш. Две недели реальных данных, не интуиция.

Sonnet сильно «тупеет»?

Для большинства patch и тестов — нет. Вручную поднимать Opus на сложных задачах умнее, чем Opus везде.

Сколько экономит /compact?

В статье: −40%–−65% входных токенов за ход; экономия на повторной истории, не скидка на модель.

Полезен ли Prompt Caching?

В API-режиме при повторяющихся системных промптах и док-блоках. Подписчики Max выигрывают в основном дисциплиной workflow, не тарифом кэша.

Падает ли продуктивность?

За четыре недели: PR чуть выросли, раунды review снизились. Ключ — уровни моделей и разбиение сессий, не ленивый downgrade.

Как связаны Cloud Mac и счёт?

Меньше обрывов и перезапусков — меньше сожжённых токенов. Стабильный узел выполнения — скрытый рычаг экономии.

Заключение

Счёт Claude Code $800 — не всегда «слишком зависим от ИИ». Чаще это плата flagship-ценой за работу entry-уровня плюс снежный ком контекста и налог на разведку. Маршрутизация моделей, узкое поле, compact и короткие сессии, пересчёт Max vs API, стабильный узел — восемь простых шагов вместе возвращают месячный счёт к трём цифрам.

Если Anthropic пересмотрит цены или квоты Claude Code в следующем месяце, сначала трогайте «модель по умолчанию» и «гранулярность сессии» — обычно быстрее, чем смена инструмента.

Чтобы сэкономить на агенте, не обрывайте его в полночь

Выделенный Vuncloud Mac mini M4 Cloud Mac: марафон Claude Code, tmux на ночь, сборки Xcode без обрыва. Узлы US East / US West / APAC — квоты и счёт под контролем, без «сначала с нуля».

Тарифы Cloud Mac · Гид по ценам LLM API

Обновлено: 23 июня 2026. Тарифы и возможности Claude Code — по официальным данным Anthropic на момент публикации; суммы из личного разбора счёта, только для ориентира.

Полевые заметки · ИИ

Счёт Claude Code под контролем

Уровни моделей · сжатие контекста · Max · узел Cloud Mac

Тарифы Cloud Mac
Ограниченное предложение Смотреть тарифы