Среда, после обеда: Codex CLI внезапно отвечает rate limit exceeded, а PR вы доделали только наполовину — это не сеть, а двухуровневая скользящая квота, которую OpenAI навесил на Codex в 2026 году. Эти полевые заметки идут по порядку: разобрать механизм → выбрать путь восстановления → собрать запасной стек. Семь рабочих вариантов, когда недельный лимит на нуле.
1. Лимиты Codex: какой уровень исчерпан?
Многие думают, что у Codex один потолок по числу сообщений. На деле Codex в подписке ChatGPT (CLI, IDE-плагин, облачные задачи) ограничен двумя независимыми скользящими квотами — см. OpenAI Codex Pricing.
1.1 Скользящее окно 5 часов
Local Messages (локальная CLI) и Cloud Tasks делят одно скользящее окно 5 часов. Сброс не в полночь: отсчёт идёт от первого расхода. Тяжёлые задачи — большой репозиторий, долгий agent reasoning, облако вместо локали — сжигают быстрее.
Симптомы: rate limit в CLI, серая кнопка отправки в IDE, облачные задачи в очереди или отклонены. Это самый частый уровень в повседневной работе.
1.2 Недельный лимит (Weekly)
Над окном 5 ч — скользящая 7-дневная недельная квота, ограничивающая интенсивную нагрузку за неделю. Даже если каждое окно 5 ч вы «бережёте», накопленная недельная работа может опустить Weekly до 0 %.
Симптомы: в 5 ч ещё есть запас, но глобальный throttling; или CLI явно показывает Weekly 0%. Именно это «недельный лимит исчерпан» в заголовке.
Не путать с Context Window %
Некоторые сторонние плагины показывают контекст тысячами процентов — это занятость токенов текущей сессии, не 5 ч / Weekly. При отладке смотрите только строки с 5h, Weekly, Remaining.
1.3 Как читать проценты в CLI / IDE
Codex CLI и расширение IDE обычно показывают:
Rate Limits Remaining: 5h 96%, Weekly 94%
Ключевое слово: Remaining (остаток):
Weekly 94%= осталось 94 % недельной квоты, не израсходовано 94 %5h 12%= в текущем 5-часовом окне осталось 12 %, скоро потолок- Способы ниже — только при
0%или явной ошибке rate limit
1.4 Порядок величин по тарифам (06/2026)
OpenAI указывает диапазоны сообщений, а не фиксированные числа — одно «сообщение» может отличаться на порядки в зависимости от размера репо. Таблица с pricing-страницы, пример GPT-5.3-Codex (Local Messages за 5 ч, примерно):
| Тариф | GPT-5.3-Codex / 5 ч (≈) | GPT-5.4-mini / 5 ч (≈) | Примечание |
|---|---|---|---|
| ChatGPT Plus | 10–60 | 60–350 | + ограничение Weekly |
| Pro 5x | ~5× Plus | ~5× Plus | 2026: $100/мес |
| Pro 20x | ~20× Plus | ~20× Plus | параллельная тяжёлая нагрузка |
| Business (не flex) | ≈ Plus | ≈ Plus | за место |
| API Key | нет окна 5 ч / Weekly по подписке | token + rate limits | |
H1 2026: OpenAI ужесточил Plus/Pro — новый Pro 5x за $100, сохранён 20x, после исчерпания квоты подписки можно покупать Credits без немедленного upgrade. Актуальные цифры: chatgpt.com/codex/pricing.
2. Недельный лимит исчерпан: 7 способов
Семь путей отсортированы по возрастанию стоимости. Пробуйте сверху вниз — не меняйте тариф сразу.
Способ 1: Weekly или 5 ч?
«Вообще ничего не работает» иногда значит: только 5 ч на нуле, Weekly ещё жив (или наоборот). Запустите codex в CLI и прочитайте строку rate limit, или проверьте статус-бар расширения VS Code Codex.
- Только
5h 0%→ дождаться 5 ч или reset-токен (способ 3) - Только
Weekly 0%→ ждать 7 дней скользящих или Credits / upgrade (5, 6) - Оба 0 → комбинация ожидания + Credits и план запасного стека (7)
Способ 2: дождаться скользящего сброса
Нулевая цена: не запускать новые задачи, время освободит окна.
- Окно 5 ч: 5 часов от самого раннего расхода в окне
- Недельный лимит: скользящие 7 дней, не сброс в понедельник 0:00
Подходит: некритичные фиксы, code review, документация. Не подходит: ночь перед release в CI — способы 3–7.
Способ 3: сохраняемые reset-токены
В июне 2026 OpenAI ввёл для Go / Plus / Pro / Business сохраняемые rate limit reset: вместо сброса только в фиксированное время вы получаете «монеты сброса», которые можно вручную потратить и немедленно восстановить стандартное окно использования.
- При запуске — минимум 1 бесплатный reset для подходящих аккаунтов
- Каждый токен действует 30 дней, потом сгорает
- В promo-период — дополнительные reset за приглашения (по официальным объявлениям)
Важно: в changelog речь в основном о «стандартном окне использования» — сброс Weekly не подтверждён. На практике — экстренный 5-часовой вариант; Weekly — скользящее восстановление или Credits.
Способ 4: переключиться на GPT-5.4-mini
На том же тарифе лимит сообщений GPT-5.4-mini заметно выше полноразмерного GPT-5.3-Codex (Plus: mini ≈ 60–350 / 5 ч, Codex ≈ 10–60). Смена модели в CLI или IDE:
# Пример: модель в поддерживаемой сессии
/model gpt-5.4-mini
Подходит: рефактор одного файла, дополнение тестов, lint, ответы в PR. Не подходит: миграция архитектуры между модулями, сложные concurrency-баги — mini может зациклиться и сжечь квоту.
Способ 5: купить Credits
С 2026 года пользователи ChatGPT Plus и Pro после исчерпания квоты подписки могут докупить Credits для Codex без немедленного повышения тарифа. Business / Enterprise с гибким ценообразованием — workspace credits.
Путь: настройки аккаунта ChatGPT → Usage / Billing → купить Credits (текст UI зависит от региона).
Подходит: sprint-неделя (release, hackathon), если Codex нужен и в следующем месяце. Не подходит: Weekly на нуле каждый месяц — upgrade или API (6, 7).
Способ 6: повысить тариф
Если вы каждую неделю доводите Weekly до 0, тариф не соответствует нагрузке. Грубые уровни 2026:
- Plus: лёгкое повседневное использование, эпизодически
- Pro 5x (~$100/мес): ~5× Codex Plus, для full-time разработки
- Pro 20x: параллельные репо, несколько агентов одновременно
Перед upgrade посчитайте: если месячные траты на Credits близки к разнице тарифов, upgrade обычно проще.
Способ 7: API Key или запасной агент
Когда квота подписки — жёсткий потолок, два пути:
A. OpenAI API Key — Codex поддерживает вход по API Key. Нет окна 5 ч / Weekly ChatGPT; оплата по token, ограничения балансом и RPM/TPM. GPT-5.3 Codex API (06/2026): input ~$1,75 / млн token, output ~$14 / млн token.
B. Сменить toolchain — Claude Code, Cursor Agent, Gemini CLI, свой LangGraph + API: у каждого своя система квот. Многие команды держат «Codex основной + Claude Code запасной», чтобы не упираться в single-point rate limit.
Быстрое решение
- PR нужно смержить сегодня → способ 3 или 5
- Третий Weekly 0 за неделю → 6 или 7
- Интеграция в продукт компании → 7A (API Key)
- Apple-платформа, job на ночь → 7B + стабильный Cloud Mac (раздел 5)
3. Сравнение альтернативных API и инструментов
Пустой недельный лимит — повод пересмотреть стек. Сравнение по модели квот, code-agent, типичной стоимости (публичные данные, июнь 2026):
| Вариант | Модель квот | Форма агента | Кому |
|---|---|---|---|
| Codex (подписка ChatGPT) | 5 ч + Weekly скользящие | CLI / IDE / облачные задачи | Plus/Pro, экосистема OpenAI |
| Codex (API Key) | по token, без недельного лимита | то же, предсказуемый счёт | интеграция команды, CI |
| Claude Code | сессия Pro/Max или API token | терминальный агент + CLAUDE.md |
длинные цепочки, multi-file |
| Cursor Agent | запросы подписки + надбавка модели | встроен в IDE | ежедневный coding + лёгкий agent |
| Gemini CLI / API | free tier + по token | CLI / экосистема Google | multimodal, большой контекст RAG |
| DeepSeek API | чисто по token, дёшево | нужен свой agent framework | чувствительны к cost, CN-рынок |
Детали цен моделей: Гид по ценам и выбору LLM API 2026. Смена инструмента ≠ смена среды — агентам нужны стабильные macOS / Linux узлы для сборки и тестов.
4. Профилактика: квота на всю неделю
Раз починить лимит легко; каждую неделю — менять workflow:
- Дробить задачи: одна agent-сессия — одна чёткая цель («починить flaky test», не «рефакторить модуль»), меньше холостых итераций.
- Сначала локально: что решает
rg/ LSP — не отдавать агенту; квота на cross-file reasoning. - Уровни модели: по умолчанию mini, полный Codex — для тяжёлых случаев.
- Cloud Tasks экономно: делят 5 ч с Local Messages; локально, где можно.
- Следить за Remaining: останавливаться при
5h < 20%, доделать в следующем окне. - Dual-stack: Codex основной, Claude Code или API — backup при rate limit.
5. Узел выполнения: лимит вернулся — задача не обрывается
Квота решена — следующий разрыв: runtime. Облачные задачи Codex, CLI на ночь, UI-тесты Xcode на ноутбуке: крышка закрыта, VPN дёргается, диск полон — агент обрывается на полпути.
Прагматично в 2026: разделять квоту модели и узел выполнения. Подписка/API = «мозг», Cloud Mac = «тело» — выделенный macOS-узел 24/7, длинные job в tmux; когда у Codex или Claude Code снова есть квота — возвращаетесь к приёмке.
Это не дефицит моделей, а стабильный, предсказуемый macOS compute. Подробнее: Гонка моделей закончилась — почему Mac-узлы стали дефицитом
FAQ
Чем отличаются Weekly и 5 ч?
5 ч ограничивает краткосрочные всплески; Weekly — недельный накопленный объём. Оба крутятся независимо; достаточно одного пустого уровня для throttling.
CLI: Weekly 94 % — почти кончилось или ещё много?
Remaining = остаток. 94% значит осталось 94 %, не израсходовано 94 %.
Credits после исчерпания недельного лимита?
Да. Plus / Pro могут купить Credits; Business flex — workspace credits.
Сохраняемый reset-токен сбрасывает Weekly?
Официально не подтверждено. Считать экстренным 5-часовым; Weekly — скользящее восстановление или Credits.
GPT-5.4-mini продлевает квоту?
Да. На том же тарифе заметно выше лимит 5 ч для лёгких задач.
Есть ли недельный лимит с API Key?
Нет окна 5 ч / Weekly по подписке; оплата по token и rate limits.
Claude Code может заменить Codex?
Похожий terminal-agent, независимая квота. Для iOS/macOS — длинные прогоны на стабильном Cloud Mac.
Итог
Нулевой недельный лимит Codex — не «сломанный аккаунт»: OpenAI в 2026 чётче разводит «лёгкую пробу» и «full-time agent-разработку». Прочитать 5 ч и Weekly, использовать reset-токены и mini, при необходимости Credits или upgrade, держать API / Claude Code в запасе — большинство команд за неделю возвращают ритм.
Квота сбросится; дата релиза — нет. Длинные задачи на узле, который не отваливается, выгоднее ночного ожидания скользящего окна.
Codex в throttling? Сначала — стабильный Mac-узел для агента
Vuncloud выделенный Mac mini M4 Cloud Mac: marathon Codex / Claude Code, сборки Xcode, tmux на ночь — US East / US West / APAC. Квота вернулась — задача не оборвана на полпути.
Читать также
- Цены, config, performance и аудитории LLM 2026
- Гонка моделей закончилась — Mac-узлы стали дефицитом
- AI Coding, Personal AI и agent-архитектура: треугольник dev 2026
Обновлено: 22 июня 2026. Лимиты и цены по OpenAI Codex Pricing и changelog июня 2026.