Mercredi après-midi : la CLI Codex renvoie soudain rate limit exceeded, et votre PR est à moitié faite — ce n'est pas le réseau, c'est le double quota glissant qu'OpenAI applique à Codex en 2026. Ce lab note suit l'ordre : comprendre le mécanisme → choisir la voie de réparation → monter une stack de repli. Sept options concrètes quand le plafond hebdomadaire est à zéro.
1. Limites Codex : quelle couche est pleine ?
Beaucoup pensent qu'il n'y a qu'un plafond de messages. En réalité, Codex dans l'abonnement ChatGPT (CLI, extension IDE, tâches cloud) obéit à deux quotas glissants indépendants — voir OpenAI Codex Pricing.
1.1 Fenêtre glissante 5 heures
Local Messages (CLI locale) et Cloud Tasks partagent la même fenêtre glissante de 5 heures. Pas de reset à minuit : le compteur avance à partir de la première consommation. Les jobs lourds — gros dépôt, long reasoning agent, exécution cloud — brûlent plus vite.
Symptômes : rate limit en CLI, bouton d'envoi grisé dans l'IDE, tâches cloud en file ou refusées. C'est la couche la plus fréquente au quotidien.
1.2 Plafond hebdomadaire (Weekly)
Au-dessus de la fenêtre 5 h, un quota glissant sur 7 jours limite l'usage soutenu sur la semaine. Même en « économisant » chaque fenêtre 5 h, le cumul hebdo peut amener Weekly à 0 %.
Symptômes : il reste du 5 h mais throttling global ; ou la CLI affiche Weekly 0%. C'est le « plafond hebdo épuisé » du titre.
Distinct du Context Window %
Certains plugins tiers affichent le contexte en milliers de pourcents — c'est l'occupation token de la session courante, pas le 5 h / Weekly. En debug, ne regarder que les lignes 5h, Weekly, Remaining.
1.3 Lire les pourcentages CLI / IDE
La CLI Codex et l'extension IDE affichent typiquement :
Rate Limits Remaining: 5h 96%, Weekly 94%
Mot-clé : Remaining (restant) :
Weekly 94%= 94 % de quota hebdo restant, pas 94 % consommé5h 12%= plus que 12 % dans la fenêtre 5 h actuelle, bientôt plein- À
0%ou erreur rate limit explicite seulement, activer les correctifs ci-dessous
1.4 Ordres de grandeur par offre (06/2026)
OpenAI publie des fourchettes de messages, pas des entiers fixes — une « message » varie d'ordres de grandeur selon la taille du dépôt. Tableau issu de la page tarifs, exemple GPT-5.3-Codex (Local Messages par 5 h, environ) :
| Offre | GPT-5.3-Codex / 5 h (env.) | GPT-5.4-mini / 5 h (env.) | Remarque |
|---|---|---|---|
| ChatGPT Plus | 10–60 | 60–350 | + contrainte Weekly |
| Pro 5x | ~5× Plus | ~5× Plus | 2026 : 100 $/mois |
| Pro 20x | ~20× Plus | ~20× Plus | usage parallèle intensif |
| Business (non flex) | ≈ Plus | ≈ Plus | par siège |
| API Key | pas de fenêtre 5 h / Weekly abo | token + rate limits | |
S1 2026 : OpenAI a resserré Plus/Pro — palier Pro 5x à 100 $, palier 20x conservé, et après épuisement du quota abo possibilité d'acheter des Credits sans upgrade immédiat. Chiffres à jour : chatgpt.com/codex/pricing.
2. Plafond hebdo épuisé : 7 correctifs
Les sept voies sont classées par coût croissant. Tester de haut en bas — ne pas upgrader d'emblée.
Correctif 1 : Weekly ou 5 h ?
« Tout est bloqué » peut signifier : seul le 5 h est à zéro, Weekly a encore de la marge (ou l'inverse). Lancer codex en CLI et lire la ligne rate limit, ou vérifier la barre d'état de l'extension VS Code Codex.
- Seulement
5h 0%→ laisser glisser 5 h ou jeton reset (correctif 3) - Seulement
Weekly 0%→ attendre 7 jours glissants ou Credits / upgrade (5, 6) - Les deux à 0 → combiner attente + Credits, planifier la stack de repli (7)
Correctif 2 : attendre le glissement
Coût zéro : ne plus lancer de tâches, le temps libère les fenêtres.
- Fenêtre 5 h : 5 heures après la première consommation dans la fenêtre
- Plafond hebdo : 7 jours glissants, pas de reset lundi 0 h
Convient : correctifs non urgents, revue de code, docs. Inadapté : veille de release CI — correctifs 3–7.
Correctif 3 : jetons de reset stockables
En juin 2026, OpenAI a introduit pour Go / Plus / Pro / Business des resets de rate limit stockables : au lieu de vider à heure fixe, vous recevez des « jetons reset » à consommer manuellement pour restaurer immédiatement la fenêtre d'usage standard.
- Au lancement, au moins 1 reset gratuit pour les comptes éligibles
- Chaque jeton valable 30 jours, puis expiration
- Période promo : resets supplémentaires via parrainage (détails selon annonce officielle)
Attention : le changelog parle surtout de la « fenêtre d'usage standard » — reset du Weekly non confirmé. En prod, traiter comme secours 5 h ; Weekly via glissement ou Credits.
Correctif 4 : basculer sur GPT-5.4-mini
Sur la même offre, le plafond messages de GPT-5.4-mini dépasse largement GPT-5.3-Codex pleine taille (Plus : mini env. 60–350 / 5 h, Codex env. 10–60). Changer de modèle en CLI ou IDE :
# Exemple : modèle dans une session compatible
/model gpt-5.4-mini
Adapté : refactor fichier unique, complétion de tests, lint, réponses PR. Inadapté : migration architecture multi-modules, bugs concurrency complexes — mini peut boucler et gaspiller le quota.
Correctif 5 : acheter des Credits
Depuis 2026, les utilisateurs ChatGPT Plus et Pro peuvent acheter des Credits Codex après épuisement du quota abo, sans monter de palier tout de suite. Business / Enterprise en tarification flexible peuvent acheter des workspace credits.
Chemin : paramètres compte ChatGPT → Usage / Billing → acheter Credits (libellés variables selon région).
Convient : semaine sprint (release, hackathon), si vous gardez Codex le mois suivant. Inadapté : Weekly à zéro chaque mois — upgrade ou API (6, 7).
Correctif 6 : monter de palier
Si vous mettez Weekly à 0 chaque semaine, l'offre ne correspond pas à la charge. Paliers 2026 en gros :
- Plus : usage léger au quotidien, intermittent
- Pro 5x (~100 $/mois) : ~5× le Codex Plus, dev à temps plein
- Pro 20x : dépôts parallèles, plusieurs agents simultanés
Avant upgrade : si la dépense Credits mensuelle approche l'écart de palier, l'upgrade est souvent plus simple.
Correctif 7 : API Key ou agent de repli
Quand le quota abo devient un plafond dur, deux routes :
A. OpenAI API Key — Codex accepte la connexion par API Key. Pas de fenêtre 5 h / Weekly ChatGPT ; facturation au token, plafonnée par solde et RPM/TPM. GPT-5.3 Codex API (06/2026) : entrée ~1,75 $ / M tokens, sortie ~14 $ / M tokens.
B. Changer de toolchain — Claude Code, Cursor Agent, Gemini CLI, LangGraph maison + API : quotas indépendants. Beaucoup d'équipes roulent « Codex principal + Claude Code secours » pour éviter le rate limit single point.
Décision rapide
- PR à merger aujourd'hui → correctif 3 ou 5
- Troisième Weekly à 0 cette semaine → 6 ou 7
- Intégration produit entreprise → 7A (API Key)
- Plateforme Apple, job overnight → 7B + Cloud Mac stable (section 5)
3. API et outils de repli comparés
Un plafond hebdo vide pousse souvent à revoir la stack. Comparaison modèle de quota, agent code, coût typique (infos publiques juin 2026) :
| Option | Modèle de quota | Forme agent | Pour qui |
|---|---|---|---|
| Codex (abo ChatGPT) | 5 h + Weekly glissants | CLI / IDE / tâches cloud | Plus/Pro, écosystème OpenAI |
| Codex (API Key) | au token, pas de plafond hebdo | idem, facture prévisible | intégration équipe, CI |
| Claude Code | quota session Pro/Max ou token API | agent terminal + CLAUDE.md |
longues chaînes, multi-fichiers |
| Cursor Agent | requêtes abo + surcoût modèle | intégré IDE | coding quotidien + agent léger |
| Gemini CLI / API | free tier + au token | CLI / écosystème Google | multimodal, gros contexte RAG |
| DeepSeek API | pur token, bas prix | framework agent à construire | sensible au coût, marché CN |
Détail des prix modèles : Guide prix et choix API LLM 2026. Changer d'outil ≠ changer d'environnement — les agents ont besoin de nœuds macOS / Linux stables pour build et tests.
4. Prévention : tenir une semaine entière
Réparer une fois est facile ; chaque semaine — adapter le workflow :
- Découper les tâches : une session agent, un objectif clair (« corriger flaky test », pas « refactor module entier »), moins d'allers-retours inutiles.
- Local d'abord : ce que
rg/ LSP résout, pas l'agent ; quota pour le reasoning multi-fichiers. - Paliers modèle : mini par défaut, Codex pleine taille pour les cas durs.
- Cloud Tasks avec parcimonie : partagent le 5 h avec Local Messages ; local si possible.
- Surveiller Remaining : couper à
5h < 20%, finir au prochain créneau. - Double stack : Codex principal, Claude Code ou API en backup au rate limit.
5. Nœud d'exécution : quota OK, job continu
Quota réglé — autre rupture : runtime. Tâches cloud Codex, CLI overnight, tests UI Xcode sur le laptop : fermeture capot, VPN instable, disque plein — l'agent s'arrête en plein milieu.
Pragmatique 2026 : séparer quota modèle et nœud d'exécution. Abo/API = « cerveau », Cloud Mac = « corps » — nœud macOS dédié 24/7, longs jobs dans tmux ; quand Codex ou Claude Code a de nouveau du quota, vous revenez valider.
Ce n'est pas la rareté des modèles, c'est le compute macOS stable et prévisible. Voir La course aux modèles est finie — pourquoi les nœuds Mac se raréfient
FAQ
Différence entre Weekly et 5 h ?
5 h limite les pics courts ; Weekly le cumul hebdo. Les deux glissent indépendamment ; une couche vide suffit pour throttler.
CLI : Weekly 94 % — presque fini ou beaucoup restant ?
Remaining = restant. 94% signifie 94 % restant, pas 94 % consommé.
Credits après plafond hebdo ?
Oui. Plus / Pro peuvent acheter des Credits ; Business flex des workspace credits.
Un jeton reset stocké efface-t-il Weekly ?
Non confirmé officiellement. Traiter comme secours 5 h ; Weekly via glissement ou Credits.
GPT-5.4-mini prolonge-t-il le quota ?
Oui. Sur la même offre, plafond 5 h nettement plus haut pour tâches légères.
Plafond hebdo avec API Key ?
Pas de fenêtre 5 h / Weekly abo ; facturation token et rate limits.
Claude Code peut-il remplacer Codex ?
Expérience agent terminal proche, quota indépendant. Pour iOS/macOS : longues runs sur Cloud Mac stable.
Conclusion
Un plafond hebdo Codex à zéro ne signifie pas « compte cassé » — OpenAI sépare plus nettement en 2026 « essai léger » et « dev agent à temps plein ». Lire 5 h et Weekly, utiliser jetons reset et mini, Credits ou upgrade si besoin, API / Claude Code en secours — la plupart des équipes retrouvent le rythme en une semaine.
Le quota se reset ; la date de release, non. Les longs jobs sur un nœud qui reste en ligne valent mieux qu'une nuit à attendre le glissement.
Codex throttlé ? Posez d'abord l'agent sur un Mac stable
Vuncloud Mac mini M4 Cloud Mac dédié : marathon Codex / Claude Code, builds Xcode, tmux overnight — US East / US West / APAC. Quota revenu, tâche pas coupée en deux.
Lecture associée
- Prix, config, perfs et publics LLM 2026
- Course aux modèles finie — nœuds Mac difficiles à obtenir
- AI Coding, Personal AI et architecture agent : triangle dev 2026
Mise à jour : 22 juin 2026. Limites et tarifs selon OpenAI Codex Pricing et changelog juin 2026.