Vuncloud Blog
← Retour au Cloud Lab

Limite hebdomadaire Codex atteinte ? 7 correctifs, mécanique des quotas et APIs alternatives (2026)

Limite hebdo Codex · fenêtre 5 h · jetons reset · Credits · GPT-5.4-mini · Claude Code · repli API Key ·~11 min de lecture

Code et terminal en CLI — dépannage limite hebdo Codex et choix d'API alternatives

Mercredi après-midi : la CLI Codex renvoie soudain rate limit exceeded, et votre PR est à moitié faite — ce n'est pas le réseau, c'est le double quota glissant qu'OpenAI applique à Codex en 2026. Ce lab note suit l'ordre : comprendre le mécanisme → choisir la voie de réparation → monter une stack de repli. Sept options concrètes quand le plafond hebdomadaire est à zéro.

2 niveaux
Quota glissant : fenêtre 5 h + plafond hebdo
7 voies
De l'attente au basculement API
30 jours
Jetons de reset stockables (06/2026)

1. Limites Codex : quelle couche est pleine ?

Beaucoup pensent qu'il n'y a qu'un plafond de messages. En réalité, Codex dans l'abonnement ChatGPT (CLI, extension IDE, tâches cloud) obéit à deux quotas glissants indépendants — voir OpenAI Codex Pricing.

1.1 Fenêtre glissante 5 heures

Local Messages (CLI locale) et Cloud Tasks partagent la même fenêtre glissante de 5 heures. Pas de reset à minuit : le compteur avance à partir de la première consommation. Les jobs lourds — gros dépôt, long reasoning agent, exécution cloud — brûlent plus vite.

Symptômes : rate limit en CLI, bouton d'envoi grisé dans l'IDE, tâches cloud en file ou refusées. C'est la couche la plus fréquente au quotidien.

1.2 Plafond hebdomadaire (Weekly)

Au-dessus de la fenêtre 5 h, un quota glissant sur 7 jours limite l'usage soutenu sur la semaine. Même en « économisant » chaque fenêtre 5 h, le cumul hebdo peut amener Weekly à 0 %.

Symptômes : il reste du 5 h mais throttling global ; ou la CLI affiche Weekly 0%. C'est le « plafond hebdo épuisé » du titre.

Distinct du Context Window %

Certains plugins tiers affichent le contexte en milliers de pourcents — c'est l'occupation token de la session courante, pas le 5 h / Weekly. En debug, ne regarder que les lignes 5h, Weekly, Remaining.

1.3 Lire les pourcentages CLI / IDE

La CLI Codex et l'extension IDE affichent typiquement :

Rate Limits Remaining: 5h 96%, Weekly 94%

Mot-clé : Remaining (restant) :

  • Weekly 94% = 94 % de quota hebdo restant, pas 94 % consommé
  • 5h 12% = plus que 12 % dans la fenêtre 5 h actuelle, bientôt plein
  • À 0% ou erreur rate limit explicite seulement, activer les correctifs ci-dessous

1.4 Ordres de grandeur par offre (06/2026)

OpenAI publie des fourchettes de messages, pas des entiers fixes — une « message » varie d'ordres de grandeur selon la taille du dépôt. Tableau issu de la page tarifs, exemple GPT-5.3-Codex (Local Messages par 5 h, environ) :

Offre GPT-5.3-Codex / 5 h (env.) GPT-5.4-mini / 5 h (env.) Remarque
ChatGPT Plus 10–60 60–350 + contrainte Weekly
Pro 5x ~5× Plus ~5× Plus 2026 : 100 $/mois
Pro 20x ~20× Plus ~20× Plus usage parallèle intensif
Business (non flex) ≈ Plus ≈ Plus par siège
API Key pas de fenêtre 5 h / Weekly abo token + rate limits

S1 2026 : OpenAI a resserré Plus/Pro — palier Pro 5x à 100 $, palier 20x conservé, et après épuisement du quota abo possibilité d'acheter des Credits sans upgrade immédiat. Chiffres à jour : chatgpt.com/codex/pricing.

Fond de code binaire style matrix — métaphore des compteurs glissants Codex 5 h et plafond hebdo
Deux quotas glissants indépendants : identifier 5 h vs Weekly avant de choisir le correctif.

2. Plafond hebdo épuisé : 7 correctifs

Les sept voies sont classées par coût croissant. Tester de haut en bas — ne pas upgrader d'emblée.

Correctif 1 : Weekly ou 5 h ?

« Tout est bloqué » peut signifier : seul le 5 h est à zéro, Weekly a encore de la marge (ou l'inverse). Lancer codex en CLI et lire la ligne rate limit, ou vérifier la barre d'état de l'extension VS Code Codex.

  • Seulement 5h 0% → laisser glisser 5 h ou jeton reset (correctif 3)
  • Seulement Weekly 0% → attendre 7 jours glissants ou Credits / upgrade (5, 6)
  • Les deux à 0 → combiner attente + Credits, planifier la stack de repli (7)

Correctif 2 : attendre le glissement

Coût zéro : ne plus lancer de tâches, le temps libère les fenêtres.

  • Fenêtre 5 h : 5 heures après la première consommation dans la fenêtre
  • Plafond hebdo : 7 jours glissants, pas de reset lundi 0 h

Convient : correctifs non urgents, revue de code, docs. Inadapté : veille de release CI — correctifs 3–7.

Correctif 3 : jetons de reset stockables

En juin 2026, OpenAI a introduit pour Go / Plus / Pro / Business des resets de rate limit stockables : au lieu de vider à heure fixe, vous recevez des « jetons reset » à consommer manuellement pour restaurer immédiatement la fenêtre d'usage standard.

  • Au lancement, au moins 1 reset gratuit pour les comptes éligibles
  • Chaque jeton valable 30 jours, puis expiration
  • Période promo : resets supplémentaires via parrainage (détails selon annonce officielle)

Attention : le changelog parle surtout de la « fenêtre d'usage standard » — reset du Weekly non confirmé. En prod, traiter comme secours 5 h ; Weekly via glissement ou Credits.

Correctif 4 : basculer sur GPT-5.4-mini

Sur la même offre, le plafond messages de GPT-5.4-mini dépasse largement GPT-5.3-Codex pleine taille (Plus : mini env. 60–350 / 5 h, Codex env. 10–60). Changer de modèle en CLI ou IDE :

# Exemple : modèle dans une session compatible
/model gpt-5.4-mini

Adapté : refactor fichier unique, complétion de tests, lint, réponses PR. Inadapté : migration architecture multi-modules, bugs concurrency complexes — mini peut boucler et gaspiller le quota.

Correctif 5 : acheter des Credits

Depuis 2026, les utilisateurs ChatGPT Plus et Pro peuvent acheter des Credits Codex après épuisement du quota abo, sans monter de palier tout de suite. Business / Enterprise en tarification flexible peuvent acheter des workspace credits.

Chemin : paramètres compte ChatGPT → Usage / Billing → acheter Credits (libellés variables selon région).

Convient : semaine sprint (release, hackathon), si vous gardez Codex le mois suivant. Inadapté : Weekly à zéro chaque mois — upgrade ou API (6, 7).

Correctif 6 : monter de palier

Si vous mettez Weekly à 0 chaque semaine, l'offre ne correspond pas à la charge. Paliers 2026 en gros :

  • Plus : usage léger au quotidien, intermittent
  • Pro 5x (~100 $/mois) : ~5× le Codex Plus, dev à temps plein
  • Pro 20x : dépôts parallèles, plusieurs agents simultanés

Avant upgrade : si la dépense Credits mensuelle approche l'écart de palier, l'upgrade est souvent plus simple.

Correctif 7 : API Key ou agent de repli

Quand le quota abo devient un plafond dur, deux routes :

A. OpenAI API Key — Codex accepte la connexion par API Key. Pas de fenêtre 5 h / Weekly ChatGPT ; facturation au token, plafonnée par solde et RPM/TPM. GPT-5.3 Codex API (06/2026) : entrée ~1,75 $ / M tokens, sortie ~14 $ / M tokens.

B. Changer de toolchain — Claude Code, Cursor Agent, Gemini CLI, LangGraph maison + API : quotas indépendants. Beaucoup d'équipes roulent « Codex principal + Claude Code secours » pour éviter le rate limit single point.

Décision rapide

  • PR à merger aujourd'hui → correctif 3 ou 5
  • Troisième Weekly à 0 cette semaine → 6 ou 7
  • Intégration produit entreprise → 7A (API Key)
  • Plateforme Apple, job overnight → 7B + Cloud Mac stable (section 5)

3. API et outils de repli comparés

Un plafond hebdo vide pousse souvent à revoir la stack. Comparaison modèle de quota, agent code, coût typique (infos publiques juin 2026) :

Option Modèle de quota Forme agent Pour qui
Codex (abo ChatGPT) 5 h + Weekly glissants CLI / IDE / tâches cloud Plus/Pro, écosystème OpenAI
Codex (API Key) au token, pas de plafond hebdo idem, facture prévisible intégration équipe, CI
Claude Code quota session Pro/Max ou token API agent terminal + CLAUDE.md longues chaînes, multi-fichiers
Cursor Agent requêtes abo + surcoût modèle intégré IDE coding quotidien + agent léger
Gemini CLI / API free tier + au token CLI / écosystème Google multimodal, gros contexte RAG
DeepSeek API pur token, bas prix framework agent à construire sensible au coût, marché CN

Détail des prix modèles : Guide prix et choix API LLM 2026. Changer d'outil ≠ changer d'environnement — les agents ont besoin de nœuds macOS / Linux stables pour build et tests.

4. Prévention : tenir une semaine entière

Réparer une fois est facile ; chaque semaine — adapter le workflow :

  1. Découper les tâches : une session agent, un objectif clair (« corriger flaky test », pas « refactor module entier »), moins d'allers-retours inutiles.
  2. Local d'abord : ce que rg / LSP résout, pas l'agent ; quota pour le reasoning multi-fichiers.
  3. Paliers modèle : mini par défaut, Codex pleine taille pour les cas durs.
  4. Cloud Tasks avec parcimonie : partagent le 5 h avec Local Messages ; local si possible.
  5. Surveiller Remaining : couper à 5h < 20%, finir au prochain créneau.
  6. Double stack : Codex principal, Claude Code ou API en backup au rate limit.

5. Nœud d'exécution : quota OK, job continu

Quota réglé — autre rupture : runtime. Tâches cloud Codex, CLI overnight, tests UI Xcode sur le laptop : fermeture capot, VPN instable, disque plein — l'agent s'arrête en plein milieu.

Pragmatique 2026 : séparer quota modèle et nœud d'exécution. Abo/API = « cerveau », Cloud Mac = « corps » — nœud macOS dédié 24/7, longs jobs dans tmux ; quand Codex ou Claude Code a de nouveau du quota, vous revenez valider.

Ce n'est pas la rareté des modèles, c'est le compute macOS stable et prévisible. Voir La course aux modèles est finie — pourquoi les nœuds Mac se raréfient

FAQ

Différence entre Weekly et 5 h ?

5 h limite les pics courts ; Weekly le cumul hebdo. Les deux glissent indépendamment ; une couche vide suffit pour throttler.

CLI : Weekly 94 % — presque fini ou beaucoup restant ?

Remaining = restant. 94% signifie 94 % restant, pas 94 % consommé.

Credits après plafond hebdo ?

Oui. Plus / Pro peuvent acheter des Credits ; Business flex des workspace credits.

Un jeton reset stocké efface-t-il Weekly ?

Non confirmé officiellement. Traiter comme secours 5 h ; Weekly via glissement ou Credits.

GPT-5.4-mini prolonge-t-il le quota ?

Oui. Sur la même offre, plafond 5 h nettement plus haut pour tâches légères.

Plafond hebdo avec API Key ?

Pas de fenêtre 5 h / Weekly abo ; facturation token et rate limits.

Claude Code peut-il remplacer Codex ?

Expérience agent terminal proche, quota indépendant. Pour iOS/macOS : longues runs sur Cloud Mac stable.

Conclusion

Un plafond hebdo Codex à zéro ne signifie pas « compte cassé » — OpenAI sépare plus nettement en 2026 « essai léger » et « dev agent à temps plein ». Lire 5 h et Weekly, utiliser jetons reset et mini, Credits ou upgrade si besoin, API / Claude Code en secours — la plupart des équipes retrouvent le rythme en une semaine.

Le quota se reset ; la date de release, non. Les longs jobs sur un nœud qui reste en ligne valent mieux qu'une nuit à attendre le glissement.

Codex throttlé ? Posez d'abord l'agent sur un Mac stable

Vuncloud Mac mini M4 Cloud Mac dédié : marathon Codex / Claude Code, builds Xcode, tmux overnight — US East / US West / APAC. Quota revenu, tâche pas coupée en deux.

Voir les offres Cloud Mac · Guide prix API LLM

Mise à jour : 22 juin 2026. Limites et tarifs selon OpenAI Codex Pricing et changelog juin 2026.

Cloud Lab · IA

Planifier le quota agent semaine par semaine

Codex · Claude Code · API Key · nœuds d'exécution Cloud Mac

Voir les offres Cloud Mac
Offre limitée Voir les offres