Mittwochnachmittag: Die Codex CLI antwortet plötzlich mit rate limit exceeded, und Ihr PR ist erst halb durch — kein Netzwerkproblem, sondern OpenAIs doppelte Rollier-Quota für Codex (Stand 2026). Diese Feldnotiz folgt der Reihenfolge: Mechanismus verstehen → Reparaturpfad wählen → Ersatz-Stack aufbauen. Sieben praktikable Wege, wenn die Wochenquote leer ist.
1. Codex-Limits: Welche Ebene ist voll?
Viele glauben, Codex habe nur ein Nachrichten-Obergrenze. Tatsächlich unterliegt Codex im ChatGPT-Abo (CLI, IDE-Plugin, Cloud Tasks) zwei unabhängigen Rollier-Quotas — Details in OpenAI Codex Pricing.
1.1 5-Stunden-Rollierfenster
Local Messages (lokale CLI) und Cloud Tasks teilen sich ein 5-Stunden-Rollierfenster. Es resettet nicht um Mitternacht, sondern rollt ab dem ersten Verbrauch 5 Stunden vor. Schwere Jobs — großes Repo, lange Agent-Reasoning, Cloud statt lokal — fressen schneller.
Symptome: CLI meldet Rate Limit, IDE-Senden grau, Cloud Tasks warten oder werden abgewiesen. Das ist im Alltag die häufigste Ebene.
1.2 Wochenlimit (Weekly)
Über dem 5-Stunden-Fenster liegt eine rollierende 7-Tage-Wochenquote, die anhaltend hohe Nutzung über die ganze Woche begrenzt. Selbst wenn Sie jedes 5h-Fenster „sparsam“ nutzen, kann die kumulative Wochenarbeit Weekly auf 0 % treiben.
Symptome: 5h zeigt noch Rest, plötzlich globale Drosselung; oder CLI meldet explizit Weekly 0%. Genau das meint „Wochenlimit erschöpft“ in der Überschrift.
Nicht dasselbe wie Context Window %
Manche Drittanbieter-Plugins zeigen das Kontextfenster als Tausende Prozent — das ist Token-Belegung der aktuellen Session, nicht 5h / Weekly. Beim Debuggen nur Zeilen mit 5h, Weekly, Remaining beachten.
1.3 Prozentwerte in CLI / IDE lesen
Codex CLI und IDE-Erweiterung zeigen typischerweise:
Rate Limits Remaining: 5h 96%, Weekly 94%
Schlüsselwort: Remaining (verbleibend):
Weekly 94%= 94 % Wochenquote übrig, nicht 94 % verbraucht5h 12%= im aktuellen 5-Stunden-Fenster nur noch 12 %, bald voll- Erst bei
0%oder explizitem Rate-Limit-Fehler greifen die Reparaturwege unten
1.4 Plan-Größenordnungen (06/2026)
OpenAI gibt „Nachrichtenbereiche“ statt fester Zahlen — eine „Nachricht“ kann je nach Repo-Größe um Größenordnungen variieren. Tabelle von der Pricing-Seite, Beispiel GPT-5.3-Codex (Local Messages pro 5h, circa):
| Plan | GPT-5.3-Codex / 5h (ca.) | GPT-5.4-mini / 5h (ca.) | Anmerkung |
|---|---|---|---|
| ChatGPT Plus | 10–60 | 60–350 | zusätzlich Weekly |
| Pro 5x | ~5× Plus | ~5× Plus | 2026: $100/Monat |
| Pro 20x | ~20× Plus | ~20× Plus | parallele Heavy-User |
| Business (nicht flex) | ≈ Plus | ≈ Plus | pro Sitz |
| API Key | kein 5h / Weekly-Abo-Fenster | Token + Rate Limits | |
2026 H1: OpenAI schärfte Plus/Pro — neuer $100-Pro-5x-Tarif, höherer 20x-Tarif, und nach Quota-Erschöpfung Credits kaufen statt nur Upgrade. Aktuelle Zahlen: chatgpt.com/codex/pricing.
2. Wochenlimit leer: 7 Reparaturwege
Die sieben Wege sind nach Kosten aufsteigend sortiert. Von oben nach unten probieren — nicht gleich den Plan wechseln.
Weg 1: Weekly oder 5h prüfen
„Gar nichts geht“ heißt manchmal: nur 5h ist leer, Weekly hat noch Luft (oder umgekehrt). In der CLI codex starten und die Rate-Limit-Zeile lesen, oder in der VS-Code-Codex-Erweiterung die Statusleiste prüfen.
- Nur
5h 0%→ 5h rollen lassen oder Reset-Token (Weg 3) - Nur
Weekly 0%→ 7-Tage-Rollierung abwarten oder Credits / Upgrade (Weg 5, 6) - Beide 0 → Kombination Warten + Credits, plus Ersatz-Stack planen (Weg 7)
Weg 2: Rollend abwarten
Null Euro: keine neuen Tasks starten, die Zeit rollt die Fenster frei.
- 5-Stunden-Fenster: 5 Stunden ab dem frühesten Verbrauch im Fenster
- Wochenlimit: rollierende 7 Tage, kein Reset Montag 0 Uhr
Passt für: nicht dringende Fixes, Code Review, Docs. Ungeeignet: CI-Nacht vor Release — dann Weg 3–7.
Weg 3: Speicherbare Reset-Tokens nutzen
Im Juni 2026 führte OpenAI für Go / Plus / Pro / Business speicherbare Rate-Limit-Resets ein: Statt nur zu festen Zeiten zu leeren, erhalten Sie „Reset-Münzen“, die Sie manuell einlösen können, um das Standard-Nutzungsfenster sofort wiederherzustellen.
- Beim Rollout mindestens 1 gratis Reset für berechtigte Konten
- Jeder Token 30 Tage gültig, danach verfallen
- In der Promo-Phase zusätzliche Resets per Einladung (Details laut offizieller Ankündigung)
Hinweis: Im Changelog geht es vor allem um das „Standard-Nutzungsfenster“ — ob Weekly mit zurückgesetzt wird, ist nicht explizit. Praxis: als 5-Stunden-Notfall behandeln; Weekly braucht Rollierung oder Credits.
Weg 4: Auf GPT-5.4-mini wechseln
Im selben Plan liegt das Nachrichtenlimit von GPT-5.4-mini deutlich über GPT-5.3-Codex Vollmodell (Plus: mini ca. 60–350 / 5h, Codex ca. 10–60). Modell in CLI oder IDE wechseln:
# Beispiel: Modell in unterstützter Session setzen
/model gpt-5.4-mini
Geeignet: Einzeldatei-Refactor, Test-Ergänzung, Lint-Fixes, PR-Kommentare. Ungeeignet: modulübergreifende Architektur, harte Concurrency-Bugs — mini kann mehrfach scheitern und mehr Quota verbrennen.
Weg 5: Credits nachkaufen
Seit 2026 können ChatGPT Plus- und Pro-Nutzer nach Abo-Quota-Erschöpfung zusätzliche Credits für Codex kaufen, ohne sofort hochzustufen. Business / Enterprise mit flexibler Preisgestaltung können Workspace Credits erwerben.
Pfad: ChatGPT-Kontoeinstellungen → Usage / Billing → Credits kaufen (UI-Text variiert regional).
Passt für: Sprint-Woche (Release, Hackathon), wenn Sie Codex nächsten Monat weiter nutzen. Unpassend: jeden Monat Weekly voll — dann Upgrade oder API (Weg 6, 7).
Weg 6: Plan hochstufen
Wer wöchentlich Weekly auf 0 fährt, passt nicht zum Tarif. Grobe 2026-Stufen:
- Plus: leichte Alltagsnutzung, intermittierend
- Pro 5x (~$100/Monat): ~5× Plus-Codex, für Vollzeit-Entwicklung
- Pro 20x: parallele Repos, mehrere Agenten gleichzeitig
Vor dem Upgrade rechnen: Wenn monatliche Credit-Ausgaben fast der höheren Stufe entsprechen, lohnt sich das Upgrade meist.
Weg 7: API Key oder Ersatz-Agent
Wenn Abo-Quota zur harten Decke wird, zwei Pfade:
A. OpenAI API Key — Codex unterstützt Anmeldung per API Key. Kein ChatGPT-5h-/Weekly-Fenster; Abrechnung pro Token, begrenzt durch Guthaben und RPM/TPM. GPT-5.3 Codex API (06/2026): Input ~$1,75 / Mio. Token, Output ~$14 / Mio. Token.
B. Toolchain wechseln — Claude Code, Cursor Agent, Gemini CLI, eigenes LangGraph + API: jeweils eigenes Quota-System. Viele Teams fahren „Codex primär + Claude Code Backup“, um Single-Point-Rate-Limits zu vermeiden.
Entscheidung auf einen Blick
- PR muss heute rein → Weg 3 oder 5
- Drittes Weekly-0 diese Woche → Weg 6 oder 7
- Integration ins Firmenprodukt → Weg 7A (API Key)
- Apple-Plattform, Job über Nacht → Weg 7B + stabiler Cloud Mac (Abschnitt 5)
3. Ersatz-APIs und Tools im Vergleich
Leeres Wochenlimit ist oft der Anlass, den Stack neu zu sortieren. Vergleich nach Quota-Modell, Code-Agent-Fähigkeit, typischen Kosten (öffentliche Infos Juni 2026):
| Option | Quota-Modell | Agent-Form | Für wen |
|---|---|---|---|
| Codex (ChatGPT-Abo) | 5h + Weekly rollierend | CLI / IDE / Cloud Tasks | Plus/Pro, OpenAI-Ökosystem |
| Codex (API Key) | pro Token, kein Wochenlimit | wie oben, planbare Rechnung | Team-Integration, CI |
| Claude Code | Pro/Max-Session oder API-Token | Terminal-Agent + CLAUDE.md |
lange Reasoning-Ketten, Multi-File |
| Cursor Agent | Abo-Anfragen + Modell-Aufschlag | IDE-integriert | Tagescoding + leichte Agenten |
| Gemini CLI / API | Free-Tier + pro Token | CLI / Google-Ökosystem | Multimodal, großes Kontext-RAG |
| DeepSeek API | rein pro Token, günstig | eigenes Agent-Framework nötig | kostensensibel, CN-Business |
Modellpreise im Detail: LLM-API-Preise & Auswahl 2026. Tool wechseln ≠ Umgebung wechseln — Agenten brauchen stabile macOS-/Linux-Nodes für Build und Tests.
4. Vorbeugen: Quota über die Woche strecken
Einmal Limits reparieren ist leicht; jede Woche neu — Workflow anpassen:
- Tasks klein schneiden: eine Agent-Session, ein klares Ziel („flaky test fixen“, nicht „Modul refactoren“), weniger Leerlauf.
- Lokal zuerst: was
rg/ LSP löst, nicht an den Agent; Quota für dateiübergreifendes Reasoning. - Modell-Stufen: Default mini, Voll-Codex nur für harte Brocken.
- Cloud Tasks sparsam: teilen 5h mit Local Messages; lokal wenn möglich.
- Remaining beobachten: bei
5h < 20%abbrechen, Rest ins nächste Fenster. - Dual-Stack: Codex primär, Claude Code oder API als Backup bei Rate Limit.
5. Compute-Node: Limit zurück, Job nicht abbrechen
Quota gelöst — nächster Bruch: Runtime. Codex Cloud Tasks, CLI über Nacht, Xcode UI-Tests auf dem Laptop: Deckel zu, VPN wackelt, Platte voll — Agent bricht ab.
Pragmatisch 2026: Modell-Quota und Compute-Node getrennt planen. Abo/API = „Kopf“, Cloud Mac = „Körper“ — dedizierter macOS-Node 24/7, lange Jobs in tmux; wenn Codex oder Claude Code wieder quota hat, kommen Sie zur Abnahme zurück.
Das ist nicht Modell-Knappheit, sondern stabile, planbare macOS-Compute. Mehr dazu: Modell-Rennen vorbei — warum Mac-Compute-Nodes knapp sind
FAQ
Was ist der Unterschied zwischen Weekly und 5h?
5h begrenzt kurzfristige Spitzen; Weekly die Wochensumme. Beide rollen unabhängig; eine leere Ebene reicht für Drosselung.
CLI: Weekly 94 % — fast leer oder viel übrig?
Remaining = verbleibend. 94% heißt 94 % übrig, nicht 94 % verbraucht.
Credits nach leerem Wochenlimit?
Ja. Plus / Pro können Credits kaufen; Business flex kann Workspace Credits kaufen.
Setzt ein gespeicherter Reset-Token Weekly zurück?
Nicht offiziell bestätigt. Als 5h-Notfall behandeln; Weekly via Rollierung oder Credits.
Verlängert GPT-5.4-mini die Quota?
Ja. Im selben Plan deutlich höheres 5h-Limit für leichtere Tasks.
Gibt es mit API Key ein Wochenlimit?
Nein 5h-/Weekly-Abo-Fenster; Abrechnung pro Token und Rate Limits.
Kann Claude Code Codex ersetzen?
Ähnliche Terminal-Agent-Erfahrung, unabhängige Quota. Für iOS/macOS: lange Läufe auf stabilem Cloud Mac.
Schluss
Leeres Codex-Wochenlimit heißt nicht „Konto kaputt“ — OpenAI trennt 2026 „leichte Proben“ und „Vollzeit-Agent-Entwicklung“ schärfer. 5h und Weekly lesen, Reset-Tokens und mini nutzen, bei Bedarf Credits oder Upgrade, API / Claude Code als Backup — die meisten Teams finden innerhalb einer Woche wieder Rhythmus.
Quota resettet; Release-Termine nicht. Lange Jobs auf einem Node, der online bleibt, schlägt Nachtwache auf dem Rollierfenster.
Codex gedrosselt? Agent erst auf stabilen Mac-Node legen
Vuncloud dedizierter Mac mini M4 Cloud Mac: Codex / Claude Code Marathon, Xcode-Builds, tmux über Nacht — US East / US West / APAC. Limit zurück, Task nicht halbfertig.
Weiterlesen
- LLM-Preise, Config, Performance & Zielgruppen 2026
- Modell-Rennen vorbei — Mac-Compute-Nodes knapp
- AI Coding, Personal AI & Agent-Architektur: Entwickler-Dreieck 2026
Stand: 22. Juni 2026. Limits und Preise laut OpenAI Codex Pricing und Changelog Juni 2026.