Vuncloud Blog
← Zurück zu den Feldnotizen

Codex-Wochenlimit erreicht? 7 Fixes, Kontingent-Mechanik & alternative APIs (2026)

Codex-Wochenlimit · 5-Stunden-Fenster · Reset-Tokens · Credits · GPT-5.4-mini · Claude Code · API-Key-Fallback ·ca. 11 Min. Lesezeit

Code und Terminal im CLI-Fenster—Codex-Wochenlimit-Troubleshooting und alternative API-Auswahl

Mittwochnachmittag: Die Codex CLI antwortet plötzlich mit rate limit exceeded, und Ihr PR ist erst halb durch — kein Netzwerkproblem, sondern OpenAIs doppelte Rollier-Quota für Codex (Stand 2026). Diese Feldnotiz folgt der Reihenfolge: Mechanismus verstehen → Reparaturpfad wählen → Ersatz-Stack aufbauen. Sieben praktikable Wege, wenn die Wochenquote leer ist.

2 Ebenen
Rollier-Quota: 5-Stunden-Fenster + Wochenlimit
7 Wege
Vom Abwarten bis zum API-Wechsel
30 Tage
Speicherbare Reset-Tokens (06/2026)

1. Codex-Limits: Welche Ebene ist voll?

Viele glauben, Codex habe nur ein Nachrichten-Obergrenze. Tatsächlich unterliegt Codex im ChatGPT-Abo (CLI, IDE-Plugin, Cloud Tasks) zwei unabhängigen Rollier-Quotas — Details in OpenAI Codex Pricing.

1.1 5-Stunden-Rollierfenster

Local Messages (lokale CLI) und Cloud Tasks teilen sich ein 5-Stunden-Rollierfenster. Es resettet nicht um Mitternacht, sondern rollt ab dem ersten Verbrauch 5 Stunden vor. Schwere Jobs — großes Repo, lange Agent-Reasoning, Cloud statt lokal — fressen schneller.

Symptome: CLI meldet Rate Limit, IDE-Senden grau, Cloud Tasks warten oder werden abgewiesen. Das ist im Alltag die häufigste Ebene.

1.2 Wochenlimit (Weekly)

Über dem 5-Stunden-Fenster liegt eine rollierende 7-Tage-Wochenquote, die anhaltend hohe Nutzung über die ganze Woche begrenzt. Selbst wenn Sie jedes 5h-Fenster „sparsam“ nutzen, kann die kumulative Wochenarbeit Weekly auf 0 % treiben.

Symptome: 5h zeigt noch Rest, plötzlich globale Drosselung; oder CLI meldet explizit Weekly 0%. Genau das meint „Wochenlimit erschöpft“ in der Überschrift.

Nicht dasselbe wie Context Window %

Manche Drittanbieter-Plugins zeigen das Kontextfenster als Tausende Prozent — das ist Token-Belegung der aktuellen Session, nicht 5h / Weekly. Beim Debuggen nur Zeilen mit 5h, Weekly, Remaining beachten.

1.3 Prozentwerte in CLI / IDE lesen

Codex CLI und IDE-Erweiterung zeigen typischerweise:

Rate Limits Remaining: 5h 96%, Weekly 94%

Schlüsselwort: Remaining (verbleibend):

  • Weekly 94% = 94 % Wochenquote übrig, nicht 94 % verbraucht
  • 5h 12% = im aktuellen 5-Stunden-Fenster nur noch 12 %, bald voll
  • Erst bei 0% oder explizitem Rate-Limit-Fehler greifen die Reparaturwege unten

1.4 Plan-Größenordnungen (06/2026)

OpenAI gibt „Nachrichtenbereiche“ statt fester Zahlen — eine „Nachricht“ kann je nach Repo-Größe um Größenordnungen variieren. Tabelle von der Pricing-Seite, Beispiel GPT-5.3-Codex (Local Messages pro 5h, circa):

Plan GPT-5.3-Codex / 5h (ca.) GPT-5.4-mini / 5h (ca.) Anmerkung
ChatGPT Plus 10–60 60–350 zusätzlich Weekly
Pro 5x ~5× Plus ~5× Plus 2026: $100/Monat
Pro 20x ~20× Plus ~20× Plus parallele Heavy-User
Business (nicht flex) ≈ Plus ≈ Plus pro Sitz
API Key kein 5h / Weekly-Abo-Fenster Token + Rate Limits

2026 H1: OpenAI schärfte Plus/Pro — neuer $100-Pro-5x-Tarif, höherer 20x-Tarif, und nach Quota-Erschöpfung Credits kaufen statt nur Upgrade. Aktuelle Zahlen: chatgpt.com/codex/pricing.

Matrix-artiger Binärcode-Hintergrund — Metapher für Codex 5h-Fenster und Wochenlimit als zwei unabhängige Rollier-Zähler
Zwei Ebenen rollen unabhängig: Erst klären, ob 5h oder Weekly voll ist — dann den Reparaturweg wählen.

2. Wochenlimit leer: 7 Reparaturwege

Die sieben Wege sind nach Kosten aufsteigend sortiert. Von oben nach unten probieren — nicht gleich den Plan wechseln.

Weg 1: Weekly oder 5h prüfen

„Gar nichts geht“ heißt manchmal: nur 5h ist leer, Weekly hat noch Luft (oder umgekehrt). In der CLI codex starten und die Rate-Limit-Zeile lesen, oder in der VS-Code-Codex-Erweiterung die Statusleiste prüfen.

  • Nur 5h 0% → 5h rollen lassen oder Reset-Token (Weg 3)
  • Nur Weekly 0% → 7-Tage-Rollierung abwarten oder Credits / Upgrade (Weg 5, 6)
  • Beide 0 → Kombination Warten + Credits, plus Ersatz-Stack planen (Weg 7)

Weg 2: Rollend abwarten

Null Euro: keine neuen Tasks starten, die Zeit rollt die Fenster frei.

  • 5-Stunden-Fenster: 5 Stunden ab dem frühesten Verbrauch im Fenster
  • Wochenlimit: rollierende 7 Tage, kein Reset Montag 0 Uhr

Passt für: nicht dringende Fixes, Code Review, Docs. Ungeeignet: CI-Nacht vor Release — dann Weg 3–7.

Weg 3: Speicherbare Reset-Tokens nutzen

Im Juni 2026 führte OpenAI für Go / Plus / Pro / Business speicherbare Rate-Limit-Resets ein: Statt nur zu festen Zeiten zu leeren, erhalten Sie „Reset-Münzen“, die Sie manuell einlösen können, um das Standard-Nutzungsfenster sofort wiederherzustellen.

  • Beim Rollout mindestens 1 gratis Reset für berechtigte Konten
  • Jeder Token 30 Tage gültig, danach verfallen
  • In der Promo-Phase zusätzliche Resets per Einladung (Details laut offizieller Ankündigung)

Hinweis: Im Changelog geht es vor allem um das „Standard-Nutzungsfenster“ — ob Weekly mit zurückgesetzt wird, ist nicht explizit. Praxis: als 5-Stunden-Notfall behandeln; Weekly braucht Rollierung oder Credits.

Weg 4: Auf GPT-5.4-mini wechseln

Im selben Plan liegt das Nachrichtenlimit von GPT-5.4-mini deutlich über GPT-5.3-Codex Vollmodell (Plus: mini ca. 60–350 / 5h, Codex ca. 10–60). Modell in CLI oder IDE wechseln:

# Beispiel: Modell in unterstützter Session setzen
/model gpt-5.4-mini

Geeignet: Einzeldatei-Refactor, Test-Ergänzung, Lint-Fixes, PR-Kommentare. Ungeeignet: modulübergreifende Architektur, harte Concurrency-Bugs — mini kann mehrfach scheitern und mehr Quota verbrennen.

Weg 5: Credits nachkaufen

Seit 2026 können ChatGPT Plus- und Pro-Nutzer nach Abo-Quota-Erschöpfung zusätzliche Credits für Codex kaufen, ohne sofort hochzustufen. Business / Enterprise mit flexibler Preisgestaltung können Workspace Credits erwerben.

Pfad: ChatGPT-Kontoeinstellungen → Usage / Billing → Credits kaufen (UI-Text variiert regional).

Passt für: Sprint-Woche (Release, Hackathon), wenn Sie Codex nächsten Monat weiter nutzen. Unpassend: jeden Monat Weekly voll — dann Upgrade oder API (Weg 6, 7).

Weg 6: Plan hochstufen

Wer wöchentlich Weekly auf 0 fährt, passt nicht zum Tarif. Grobe 2026-Stufen:

  • Plus: leichte Alltagsnutzung, intermittierend
  • Pro 5x (~$100/Monat): ~5× Plus-Codex, für Vollzeit-Entwicklung
  • Pro 20x: parallele Repos, mehrere Agenten gleichzeitig

Vor dem Upgrade rechnen: Wenn monatliche Credit-Ausgaben fast der höheren Stufe entsprechen, lohnt sich das Upgrade meist.

Weg 7: API Key oder Ersatz-Agent

Wenn Abo-Quota zur harten Decke wird, zwei Pfade:

A. OpenAI API Key — Codex unterstützt Anmeldung per API Key. Kein ChatGPT-5h-/Weekly-Fenster; Abrechnung pro Token, begrenzt durch Guthaben und RPM/TPM. GPT-5.3 Codex API (06/2026): Input ~$1,75 / Mio. Token, Output ~$14 / Mio. Token.

B. Toolchain wechseln — Claude Code, Cursor Agent, Gemini CLI, eigenes LangGraph + API: jeweils eigenes Quota-System. Viele Teams fahren „Codex primär + Claude Code Backup“, um Single-Point-Rate-Limits zu vermeiden.

Entscheidung auf einen Blick

  • PR muss heute rein → Weg 3 oder 5
  • Drittes Weekly-0 diese Woche → Weg 6 oder 7
  • Integration ins Firmenprodukt → Weg 7A (API Key)
  • Apple-Plattform, Job über Nacht → Weg 7B + stabiler Cloud Mac (Abschnitt 5)

3. Ersatz-APIs und Tools im Vergleich

Leeres Wochenlimit ist oft der Anlass, den Stack neu zu sortieren. Vergleich nach Quota-Modell, Code-Agent-Fähigkeit, typischen Kosten (öffentliche Infos Juni 2026):

Option Quota-Modell Agent-Form Für wen
Codex (ChatGPT-Abo) 5h + Weekly rollierend CLI / IDE / Cloud Tasks Plus/Pro, OpenAI-Ökosystem
Codex (API Key) pro Token, kein Wochenlimit wie oben, planbare Rechnung Team-Integration, CI
Claude Code Pro/Max-Session oder API-Token Terminal-Agent + CLAUDE.md lange Reasoning-Ketten, Multi-File
Cursor Agent Abo-Anfragen + Modell-Aufschlag IDE-integriert Tagescoding + leichte Agenten
Gemini CLI / API Free-Tier + pro Token CLI / Google-Ökosystem Multimodal, großes Kontext-RAG
DeepSeek API rein pro Token, günstig eigenes Agent-Framework nötig kostensensibel, CN-Business

Modellpreise im Detail: LLM-API-Preise & Auswahl 2026. Tool wechseln ≠ Umgebung wechseln — Agenten brauchen stabile macOS-/Linux-Nodes für Build und Tests.

4. Vorbeugen: Quota über die Woche strecken

Einmal Limits reparieren ist leicht; jede Woche neu — Workflow anpassen:

  1. Tasks klein schneiden: eine Agent-Session, ein klares Ziel („flaky test fixen“, nicht „Modul refactoren“), weniger Leerlauf.
  2. Lokal zuerst: was rg / LSP löst, nicht an den Agent; Quota für dateiübergreifendes Reasoning.
  3. Modell-Stufen: Default mini, Voll-Codex nur für harte Brocken.
  4. Cloud Tasks sparsam: teilen 5h mit Local Messages; lokal wenn möglich.
  5. Remaining beobachten: bei 5h < 20% abbrechen, Rest ins nächste Fenster.
  6. Dual-Stack: Codex primär, Claude Code oder API als Backup bei Rate Limit.

5. Compute-Node: Limit zurück, Job nicht abbrechen

Quota gelöst — nächster Bruch: Runtime. Codex Cloud Tasks, CLI über Nacht, Xcode UI-Tests auf dem Laptop: Deckel zu, VPN wackelt, Platte voll — Agent bricht ab.

Pragmatisch 2026: Modell-Quota und Compute-Node getrennt planen. Abo/API = „Kopf“, Cloud Mac = „Körper“ — dedizierter macOS-Node 24/7, lange Jobs in tmux; wenn Codex oder Claude Code wieder quota hat, kommen Sie zur Abnahme zurück.

Das ist nicht Modell-Knappheit, sondern stabile, planbare macOS-Compute. Mehr dazu: Modell-Rennen vorbei — warum Mac-Compute-Nodes knapp sind

FAQ

Was ist der Unterschied zwischen Weekly und 5h?

5h begrenzt kurzfristige Spitzen; Weekly die Wochensumme. Beide rollen unabhängig; eine leere Ebene reicht für Drosselung.

CLI: Weekly 94 % — fast leer oder viel übrig?

Remaining = verbleibend. 94% heißt 94 % übrig, nicht 94 % verbraucht.

Credits nach leerem Wochenlimit?

Ja. Plus / Pro können Credits kaufen; Business flex kann Workspace Credits kaufen.

Setzt ein gespeicherter Reset-Token Weekly zurück?

Nicht offiziell bestätigt. Als 5h-Notfall behandeln; Weekly via Rollierung oder Credits.

Verlängert GPT-5.4-mini die Quota?

Ja. Im selben Plan deutlich höheres 5h-Limit für leichtere Tasks.

Gibt es mit API Key ein Wochenlimit?

Nein 5h-/Weekly-Abo-Fenster; Abrechnung pro Token und Rate Limits.

Kann Claude Code Codex ersetzen?

Ähnliche Terminal-Agent-Erfahrung, unabhängige Quota. Für iOS/macOS: lange Läufe auf stabilem Cloud Mac.

Schluss

Leeres Codex-Wochenlimit heißt nicht „Konto kaputt“ — OpenAI trennt 2026 „leichte Proben“ und „Vollzeit-Agent-Entwicklung“ schärfer. 5h und Weekly lesen, Reset-Tokens und mini nutzen, bei Bedarf Credits oder Upgrade, API / Claude Code als Backup — die meisten Teams finden innerhalb einer Woche wieder Rhythmus.

Quota resettet; Release-Termine nicht. Lange Jobs auf einem Node, der online bleibt, schlägt Nachtwache auf dem Rollierfenster.

Codex gedrosselt? Agent erst auf stabilen Mac-Node legen

Vuncloud dedizierter Mac mini M4 Cloud Mac: Codex / Claude Code Marathon, Xcode-Builds, tmux über Nacht — US East / US West / APAC. Limit zurück, Task nicht halbfertig.

Cloud-Mac-Tarife ansehen · LLM-API-Preisguide

Stand: 22. Juni 2026. Limits und Preise laut OpenAI Codex Pricing und Changelog Juni 2026.

Feldnotizen · KI

Agent-Kontingent wochenweise planen

Codex · Claude Code · API Key · Cloud-Mac-Ausführungsknoten

Cloud-Mac-Pakete ansehen
Zeitlich begrenzt Pakete ansehen