週三下午,Codex CLI 突然回傳 rate limit exceeded,而你的 PR 才改到一半——這不是網路問題,而是 2026 年 OpenAI 替 Codex 套上的雙層滾動配額在起作用。本文按「先讀懂機制 → 再選修復路徑 → 最後建替代棧」的順序,把週限額耗盡後的 7 種可行方案講清楚。
一、Codex 限額機制:你到底撞的是哪一層?
很多人以為 Codex 只有「訊息條數」一個上限。實際上,ChatGPT 訂閱內的 Codex(CLI、IDE 外掛、雲端任務)受兩套獨立滾動配額約束,官方說明見 OpenAI Codex Pricing。
1.1 5 小時滾動視窗
本機 CLI 訊息(Local Messages)與雲端任務(Cloud Tasks)共享同一個 5 小時滾動視窗。視窗不是按自然日切,而是從你第一次消耗配額起向後滾動 5 小時。單次任務越重——倉庫越大、Agent 推理越久、是否走雲端——消耗越快。
觸頂表現:CLI 提示 rate limit、IDE 擴充功能灰掉傳送按鈕、雲端任務排隊或拒絕。這是日常開發最常碰到的一層。
1.2 週限額(Weekly)
在 5 小時視窗之上,還有一層滾動 7 天的週配額,用來約束整週持續高強度使用。即使你每個 5 小時視窗都「省著用」,累計一週工作量仍可能把 Weekly 打到 0%。
觸頂表現:5 小時視窗明明還有餘量,卻突然全局限流;或 CLI 明確顯示 Weekly 0%。這就是本文標題裡的「週限額耗盡」。
和 Context Window % 不是一回事
部分第三方外掛會把上下文視窗顯示成幾千個百分點——那是當前工作階段 token 佔用,與 5h / Weekly 配額無關。排障時只看帶 5h、Weekly、Remaining 字樣的指標。
1.3 如何讀 CLI / IDE 裡的百分比
Codex CLI 與 IDE 擴充功能通常會顯示類似:
Rate Limits Remaining: 5h 96%, Weekly 94%
關鍵字是 Remaining(剩餘):
Weekly 94%= 還剩 94% 週配額,不是已用掉 94%5h 12%= 當前 5 小時視窗只剩 12%,即將觸頂- 顯示
0%或出現明確限流錯誤時,才需要啟用下文修復方案
1.4 各方案大致量級(2026.06)
官方用「訊息數區間」而非固定整數,因為同一「則訊息」在不同倉庫規模下工作量差幾個數量級。下表摘自定價頁,以 GPT-5.3-Codex 檔為例(每 5 小時 Local Messages 大約範圍):
| 方案 | GPT-5.3-Codex / 5h(約) | GPT-5.4-mini / 5h(約) | 備註 |
|---|---|---|---|
| ChatGPT Plus | 10–60 | 60–350 | 另受 Weekly 約束 |
| Pro 5x | 約 Plus 的 5 倍 | 約 Plus 的 5 倍 | 2026 年 $100/月 檔 |
| Pro 20x | 約 Plus 的 20 倍 | 約 Plus 的 20 倍 | 重度並行場景 |
| Business(非彈性計價) | 與 Plus 相近 | 與 Plus 相近 | 按席位計費 |
| API Key | 無 5h / Weekly 訂閱視窗 | 按 token + 速率限制 | |
2026 年上半年 OpenAI 還調整了 Plus / Pro 分層:新增 $100 Pro 檔(5x)、保留更高檔(20x),並允許配額用盡後購買 Credits 而非只能硬升級。具體數字以 chatgpt.com/codex/pricing 為準。
二、週限額耗盡:7 種修復方案
下面 7 條按成本從低到高排列。建議從上到下試,別一上來就換方案。
方案 1:先確認撞的是 Weekly 還是 5h
看起來「完全不能用」,有時只是 5 小時視窗歸零而 Weekly 仍有餘量(或相反)。在 CLI 執行 codex 並查看 rate limit 行,或在 VS Code Codex 擴充功能狀態列核對。
- 僅
5h 0%→ 等 5 小時滾動恢復,或用重置令牌(方案 3) - 僅
Weekly 0%→ 等 7 天滾動恢復,或 Credits / 升級(方案 5、6) - 兩者皆 0 → 組合使用等待 + Credits,並規劃方案 7 的替代棧
方案 2:等待滾動自然恢復
最零成本的做法:停止發起新任務,讓時間幫你滾動視窗。
- 5 小時視窗:從最早一次消耗起算 5 小時後釋放
- 週限額:滾動 7 天,不是週一 0 點統一刷新
適合:非緊急修 bug、可以切換去做 Code Review / 寫文件的時段。不適合:CI 前夜、發版視窗——此時用方案 3–7。
方案 3:使用可保存的限額重置令牌
2026 年 6 月,OpenAI 為 Go / Plus / Pro / Business 訂閱用戶推出可保存的 rate limit reset:系統不再只在固定時刻清空計數,而是給你一枚「重置幣」,可在需要時手動觸發,立即恢復標準用量視窗。
- 新功能上線時,符合條件的帳戶會收到至少 1 枚免費重置
- 每枚有效期 30 天,過期作廢
- 推廣期可透過邀請再獲得額外重置(具體活動以官方公告為準)
注意:官方 changelog 主要描述恢復「標準用量視窗」,未明確是否同時清空 Weekly。工程上建議把它當作5 小時視窗急救;週限額仍依賴滾動恢復或 Credits。
方案 4:切換到 GPT-5.4-mini 降耗
同一方案下,GPT-5.4-mini 的訊息上限遠高於 GPT-5.3-Codex 全尺寸模型(Plus 檔 mini 約 60–350 則 / 5h,Codex 約 10–60 則)。在 CLI 或 IDE 裡切換模型:
# 範例:在支援模型切換的工作階段中指定 mini 檔
/model gpt-5.4-mini
適合:單檔案重構、測試補全、lint 修復、PR 評論回覆。不適合:跨模組架構遷移、複雜並行 bug——這類任務用 mini 可能反覆試錯,反而浪費配額。
方案 5:購買 Credits 續跑
2026 年起,ChatGPT Plus 與 Pro 用戶在訂閱內配額耗盡後,可購買額外 Credits 繼續 Codex,無需立刻升檔。Business / Enterprise 彈性計價工作區也可購買 workspace credits。
路徑:ChatGPT 帳戶設定 → 用量 / Billing → 購買 Credits(介面文案可能隨地區變化)。
適合:偶發衝刺週(發版、黑客松)、你已確定下月仍用 Codex 不想換工具鏈。不適合:每個月都撞週限額——說明應升級方案或切 API(方案 6、7)。
方案 6:升級訂閱檔位
若你每週都把 Weekly 打到 0,說明當前檔位與工作量不匹配。2026 年分層大致為:
- Plus:輕量日常,適合間歇使用
- Pro 5x(約 $100/月):Codex 用量約為 Plus 的 5 倍,適合全職日常開發
- Pro 20x:並行多倉庫、多 Agent 同時跑的重度用戶
升級前算一筆帳:若 Credits 月支出已接近更高檔價差,升檔通常更省心。
方案 7:切 API Key 或替代 Agent
當訂閱配額成為硬瓶頸,有兩條路:
A. OpenAI API Key 模式——Codex 支援用 API Key 登入。此模式沒有 ChatGPT 的 5h / Weekly 視窗,按 token 計費,受帳戶餘額與 RPM/TPM 限制。GPT-5.3 Codex API 價(2026.06):輸入約 $1.75 / 百萬 token,輸出約 $14 / 百萬 token。
B. 換工具鏈——Claude Code、Cursor Agent、Gemini CLI、自建 LangGraph + API 等,配額體系各自獨立。很多團隊採用「Codex 主力 + Claude Code 備胎」雙棧,避免單點限流。
決策快查
- 今天就要合 PR → 方案 3 或 5
- 本週第三次撞 Weekly → 方案 6 或 7
- 要整合進公司產品 → 方案 7A(API Key)
- 做 Apple 平台、任務要跑一夜 → 方案 7B + 穩定 Cloud Mac(見第五節)
三、替代 API 與工具對照
週限額耗盡往往是重新審視工具棧的契機。下表從配額模型、程式 Agent 能力、典型成本三維對比(2026 年 6 月公開資訊):
| 方案 | 配額模型 | Agent 形態 | 適合誰 |
|---|---|---|---|
| Codex(ChatGPT 訂閱) | 5h + Weekly 滾動 | CLI / IDE / 雲端任務 | 已付 Plus/Pro、深度 OpenAI 生態 |
| Codex(API Key) | 按 token,無週限額 | 同上,帳單可預測 | 團隊整合、CI 流水線 |
| Claude Code | Pro/Max 工作階段配額 或 API token | 終端 Agent + CLAUDE.md |
長鏈路推理、多檔案重構 |
| Cursor Agent | 訂閱請求數 + 模型加價 | IDE 內嵌 | 日常編碼 + 輕量 Agent |
| Gemini CLI / API | 免費檔 + 按 token | CLI / Google 生態 | 多模態、大上下文 RAG |
| DeepSeek API | 純按 token,低價 | 需自建 Agent 框架 | 中文業務、成本敏感 |
模型單價細節可參考本站 2026 大模型 API 價格與選型指南。換工具不等於換執行環境——Agent 仍需要穩定的 macOS / Linux 節點跑編譯與測試。
四、預防:讓配額撐過一整週
修一次限額很容易;每週修一次就要改工作流:
- 拆任務粒度:一次 Agent 工作階段只做一個明確目標(「修 flaky test」而非「重構整個模組」),減少無效往返。
- 本機優先:能
rg/ LSP 解決的別交給 Agent;把配額留給跨檔案推理。 - 模型分檔:預設 mini,遇到硬骨頭再切 Codex 全尺寸。
- 避開雲端任務濫用:Cloud Tasks 與 Local Messages 共享 5h 視窗;能本機跑就別上雲。
- 監控 Remaining:在
5h < 20%時收工,把收尾留到下一視窗。 - 雙棧備份:主用 Codex,備胎 Claude Code 或 API,限流時無縫切換。
五、執行節點:限額恢復了,任務也別斷
限額問題解決了,還有另一個斷點:執行環境。Codex 雲端任務、本機 CLI 掛一夜編譯、Xcode UI 測試——如果跑在個人筆電上,合蓋休眠、VPN 抖動、本機磁碟滿,都會讓 Agent 半途而廢。
2026 年的務實做法是:模型配額與執行節點分開規劃。訂閱 / API 管「大腦」,Cloud Mac 管「身體」——專屬 macOS 節點 24 小時在線,tmux 裡跑長任務,Codex 或 Claude Code 限額恢復後回來驗收即可。
這與「模型稀缺」不同:執行節點稀缺的是穩定、可預期的 macOS 算力。詳見 捲模型已是過去式,為何 Mac 算力節點反倒一節點難求?
常見問題(FAQ)
Codex 的 Weekly 限額和 5h 限額有什麼區別?
5 小時視窗約束短期爆發;週限額約束整週累計。兩者獨立滾動,任一耗盡都會限流。
CLI 裡 Weekly 94% 是快用完了還是還剩很多?
Remaining = 剩餘。94% 表示還剩 94%,不是已用 94%。
週限額耗盡後能買 Credits 嗎?
可以。Plus / Pro 可購額外 Credits;Business 彈性計價工作區可購 workspace credits。
保存的重置令牌能清週限額嗎?
官方未明確。建議視為 5h 視窗急救;週限額靠滾動恢復或 Credits。
切到 GPT-5.4-mini 能延長配額嗎?
能。同方案下 mini 檔 5h 訊息上限顯著更高,適合較輕任務。
API Key 還有週限額嗎?
沒有訂閱內的 5h / Weekly 視窗,按 token 與速率限制計費。
Claude Code 能替代 Codex 嗎?
終端 Agent 體驗相近,配額獨立。做 iOS / macOS 開發建議在穩定 Cloud Mac 上長跑。
結語
Codex 週限額耗盡不是帳號壞了,而是 OpenAI 在 2026 年把「輕量試用」和「全職 Agent 開發」拆得更開。讀懂 5h 與 Weekly 兩層、善用重置令牌與 mini 降耗、必要時 Credits 或升檔,再備一條 API / Claude Code 備胎——大多數團隊一週內都能把節奏找回來。
配額會重置,發版日不會等你。把長任務放在不掉線的執行節點上,比熬夜等滾動視窗划算。
Codex 限流了?先把 Agent 跑在穩的 Mac 節點上
Vuncloud 獨享 Mac mini M4 Cloud Mac:Codex / Claude Code 長跑、Xcode 構建、tmux 過夜任務,美東 / 美西 / APAC 節點——限額恢復後回來驗收,任務不會斷在半截。
相關閱讀
- 2026 最新大模型價格、配置、效能與人群:一篇講透
- 捲模型已是過去式,為何 Mac 算力節點反倒一節點難求?
- 2026 開發者 AI 三層架構:AI Coding、Personal AI 與 Agent 編排完整指南
最後更新:2026 年 6 月 22 日。限額與定價資料來自 OpenAI Codex Pricing 及 2026 年 6 月官方 changelog。