周三下午,Codex CLI 突然返回 rate limit exceeded,而你的 PR 才改到一半——这不是网络问题,而是 2026 年 OpenAI 给 Codex 套上的双层滚动配额在起作用。本文按「先读懂机制 → 再选修复路径 → 最后建替代栈」的顺序,把周限额耗尽后的 7 种可行方案讲清楚。
一、Codex 限额机制:你到底撞的是哪一层?
很多人以为 Codex 只有「消息条数」一个上限。实际上,ChatGPT 订阅内的 Codex(CLI、IDE 插件、云端任务)受两套独立滚动配额约束,官方说明见 OpenAI Codex Pricing。
1.1 5 小时滚动窗口
本地 CLI 消息(Local Messages)与云端任务(Cloud Tasks)共享同一个 5 小时滚动窗口。窗口不是按自然日切,而是从你第一次消耗配额起向后滚动 5 小时。单次任务越重——仓库越大、Agent 推理越久、是否走云端——消耗越快。
触顶表现:CLI 提示 rate limit、IDE 扩展灰掉发送按钮、云端任务排队或拒绝。这是日常开发最常碰到的一层。
1.2 周限额(Weekly)
在 5 小时窗口之上,还有一层滚动 7 天的周配额,用来约束整周持续高强度使用。即使你每个 5 小时窗口都「省着用」,累计一周工作量仍可能把 Weekly 打到 0%。
触顶表现:5 小时窗口明明还有余量,却突然全局限流;或 CLI 明确显示 Weekly 0%。这就是本文标题里的「周限额耗尽」。
和 Context Window % 不是一回事
部分第三方插件会把上下文窗口显示成几千个百分点——那是当前会话 token 占用,与 5h / Weekly 配额无关。排障时只看带 5h、Weekly、Remaining 字样的指标。
1.3 如何读 CLI / IDE 里的百分比
Codex CLI 与 IDE 扩展通常会显示类似:
Rate Limits Remaining: 5h 96%, Weekly 94%
关键词是 Remaining(剩余):
Weekly 94%= 还剩 94% 周配额,不是已用掉 94%5h 12%= 当前 5 小时窗口只剩 12%,即将触顶- 显示
0%或出现明确限流错误时,才需要启用下文修复方案
1.4 各套餐大致量级(2026.06)
官方用「消息数区间」而非固定整数,因为同一「条消息」在不同仓库规模下工作量差几个数量级。下表摘自定价页,取 GPT-5.3-Codex 档为例(每 5 小时 Local Messages 大约范围):
| 套餐 | GPT-5.3-Codex / 5h(约) | GPT-5.4-mini / 5h(约) | 备注 |
|---|---|---|---|
| ChatGPT Plus | 10–60 | 60–350 | 另受 Weekly 约束 |
| Pro 5x | 约 Plus 的 5 倍 | 约 Plus 的 5 倍 | 2026 年 $100/月 档 |
| Pro 20x | 约 Plus 的 20 倍 | 约 Plus 的 20 倍 | 重度并行场景 |
| Business(非灵活计价) | 与 Plus 相近 | 与 Plus 相近 | 按席位计费 |
| API Key | 无 5h / Weekly 订阅窗口 | 按 token + 速率限制 | |
2026 年上半年 OpenAI 还调整了 Plus / Pro 分层:新增 $100 Pro 档(5x)、保留更高档(20x),并允许配额用尽后购买 Credits 而非只能硬升级。具体数字以 chatgpt.com/codex/pricing 为准。
二、周限额耗尽:7 种修复方案
下面 7 条按成本从低到高排列。建议从上到下试,别一上来就换套餐。
方案 1:先确认撞的是 Weekly 还是 5h
看起来「完全不能用」,有时只是 5 小时窗口归零而 Weekly 仍有余量(或相反)。在 CLI 执行 codex 并查看 rate limit 行,或在 VS Code Codex 扩展状态栏核对。
- 仅
5h 0%→ 等 5 小时滚动恢复,或用重置令牌(方案 3) - 仅
Weekly 0%→ 等 7 天滚动恢复,或 Credits / 升级(方案 5、6) - 两者皆 0 → 组合使用等待 + Credits,并规划方案 7 的替代栈
方案 2:等待滚动自然恢复
最零成本的做法:停止发起新任务,让时间帮你滚动窗口。
- 5 小时窗口:从最早一次消耗起算 5 小时后释放
- 周限额:滚动 7 天,不是周一 0 点统一刷新
适合:非紧急修 bug、可以切换去做 Code Review / 写文档的时段。不适合:CI 前夜、发版窗口——此时用方案 3–7。
方案 3:使用可保存的限额重置令牌
2026 年 6 月,OpenAI 为 Go / Plus / Pro / Business 订阅用户推出可保存的 rate limit reset:系统不再只在固定时刻清空计数,而是给你一枚「重置币」,可在需要时手动触发,立即恢复标准用量窗口。
- 新功能上线时,符合条件的账户会收到至少 1 枚免费重置
- 每枚有效期 30 天,过期作废
- 推广期可通过邀请再获得额外重置(具体活动以官方公告为准)
注意:官方 changelog 主要描述恢复「标准用量窗口」,未明确是否同时清空 Weekly。工程上建议把它当作5 小时窗口急救;周限额仍依赖滚动恢复或 Credits。
方案 4:切换到 GPT-5.4-mini 降耗
同一套餐下,GPT-5.4-mini 的消息上限远高于 GPT-5.3-Codex 全尺寸模型(Plus 档 mini 约 60–350 条 / 5h,Codex 约 10–60 条)。在 CLI 或 IDE 里切换模型:
# 示例:在支持模型切换的会话中指定 mini 档
/model gpt-5.4-mini
适合:单文件重构、测试补全、lint 修复、PR 评论回复。不适合:跨模块架构迁移、复杂并发 bug——这类任务用 mini 可能反复试错,反而浪费配额。
方案 5:购买 Credits 续跑
2026 年起,ChatGPT Plus 与 Pro 用户在订阅内配额耗尽后,可购买额外 Credits 继续 Codex,无需立刻升档。Business / Enterprise 灵活计价工作区也可购买 workspace credits。
路径:ChatGPT 账户设置 → 用量 / Billing → 购买 Credits(界面文案可能随地区变化)。
适合:偶发冲刺周(发版、黑客松)、你已确定下月仍用 Codex 不想换工具链。不适合:每个月都撞周限额——说明应升级套餐或切 API(方案 6、7)。
方案 6:升级订阅档位
若你每周都把 Weekly 打到 0,说明当前档位与工作量不匹配。2026 年分层大致为:
- Plus:轻量日常,适合间歇使用
- Pro 5x(约 $100/月):Codex 用量约为 Plus 的 5 倍,适合全职日常开发
- Pro 20x:并行多仓库、多 Agent 同时跑的重度用户
升级前算一笔账:若 Credits 月支出已接近更高档价差,升档通常更省心。
方案 7:切 API Key 或替代 Agent
当订阅配额成为硬瓶颈,有两条路:
A. OpenAI API Key 模式——Codex 支持用 API Key 登录。此模式没有 ChatGPT 的 5h / Weekly 窗口,按 token 计费,受账户余额与 RPM/TPM 限制。GPT-5.3 Codex API 价(2026.06):输入约 $1.75 / 百万 token,输出约 $14 / 百万 token。
B. 换工具链——Claude Code、Cursor Agent、Gemini CLI、自建 LangGraph + API 等,配额体系各自独立。很多团队采用「Codex 主力 + Claude Code 备胎」双栈,避免单点限流。
决策快查
- 今天就要合 PR → 方案 3 或 5
- 本周第三次撞 Weekly → 方案 6 或 7
- 要集成进公司产品 → 方案 7A(API Key)
- 做 Apple 平台、任务要跑一夜 → 方案 7B + 稳定 Cloud Mac(见第四节)
三、替代 API 与工具对照
周限额耗尽往往是重新审视工具栈的契机。下表从配额模型、代码 Agent 能力、典型成本三维对比(2026 年 6 月公开信息):
| 方案 | 配额模型 | Agent 形态 | 适合谁 |
|---|---|---|---|
| Codex(ChatGPT 订阅) | 5h + Weekly 滚动 | CLI / IDE / 云端任务 | 已付 Plus/Pro、深度 OpenAI 生态 |
| Codex(API Key) | 按 token,无周限额 | 同上,账单可预测 | 团队集成、CI 流水线 |
| Claude Code | Pro/Max 会话配额 或 API token | 终端 Agent + CLAUDE.md |
长链路推理、多文件重构 |
| Cursor Agent | 订阅请求数 + 模型加价 | IDE 内嵌 | 日常编码 + 轻量 Agent |
| Gemini CLI / API | 免费档 + 按 token | CLI / Google 生态 | 多模态、大上下文 RAG |
| DeepSeek API | 纯按 token,低价 | 需自建 Agent 框架 | 中文业务、成本敏感 |
模型单价细节可参考本站 2026 大模型 API 价格与选型指南。换工具不等于换执行环境——Agent 仍需要稳定的 macOS / Linux 节点跑编译与测试。
四、预防:让配额撑过一整周
修一次限额很容易;每周修一次就要改工作流:
- 拆任务粒度:一次 Agent 会话只做一个明确目标(「修 flaky test」而非「重构整个模块」),减少无效往返。
- 本地优先:能
rg/ LSP 解决的别交给 Agent;把配额留给跨文件推理。 - 模型分档:默认 mini,遇到硬骨头再切 Codex 全尺寸。
- 避开云端任务滥用:Cloud Tasks 与 Local Messages 共享 5h 窗口;能本地跑就别上云。
- 监控 Remaining:在
5h < 20%时收工,把收尾留到下一窗口。 - 双栈备份:主用 Codex,备胎 Claude Code 或 API,限流时无缝切换。
五、执行节点:限额恢复了,任务也别断
限额问题解决了,还有另一个断点:执行环境。Codex 云端任务、本地 CLI 挂一夜编译、Xcode UI 测试——如果跑在个人笔记本上,合盖休眠、VPN 抖动、本地磁盘满,都会让 Agent 半途而废。
2026 年的务实做法是:模型配额与执行节点分开规划。订阅 / API 管「大脑」,Cloud Mac 管「身体」——专属 macOS 节点 24 小时在线,tmux 里跑长任务,Codex 或 Claude Code 限额恢复后回来验收即可。
这与「模型稀缺」不同:执行节点稀缺的是稳定、可预期的 macOS 算力。详见 卷模型已成过去,为什么 Mac 算力节点反倒一节点难求?
常见问题(FAQ)
Codex 的 Weekly 限额和 5h 限额有什么区别?
5 小时窗口约束短期爆发;周限额约束整周累计。两者独立滚动,任一耗尽都会限流。
CLI 里 Weekly 94% 是快用完了还是还剩很多?
Remaining = 剩余。94% 表示还剩 94%,不是已用 94%。
周限额耗尽后能买 Credits 吗?
可以。Plus / Pro 可购额外 Credits;Business 灵活计价工作区可购 workspace credits。
保存的重置令牌能清周限额吗?
官方未明确。建议视为 5h 窗口急救;周限额靠滚动恢复或 Credits。
切到 GPT-5.4-mini 能延长配额吗?
能。同套餐下 mini 档 5h 消息上限显著更高,适合较轻任务。
API Key 还有周限额吗?
没有订阅内的 5h / Weekly 窗口,按 token 与速率限制计费。
Claude Code 能替代 Codex 吗?
终端 Agent 体验相近,配额独立。做 iOS / macOS 开发建议在稳定 Cloud Mac 上长跑。
结语
Codex 周限额耗尽不是账号坏了,而是 OpenAI 在 2026 年把「轻量试用」和「全职 Agent 开发」拆得更开。读懂 5h 与 Weekly 两层、善用重置令牌与 mini 降耗、必要时 Credits 或升档,再备一条 API / Claude Code 备胎——大多数团队一周内都能把节奏找回来。
配额会重置,发版日不会等你。把长任务放在不掉线的执行节点上,比熬夜等滚动窗口划算。
Codex 限流了?先把 Agent 跑在稳的 Mac 节点上
Vuncloud 独享 Mac mini M4 Cloud Mac:Codex / Claude Code 长跑、Xcode 构建、tmux 过夜任务,美东 / 美西 / APAC 节点——限额恢复后回来验收,任务不会断在半截。
相关阅读
- 2026 最新大模型价格、配置、性能与人群:一篇讲透
- 卷模型已成过去,为什么 Mac 算力节点反倒一节点难求?
- AI Coding、Personal AI 与 Agent 架构:2026 开发者工具三角
最后更新:2026 年 6 月 22 日。限额与定价数据来自 OpenAI Codex Pricing 及 2026 年 6 月官方 changelog。