수요일 오후, Codex CLI가 갑자기 rate limit exceeded를 뱉는데 PR은 아직 반쯤입니다. 네트워크 문제가 아니라 2026년 OpenAI가 Codex에 걸어둔이중 롤링 quota가 작동 중입니다. 클라우드 랩 기준으로 「메커니즘 이해 → 복구 경로 선택 → 대체 스택 준비」 순서로 Weekly 한도 소진 후 현실적인 7가지 대응을 정리합니다.
1. Codex 한도 메커니즘: 어느 층에 걸렸나?
많은 사람이 Codex에 「메시지 개수」 한 가지만 있다고 생각합니다. 실제로 ChatGPT 구독 안의 Codex(CLI, IDE 확장, 클라우드 태스크)는 두 개의 독립 롤링 quota 아래 있습니다. 공식 설명은 OpenAI Codex Pricing 참고.
1.1 5시간 롤링 창
로컬 CLI 메시지(Local Messages)와 클라우드 태스크(Cloud Tasks)가 같은 5시간 창을 공유합니다. 자정 기준이 아니라 첫 소비 시점부터 5시간이 롤링됩니다. 레포가 크고, Agent 추론이 길고, 클라우드를 타면 한 태스크당 소비가 빠릅니다.
한도 증상: CLI rate limit, IDE 확장 전송 버튼 비활성, 클라우드 태스크 대기·거부. 일상 개발에서 가장 자주 맞는 층입니다.
1.2 Weekly(주간 한도)
5시간 창 위에 7일 롤링 Weekly quota가 있습니다. 한 주 내내 고강도 사용을 제한하는 층입니다. 각 5h 창을 아껴도 주간 누적이 Weekly를 0%로 만들 수 있습니다.
증상: 5h에는 여유가 있는데 갑자기 전역 rate limit; CLI에 Weekly 0% 표시. 본문 제목의 「Weekly 소진」이 여기입니다.
Context Window %와는 별개
서드파티 확장이 컨텍스트를 수천 %로 보여주는 경우가 있습니다——현재 세션 token 점유이며 5h / Weekly와 무관합니다. 트러블슈팅은 5h, Weekly, Remaining 라벨만 봅니다.
1.3 CLI / IDE 퍼센트 읽는 법
Codex CLI와 IDE 확장은 대략 다음처럼 표시합니다:
Rate Limits Remaining: 5h 96%, Weekly 94%
핵심은 Remaining(잔량)입니다:
Weekly 94%= 주간 quota의 94%가 남음. 94%를 썼다는 뜻이 아님5h 12%= 현재 5시간 창이 12%만 남음. 곧 한도0%또는 명확한 rate limit 에러일 때만 아래 복구안 적용
1.4 플랜별 대략 규모(2026.06)
공식은 고정 정수가 아니라 「메시지 수 구간」으로 표기합니다. 같은 「한 메시지」도 레포 규모에 따라 작업량이 크게 달라집니다. 아래는 GPT-5.3-Codex 기준 5시간 Local Messages 대략치(가격 페이지 발췌):
| 플랜 | GPT-5.3-Codex / 5h(대략) | GPT-5.4-mini / 5h(대략) | 비고 |
|---|---|---|---|
| ChatGPT Plus | 10–60 | 60–350 | Weekly 별도 제약 |
| Pro 5x | Plus 약 5배 | Plus 약 5배 | 2026년 $100/월 티어 |
| Pro 20x | Plus 약 20배 | Plus 약 20배 | 병렬·대규모 시나리오 |
| Business(비유연 요금) | Plus와 유사 | Plus와 유사 | 시트 과금 |
| API Key | 5h / Weekly 구독 창 없음 | token + rate limit | |
2026년 상반기 OpenAI는 Plus / Pro를 재편했습니다: $100 Pro(5x), 상위 20x 유지, 한도 소진 후 Credits 구매로 이어갈 수 있습니다. 수치는 chatgpt.com/codex/pricing 기준.
2. Weekly 소진: 7가지 복구안
아래 7가지는 비용 낮은 순입니다. 위에서부터 시도하고, 바로 플랜 변경은 피하세요.
안 1: Weekly인지 5h인지 확인
「완전히 안 된다」처럼 보여도 5h만 0%이고 Weekly는 여유(또는 반대)일 수 있습니다. CLI에서 codex 실행 후 rate limit 줄을 보거나 VS Code Codex 확장 상태바를 확인합니다.
5h 0%만 → 5시간 롤 회복 대기, 또는 리셋 토큰(안 3)Weekly 0%만 → 7일 롤 회복, 또는 Credits / 업그레이드(안 5·6)- 둘 다 0 → 대기 + Credits 조합, 안 7 대체 스택 계획
안 2: 롤링 자연 회복 대기
제로 코스트: 새 태스크를 멈춥니다. 시간이 창을 롤링시킵니다.
- 5시간 창: 가장 이른 소비 시점부터 5시간 후 해제
- Weekly: 7일 롤링. 월요일 0시 일괄 리셋 아님
적합: 급하지 않은 버그, Code Review·문서 작업으로 전환 가능한 시간. 부적합: CI 전날, 릴리스 창——안 3~7 검토.
안 3: 저장형 리셋 토큰 사용
2026년 6월 OpenAI는 Go / Plus / Pro / Business에 저장 가능한 rate limit reset을 도입했습니다. 고정 시각 일괄 클리어 대신, 필요할 때 수동 발동해 표준 사용량 창을 즉시 복구하는 「리셋 코인」입니다.
- 롤아웃 시 자격 계정에 최소 1장 무료 리셋
- 각 장 30일 유효. 만료 시 소멸
- 프로모 기간 초대로 추가 리셋(세부는 공식 공지)
주의: changelog는 주로 「표준 사용량 창」 복구를 설명합니다. Weekly 동시 클리어는 명시되지 않았습니다. 실무에서는 5시간 창 응급처치로 보는 게 안전합니다. Weekly는 롤 회복 또는 Credits.
안 4: GPT-5.4-mini로 전환해 소비 절감
같은 플랜에서 GPT-5.4-mini 메시지 상한은 GPT-5.3-Codex 풀사이즈보다 훨씬 높습니다(Plus 티어 mini 약 60–350 / 5h, Codex 약 10–60). CLI 또는 IDE에서 모델 전환:
# 예: 모델 전환 지원 세션에서 mini 지정
/model gpt-5.4-mini
적합: 단일 파일 리팩터, 테스트 보강, lint 수정, PR 코멘트 답변. 부적합: 모듈 간 아키텍처 이전, 복잡한 동시성 버그——mini에서 재시도가 늘면 오히려 quota 낭비.
안 5: Credits 구매로 이어가기
2026년부터 ChatGPT Plus / Pro는 구독 quota 소진 후 추가 Credits로 Codex를 계속 쓸 수 있습니다. 즉시 업그레이드 불필요. Business / Enterprise 유연 요금 워크스페이스는 workspace credits도 가능.
경로: ChatGPT 계정 설정 → 사용량 / Billing → Credits 구매(지역별 UI 문구 상이).
적합: 릴리스 주·해커톤 같은 일시적 몰아치기. 다음 달도 Codex를 쓸 거면 툴체인 변경 부담 적음. 부적합: 매달 Weekly에 걸림——플랜 업 또는 API(안 6·7) 검토.
안 6: 구독 티어 업그레이드
매주 Weekly를 0%로 만든다면 현재 티어와 작업량이 맞지 않습니다. 2026년 대략:
- Plus: 간헐 사용
- Pro 5x(약 $100/월): Codex 사용량 Plus 약 5배. 풀타임 일상 개발
- Pro 20x: 다중 레포·다중 Agent 병렬 헤비 유저
업그레이드 전 계산: Credits 월 지출이 상위 티어 차액에 가깝다면 티어 업이 더 편한 경우가 많습니다.
안 7: API Key 또는 대체 Agent
구독 quota가 하드 병목일 때 두 갈래:
A. OpenAI API Key 모드——Codex는 API Key 로그인을 지원합니다. ChatGPT 5h / Weekly 창은 없습니다. token 과금, 잔액과 RPM/TPM 제한. GPT-5.3 Codex API(2026.06): 입력 약 $1.75 / 100만 token, 출력 약 $14 / 100만 token.
B. 툴체인 교체——Claude Code, Cursor Agent, Gemini CLI, LangGraph + API 등. quota 체계는 각각 독립. 「Codex 메인 + Claude Code 예비」 이중화로 단일 한도에 막히지 않는 팀이 늘고 있습니다.
의사결정 빠른 참조
- 오늘 PR 머지해야 함 → 안 3 또는 5
- 이번 주 세 번째 Weekly → 안 6 또는 7
- 사내 제품 통합 → 안 7A(API Key)
- Apple 플랫폼, 밤샘 태스크 → 안 7B + 안정 Cloud Mac(5절 참고)
3. 대체 API·도구 대조
Weekly 소진은 툴 스택을 다시 보는 계기입니다. 2026년 6월 공개 정보 기준 quota 모델·Agent 형태·전형적 비용 비교:
| 안 | quota 모델 | Agent 형태 | 적합 대상 |
|---|---|---|---|
| Codex(ChatGPT 구독) | 5h + Weekly 롤링 | CLI / IDE / 클라우드 태스크 | Plus/Pro 구독, OpenAI 생태 깊이 사용 |
| Codex(API Key) | token 과금, Weekly 없음 | 동일, 청구 예측 용이 | 팀 통합, CI 파이프라인 |
| Claude Code | Pro/Max 세션 quota 또는 API token | 터미널 Agent + CLAUDE.md |
긴 추론 체인, 다파일 리팩터 |
| Cursor Agent | 구독 요청 수 + 모델 가산 | IDE 내장 | 일상 코딩 + 경량 Agent |
| Gemini CLI / API | 무료 티어 + token | CLI / Google 생태 | 멀티모달, 대용량 RAG |
| DeepSeek API | 순 token, 저가 | Agent 프레임워크 자체 구축 | 비용 민감, 중국어 비즈니스 |
모델 단가는 2026 최신 LLM 가격·설정·성능·대상: 한 번에 정리 참고. 도구를 바꿔도 안정적인 macOS / Linux 실행면은 별개——컴파일·테스트는 Agent의 발판입니다.
4. 예방: 한 주 버티기
한 번 고치는 건 쉽습니다. 매주면 워크플로를 바꿔야 합니다:
- 태스크 입도 줄이기: 한 세션 한 목표(「flaky test 고치기」까지. 「모듈 전체 리팩터」는 지양). 불필요 왕복 감소
- 로컬 우선:
rg/ LSP로 되는 건 Agent에 넘기지 않기. quota는 크로스 파일 추론에 보존 - 모델 티어 분리: 기본 mini, 뼈대 작업만 Codex 풀사이즈
- 클라우드 태스크 남용 금지: Cloud Tasks와 Local Messages는 5h 공유. 로컬 가능하면 클라우드 미사용
- Remaining 모니터:
5h < 20%에서 마무리, 정리는 다음 창으로 - 이중 스택: Codex 메인, Claude Code 또는 API 예비. rate limit 시 무중단 전환
5. 실행 노드: 한도가 돌아와도 작업은 끊기지 않게
quota 문제를 풀어도 또 다른 단절점이 있습니다——실행 환경. Codex 클라우드 태스크, CLI 밤샘 빌드, Xcode UI 테스트. 개인 노트북에서 돌리면 덮개 닫힘 슬립, VPN 흔들림, 디스크 full로 Agent가 중간에 끊깁니다.
2026년 실무 해법: 모델 quota와 실행 노드를 분리 설계. 구독 / API가 「뇌」, Cloud Mac이 「몸」——전용 macOS 노드를 24시간 온라인, tmux로 장기 태스크. Codex나 Claude Code 한도가 돌아오면 돌아와 검수.
「모델 부족」과 다른 차원입니다. 실행 노드에서 희한한 건 안정적·예측 가능한 macOS 연산입니다. 자세히는 모델 경쟁은 끝났다—왜 Mac 컴퓨트 노드는 구하기 어려울까.
FAQ
Codex Weekly와 5h 한도 차이는?
5시간 창은 단기 burst 제한. Weekly는 주간 누적 제한. 독립 롤링, 하나라도 소진하면 rate limit.
CLI Weekly 94%는 거의 다 썼나, 아직 여유?
Remaining = 잔량. 94%는 94% 남음. 94% 소진 아님.
Weekly 소진 후 Credits 살 수 있나?
가능. Plus / Pro 추가 Credits. Business 유연 요금 WS는 workspace credits.
저장 리셋 토큰이 Weekly도 지우나?
공식 미명시. 5h 창 응급처치로 보는 게 안전. Weekly는 롤 회복 또는 Credits.
GPT-5.4-mini로 바꾸면 quota 늘어나나?
늘어납니다. 같은 플랜에서 mini 5h 메시지 상한이 훨씬 높음. 가벼운 작업에 적합.
API Key에도 Weekly 한도가 있나?
구독 5h / Weekly 창 없음. token과 rate limit 과금.
Claude Code가 Codex 대체 가능?
터미널 Agent 경험 유사. quota 독립. iOS / macOS 개발은 안정 Cloud Mac에서 장시간 실행 권장.
맺음말
Codex Weekly 소진은 계정 고장이 아닙니다. OpenAI가 2026년 「가벼운 체험」과 「풀타임 Agent 개발」을 더 분리한 결과입니다. 5h와 Weekly 이층을 읽고, 리셋 토큰·mini 절약, 필요 시 Credits·업그레이드, API / Claude Code 예비선——대부분 팀은 일주일 안에 리듬을 되찾습니다.
quota는 리셋됩니다. 릴리스일은 기다려 주지 않습니다. 긴 작업은 끊기지 않는 실행 노드에 올리는 편이, 밤새 롤링을 기다리는 것보다 낫습니다.
Codex rate limit? Agent부터 안정 Mac 노드에서
Vuncloud 전용 Mac mini M4 Cloud Mac: Codex / Claude Code 장시간 실행, Xcode 빌드, tmux 야간 태스크. US East / West / APAC——한도 회복 후 검수로 복귀, 작업은 중간에 끊기지 않습니다.
관련 글
- 2026 최신 LLM 가격·설정·성능·대상: 한 번에 정리
- 모델 경쟁은 끝났다—왜 Mac 컴퓨트 노드는 구하기 어려울까
- 2026 AI Coding + Personal AI + Agent 아키텍처 3종 세트
최종 업데이트: 2026년 6월 22일. 한도·가격 데이터는 OpenAI Codex Pricing 및 2026년 6월 공식 changelog 기준.