Vuncloud 블로그
← 필드 노트로 돌아가기

Opus 4.8에서 Fable 5로——Anthropic 업그레이드, 무엇이 달라졌나

Claude Fable 5 · Anthropic 첫 공개 Mythos급 · 장시간 자율 Agent는 채팅 업그레이드가 아님 · Claude benchmark · Claude Code ·약 12분

멀티 모니터에서 코딩하는 개발자——Claude Fable 5 장시간 자율 Agent와 Claude Code 저장소급 작업
TL;DR · 세 줄 메모
  • Claude Fable 5는 Anthropic이 일반에 처음 공개한 Mythos급 모델(2026년 6월 9일 GA). 제한 공개 Mythos 5와 동일 아키텍처 공유
  • Opus 4.8 대비 핵심 변화는 「채팅이 똑똑해짐」이 아니라 수 시간~수 일 비동기 자율 태스크——스스로 계획·실행·테스트·반복
  • 개발자 관점: Claude Code에서 Fable 5는 「밤새 도는 시니어 외주」, Opus 4.8은 일상 페어 프로그래밍과 Dynamic Workflows 기본값. 둘 다 끊기지 않는 Cloud Mac으로 검수 루프를 끝까지

2026년 6월 9일 Anthropic은 Claude Fable 5Claude Mythos 5를 동시에 발표했습니다. 전자는 Mythos Preview(4월 Glasswing 파트너 한정) 이후 처음으로 대중에 열린 Mythos급 역량이고, 후자는 신뢰 파트너 전용이며 일부 안전 분류기를 제거한 버전입니다.

개발자 커뮤니티 첫 반응은 「또 새 모델, benchmark 몇 점 올랐지?」——질문 방향이 틀렸습니다. Fable 5와 Opus 4.8의 분수령은 일하는 방식입니다: 「내가 지켜보며 코드 고침」에서 「퇴근해도 계속 고침」으로.

이용 가능 여부 (2026-06-12 업데이트)

Anthropic은 6월 12일 미국 정부 수출 통제 지시에 따라 Claude Fable 5·Mythos 5 글로벌 접근을 일시 중단했고 복구 작업 중이라고 밝혔습니다. 본문이 풀어내는 역량·통합 차이는 복구 후에도 유효합니다. 현재는 공식 상태 페이지를 확인하세요. 일상 개발은 Opus 4.8 등 기존 Claude 모델로 계속 가능합니다.

80.3%
SWE-Bench Pro (Fable/Mythos 5)
69.2%
SWE-Bench Pro (Opus 4.8)
1M
기본 컨텍스트 윈도 (Fable 5)

차이 ①: 모델 계층——Opus 플래그십에서 Mythos급으로

Anthropic 제품 라인에서 Opus는 오래도록 「가장 강한 공개」 기준이었습니다. Mythos는 2026년에 나온 상위 계층으로, 처음엔 Mythos Preview로 Project Glasswing(사이버보안 등 핵심 인프라)에만 제공됐습니다.

Claude Fable 5의 의미는 Mythos급을 처음으로 API·Claude Pro/Max/Team·Claude Code 일반 경로에 올린 것입니다. Claude Mythos 5와 동일 아키텍처·benchmark를 공유하며, 차이는 주로 안전 셸——Fable은 분류기 포함, Mythos는 신뢰 파트너용으로 일부 제한 해제.

통합 관점에서는 model 문자열만 바꾼 게 아닙니다. 기본 태스크 길이, 실패 패턴, 청구 구조가 바뀝니다.

차이 ②: 핵심은 장시간 자율 실행, 채팅이 아님

Anthropic Fable 5 설명에 반복되는 세 단어: thorough, proactive, tests its own work. 현장 언어로:

예전 모델은 「물어보면 답하는」 고급 인턴. Fable 5는 「목표만 주면 태스크 분해·코딩·테스트·실패 수정까지 스스로」 하는 시니어 엔지니어에 가깝습니다.

공개 사례에서 Stripe는 Fable 5로 수개월 걸릴 마이그레이션을 수일로 압축했고, 5천만 줄 Ruby 코드베이스 전체를 하루 만에 이전했다고 합니다. Anthropic 내부 팀은 1주 이상 지속되는 유전체학 자율 연구에도 씁니다. Opus 4.8 시대엔 Dynamic Workflows로 서브 Agent를 손으로 짜거나, 사람이 「계속해」를 반복해야 했습니다.

WWDC 2026 이후 Siri가 시스템 Agent화한 것과 같은 축입니다. 변화는 실행 레이어에서 일어납니다——다음 human prompt를 기다리지 않고 태스크 예산 안에서 전진.

데이터 시각화와 모니터링 대시보드. Claude Fable 5 장시간 Agent 태스크 상태 추적과 benchmark 관측을 상징

차이 ③: Agentic benchmark에 「단층」

「채팅 지능」만 보면 Opus 4.8 → Fable 5는 점진적입니다. Agent가 소프트웨어 공학을 혼자 끝낼 수 있는가로 보면 곡선이 가파릅니다. Anthropic 공개 수치(Fable 5와 Mythos 5는 대부분 1–3pt 차이. * 표시는 Fable 안전 분류기로 Opus에 가까움):

Benchmark Fable 5 / Mythos 5 Opus 4.8 개발자 해석
SWE-Bench Pro 80.3% 69.2% 실제 레포급 issue 수정, 약 11pt 차
FrontierCode (Diamond) 29.3% (xhigh) 13.4% (xhigh) 유지보수 가능한 Agent 코드, 배 이상 격차
Terminal-Bench 2.1 88.0%* 82.7% 터미널 다단계 조작, Claude Code 주전장
Humanity's Last Exam (tools) 64.5%* 57.9% 학제간 장쇄 추론
OSWorld-Verified 85.0% 83.4% 컴퓨터 사용, 둘 다 비슷

매일 iOS / Swift 쓰는 팀엔 HLE보다 SWE-Bench Pro + Terminal-Bench가 실무적입니다. 「레포 수정이 머지 가능한가」「shell에서 스스로 꼬이지 않는가」——claude CLI와 xcodebuild 루프의 추상화 버전.

Opus 4.8은 출시 당시 정직함·Effort·Dynamic Workflows를 강조했습니다. Fable 5는 단일 Agent 세션 안에서 더 큰 덩어리를 처리해 손으로 짠 오케스트레이션을 줄입니다.

차이 ④: 1M 컨텍스트와 128k 출력

Fable 5 / Mythos 5는 기본 100만 token 컨텍스트, 1회 최대 128k 출력 token. 장시간 Agent에 대해:

  • 레포 전체 README·아키텍처 문서·CI 로그 조각을 한 번에 워킹 메모리에
  • memory toolcompaction으로 중간 상태를 대화창에 전부 안 쑤셔 넣음
  • Anthropic 주장: 파일형 메모리와 함께 쓰면 Fable 5 장컨텍스트 태스크 효과는 Opus 4.8의 약 3배

Opus 4.8도 장컨텍스트·adaptive thinking을 지원하지만, Fable 5는 「길이」를 기본 Agent 가정으로 뒀습니다. 마이그레이션 시: thinking: {"type": "disabled"}는 Fable 5에서 미지원. adaptive thinking은 항상 켜짐, 깊이는 effort로 조절.

차이 ⑤: 안전 분류기와 Opus 4.8 폴백

Fable 5와 Mythos 5가 이름은 같고 운명은 다름——역량은 같고 안전 셸이 다릅니다.

Fable 5는 사이버보안·생물·화학·증류(distillation) 등 고위험 쿼리에 독립 안전 분류기를 둡니다. 발동 시 API는 HTTP 200이지만 stop_reason: "refusal"을 반환하고 어떤 분류기인지 표시——전통적 4xx 오류가 아닙니다. 통합 측 필수 3가지(공식 문서):

  1. 거절 처리: refusal 파싱, 성공 출력과 혼동 금지
  2. Fallback: server-side fallbacks, SDK middleware, 또는 수동으로 claude-opus-4-8 재시도
  3. 과금: 거절·출력 없음은 과금 안 됨. fallback 시 prompt-cache 공제로 이중 캐시 비용 방지

ExploitBench, BioMysteryBench 등 * benchmark에서 Fable 5 점수가 Opus 4.8에 가까운 건 모델이 약해서가 아니라 공개판이 의도적으로 답을 막기 때문입니다. Mythos 5는 신뢰 시나리오에서 풀 역량(예: ExploitBench Cap% 약 78% vs Opus 4.8 40%).

운영 제약: Mythos급 트래픽 30일 보관(신뢰·안전 목적). 제로 데이터 보존(ZDR) 계약 대상 아님——엔터프라이즈 컴플라이언스는 별도 검토.

차이 ⑥: 요금 2배와 새 과금 규칙

Fable 5 요금은 입력 $10 / 100만 token, 출력 $50 / 100만 token——Opus 4.8($5 / $25)의 약 2배. Mythos Preview($25 / $125)의 절반 이하.

가격 자체가 「태스크 필터」입니다. 수 시간 쓸 가치가 있는 마이그레이션·감사·전 레포 테스트 수정에 맞고, 고빈도 짧은 Q&A엔 Opus 4.8 Fast나 Sonnet이 낫습니다.

구독 정책: 6월 9–22일 Pro/Max/Team 등에 Fable 5 무료 포함, 6월 23일부터 credits 소모——공식도 Fable을 프리미엄 연산으로 두고 기본 채팅 모델이 아님을 보여줍니다.

통합 체크리스트
  • CI / Agent 스크립트가 stop_reason: refusal 처리하는지
  • claude-opus-4-8 fallback 설정했는지
  • 청구 알림을 태스크 시간 기준으로 잡았는지(요청 횟수 아님)
  • 민감 고객이 30일 Mythos급 데이터 보관을 수용하는지

차이 ⑦: Claude Code 워크플로 패러다임 전환

대부분 개발자에게 Fable 5 진입점은 claude.ai가 아니라 Claude Code——터미널 레포급 Agent. Opus 4.8 시대 대비 워크플로 재배치:

단계 Opus 4.8 습관 Fable 5 습관
태스크 단위 단일 파일 / 모듈 / 1 PR 디렉터리 간 마이그레이션, 며칠 검수, 자가 루프 테스트
오케스트레이션 Dynamic Workflows로 서브 Agent 수기 모델 내장 장쇄 + task budgets (beta)
사고 모드 adaptive 선택 / thinking 끄기 가능 adaptive만. raw CoT 미반환
메모리 주로 세션 컨텍스트 memory tool + 파일형 장기 메모리
인간 역할 diff 단계별 리뷰 목표·게이트 설정, 머지 전 검수

Cloud Mac 추천 시작:

tmux + Claude Code · Fable 5 장거리
cd ~/work/your-ios-app
tmux new -s fable-migration

claude
# 세션 내 (설치 버전에 따름):
#   /model  → claude-fable-5
#   /effort → xhigh (대규모 마이그레이션)
# 태스크 예:
# 「agent/fable-checkout 브랜치에서 Checkout 모듈 동기 API를 async/await로.
#  먼저 계획 제시, 확인 후 자율 실행. 각 단계마다 swift test --filter CheckoutTests;
#  전부 통과하면 git diff --stat 출력. push 하지 마.」

# Ctrl+B D로 detach. 노트북은 꺼도 됨

iOS CI 캐시 최적화, xcodebuild 속도 개선과 같은 논리: Fable 5는 같은 빌드를 반복합니다. DerivedData / Pods에 고정 「집」이 있으면 GitHub-hosted macOS를 맨으로 도는 것보다 시간·쿼터를 아낍니다.

Fable 5 vs Opus 4.8, 뭘 쓸까?

둘 중 하나가 아닙니다. 태스크 길이와 리스크로 고르세요:

  • Fable 5: 전 레포 마이그레이션, 모듈 간 일관 리팩터, 모델이 스스로 테스트·수정하는 며칠짜리 작업. 예산은 「채팅 횟수」가 아니라 「엔지니어 인일」
  • Opus 4.8: 일상 페어, Dynamic Workflows 시범, 보안/생물 주제로 Fable 거절 가능성(또는 fallback 후 안정 경로), 비용 민감 고빈도 호출
  • Cursor 로컬 + 원격 조합: IDE 소규모 수정은 Cursor. Cloud Mac의 Fable 5가 큰 일——Opus 4.8 시대와 역할 분담은 같고 「큰 일」 정의만 커짐

왜 Cloud Mac에서 돌려야 하나

Fable 5 「장시간 자율」이 요구하는 실행 환경은 Opus 4.8 Dynamic Workflows만큼이나, 오히려 더 까다롭습니다:

  • 세션 끊김 불가: 시간·일 단위 태스크는 노트북 슬립에 못 버팀. tmux + 7×24 Cloud Mac이 베이스라인
  • 진짜 macOS 툴체인: xcodebuild, Simulator, SPM / CocoaPods는 Mac에서만 Agent Swift 변경 검수 가능
  • 디스크·메모리: 1M 컨텍스트 + 병렬 테스트는 메모리 소모. monorepo에서 M4 24GB·대용량 디스크는 사치가 아님
  • CI 동일 머신: Agent 수정 → 동일 머신 warm build → 실패 로그 Agent 재주입. 피드백 루프 단축

모델 ID가 나중에 claude-fable-5에서 차세대 Mythos로 바뀌어도 호스트와 워크플로는 갈아엎을 필요 없음——Cloud Mac이 「Agent 물리층」인 이유.

자주 묻는 질문 (FAQ)

Opus 4.8과 가장 큰 차이?

장시간 자율 Agent 역량. 채팅 격차는 제한적. 레포급·며칠·자검증 태스크는 격차가 큼.

Fable 5와 Mythos 5, 같은 강도?

기반 동일. Fable은 안전 분류기 추가, 일부 시나리오 Opus 4.8 폴백. Mythos 5는 Glasswing 등 신뢰 경로만.

API 모델 ID?

claude-fable-5(공개), claude-mythos-5(제한).

지금 쓸 수 있나?

2026년 6월 12일부터 글로벌 일시 중단. 복구는 Anthropic 공지 따름. 작성 시점(6월 15일) 공식 상태 확인. Opus 4.8 등은 영향 없음.

Cursor와 충돌?

아님. 로컬 IDE + 원격 Claude Code는 흔한 조합. Fable 5는 「밤새 큰 일」 담당.

맺음말

이번 업그레이드, 뭐가 달라졌나? 한 줄로: Anthropic이 Mythos급 장시간 Agent를 처음으로 일반 개발자에게 넘겼다. 위 7가지 차이——계층, 자율 실행, benchmark 단층, 컨텍스트 스펙, 안전 폴백, 요금, Claude Code 패러다임——은 모두 같은 방향을 가리킵니다:

AI 코딩 경쟁은 「한 번 답이 똑똑한가」에서 「무인으로 태스크를 끝내는가」로.

benchmark 80.3% vs 69.2%는 신호입니다. 진짜 검수는 레포에서 「하룻밤 맡기고 아침 diff가 머지 가능했는가」. 그 전에 끊기지 않는 Cloud Mac을——Fable 5와 Opus 4.8 둘 다 필요하지만, 전자가 더 못 떨어집니다.

Fable 5 밤새 마이그레이션, 끊기지 않는 Mac이 필요

Vuncloud Cloud Mac M4: tmux로 Claude Code 장거리, 동일 머신 xcodebuild 검수, DerivedData 영구 캐시——장시간 Agent 물리 실행층.

Cloud Mac 플랜 보기 · Opus 4.8 심층 분석

필드 노트 · Claude

Mythos급 Agent에는 Mythos급 실행 환경이 필요하다

Fable 5 · Claude Code · Cloud Mac · 장시간 작업

Opus 4.8 심층 분석 읽기
한정 혜택 플랜 보기