- Claude Fable 5 は Anthropic が一般公開した初の Mythos 級モデル(2026年6月9日 GA)。制限付きの Mythos 5 と同一アーキテクチャを共有
- Opus 4.8 との最大の差は「会話が賢くなった」ではなく、数時間から数日にわたる非同期自律タスク——計画・実行・テスト・反復を自分で回せること
- 開発者視点:Claude Code では Fable 5 を「夜通し働くシニア外注」、Opus 4.8 は日常ペアと Dynamic Workflows の堅実なデフォルト。どちらも切れない Cloud Macで検収ループを完走させる
2026年6月9日、Anthropic は Claude Fable 5 と Claude Mythos 5 を同時リリースしました。前者は Mythos Preview(4月は Glasswing パートナーのみ)のあと、初めて一般に開かれた Mythos 級能力。後者は引き続き信頼パートナー向けで、一部の安全分類器を外した版です。
開発者コミュニティの第一声は「また新モデル、benchmark 何ポイント上がった?」——この問いの立て方がズレています。Fable 5 と Opus 4.8 の分水嶺は働き方:「あなたが見張りながらコードを直す」から「あなたが帰ったあとも直し続ける」へ。
Anthropic は6月12日、米国政府の輸出規制指示により Claude Fable 5 と Mythos 5 のグローバルアクセスを一時停止し、復旧に向けて対応中と発表。本文で分解する能力と統合の差分は復旧後も有効です。現状は 公式ステータスを確認してください。日常開発は Opus 4.8 ほか既存 Claude モデルで継続可能です。
差分①:モデル階層——Opus 旗艦から Mythos 級へ
Anthropic の製品ラインでは、Opus が長らく「最強の一般公開」基準。Mythos は2026年に登場した上位階層で、当初は Mythos Preview として Project Glasswing(サイバーセキュリティなど重要インフラ)向けに限定されていました。
Claude Fable 5 の意味は、Mythos 級を初めて API・Claude Pro/Max/Team・Claude Code の通常ルートに載せたこと。Claude Mythos 5 と同一アーキテクチャ・同一 benchmark を共有し、違いは主に安全シェル——Fable は分類器付き、Mythos は信頼パートナー向けに一部制限を外す。
統合側にとって、model 文字列を差し替えただけでは済みません。デフォルトのタスク時間、失敗モード、請求構造が変わります。
差分②:中核は長時間自律実行、チャットではない
Anthropic の Fable 5 説明に繰り返し出る三語:thorough、proactive、tests its own work。現場の言葉にすると:
以前のモデルは「質問に答える優秀なインターン」。Fable 5 は「ゴールを渡せばタスク分解・実装・テスト・失敗修正まで自分で回すシニアエンジニア」に近い。
公開事例では、Stripe は Fable 5 で数ヶ月かかる移行を数日に圧縮し、5000万行の Ruby コードベース全体を1日で移行したと述べています。Anthropic 内部チームは1週間超のゲノム学自律研究にも使っています。Opus 4.8 時代は Dynamic Workflows で子 Agent を手組みするか、人間が「続けて」と何度も叩く必要がありました。
WWDC 2026 後の Siri がシステム Agent 化したのと同型で、変化は実行レイヤーに起きています。次の人間プロンプトを待たず、タスク予算内で前進し続ける。
差分③:Agentic benchmark に「断層」
「会話の賢さ」だけ見れば Opus 4.8 → Fable 5 は漸進的。Agent がソフトウェア工程を単独で完遂できるかで見ると、曲線は急です。Anthropic 公表値(Fable 5 と Mythos 5 は多くの項目で1–3pt差。* 付きは Fable の安全分類器で Opus に近づく):
| Benchmark | Fable 5 / Mythos 5 | Opus 4.8 | 開発者の読み方 |
|---|---|---|---|
| SWE-Bench Pro | 80.3% | 69.2% | 実リポジトリ級 issue 修正、約11pt差 |
| FrontierCode (Diamond) | 29.3% (xhigh) | 13.4% (xhigh) | 保守可能な Agent コード、倍級の差 |
| Terminal-Bench 2.1 | 88.0%* | 82.7% | ターミナル多段操作、Claude Code の主戦場 |
| Humanity's Last Exam (tools) | 64.5%* | 57.9% | 学際的な長鎖推論 |
| OSWorld-Verified | 85.0% | 83.4% | コンピュータ操作、両者は接近 |
日々 iOS / Swift を書くチームには、HLE より SWE-Bench Pro + Terminal-Bench が実務的。「リポジトリ修正がマージ可能か」「shell で自分を詰まらせないか」——claude CLI と xcodebuild ループの抽象版です。
Opus 4.8 はリリース時に正直さ・Effort・Dynamic Workflows を前面に。Fable 5 は単一 Agent セッション内でより大きな塊を噛み、手書きオーケストレーションを減らす方向です。
差分④:1M コンテキストと 128k 出力
Fable 5 / Mythos 5 はデフォルトで100万 token コンテキスト、1回あたり最大128k 出力 token。長時間 Agent にとって:
- リポジトリ全体の README・アーキテクチャ文書・CI ログ断片を一度にワーキングメモリへ
- memory tool と compaction で中間状態を会話窓に全部詰め込まない
- Anthropic 称:ファイル型メモリ併用時、Fable 5 の長コンテキストタスク効果は Opus 4.8 の約3倍
Opus 4.8 も長コンテキストと adaptive thinking に対応済みですが、Fable 5 は「長さ」をデフォルトの Agent 前提にしました。移行注意:thinking: {"type": "disabled"} は Fable 5 で非対応。adaptive thinking は常時オン、深度は effort で調整。
差分⑤:安全分類器と Opus 4.8 フォールバック
Fable 5 と Mythos 5 が同名別物になる核心——能力は同じ、安全シェルが違う。
Fable 5 はサイバーセキュリティ・生物・化学・蒸留(distillation)など高リスククエリに独立した安全分類器を配置。発火時 API は HTTP 200 ですが stop_reason: "refusal" を返し、どの分類器かを明示——従来の 4xx エラーではありません。統合側は次の3点が必須(公式ドキュメント):
- 拒否処理:refusal をパースし、成功出力と混同しない
- Fallback:server-side
fallbacks、SDK middleware、または手動でclaude-opus-4-8へ再試行 - 課金:拒否かつ出力なしは課金なし。fallback 時は prompt-cache 控除で二重キャッシュ料を避ける
ExploitBench、BioMysteryBench など * 付き benchmark で Fable 5 のスコアが Opus 4.8 に近いのは、モデルが弱いのではなく公開版が意図的に答えさせないため。Mythos 5 は信頼シナリオでフル能力(例:ExploitBench Cap% 約78% 対 Opus 4.8 の40%)。
運用上の制約も:Mythos 級トラフィックは30日保持(信頼・安全目的)。ゼロデータ保持(ZDR)契約の対象外——エンタープライズのコンプライアンス審査は別途。
差分⑥:料金2倍と新しい課金ルール
Fable 5 の料金は入力 $10 / 100万 token、出力 $50 / 100万 token——Opus 4.8($5 / $25)の約2倍。Mythos Preview($25 / $125)の半分以下。
価格自体が「タスク選別器」:数時間かけて価値がある移行・監査・全リポジトリテスト修正向き。高頻度の短い Q&A には Opus 4.8 Fast や Sonnet の方が合理的。
サブスクでは6月9–22日に Pro/Max/Team 等で Fable 5 を無料同梱、6月23日から credits 消費へ——公式も Fable をプレミアム算力として位置づけ、デフォルトのチャットモデルではないことを示しています。
- CI / Agent スクリプトが
stop_reason: refusalを処理しているか claude-opus-4-8への fallback を設定したか- 請求アラートをタスク時間基準にしているか(リクエスト回数ではない)
- 機密顧客が30日 Mythos 級データ保持を受け入れるか
差分⑦:Claude Code ワークフローのパラダイム転換
多くの開発者にとって Fable 5 の入口は claude.ai ではなく Claude Code——ターミナルのリポジトリ級 Agent。Opus 4.8 時代とのワークフロー再配置:
| 段階 | Opus 4.8 の癖 | Fable 5 の癖 |
|---|---|---|
| タスク粒度 | 単一ファイル / モジュール / 1 PR | ディレクトリ横断移行、複数日検収、自己ループテスト |
| オーケストレーション | Dynamic Workflows で子 Agent を手書き | モデル内蔵の長鎖 + task budgets(beta) |
| 思考モード | adaptive 選択可 / thinking オフ可 | adaptive のみ。raw CoT は返らない |
| メモリ | 主にセッションコンテキスト | memory tool + ファイル型長期メモリ |
| 人間の役割 | diff を段階的に review | ゴール設定・ゲート設定・マージ前検収 |
Cloud Mac での推奨スタート:
cd ~/work/your-ios-app tmux new -s fable-migration claude # セッション内(インストール版による): # /model → claude-fable-5 # /effort → xhigh(大規模移行) # タスク例: # 「agent/fable-checkout ブランチで Checkout モジュールの同期 API を async/await に。 # まず計画を出し、確認後に自律実行。各段階で swift test --filter CheckoutTests; # 全部通ったら git diff --stat を出力。push しない。」 # Ctrl+B D でデタッチ。ノートPCはシャットダウン可
iOS CI キャッシュ最適化やxcodebuild 高速化と同じ理屈:Fable 5 は同じビルドを何度も叩く。DerivedData / Pods に固定の「居場所」がある方が、GitHub-hosted macOS を素のまま回すより時間もクォータも節約できます。
Fable 5 と Opus 4.8、どちらを選ぶ?
二択ではなく、タスク時間とリスクで選ぶ:
- Fable 5:全リポ移行、モジュール横断の一貫リファクタ、モデルが自分でテストして直す複数日タスク。予算は「チャット回数」ではなく「エンジニア人日」で見積もる
- Opus 4.8:日常ペア、Dynamic Workflows 試行、セキュリティ/生物系で Fable が拒否しうるテーマ(または fallback 後の安定ルート)、コスト敏感な高頻度呼び出し
- Cursor ローカル + リモート併用:IDE 内の小改修は Cursor。Cloud Mac 上の Fable 5 が大仕事——Opus 4.8 時代と役割分担は同じで、「大仕事」の定義だけ大きくなった
なぜ Cloud Mac 上で回す必要があるか
Fable 5 の「長時間自律」が要求する実行環境は、Opus 4.8 の Dynamic Workflows と同程度か、それ以上に厳しい:
- セッション切断不可:時間・日単位のタスクはノートのスリープに耐えられない。
tmux+ 7×24 Cloud Mac がベースライン - 本物の macOS ツールチェーン:
xcodebuild、Simulator、SPM / CocoaPods は Mac 上でしか Agent の Swift 変更を検収できない - ディスクとメモリ:1M コンテキスト + 並列テストはメモリを食う。monorepo では M4 24GB と大容量ディスクは贅沢ではない
- CI と同機:Agent 修正 → 同機 warm build → 失敗ログを Agent に戻す。フィードバックループを短く
モデル ID が将来 claude-fable-5 から次世代 Mythos に変わっても、ホストとワークフローは捨てなくていい——Cloud Mac が「Agent の物理層」である理由です。
よくある質問(FAQ)
Opus 4.8 との最大の違いは?
長時間自律 Agent 能力。チャットの差は限定的。リポジトリ級・複数日・自検証タスクでは差が桁違い。
Fable 5 と Mythos 5 は同じ強さ?
基盤は同じ。Fable は安全分類器が追加され、一部シナリオで Opus 4.8 にフォールバック。Mythos 5 は Glasswing 等の信頼ルートのみ。
API モデル ID は?
claude-fable-5(公開)、claude-mythos-5(制限)。
今使える?
2026年6月12日からグローバル一時停止。復旧は Anthropic 告知次第。執筆時(6月15日)は公式ステータスを確認。Opus 4.8 ほかは影響なし。
Cursor と競合する?
しない。ローカル IDE + リモート Claude Code は定番。Fable 5 は「夜通しの大仕事」担当。
おわりに
今回のアップグレードは何が変わったのか?一言で:Anthropic が Mythos 級の長時間 Agent を初めて一般開発者に渡した。上の7差分——階層、自律実行、benchmark 断層、コンテキスト仕様、安全フォールバック、料金、Claude Code パラダイム——はすべて同じ方向を指します:
AI コーディングの勝負は「1回の回答が賢いか」から「無人でタスクを完遂できるか」へ。
benchmark の 80.3% vs 69.2% はシグナル。本当の検収は、リポジトリで「一晩任せて、朝の diff がマージ可能だった」かどうか。その前に切れない Cloud Macを——Fable 5 も Opus 4.8 も必要ですが、前者の方がより離せません。
Fable 5 を夜通し回すなら、切れない Mac が要る
Vuncloud Cloud Mac M4:tmux で Claude Code 長走、同機 xcodebuild 検収、DerivedData 永続キャッシュ——長時間 Agent の物理実行層。