Vuncloud ブログ
← フィールドノートに戻る

Opus 4.8 から Fable 5 へ——Anthropic のアップグレードは何が変わったのか

Claude Fable 5 · Anthropic 初の公開 Mythos 級 · 長時間自律 Agent はチャット強化ではない · Claude benchmark · Claude Code ·約12分

マルチモニターでコーディングする開発者——Claude Fable 5 の長時間自律 Agent と Claude Code のリポジトリ級タスク
TL;DR · 三行メモ
  • Claude Fable 5 は Anthropic が一般公開した初の Mythos 級モデル(2026年6月9日 GA)。制限付きの Mythos 5 と同一アーキテクチャを共有
  • Opus 4.8 との最大の差は「会話が賢くなった」ではなく、数時間から数日にわたる非同期自律タスク——計画・実行・テスト・反復を自分で回せること
  • 開発者視点:Claude Code では Fable 5 を「夜通し働くシニア外注」、Opus 4.8 は日常ペアと Dynamic Workflows の堅実なデフォルト。どちらも切れない Cloud Macで検収ループを完走させる

2026年6月9日、Anthropic は Claude Fable 5Claude Mythos 5 を同時リリースしました。前者は Mythos Preview(4月は Glasswing パートナーのみ)のあと、初めて一般に開かれた Mythos 級能力。後者は引き続き信頼パートナー向けで、一部の安全分類器を外した版です。

開発者コミュニティの第一声は「また新モデル、benchmark 何ポイント上がった?」——この問いの立て方がズレています。Fable 5 と Opus 4.8 の分水嶺は働き方:「あなたが見張りながらコードを直す」から「あなたが帰ったあとも直し続ける」へ。

利用可否メモ(2026-06-12 更新)

Anthropic は6月12日、米国政府の輸出規制指示により Claude Fable 5 と Mythos 5 のグローバルアクセスを一時停止し、復旧に向けて対応中と発表。本文で分解する能力と統合の差分は復旧後も有効です。現状は 公式ステータスを確認してください。日常開発は Opus 4.8 ほか既存 Claude モデルで継続可能です。

80.3%
SWE-Bench Pro(Fable/Mythos 5)
69.2%
SWE-Bench Pro(Opus 4.8)
1M
デフォルトコンテキスト(Fable 5)

差分①:モデル階層——Opus 旗艦から Mythos 級へ

Anthropic の製品ラインでは、Opus が長らく「最強の一般公開」基準。Mythos は2026年に登場した上位階層で、当初は Mythos Preview として Project Glasswing(サイバーセキュリティなど重要インフラ)向けに限定されていました。

Claude Fable 5 の意味は、Mythos 級を初めて API・Claude Pro/Max/Team・Claude Code の通常ルートに載せたこと。Claude Mythos 5 と同一アーキテクチャ・同一 benchmark を共有し、違いは主に安全シェル——Fable は分類器付き、Mythos は信頼パートナー向けに一部制限を外す。

統合側にとって、model 文字列を差し替えただけでは済みません。デフォルトのタスク時間、失敗モード、請求構造が変わります。

差分②:中核は長時間自律実行、チャットではない

Anthropic の Fable 5 説明に繰り返し出る三語:thoroughproactivetests its own work。現場の言葉にすると:

以前のモデルは「質問に答える優秀なインターン」。Fable 5 は「ゴールを渡せばタスク分解・実装・テスト・失敗修正まで自分で回すシニアエンジニア」に近い。

公開事例では、Stripe は Fable 5 で数ヶ月かかる移行を数日に圧縮し、5000万行の Ruby コードベース全体を1日で移行したと述べています。Anthropic 内部チームは1週間超のゲノム学自律研究にも使っています。Opus 4.8 時代は Dynamic Workflows で子 Agent を手組みするか、人間が「続けて」と何度も叩く必要がありました。

WWDC 2026 後の Siri がシステム Agent 化したのと同型で、変化は実行レイヤーに起きています。次の人間プロンプトを待たず、タスク予算内で前進し続ける。

データ可視化と監視ダッシュボード。Claude Fable 5 の長時間 Agent タスクの状態追跡と benchmark 観測を象徴

差分③:Agentic benchmark に「断層」

「会話の賢さ」だけ見れば Opus 4.8 → Fable 5 は漸進的。Agent がソフトウェア工程を単独で完遂できるかで見ると、曲線は急です。Anthropic 公表値(Fable 5 と Mythos 5 は多くの項目で1–3pt差。* 付きは Fable の安全分類器で Opus に近づく):

Benchmark Fable 5 / Mythos 5 Opus 4.8 開発者の読み方
SWE-Bench Pro 80.3% 69.2% 実リポジトリ級 issue 修正、約11pt差
FrontierCode (Diamond) 29.3% (xhigh) 13.4% (xhigh) 保守可能な Agent コード、倍級の差
Terminal-Bench 2.1 88.0%* 82.7% ターミナル多段操作、Claude Code の主戦場
Humanity's Last Exam (tools) 64.5%* 57.9% 学際的な長鎖推論
OSWorld-Verified 85.0% 83.4% コンピュータ操作、両者は接近

日々 iOS / Swift を書くチームには、HLE より SWE-Bench Pro + Terminal-Bench が実務的。「リポジトリ修正がマージ可能か」「shell で自分を詰まらせないか」——claude CLI と xcodebuild ループの抽象版です。

Opus 4.8 はリリース時に正直さ・Effort・Dynamic Workflows を前面に。Fable 5 は単一 Agent セッション内でより大きな塊を噛み、手書きオーケストレーションを減らす方向です。

差分④:1M コンテキストと 128k 出力

Fable 5 / Mythos 5 はデフォルトで100万 token コンテキスト、1回あたり最大128k 出力 token。長時間 Agent にとって:

  • リポジトリ全体の README・アーキテクチャ文書・CI ログ断片を一度にワーキングメモリへ
  • memory toolcompaction で中間状態を会話窓に全部詰め込まない
  • Anthropic 称:ファイル型メモリ併用時、Fable 5 の長コンテキストタスク効果は Opus 4.8 の約3倍

Opus 4.8 も長コンテキストと adaptive thinking に対応済みですが、Fable 5 は「長さ」をデフォルトの Agent 前提にしました。移行注意:thinking: {"type": "disabled"} は Fable 5 で非対応。adaptive thinking は常時オン、深度は effort で調整。

差分⑤:安全分類器と Opus 4.8 フォールバック

Fable 5 と Mythos 5 が同名別物になる核心——能力は同じ、安全シェルが違う。

Fable 5 はサイバーセキュリティ・生物・化学・蒸留(distillation)など高リスククエリに独立した安全分類器を配置。発火時 API は HTTP 200 ですが stop_reason: "refusal" を返し、どの分類器かを明示——従来の 4xx エラーではありません。統合側は次の3点が必須(公式ドキュメント):

  1. 拒否処理:refusal をパースし、成功出力と混同しない
  2. Fallback:server-side fallbacks、SDK middleware、または手動で claude-opus-4-8 へ再試行
  3. 課金:拒否かつ出力なしは課金なし。fallback 時は prompt-cache 控除で二重キャッシュ料を避ける

ExploitBench、BioMysteryBench など * 付き benchmark で Fable 5 のスコアが Opus 4.8 に近いのは、モデルが弱いのではなく公開版が意図的に答えさせないため。Mythos 5 は信頼シナリオでフル能力(例:ExploitBench Cap% 約78% 対 Opus 4.8 の40%)。

運用上の制約も:Mythos 級トラフィックは30日保持(信頼・安全目的)。ゼロデータ保持(ZDR)契約の対象外——エンタープライズのコンプライアンス審査は別途。

差分⑥:料金2倍と新しい課金ルール

Fable 5 の料金は入力 $10 / 100万 token、出力 $50 / 100万 token——Opus 4.8($5 / $25)の約2倍。Mythos Preview($25 / $125)の半分以下。

価格自体が「タスク選別器」:数時間かけて価値がある移行・監査・全リポジトリテスト修正向き。高頻度の短い Q&A には Opus 4.8 Fast や Sonnet の方が合理的。

サブスクでは6月9–22日に Pro/Max/Team 等で Fable 5 を無料同梱、6月23日から credits 消費へ——公式も Fable をプレミアム算力として位置づけ、デフォルトのチャットモデルではないことを示しています。

統合チェックリスト
  • CI / Agent スクリプトが stop_reason: refusal を処理しているか
  • claude-opus-4-8 への fallback を設定したか
  • 請求アラートをタスク時間基準にしているか(リクエスト回数ではない)
  • 機密顧客が30日 Mythos 級データ保持を受け入れるか

差分⑦:Claude Code ワークフローのパラダイム転換

多くの開発者にとって Fable 5 の入口は claude.ai ではなく Claude Code——ターミナルのリポジトリ級 Agent。Opus 4.8 時代とのワークフロー再配置:

段階 Opus 4.8 の癖 Fable 5 の癖
タスク粒度 単一ファイル / モジュール / 1 PR ディレクトリ横断移行、複数日検収、自己ループテスト
オーケストレーション Dynamic Workflows で子 Agent を手書き モデル内蔵の長鎖 + task budgets(beta)
思考モード adaptive 選択可 / thinking オフ可 adaptive のみ。raw CoT は返らない
メモリ 主にセッションコンテキスト memory tool + ファイル型長期メモリ
人間の役割 diff を段階的に review ゴール設定・ゲート設定・マージ前検収

Cloud Mac での推奨スタート:

tmux + Claude Code · Fable 5 長走
cd ~/work/your-ios-app
tmux new -s fable-migration

claude
# セッション内(インストール版による):
#   /model  → claude-fable-5
#   /effort → xhigh(大規模移行)
# タスク例:
# 「agent/fable-checkout ブランチで Checkout モジュールの同期 API を async/await に。
#  まず計画を出し、確認後に自律実行。各段階で swift test --filter CheckoutTests;
#  全部通ったら git diff --stat を出力。push しない。」

# Ctrl+B D でデタッチ。ノートPCはシャットダウン可

iOS CI キャッシュ最適化xcodebuild 高速化と同じ理屈:Fable 5 は同じビルドを何度も叩く。DerivedData / Pods に固定の「居場所」がある方が、GitHub-hosted macOS を素のまま回すより時間もクォータも節約できます。

Fable 5 と Opus 4.8、どちらを選ぶ?

二択ではなく、タスク時間とリスクで選ぶ:

  • Fable 5:全リポ移行、モジュール横断の一貫リファクタ、モデルが自分でテストして直す複数日タスク。予算は「チャット回数」ではなく「エンジニア人日」で見積もる
  • Opus 4.8:日常ペア、Dynamic Workflows 試行、セキュリティ/生物系で Fable が拒否しうるテーマ(または fallback 後の安定ルート)、コスト敏感な高頻度呼び出し
  • Cursor ローカル + リモート併用:IDE 内の小改修は Cursor。Cloud Mac 上の Fable 5 が大仕事——Opus 4.8 時代と役割分担は同じで、「大仕事」の定義だけ大きくなった

なぜ Cloud Mac 上で回す必要があるか

Fable 5 の「長時間自律」が要求する実行環境は、Opus 4.8 の Dynamic Workflows と同程度か、それ以上に厳しい:

  • セッション切断不可:時間・日単位のタスクはノートのスリープに耐えられない。tmux + 7×24 Cloud Mac がベースライン
  • 本物の macOS ツールチェーンxcodebuild、Simulator、SPM / CocoaPods は Mac 上でしか Agent の Swift 変更を検収できない
  • ディスクとメモリ:1M コンテキスト + 並列テストはメモリを食う。monorepo では M4 24GB と大容量ディスクは贅沢ではない
  • CI と同機:Agent 修正 → 同機 warm build → 失敗ログを Agent に戻す。フィードバックループを短く

モデル ID が将来 claude-fable-5 から次世代 Mythos に変わっても、ホストとワークフローは捨てなくていい——Cloud Mac が「Agent の物理層」である理由です。

よくある質問(FAQ)

Opus 4.8 との最大の違いは?

長時間自律 Agent 能力。チャットの差は限定的。リポジトリ級・複数日・自検証タスクでは差が桁違い。

Fable 5 と Mythos 5 は同じ強さ?

基盤は同じ。Fable は安全分類器が追加され、一部シナリオで Opus 4.8 にフォールバック。Mythos 5 は Glasswing 等の信頼ルートのみ。

API モデル ID は?

claude-fable-5(公開)、claude-mythos-5(制限)。

今使える?

2026年6月12日からグローバル一時停止。復旧は Anthropic 告知次第。執筆時(6月15日)は公式ステータスを確認。Opus 4.8 ほかは影響なし。

Cursor と競合する?

しない。ローカル IDE + リモート Claude Code は定番。Fable 5 は「夜通しの大仕事」担当。

おわりに

今回のアップグレードは何が変わったのか?一言で:Anthropic が Mythos 級の長時間 Agent を初めて一般開発者に渡した。上の7差分——階層、自律実行、benchmark 断層、コンテキスト仕様、安全フォールバック、料金、Claude Code パラダイム——はすべて同じ方向を指します:

AI コーディングの勝負は「1回の回答が賢いか」から「無人でタスクを完遂できるか」へ。

benchmark の 80.3% vs 69.2% はシグナル。本当の検収は、リポジトリで「一晩任せて、朝の diff がマージ可能だった」かどうか。その前に切れない Cloud Macを——Fable 5 も Opus 4.8 も必要ですが、前者の方がより離せません。

Fable 5 を夜通し回すなら、切れない Mac が要る

Vuncloud Cloud Mac M4:tmux で Claude Code 長走、同機 xcodebuild 検収、DerivedData 永続キャッシュ——長時間 Agent の物理実行層。

Cloud Mac プランを見る · Opus 4.8 深掘り

フィールドノート · Claude

Mythos 級 Agent には Mythos 級の実行環境が要る

Fable 5 · Claude Code · Cloud Mac · 長時間タスク

Opus 4.8 深掘りを読む
限定オファー プランを見る