Claude Fable 5 和 Opus 4.8 最大的區別是什麼？

Fable 5 是 Mythos 級模型，核心升級不是聊天品質，而是能持續數小時乃至數天的長時自主 Agent 任務。Opus 4.8 仍是旗艦對話/編碼模型，擅長單次會話內的複雜推理與 Dynamic Workflows。

Fable 5 和 Mythos 5 能力一樣嗎？

底層架構與能力相同。Fable 5 面向公眾開放，附帶安全分級器，部分請求會回退到 Opus 4.8。Mythos 5 僅透過 Project Glasswing 向受信夥伴開放。

Claude Fable 5 的 API 模型 ID 是什麼？

claude-fable-5。Mythos 5 為 claude-mythos-5。定價均為輸入約 10 美元/百萬 token、輸出約 50 美元/百萬 token。

SWE-Bench Pro 上 Fable 5 比 Opus 4.8 高多少？

Anthropic 公布約 80.3% 對 69.2%，差距約 11 個百分點。FrontierCode (Diamond) 上差距更大：約 29.3% 對 13.4%。

Claude Code 該用 Fable 5 還是 Opus 4.8？

跨天、跨模組、自驗自修的多日任務選 Fable 5；日常結對與 Dynamic Workflows 試點仍可用 Opus 4.8。Fable 5 在 tmux + Cloud Mac 上長跑更合適。

為什麼 Fable 5 會回退到 Opus 4.8？

Fable 5 內建安全分級器，高風險查詢以 stop_reason: refusal 返回，可配置 fallback 改用 Opus 4.8。被拒絕且未產生輸出的請求不計費。

從 Opus 4.8 到 Fable 5，Anthropic 這次升級到底改在哪裡？

TL;DR · 三行備忘

Claude Fable 5 是 Anthropic 首個對公眾開放的 Mythos 級模型（2026 年 6 月 9 日 GA），與受限開放的 Mythos 5 共用同一底層架構
相較 Opus 4.8，最大變化不是「聊得更聰明」，而是能持續數小時乃至數天的非同步自主任務——自己規劃、執行、測試、迭代
對開發者：在 Claude Code 裡把 Fable 5 當成「能過夜的外包資深工程師」；Opus 4.8 仍是日常結對與 Dynamic Workflows 的穩妥預設；兩者都需要不掉線的 Cloud Mac 跑完驗收閉環

2026 年 6 月 9 日，Anthropic 同時發布 Claude Fable 5 與 Claude Mythos 5。前者是 Mythos Preview（4 月僅限 Glasswing 夥伴）之後，第一次對公眾開放的 Mythos 級能力；後者仍是受信夥伴專用、卸除了部分安全分級器。

開發圈的第一反應往往是：「又出新模型了，benchmark 漲了幾分？」——這個問題問錯方向。Fable 5 與 Opus 4.8 的分水嶺，在於工作形態：從「你盯著它改程式」變成「你下班它還在改」。

可用性提示（2026-06-12 更新）

Anthropic 於 6 月 12 日因美國政府出口管制指令，暫時暫停 Claude Fable 5 與 Mythos 5 的全球存取，並稱正努力恢復。本文拆解的能力與整合差異在恢復後仍然適用；目前請以官方狀態頁為準，日常開發可繼續使用 Opus 4.8 與其它 Claude 模型。

80.3%

SWE-Bench Pro（Fable/Mythos 5）

69.2%

SWE-Bench Pro（Opus 4.8）

預設上下文視窗（Fable 5）

差異一：模型梯隊——從 Opus 旗艦到 Mythos 級

在 Anthropic 的產品譜系裡，Opus 長期是「最強公開發布」的標竿；Mythos 則是 2026 年推出的更高梯隊，最初以 Mythos Preview 形式只服務 Project Glasswing（網路安全等關鍵基礎設施場景）。

Claude Fable 5 的意義在於：把 Mythos 級能力第一次放進 API、Claude Pro/Max/Team 與 Claude Code 的常規路徑。它與 Claude Mythos 5 共用同一套架構與 benchmark；差別主要在安全殼——Fable 帶分級器，Mythos 面向受信夥伴卸除部分限制。

對整合方而言，這不是換了個 model 字串那麼簡單，而是預設任務時長、失敗模式與帳單結構都變了。

差異二：核心升級是長時自主執行，不是聊天

Anthropic 對 Fable 5 的官方描述反覆出現三個詞：thorough（徹底）、proactive（主動）、tests its own work（自驗）。翻成白話：

以前模型像「你問一句它答一句」的高級實習生；Fable 5 更像「你交代目標後，它會自己拆任務、寫程式、跑測試、發現失敗再改」的資深工程師。

公開案例裡，Stripe 稱 Fable 5 把數月的遷移工作壓縮到數天，在單日內完成 5000 萬行 Ruby 程式庫的全域遷移；Anthropic 內部團隊用其做長達一週以上的基因組學自主研究。這類任務在 Opus 4.8 時代往往要靠 Dynamic Workflows 手動編排子 Agent，或靠人類反覆「繼續」。

與 WWDC 2026 後 Siri 變成系統 Agent 類似，變化發生在執行層：模型不再等待下一輪人類 prompt，而是在任務預算內持續推進。

資料視覺化與監控大屏，象徵 Claude Fable 5 長時 Agent 任務的狀態追蹤與 benchmark 觀測

差異三：Agentic benchmark 出現「斷層」

若只看「聊天智商」，Opus 4.8 到 Fable 5 的提升是漸進的；若看Agent 能否獨立完成軟體工程任務，曲線是陡的。Anthropic 公布的對比（Fable 5 與 Mythos 5 在多數項上相差 1–3 個百分點；帶 * 的項因 Fable 安全分級器更接近 Opus 表現）：

Benchmark	Fable 5 / Mythos 5	Opus 4.8	開發者讀法
SWE-Bench Pro	80.3%	69.2%	真實倉庫級 issue 修復，差距約 11pt
FrontierCode (Diamond)	29.3% (xhigh)	13.4% (xhigh)	可維護性 Agent 程式碼，差距翻倍級
Terminal-Bench 2.1	88.0%*	82.7%	終端多步操作，Claude Code 主戰場
Humanity's Last Exam (tools)	64.5%*	57.9%	跨學科長鏈推理
OSWorld-Verified	85.0%	83.4%	電腦使用，兩者接近

對日常寫 iOS / Swift 的團隊，SWE-Bench Pro + Terminal-Bench 比 HLE 更有參考價值：前者測「改倉庫能不能合併」，後者測「在 shell 裡會不會把自己繞死」——正是 claude CLI 與 xcodebuild 循環的抽象版。

Opus 4.8 在發布時強調的是誠實、Effort 與 Dynamic Workflows；Fable 5 則是在單次 Agent 會話內就能啃下更大塊工作，減少你手寫編排腳本的次數。

差異四：1M 上下文與 128k 輸出

Fable 5 / Mythos 5 預設提供 100 萬 token 上下文，單次最高 128k 輸出 token。對長時 Agent 這意味著：

可以把整倉 README、架構文件、CI 日誌片段一次性塞進工作記憶
配合 memory tool 與 compaction，中間態不必全部擠進對話視窗
Anthropic 稱：在檔案型記憶加持下，Fable 5 的長上下文任務收益是 Opus 4.8 的約三倍

Opus 4.8 已支援長上下文與 adaptive thinking，但 Fable 5 把「長」當作預設 Agent 假設而非付費加購項。遷移時需注意：thinking: {"type": "disabled"} 在 Fable 5 上不支援，adaptive thinking 始終開啟，靠 effort 調深度。

差異五：安全分級器與 Opus 4.8 回退

這是 Fable 5 與 Mythos 5 同名不同命的核心：能力相同，安全殼不同。

Fable 5 對網路安全、生物、化學、蒸餾（distillation）等高風險查詢部署獨立安全分級器。觸發時 API 回傳 HTTP 200，但 stop_reason: "refusal"，並標明是哪類分級器拒絕——不是傳統意義上的 4xx 錯誤。整合方必須實作三件事（官方文件）：

拒絕處理：解析 refusal，勿當作成功輸出
Fallback：server-side fallbacks 參數、SDK middleware 或手動重試到 claude-opus-4-8
計費：拒絕且未產生輸出不計費；fallback 有 prompt-cache 抵扣，避免付雙倍快取費

因此在 ExploitBench、BioMysteryBench 等帶 * 的 benchmark 上，Fable 5 分數更接近 Opus 4.8——不是模型變弱，而是公開版主動不讓它答。Mythos 5 在受信場景下才展現完整能力（例如 ExploitBench Cap% 約 78% 對 Opus 4.8 的 40%）。

另有一條營運約束：Mythos 級流量保留 30 天用於信任與安全，不適用零資料保留（ZDR）協議——企業合規評審時要單獨過一遍。

差異六：定價翻倍與計費新規則

Fable 5 定價為輸入 $10 / 百萬 token，輸出 $50 / 百萬 token——約為 Opus 4.8（$5 / $25）的兩倍，但不到 Mythos Preview（$25 / $125）的一半。

價格本身是一種「任務篩選器」：適合值得跑數小時的遷移、稽核、全倉測試修復；不適合高頻短問答（那時用 Opus 4.8 Fast 或 Sonnet 更合理）。

訂閱策略上，Anthropic 曾宣布 6 月 9–22 日 Pro/Max/Team 等方案免費包含 Fable 5，6 月 23 日起改為消耗 credits——說明官方也把 Fable 當作溢價算力而非預設聊天模型。

整合檢查清單

CI / Agent 腳本是否處理 stop_reason: refusal
是否配置 fallback 到 claude-opus-4-8
帳單告警是否按任務時長而非請求次數設定
敏感客戶是否接受 30 天 Mythos 級資料保留政策

差異七：Claude Code 工作流範式切換

對絕大多數開發者，Fable 5 的入口不是 claude.ai 網頁，而是 Claude Code——終端裡的倉庫級 Agent。與 Opus 4.8 時代相比，工作流應這樣重排：

環節	Opus 4.8 習慣	Fable 5 習慣
任務粒度	單檔 / 單模組 / 一次 PR	跨目錄遷移、多日驗收、自循環測試
編排	Dynamic Workflows 手寫子 Agent	模型內建長鏈 + task budgets（beta）
思考模式	可選 adaptive / 關閉 thinking	僅 adaptive；raw CoT 不回傳
記憶	主要依賴會話上下文	memory tool + 檔案型長期記憶
人類角色	逐步 review diff	定目標、定門禁、合併前驗收

在 Cloud Mac 上的推薦起手式：

tmux + Claude Code · Fable 5 長跑

cd ~/work/your-ios-app
tmux new -s fable-migration

claude
# 會話內（以你安裝的版本為準）：
#   /model  → claude-fable-5
#   /effort → xhigh（大遷移）
# 範例任務 prompt：
# 「在 agent/fable-checkout 分支上，將 Checkout 模組同步 API 改為 async/await。
#  先出計畫，確認後自主執行；每階段跑 swift test --filter CheckoutTests；
#  全部通過後輸出 git diff --stat。不要 push。」

# Ctrl+B D 分離；筆電可關機

與 iOS CI 快取優化、xcodebuild 提速同一邏輯：Fable 5 會反覆打同一套建置，DerivedData / Pods 有固定「家」比裸跑 GitHub-hosted macOS 更省時間與額度。

該選 Fable 5 還是 Opus 4.8？

不必二選一，按任務時長與風險選模型：

選 Fable 5：全倉遷移、跨模組一致性重構、需要模型自己跑測試並修的多日任務；預算按「工程師人天」估，不按「聊天條數」估
選 Opus 4.8：日常結對、Dynamic Workflows 試點、安全/生物相關且可能被 Fable 拒絕的主題（或主動 fallback 後的穩定路徑）、成本敏感的高頻呼叫
選 Cursor 本地 + 遠端組合：IDE 內小改仍用 Cursor；Fable 5 在 Cloud Mac 上啃大活——與 Opus 4.8 時代分工相同，只是「大活」的定義變大了

為什麼必須落在 Cloud Mac 上跑？

Fable 5 的「長時自主」對執行環境的要求，和 Opus 4.8 跑 Dynamic Workflows 一樣硬，甚至更高：

會話不能斷：小時級、天級任務經不起筆電睡眠；tmux + 7×24 Cloud Mac 是基線
真 macOS 工具鏈：xcodebuild、Simulator、SPM / CocoaPods 只能在 Mac 上驗收 Agent 的 Swift 改動
磁碟與記憶體：1M 上下文 + 並行測試會吃記憶體；M4 24GB 與大碟在 monorepo 上不是奢侈
與 CI 同機：Agent 改完 → 同機 warm build → 失敗日誌回灌 Agent，縮短回饋環

模型 ID 將來可能從 claude-fable-5 換成下一代 Mythos，但主機與工作流不用推倒重來——這正是 Cloud Mac 作為「Agent 物理層」的價值。

常見問題（FAQ）

和 Opus 4.8 最大的區別？

長時自主 Agent 能力。聊天差距有限；倉庫級、多日、自驗任務差距巨大。

Fable 5 和 Mythos 5 一樣強嗎？

底層一樣。Fable 多一層安全分級器，部分場景回退 Opus 4.8；Mythos 5 僅 Glasswing 等受信路徑可用。

API 模型 ID？

claude-fable-5（公開）、claude-mythos-5（受限）。

現在能用嗎？

2026 年 6 月 12 日起曾全球暫停，恢復時間以 Anthropic 公告為準。寫作本文時（6 月 15 日）請查官方狀態；Opus 4.8 與其它模型不受影響。

和 Cursor 衝突嗎？

不衝突。本地 IDE + 遠端 Claude Code 是常見組合；Fable 5 負責「過夜的大活」。

結語

這次升級到底改在哪裡？一句話：Anthropic 把 Mythos 級長時 Agent 第一次交給了普通開發者。上面 7 個關鍵差異——梯隊、自主執行、benchmark 斷層、上下文規格、安全回退、定價與 Claude Code 範式——都指向同一件事：

AI 編碼的競爭，從「誰單次回答更聰明」轉向「誰能在無人值守下把任務做完」。

benchmark 上的 80.3% vs 69.2% 是信號；你倉庫裡那次「交給它一整夜、早上看 diff 能合併」才是驗收。在那之前，先備好一塊不掉線的 Cloud Mac——Fable 5 和 Opus 4.8 都需要，只是前者更離不開。