- Claude Fable 5 是 Anthropic 首個對公眾開放的 Mythos 級模型(2026 年 6 月 9 日 GA),與受限開放的 Mythos 5 共用同一底層架構
- 相較 Opus 4.8,最大變化不是「聊得更聰明」,而是能持續數小時乃至數天的非同步自主任務——自己規劃、執行、測試、迭代
- 對開發者:在 Claude Code 裡把 Fable 5 當成「能過夜的外包資深工程師」;Opus 4.8 仍是日常結對與 Dynamic Workflows 的穩妥預設;兩者都需要不掉線的 Cloud Mac 跑完驗收閉環
2026 年 6 月 9 日,Anthropic 同時發布 Claude Fable 5 與 Claude Mythos 5。前者是 Mythos Preview(4 月僅限 Glasswing 夥伴)之後,第一次對公眾開放的 Mythos 級能力;後者仍是受信夥伴專用、卸除了部分安全分級器。
開發圈的第一反應往往是:「又出新模型了,benchmark 漲了幾分?」——這個問題問錯方向。Fable 5 與 Opus 4.8 的分水嶺,在於工作形態:從「你盯著它改程式」變成「你下班它還在改」。
Anthropic 於 6 月 12 日因美國政府出口管制指令,暫時暫停 Claude Fable 5 與 Mythos 5 的全球存取,並稱正努力恢復。本文拆解的能力與整合差異在恢復後仍然適用;目前請以 官方狀態頁 為準,日常開發可繼續使用 Opus 4.8 與其它 Claude 模型。
差異一:模型梯隊——從 Opus 旗艦到 Mythos 級
在 Anthropic 的產品譜系裡,Opus 長期是「最強公開發布」的標竿;Mythos 則是 2026 年推出的更高梯隊,最初以 Mythos Preview 形式只服務 Project Glasswing(網路安全等關鍵基礎設施場景)。
Claude Fable 5 的意義在於:把 Mythos 級能力第一次放進 API、Claude Pro/Max/Team 與 Claude Code 的常規路徑。它與 Claude Mythos 5 共用同一套架構與 benchmark;差別主要在安全殼——Fable 帶分級器,Mythos 面向受信夥伴卸除部分限制。
對整合方而言,這不是換了個 model 字串那麼簡單,而是預設任務時長、失敗模式與帳單結構都變了。
差異二:核心升級是長時自主執行,不是聊天
Anthropic 對 Fable 5 的官方描述反覆出現三個詞:thorough(徹底)、proactive(主動)、tests its own work(自驗)。翻成白話:
以前模型像「你問一句它答一句」的高級實習生;Fable 5 更像「你交代目標後,它會自己拆任務、寫程式、跑測試、發現失敗再改」的資深工程師。
公開案例裡,Stripe 稱 Fable 5 把數月的遷移工作壓縮到數天,在單日內完成 5000 萬行 Ruby 程式庫的全域遷移;Anthropic 內部團隊用其做長達一週以上的基因組學自主研究。這類任務在 Opus 4.8 時代往往要靠 Dynamic Workflows 手動編排子 Agent,或靠人類反覆「繼續」。
與 WWDC 2026 後 Siri 變成系統 Agent 類似,變化發生在執行層:模型不再等待下一輪人類 prompt,而是在任務預算內持續推進。
差異三:Agentic benchmark 出現「斷層」
若只看「聊天智商」,Opus 4.8 到 Fable 5 的提升是漸進的;若看Agent 能否獨立完成軟體工程任務,曲線是陡的。Anthropic 公布的對比(Fable 5 與 Mythos 5 在多數項上相差 1–3 個百分點;帶 * 的項因 Fable 安全分級器更接近 Opus 表現):
| Benchmark | Fable 5 / Mythos 5 | Opus 4.8 | 開發者讀法 |
|---|---|---|---|
| SWE-Bench Pro | 80.3% | 69.2% | 真實倉庫級 issue 修復,差距約 11pt |
| FrontierCode (Diamond) | 29.3% (xhigh) | 13.4% (xhigh) | 可維護性 Agent 程式碼,差距翻倍級 |
| Terminal-Bench 2.1 | 88.0%* | 82.7% | 終端多步操作,Claude Code 主戰場 |
| Humanity's Last Exam (tools) | 64.5%* | 57.9% | 跨學科長鏈推理 |
| OSWorld-Verified | 85.0% | 83.4% | 電腦使用,兩者接近 |
對日常寫 iOS / Swift 的團隊,SWE-Bench Pro + Terminal-Bench 比 HLE 更有參考價值:前者測「改倉庫能不能合併」,後者測「在 shell 裡會不會把自己繞死」——正是 claude CLI 與 xcodebuild 循環的抽象版。
Opus 4.8 在 發布時 強調的是誠實、Effort 與 Dynamic Workflows;Fable 5 則是在單次 Agent 會話內就能啃下更大塊工作,減少你手寫編排腳本的次數。
差異四:1M 上下文與 128k 輸出
Fable 5 / Mythos 5 預設提供 100 萬 token 上下文,單次最高 128k 輸出 token。對長時 Agent 這意味著:
- 可以把整倉 README、架構文件、CI 日誌片段一次性塞進工作記憶
- 配合 memory tool 與 compaction,中間態不必全部擠進對話視窗
- Anthropic 稱:在檔案型記憶加持下,Fable 5 的長上下文任務收益是 Opus 4.8 的約三倍
Opus 4.8 已支援長上下文與 adaptive thinking,但 Fable 5 把「長」當作預設 Agent 假設而非付費加購項。遷移時需注意:thinking: {"type": "disabled"} 在 Fable 5 上不支援,adaptive thinking 始終開啟,靠 effort 調深度。
差異五:安全分級器與 Opus 4.8 回退
這是 Fable 5 與 Mythos 5 同名不同命的核心:能力相同,安全殼不同。
Fable 5 對網路安全、生物、化學、蒸餾(distillation)等高風險查詢部署獨立安全分級器。觸發時 API 回傳 HTTP 200,但 stop_reason: "refusal",並標明是哪類分級器拒絕——不是傳統意義上的 4xx 錯誤。整合方必須實作三件事(官方文件):
- 拒絕處理:解析 refusal,勿當作成功輸出
- Fallback:server-side
fallbacks參數、SDK middleware 或手動重試到claude-opus-4-8 - 計費:拒絕且未產生輸出不計費;fallback 有 prompt-cache 抵扣,避免付雙倍快取費
因此在 ExploitBench、BioMysteryBench 等帶 * 的 benchmark 上,Fable 5 分數更接近 Opus 4.8——不是模型變弱,而是公開版主動不讓它答。Mythos 5 在受信場景下才展現完整能力(例如 ExploitBench Cap% 約 78% 對 Opus 4.8 的 40%)。
另有一條營運約束:Mythos 級流量保留 30 天用於信任與安全,不適用零資料保留(ZDR)協議——企業合規評審時要單獨過一遍。
差異六:定價翻倍與計費新規則
Fable 5 定價為輸入 $10 / 百萬 token,輸出 $50 / 百萬 token——約為 Opus 4.8($5 / $25)的兩倍,但不到 Mythos Preview($25 / $125)的一半。
價格本身是一種「任務篩選器」:適合值得跑數小時的遷移、稽核、全倉測試修復;不適合高頻短問答(那時用 Opus 4.8 Fast 或 Sonnet 更合理)。
訂閱策略上,Anthropic 曾宣布 6 月 9–22 日 Pro/Max/Team 等方案免費包含 Fable 5,6 月 23 日起改為消耗 credits——說明官方也把 Fable 當作溢價算力而非預設聊天模型。
- CI / Agent 腳本是否處理
stop_reason: refusal - 是否配置 fallback 到
claude-opus-4-8 - 帳單告警是否按任務時長而非請求次數設定
- 敏感客戶是否接受 30 天 Mythos 級資料保留政策
差異七:Claude Code 工作流範式切換
對絕大多數開發者,Fable 5 的入口不是 claude.ai 網頁,而是 Claude Code——終端裡的倉庫級 Agent。與 Opus 4.8 時代相比,工作流應這樣重排:
| 環節 | Opus 4.8 習慣 | Fable 5 習慣 |
|---|---|---|
| 任務粒度 | 單檔 / 單模組 / 一次 PR | 跨目錄遷移、多日驗收、自循環測試 |
| 編排 | Dynamic Workflows 手寫子 Agent | 模型內建長鏈 + task budgets(beta) |
| 思考模式 | 可選 adaptive / 關閉 thinking | 僅 adaptive;raw CoT 不回傳 |
| 記憶 | 主要依賴會話上下文 | memory tool + 檔案型長期記憶 |
| 人類角色 | 逐步 review diff | 定目標、定門禁、合併前驗收 |
在 Cloud Mac 上的推薦起手式:
cd ~/work/your-ios-app tmux new -s fable-migration claude # 會話內(以你安裝的版本為準): # /model → claude-fable-5 # /effort → xhigh(大遷移) # 範例任務 prompt: # 「在 agent/fable-checkout 分支上,將 Checkout 模組同步 API 改為 async/await。 # 先出計畫,確認後自主執行;每階段跑 swift test --filter CheckoutTests; # 全部通過後輸出 git diff --stat。不要 push。」 # Ctrl+B D 分離;筆電可關機
與 iOS CI 快取優化、xcodebuild 提速 同一邏輯:Fable 5 會反覆打同一套建置,DerivedData / Pods 有固定「家」比裸跑 GitHub-hosted macOS 更省時間與額度。
該選 Fable 5 還是 Opus 4.8?
不必二選一,按任務時長與風險選模型:
- 選 Fable 5:全倉遷移、跨模組一致性重構、需要模型自己跑測試並修的多日任務;預算按「工程師人天」估,不按「聊天條數」估
- 選 Opus 4.8:日常結對、Dynamic Workflows 試點、安全/生物相關且可能被 Fable 拒絕的主題(或主動 fallback 後的穩定路徑)、成本敏感的高頻呼叫
- 選 Cursor 本地 + 遠端組合:IDE 內小改仍用 Cursor;Fable 5 在 Cloud Mac 上啃大活——與 Opus 4.8 時代分工相同,只是「大活」的定義變大了
為什麼必須落在 Cloud Mac 上跑?
Fable 5 的「長時自主」對執行環境的要求,和 Opus 4.8 跑 Dynamic Workflows 一樣硬,甚至更高:
- 會話不能斷:小時級、天級任務經不起筆電睡眠;
tmux+ 7×24 Cloud Mac 是基線 - 真 macOS 工具鏈:
xcodebuild、Simulator、SPM / CocoaPods 只能在 Mac 上驗收 Agent 的 Swift 改動 - 磁碟與記憶體:1M 上下文 + 並行測試會吃記憶體;M4 24GB 與大碟在 monorepo 上不是奢侈
- 與 CI 同機:Agent 改完 → 同機 warm build → 失敗日誌回灌 Agent,縮短回饋環
模型 ID 將來可能從 claude-fable-5 換成下一代 Mythos,但主機與工作流不用推倒重來——這正是 Cloud Mac 作為「Agent 物理層」的價值。
常見問題(FAQ)
和 Opus 4.8 最大的區別?
長時自主 Agent 能力。聊天差距有限;倉庫級、多日、自驗任務差距巨大。
Fable 5 和 Mythos 5 一樣強嗎?
底層一樣。Fable 多一層安全分級器,部分場景回退 Opus 4.8;Mythos 5 僅 Glasswing 等受信路徑可用。
API 模型 ID?
claude-fable-5(公開)、claude-mythos-5(受限)。
現在能用嗎?
2026 年 6 月 12 日起曾全球暫停,恢復時間以 Anthropic 公告為準。寫作本文時(6 月 15 日)請查官方狀態;Opus 4.8 與其它模型不受影響。
和 Cursor 衝突嗎?
不衝突。本地 IDE + 遠端 Claude Code 是常見組合;Fable 5 負責「過夜的大活」。
結語
這次升級到底改在哪裡?一句話:Anthropic 把 Mythos 級長時 Agent 第一次交給了普通開發者。上面 7 個關鍵差異——梯隊、自主執行、benchmark 斷層、上下文規格、安全回退、定價與 Claude Code 範式——都指向同一件事:
AI 編碼的競爭,從「誰單次回答更聰明」轉向「誰能在無人值守下把任務做完」。
benchmark 上的 80.3% vs 69.2% 是信號;你倉庫裡那次「交給它一整夜、早上看 diff 能合併」才是驗收。在那之前,先備好一塊不掉線的 Cloud Mac——Fable 5 和 Opus 4.8 都需要,只是前者更離不開。
Fable 5 過夜跑遷移,得有一塊不掉線的 Mac
Vuncloud Cloud Mac M4:tmux 長跑 Claude Code、同機 xcodebuild 驗收、DerivedData 持久快取——長時 Agent 的物理執行層。