Vuncloud 部落格
← 返回機房手記專欄

從 Opus 4.8 到 Fable 5,Anthropic 這次升級到底改在哪裡?

Claude Fable 5 · Anthropic 首個公開 Mythos 級 · 長時自主 Agent 不是聊天升級 · Claude benchmark · Claude Code ·約 12 分鐘閱讀

開發者在多螢幕工作站上編寫程式,象徵 Claude Fable 5 長時自主 Agent 與 Claude Code 倉庫級任務
TL;DR · 三行備忘
  • Claude Fable 5 是 Anthropic 首個對公眾開放的 Mythos 級模型(2026 年 6 月 9 日 GA),與受限開放的 Mythos 5 共用同一底層架構
  • 相較 Opus 4.8,最大變化不是「聊得更聰明」,而是能持續數小時乃至數天的非同步自主任務——自己規劃、執行、測試、迭代
  • 對開發者:在 Claude Code 裡把 Fable 5 當成「能過夜的外包資深工程師」;Opus 4.8 仍是日常結對與 Dynamic Workflows 的穩妥預設;兩者都需要不掉線的 Cloud Mac 跑完驗收閉環

2026 年 6 月 9 日,Anthropic 同時發布 Claude Fable 5Claude Mythos 5。前者是 Mythos Preview(4 月僅限 Glasswing 夥伴)之後,第一次對公眾開放的 Mythos 級能力;後者仍是受信夥伴專用、卸除了部分安全分級器。

開發圈的第一反應往往是:「又出新模型了,benchmark 漲了幾分?」——這個問題問錯方向。Fable 5 與 Opus 4.8 的分水嶺,在於工作形態:從「你盯著它改程式」變成「你下班它還在改」。

可用性提示(2026-06-12 更新)

Anthropic 於 6 月 12 日因美國政府出口管制指令,暫時暫停 Claude Fable 5 與 Mythos 5 的全球存取,並稱正努力恢復。本文拆解的能力與整合差異在恢復後仍然適用;目前請以 官方狀態頁 為準,日常開發可繼續使用 Opus 4.8 與其它 Claude 模型。

80.3%
SWE-Bench Pro(Fable/Mythos 5)
69.2%
SWE-Bench Pro(Opus 4.8)
1M
預設上下文視窗(Fable 5)

差異一:模型梯隊——從 Opus 旗艦到 Mythos 級

在 Anthropic 的產品譜系裡,Opus 長期是「最強公開發布」的標竿;Mythos 則是 2026 年推出的更高梯隊,最初以 Mythos Preview 形式只服務 Project Glasswing(網路安全等關鍵基礎設施場景)。

Claude Fable 5 的意義在於:把 Mythos 級能力第一次放進 API、Claude Pro/Max/Team 與 Claude Code 的常規路徑。它與 Claude Mythos 5 共用同一套架構與 benchmark;差別主要在安全殼——Fable 帶分級器,Mythos 面向受信夥伴卸除部分限制。

對整合方而言,這不是換了個 model 字串那麼簡單,而是預設任務時長、失敗模式與帳單結構都變了。

差異二:核心升級是長時自主執行,不是聊天

Anthropic 對 Fable 5 的官方描述反覆出現三個詞:thorough(徹底)proactive(主動)tests its own work(自驗)。翻成白話:

以前模型像「你問一句它答一句」的高級實習生;Fable 5 更像「你交代目標後,它會自己拆任務、寫程式、跑測試、發現失敗再改」的資深工程師。

公開案例裡,Stripe 稱 Fable 5 把數月的遷移工作壓縮到數天,在單日內完成 5000 萬行 Ruby 程式庫的全域遷移;Anthropic 內部團隊用其做長達一週以上的基因組學自主研究。這類任務在 Opus 4.8 時代往往要靠 Dynamic Workflows 手動編排子 Agent,或靠人類反覆「繼續」。

WWDC 2026 後 Siri 變成系統 Agent 類似,變化發生在執行層:模型不再等待下一輪人類 prompt,而是在任務預算內持續推進。

資料視覺化與監控大屏,象徵 Claude Fable 5 長時 Agent 任務的狀態追蹤與 benchmark 觀測

差異三:Agentic benchmark 出現「斷層」

若只看「聊天智商」,Opus 4.8 到 Fable 5 的提升是漸進的;若看Agent 能否獨立完成軟體工程任務,曲線是陡的。Anthropic 公布的對比(Fable 5 與 Mythos 5 在多數項上相差 1–3 個百分點;帶 * 的項因 Fable 安全分級器更接近 Opus 表現):

Benchmark Fable 5 / Mythos 5 Opus 4.8 開發者讀法
SWE-Bench Pro 80.3% 69.2% 真實倉庫級 issue 修復,差距約 11pt
FrontierCode (Diamond) 29.3% (xhigh) 13.4% (xhigh) 可維護性 Agent 程式碼,差距翻倍級
Terminal-Bench 2.1 88.0%* 82.7% 終端多步操作,Claude Code 主戰場
Humanity's Last Exam (tools) 64.5%* 57.9% 跨學科長鏈推理
OSWorld-Verified 85.0% 83.4% 電腦使用,兩者接近

對日常寫 iOS / Swift 的團隊,SWE-Bench Pro + Terminal-Bench 比 HLE 更有參考價值:前者測「改倉庫能不能合併」,後者測「在 shell 裡會不會把自己繞死」——正是 claude CLI 與 xcodebuild 循環的抽象版。

Opus 4.8 在 發布時 強調的是誠實、Effort 與 Dynamic Workflows;Fable 5 則是在單次 Agent 會話內就能啃下更大塊工作,減少你手寫編排腳本的次數。

差異四:1M 上下文與 128k 輸出

Fable 5 / Mythos 5 預設提供 100 萬 token 上下文,單次最高 128k 輸出 token。對長時 Agent 這意味著:

  • 可以把整倉 README、架構文件、CI 日誌片段一次性塞進工作記憶
  • 配合 memory toolcompaction,中間態不必全部擠進對話視窗
  • Anthropic 稱:在檔案型記憶加持下,Fable 5 的長上下文任務收益是 Opus 4.8 的約三倍

Opus 4.8 已支援長上下文與 adaptive thinking,但 Fable 5 把「長」當作預設 Agent 假設而非付費加購項。遷移時需注意:thinking: {"type": "disabled"} 在 Fable 5 上不支援,adaptive thinking 始終開啟,靠 effort 調深度。

差異五:安全分級器與 Opus 4.8 回退

這是 Fable 5 與 Mythos 5 同名不同命的核心:能力相同,安全殼不同。

Fable 5 對網路安全、生物、化學、蒸餾(distillation)等高風險查詢部署獨立安全分級器。觸發時 API 回傳 HTTP 200,但 stop_reason: "refusal",並標明是哪類分級器拒絕——不是傳統意義上的 4xx 錯誤。整合方必須實作三件事(官方文件):

  1. 拒絕處理:解析 refusal,勿當作成功輸出
  2. Fallback:server-side fallbacks 參數、SDK middleware 或手動重試到 claude-opus-4-8
  3. 計費:拒絕且未產生輸出不計費;fallback 有 prompt-cache 抵扣,避免付雙倍快取費

因此在 ExploitBench、BioMysteryBench 等帶 * 的 benchmark 上,Fable 5 分數更接近 Opus 4.8——不是模型變弱,而是公開版主動不讓它答。Mythos 5 在受信場景下才展現完整能力(例如 ExploitBench Cap% 約 78% 對 Opus 4.8 的 40%)。

另有一條營運約束:Mythos 級流量保留 30 天用於信任與安全,不適用零資料保留(ZDR)協議——企業合規評審時要單獨過一遍。

差異六:定價翻倍與計費新規則

Fable 5 定價為輸入 $10 / 百萬 token,輸出 $50 / 百萬 token——約為 Opus 4.8($5 / $25)的兩倍,但不到 Mythos Preview($25 / $125)的一半。

價格本身是一種「任務篩選器」:適合值得跑數小時的遷移、稽核、全倉測試修復;不適合高頻短問答(那時用 Opus 4.8 Fast 或 Sonnet 更合理)。

訂閱策略上,Anthropic 曾宣布 6 月 9–22 日 Pro/Max/Team 等方案免費包含 Fable 5,6 月 23 日起改為消耗 credits——說明官方也把 Fable 當作溢價算力而非預設聊天模型。

整合檢查清單
  • CI / Agent 腳本是否處理 stop_reason: refusal
  • 是否配置 fallback 到 claude-opus-4-8
  • 帳單告警是否按任務時長而非請求次數設定
  • 敏感客戶是否接受 30 天 Mythos 級資料保留政策

差異七:Claude Code 工作流範式切換

對絕大多數開發者,Fable 5 的入口不是 claude.ai 網頁,而是 Claude Code——終端裡的倉庫級 Agent。與 Opus 4.8 時代相比,工作流應這樣重排:

環節 Opus 4.8 習慣 Fable 5 習慣
任務粒度 單檔 / 單模組 / 一次 PR 跨目錄遷移、多日驗收、自循環測試
編排 Dynamic Workflows 手寫子 Agent 模型內建長鏈 + task budgets(beta)
思考模式 可選 adaptive / 關閉 thinking 僅 adaptive;raw CoT 不回傳
記憶 主要依賴會話上下文 memory tool + 檔案型長期記憶
人類角色 逐步 review diff 定目標、定門禁、合併前驗收

在 Cloud Mac 上的推薦起手式:

tmux + Claude Code · Fable 5 長跑
cd ~/work/your-ios-app
tmux new -s fable-migration

claude
# 會話內(以你安裝的版本為準):
#   /model  → claude-fable-5
#   /effort → xhigh(大遷移)
# 範例任務 prompt:
# 「在 agent/fable-checkout 分支上,將 Checkout 模組同步 API 改為 async/await。
#  先出計畫,確認後自主執行;每階段跑 swift test --filter CheckoutTests;
#  全部通過後輸出 git diff --stat。不要 push。」

# Ctrl+B D 分離;筆電可關機

iOS CI 快取優化xcodebuild 提速 同一邏輯:Fable 5 會反覆打同一套建置,DerivedData / Pods 有固定「家」比裸跑 GitHub-hosted macOS 更省時間與額度。

該選 Fable 5 還是 Opus 4.8?

不必二選一,按任務時長與風險選模型:

  • 選 Fable 5:全倉遷移、跨模組一致性重構、需要模型自己跑測試並修的多日任務;預算按「工程師人天」估,不按「聊天條數」估
  • 選 Opus 4.8:日常結對、Dynamic Workflows 試點、安全/生物相關且可能被 Fable 拒絕的主題(或主動 fallback 後的穩定路徑)、成本敏感的高頻呼叫
  • 選 Cursor 本地 + 遠端組合:IDE 內小改仍用 Cursor;Fable 5 在 Cloud Mac 上啃大活——與 Opus 4.8 時代分工相同,只是「大活」的定義變大了

為什麼必須落在 Cloud Mac 上跑?

Fable 5 的「長時自主」對執行環境的要求,和 Opus 4.8 跑 Dynamic Workflows 一樣硬,甚至更高:

  • 會話不能斷:小時級、天級任務經不起筆電睡眠;tmux + 7×24 Cloud Mac 是基線
  • 真 macOS 工具鏈xcodebuild、Simulator、SPM / CocoaPods 只能在 Mac 上驗收 Agent 的 Swift 改動
  • 磁碟與記憶體:1M 上下文 + 並行測試會吃記憶體;M4 24GB 與大碟在 monorepo 上不是奢侈
  • 與 CI 同機:Agent 改完 → 同機 warm build → 失敗日誌回灌 Agent,縮短回饋環

模型 ID 將來可能從 claude-fable-5 換成下一代 Mythos,但主機與工作流不用推倒重來——這正是 Cloud Mac 作為「Agent 物理層」的價值。

常見問題(FAQ)

和 Opus 4.8 最大的區別?

長時自主 Agent 能力。聊天差距有限;倉庫級、多日、自驗任務差距巨大。

Fable 5 和 Mythos 5 一樣強嗎?

底層一樣。Fable 多一層安全分級器,部分場景回退 Opus 4.8;Mythos 5 僅 Glasswing 等受信路徑可用。

API 模型 ID?

claude-fable-5(公開)、claude-mythos-5(受限)。

現在能用嗎?

2026 年 6 月 12 日起曾全球暫停,恢復時間以 Anthropic 公告為準。寫作本文時(6 月 15 日)請查官方狀態;Opus 4.8 與其它模型不受影響。

和 Cursor 衝突嗎?

不衝突。本地 IDE + 遠端 Claude Code 是常見組合;Fable 5 負責「過夜的大活」。

結語

這次升級到底改在哪裡?一句話:Anthropic 把 Mythos 級長時 Agent 第一次交給了普通開發者。上面 7 個關鍵差異——梯隊、自主執行、benchmark 斷層、上下文規格、安全回退、定價與 Claude Code 範式——都指向同一件事:

AI 編碼的競爭,從「誰單次回答更聰明」轉向「誰能在無人值守下把任務做完」。

benchmark 上的 80.3% vs 69.2% 是信號;你倉庫裡那次「交給它一整夜、早上看 diff 能合併」才是驗收。在那之前,先備好一塊不掉線的 Cloud Mac——Fable 5 和 Opus 4.8 都需要,只是前者更離不開。

Fable 5 過夜跑遷移,得有一塊不掉線的 Mac

Vuncloud Cloud Mac M4:tmux 長跑 Claude Code、同機 xcodebuild 驗收、DerivedData 持久快取——長時 Agent 的物理執行層。

查看 Cloud Mac 方案 · Opus 4.8 深度拆解

機房手記 · Claude

Mythos 級 Agent,需要 Mythos 級執行環境

Fable 5 · Claude Code · Cloud Mac · 長時任務

讀 Opus 4.8 拆解
限時優惠 點擊查看方案