Vuncloud Блог
← Назад к полевым заметкам

От Opus 4.8 к Fable 5: что на самом деле изменилось в апгрейде Anthropic

Claude Fable 5 · первый публичный Mythos от Anthropic · долгие агенты, не «умнее чат» · Claude benchmark · Claude Code ·~12 мин чтения

Разработчик за мультимониторной станцией—долгие агенты Claude Fable 5 и задачи репозитория в Claude Code
TL;DR · три строки
  • Claude Fable 5первая публично доступная модель уровня Mythos от Anthropic (GA 9 июня 2026), та же архитектура, что у ограниченного Mythos 5
  • Относительно Opus 4.8 сдвиг не в «умнее болтать», а в асинхронную автономию на часы и дни — планировать, выполнять, тестировать, итерировать без постоянного «продолжай»
  • Для разработчиков: Fable 5 в Claude Code как «сеньор, который остаётся на ночь»; Opus 4.8 — надёжный дефолт для парного кодинга и Dynamic Workflows; обоим нужен Cloud Mac, который не засыпает

9 июня 2026 Anthropic одновременно выпустил Claude Fable 5 и Claude Mythos 5. Fable — первые возможности уровня Mythos для широкой аудитории после Mythos Preview (апрель, только партнёры Project Glasswing); Mythos 5 остаётся партнёрским путём с отключённой частью классификаторов безопасности.

Первая реакция в dev-среде: «новая модель — сколько пунктов в benchmark?» — вопрос мимо сути. Водораздел между Fable 5 и Opus 4.8 — в форме работы: от «вы смотрите, как он меняет код» к «вы ушли — он продолжает».

Доступность (обновление 12.06.2026)

12 июня Anthropic временно приостановил глобальный доступ к Claude Fable 5 и Mythos 5 из-за американских экспортных ограничений и работает над восстановлением. Описанные ниже возможности и отличия интеграции останутся актуальны после снятия блокировки; сейчас смотрите официальную страницу статуса. В повседневной работе Opus 4.8 и другие модели Claude доступны.

80,3 %
SWE-Bench Pro (Fable/Mythos 5)
69,2 %
SWE-Bench Pro (Opus 4.8)
1 M
Контекст по умолчанию (Fable 5)

Отличие 1: уровень модели — от флагмана Opus к Mythos

В линейке Anthropic Opus долго был «самым сильным публичным»; Mythos — ступень выше, введённая в 2026 году, сначала как Mythos Preview только для Project Glasswing (кибербезопасность, критическая инфраструктура).

Claude Fable 5 впервые выводит возможности уровня Mythos в обычный путь: API, Claude Pro/Max/Team и Claude Code. Та же архитектура и бенчмарки, что у Claude Mythos 5; разница в оболочке безопасности — Fable с классификаторами, Mythos для доверенных партнёров с меньшими ограничениями.

Для интеграторов это больше, чем новый model-строка: меняются типичная длительность задачи, паттерны сбоев и структура счёта.

Отличие 2: долгая автономия, а не качество чата

В официальном описании Fable 5 три слова повторяются постоянно: thorough, proactive, tests its own work. На языке разработчиков:

Раньше модель была как хороший стажёр по запросу; Fable 5 — как сеньор, которому вы даёте цель: он сам декомпозирует, пишет код, гоняет тесты и чинит, когда что-то падает.

Публичные кейсы: Stripe сообщает, что Fable 5 сжал месяцы миграции до дней — глобальная миграция Ruby-базы в 50 млн строк за один день; внутренние команды Anthropic используют его для автономных геномных исследований больше недели. На Opus 4.8 для этого часто нужны вручную собранные Dynamic Workflows или бесконечное человеческое «продолжай».

Как и у Siri как системного агента после WWDC 2026, сдвиг в слое исполнения: модель не ждёт следующий prompt, а двигается в рамках бюджета задачи.

Дашборд мониторинга — долгие agent-задачи и наблюдение за бенчмарками Claude Fable 5

Отличие 3: «разрыв» в agentic-бенчмарках

По чистой «чатовой» интеллектуальности скачок Opus 4.8 → Fable 5 плавный; по автономной инженерной работе кривая резкая. Сравнение Anthropic (Fable 5 и Mythos 5 обычно в пределах 1–3 п.п.; с * ближе к Opus из-за классификаторов Fable):

Benchmark Fable 5 / Mythos 5 Opus 4.8 Как читать dev'у
SWE-Bench Pro 80,3 % 69,2 % Реальные issue в репо — разрыв ~11 п.п.
FrontierCode (Diamond) 29,3 % (xhigh) 13,4 % (xhigh) Поддерживаемый agent-код — почти удвоение
Terminal-Bench 2.1 88,0 %* 82,7 % Многошаговый терминал — поле Claude Code
Humanity's Last Exam (tools) 64,5 %* 57,9 % Длинные цепочки рассуждений
OSWorld-Verified 85,0 % 83,4 % Computer use — оба близко

Для iOS/Swift-команд важнее SWE-Bench Pro + Terminal-Bench, чем HLE: «PR смержится?» vs «агент запутается в shell?» — абстракция циклов claude CLI и xcodebuild.

Opus 4.8 при релизе делал ставку на честность, Effort и Dynamic Workflows; Fable 5 за один agent-сеанс берёт крупнее куски — меньше ручной оркестрации.

Отличие 4: контекст 1M и вывод 128k

Fable 5 / Mythos 5 по умолчанию дают 1 миллион токенов контекста и до 128k токенов вывода за ответ. Для долгих агентов это значит:

  • README всего репо, архитектурные доки и фрагменты CI-логов — в одной рабочей памяти
  • С memory tool и compaction не нужно тащить каждый промежуточный state в чат
  • Anthropic: с файловой памятью выгода длинного контекста примерно втрое выше, чем у Opus 4.8

У Opus 4.8 уже был длинный контекст и adaptive thinking — Fable 5 считает «длинным» дефолтное допущение агента, а не платную опцию. Миграция: thinking: {"type": "disabled"} на Fable 5 не поддерживается; adaptive thinking всегда включён, глубина через effort.

Отличие 5: классификаторы безопасности и fallback на Opus 4.8

Здесь Fable 5 и Mythos 5 расходятся при равной мощности: та же способность, разная оболочка.

Fable 5 ставит отдельные классификаторы безопасности на кибербезопасность, биологию, химию и дистилляцию. При срабатывании: HTTP 200, но stop_reason: "refusal" с типом классификатора — не классическая 4xx-ошибка. Интеграторам нужно три вещи (документация):

  1. Обработать refusal — не считать успешным выводом
  2. Fallback — server-side fallbacks, SDK-middleware или ручной retry на claude-opus-4-8
  3. Биллинг — refusal без output не тарифицируется; fallback с зачётом prompt-cache, без двойной оплаты кэша

Поэтому на ExploitBench, BioMysteryBench и т.п. с * баллы Fable 5 ближе к Opus 4.8 — не слабее, а публичной версии запрещено отвечать. Mythos 5 показывает полную ширину в доверенных сценариях (напр. ExploitBench Cap% ~78 % vs Opus 4.8 ~40 %).

Операционно: трафик уровня Mythos хранится 30 дней для trust & safety — без zero-data retention (ZDR). Compliance-ревью отдельно.

Отличие 6: удвоенные цены и новые правила биллинга

Fable 5: ввод $10 / млн токенов, вывод $50 / млн — примерно вдвое дороже Opus 4.8 (5 / 25), но дешевле Mythos Preview (25 / 125).

Цена фильтрует задачи: уместна для многочасовых миграций, аудитов, test-fix по всему репо; не для коротких частых Q&A (там Opus 4.8 Fast или Sonnet).

Подписка: 9–22 июня Fable 5 был бесплатно включён в Pro/Max/Team; с 23 июня — расход credits. Fable как премиум-вычисления, не дефолтная чат-модель.

Чеклист интеграции
  • CI/agent-скрипты ловят stop_reason: refusal?
  • Настроен fallback на claude-opus-4-8?
  • Алерты по счёту — по длительности задачи, а не только по числу запросов?
  • Чувствительные клиенты принимают 30-дневное хранение данных уровня Mythos?

Отличие 7: смена парадигмы в Claude Code

Для большинства разработчиков вход в Fable 5 — не claude.ai, а Claude Code, repo-агент в терминале. По сравнению с привычками Opus 4.8:

Этап Привычка Opus 4.8 Привычка Fable 5
Гранулярность Один файл / модуль / один PR Кросс-директорная миграция, многодневная приёмка, тестовые циклы
Оркестрация Dynamic Workflows, sub-agent'ы вручную Встроенная длинная цепочка + task budgets (beta)
Thinking Adaptive опционально / thinking выкл. Только adaptive; raw CoT в ответе не отдаётся
Память В основном контекст сессии memory tool + файловая долгая память
Роль человека Review diff по шагам Задать цель и gates, принять перед merge

Рекомендуемый старт на Cloud Mac:

tmux + Claude Code · длинный прогон Fable 5
cd ~/work/your-ios-app
tmux new -s fable-migration

claude
# В сессии (зависит от версии):
#   /model  → claude-fable-5
#   /effort → xhigh (крупная миграция)
# Пример prompt:
# «На ветке agent/fable-checkout мигрировать модуль Checkout на async/await.
#  Сначала план, затем автономное выполнение; на каждом этапе swift test --filter CheckoutTests;
#  в конце git diff --stat. Не пушить.»

# Ctrl+B D — отсоединиться; ноутбук можно закрыть

В той же логике, что кэш iOS CI и ускорение xcodebuild: Fable 5 многократно бьёт те же сборки — DerivedData и Pods с постоянным «домом» экономят время и credits против голого GitHub-hosted macOS.

Fable 5 или Opus 4.8?

Не «или-или» — выбирайте по длительности и риску:

  • Fable 5: миграция всего репо, кросс-модульный рефакторинг, многодневные задачи с самостоятельным тестом и фиксом; бюджет как «инженеро-дни», не «сообщения в чате»
  • Opus 4.8: ежедневный pairing, эксперименты с Dynamic Workflows, security/bio-темы с риском refusal (или стабильный путь после fallback), частые вызовы с жёстким бюджетом
  • Cursor локально + remote: мелкие правки в IDE — в Cursor; Fable 5 на Cloud Mac для крупных кусков — та же схема, что с Opus 4.8, только «крупное» стало больше

Почему это должно крутиться на Cloud Mac

«Долгая автономия» предъявляет к рантайму минимум те же требования, что Dynamic Workflows на Opus 4.8 — скорее выше:

  • Сессия не должна умирать: часы и дни не переживут sleep ноутбука; tmux + Cloud Mac 7×24 — базовый уровень
  • Настоящая macOS-toolchain: xcodebuild, Simulator, SPM/CocoaPods — Swift-правки валидируются только на Mac
  • RAM и диск: контекст 1M + параллельные тесты едят память; M4 24 ГБ и большой диск в monorepo — не роскошь
  • Та же машина, что CI: агент правит → warm build на той же коробке → лог ошибки обратно агенту — короче feedback loop

ID модели может смениться с claude-fable-5 на следующее поколение Mythos — хост и workflow остаются. Для этого Cloud Mac и есть физический слой агента.

FAQ

Главное отличие от Opus 4.8?

Долгая автономная agent-способность. Разрыв в чате небольшой; repo-wide, многодневные, самопроверяемые задачи — огромный.

Fable 5 так же силён, как Mythos 5?

Одна база. У Fable дополнительные классификаторы и откат на Opus 4.8 в части сценариев; Mythos 5 — только через Glasswing и доверенные пути.

ID моделей в API?

claude-fable-5 (публичный), claude-mythos-5 (ограниченный).

Доступен сейчас?

С 12 июня 2026 временно приостановлен глобально; возобновление — по анонсам Anthropic. На момент статьи (15 июня) — официальный статус. Opus 4.8 и другие модели без изменений.

Конфликтует с Cursor?

Нет. Локальная IDE + удалённый Claude Code — обычная схема; Fable 5 берёт «ночную смену».

Итог

Что на самом деле изменилось в апгрейде Anthropic? Одной фразой: долгие агенты уровня Mythos впервые доступны обычным разработчикам. Семь отличий — уровень, автономия, разрыв в бенчмарках, контекст, safety-fallback, цена, парадигма Claude Code — смотрят в одну сторону:

Гонка AI-кодинга смещается с «кто умнее отвечает за раз» на «кто доводит задачу без присмотра».

80,3 % vs 69,2 % на SWE-Bench Pro — сигнал; настоящая приёмка: «оставил на ночь — утром diff можно мержить». Для этого нужен Cloud Mac, который не засыпает — Fable 5 ещё сильнее, чем Opus 4.8.

Ночная миграция на Fable 5 — нужен Mac, который не спит

Vuncloud Cloud Mac M4: длинные прогоны tmux с Claude Code, приёмка xcodebuild на той же машине, персистентный DerivedData — физический слой исполнения для долгих агентов.

Тарифы Cloud Mac · Разбор Opus 4.8

Полевые заметки · Claude

Агенту уровня Mythos нужна среда того же уровня

Fable 5 · Claude Code · Cloud Mac · долгие задачи

Разбор Opus 4.8
Акция Смотреть тарифы