Vuncloud Blog
← Retour au carnet du labo

D'Opus 4.8 à Fable 5 : qu'est-ce qu'Anthropic a vraiment changé ?

Claude Fable 5 · premier Mythos public d'Anthropic · agents longue durée, pas un chat plus malin · Claude benchmark · Claude Code ·~12 min de lecture

Développeur sur poste multi-écrans—agents longue durée Claude Fable 5 et tâches repo Claude Code
TL;DR · trois lignes
  • Claude Fable 5 est le premier modèle de tier Mythos ouvert au public chez Anthropic (GA le 9 juin 2026), même architecture que le Mythos 5 à accès restreint
  • Face à Opus 4.8, le saut n’est pas « mieux chatter », mais l’autonomie asynchrone sur des heures voire des jours — planifier, exécuter, tester, itérer sans « continue » permanent
  • Pour les devs : Fable 5 dans Claude Code comme un « senior qui reste la nuit » ; Opus 4.8 reste le défaut solide pour le pairing et les Dynamic Workflows — les deux exigent un Cloud Mac qui ne s’endort pas

Le 9 juin 2026, Anthropic a sorti Claude Fable 5 et Claude Mythos 5 en même temps. Fable, c’est la première capacité tier Mythos accessible au public après la Mythos Preview (avril, partenaires Project Glasswing seulement) ; Mythos 5 reste le chemin partenaires avec une partie des classificateurs de sécurité désactivée.

La première réaction dans les cercles dev : « nouveau modèle — combien de points de benchmark en plus ? » — la question rate le cœur du sujet. La ligne de partage entre Fable 5 et Opus 4.8, c’est la forme de travail : de « vous regardez modifier le code » à « vous partez, ça continue ».

Disponibilité (mise à jour 12.06.2026)

Le 12 juin, Anthropic a suspendu temporairement l’accès mondial à Claude Fable 5 et Mythos 5 suite à des directives américaines d’export control, et travaille à la réouverture. Les capacités et différences d’intégration décrites ci-dessous restent valables après rétablissement ; consultez la page de statut officielle. Au quotidien, Opus 4.8 et les autres modèles Claude restent utilisables.

80,3 %
SWE-Bench Pro (Fable/Mythos 5)
69,2 %
SWE-Bench Pro (Opus 4.8)
1 M
Fenêtre de contexte par défaut (Fable 5)

Diff 1 : tier modèle — du flagship Opus au tier Mythos

Dans la gamme Anthropic, Opus a longtemps été le « plus fort en public » ; Mythos est le palier supérieur introduit en 2026 — d’abord en Mythos Preview pour Project Glasswing (cybersécurité, infrastructures critiques).

Claude Fable 5 met la capacité tier Mythos pour la première fois dans le chemin standard : API, Claude Pro/Max/Team et Claude Code. Même architecture et benchmarks que Claude Mythos 5 ; la différence, c’est la coque de sécurité — Fable avec classificateurs, Mythos pour partenaires de confiance avec moins de garde-fous.

Pour les intégrateurs, ce n’est pas qu’un nouveau string model : durée de tâche par défaut, modes d’échec et structure de facture bougent.

Diff 2 : autonomie longue durée, pas la qualité du chat

Dans la description officielle de Fable 5, trois mots reviennent : thorough, proactive, tests its own work. En langage dev :

Avant, le modèle ressemblait à un bon stagiaire à la demande ; Fable 5, plutôt à un senior à qui vous donnez un objectif — il découpe, code, teste et corrige tout seul quand ça casse.

Exemples publics : Stripe dit que Fable 5 a compressé des mois de migration en jours — migration globale d’une base Ruby de 50 millions de lignes en une journée ; des équipes Anthropic l’utilisent pour de la recherche génomique autonome sur plus d’une semaine. Avec Opus 4.8, il fallait souvent des Dynamic Workflows orchestrés à la main ou un « continue » humain en boucle.

Comme pour Siri agent système après WWDC 2026, le changement est dans la couche d’exécution : le modèle n’attend plus le prochain prompt, il avance dans le budget de tâche.

Tableau de bord de monitoring — tâches agent longue durée et observation des benchmarks avec Claude Fable 5

Diff 3 : benchmarks agentiques avec « fossé »

Sur la seule « intelligence de chat », le saut Opus 4.8 → Fable 5 est graduel ; sur le travail logiciel autonome, la courbe est raide. Comparaison Anthropic (Fable 5 et Mythos 5 souvent à 1–3 points près ; avec * plus proche d’Opus à cause des classificateurs Fable) :

Benchmark Fable 5 / Mythos 5 Opus 4.8 Lecture dev
SWE-Bench Pro 80,3 % 69,2 % Vrais issues de repo — écart ~11 pp
FrontierCode (Diamond) 29,3 % (xhigh) 13,4 % (xhigh) Code agent maintenable — quasi doublement
Terminal-Bench 2.1 88,0 %* 82,7 % Multistep terminal — terrain Claude Code
Humanity's Last Exam (tools) 64,5 %* 57,9 % Raisonnement long sur disciplines
OSWorld-Verified 85,0 % 83,4 % Computer use — les deux proches

Pour les équipes iOS/Swift, SWE-Bench Pro + Terminal-Bench comptent plus que HLE : « le PR merge ? » vs « l’agent se perd-il dans le shell ? » — l’abstraction des boucles claude CLI et xcodebuild.

Opus 4.8 mettait l’accent à la sortie sur l’honnêteté, Effort et Dynamic Workflows ; Fable 5 avale de plus gros morceaux en une session agent — moins d’orchestration scriptée à la main.

Diff 4 : contexte 1M et sortie 128k

Fable 5 / Mythos 5 offrent par défaut 1 million de tokens de contexte et jusqu’à 128k tokens de sortie par réponse. Pour les agents longue durée :

  • README entier du repo, docs d’archi et extraits de logs CI dans une seule mémoire de travail
  • Avec memory tool et compaction, pas besoin de tout l’état intermédiaire dans le chat
  • Anthropic : avec mémoire fichier, gain long contexte environ triplé vs Opus 4.8

Opus 4.8 avait déjà long contexte et adaptive thinking — Fable 5 assume « long » comme hypothèse agent par défaut, pas en option payante. Migration : thinking: {"type": "disabled"} non supporté sur Fable 5 ; adaptive thinking toujours actif, profondeur via effort.

Diff 5 : classificateurs de sécurité et fallback Opus 4.8

Là où Fable 5 et Mythos 5 divergent à performance égale : même capacité, coque différente.

Fable 5 déploie des classificateurs de sécurité pour cybersécurité, biologie, chimie et distillation. À la déclenche : HTTP 200, mais stop_reason: "refusal" avec le type de classificateur — pas une erreur 4xx classique. Les intégrateurs doivent couvrir trois points (doc) :

  1. Traiter le refusal — ne pas le compter comme sortie réussie
  2. Fallback — paramètre fallbacks côté serveur, middleware SDK ou retry manuel vers claude-opus-4-8
  3. Facturation — refusal sans output non facturé ; fallback avec compensation prompt-cache, pas de double paiement cache

D’où des scores Fable 5 sur ExploitBench, BioMysteryBench, etc. avec * plus proches d’Opus 4.8 — pas plus faible, mais interdit de répondre en version publique. Mythos 5 montre la pleine mesure en scénarios de confiance (ex. ExploitBench Cap% ~78 % vs Opus 4.8 ~40 %).

Opérationnel : le trafic tier Mythos est conservé 30 jours pour trust & safety — pas de zero-data retention (ZDR). Revue compliance à prévoir.

Diff 6 : tarifs doublés et nouvelles règles de facturation

Fable 5 : entrée 10 USD / million de tokens, sortie 50 USD / million — environ le double d’Opus 4.8 (5 / 25), mais sous Mythos Preview (25 / 125).

Le prix filtre les tâches : pertinent pour migrations multi-heures, audits, test-fix sur tout le repo ; inadapté aux Q&R courtes et fréquentes (là, Opus 4.8 Fast ou Sonnet).

Abonnement : du 9 au 22 juin, Fable 5 inclus gratuitement dans Pro/Max/Team ; à partir du 23 juin, consommation de credits — Fable comme compute premium, pas modèle de chat par défaut.

Checklist d’intégration
  • Scripts CI/agent : gèrent-ils stop_reason: refusal ?
  • Fallback vers claude-opus-4-8 configuré ?
  • Alertes facture sur durée de tâche, pas seulement le nombre de requêtes ?
  • Clients sensibles : acceptent-ils la rétention 30 jours tier Mythos ?

Diff 7 : changement de paradigme dans Claude Code

Pour la plupart des devs, l’entrée vers Fable 5 n’est pas claude.ai, c’est Claude Code — l’agent repo dans le terminal. Par rapport aux habitudes Opus 4.8 :

Étape Habitude Opus 4.8 Habitude Fable 5
Granularité Fichier / module / un PR Migration cross-répertoires, validation sur plusieurs jours, boucles de test
Orchestration Dynamic Workflows, sub-agents à la main Chaîne longue intégrée + task budgets (bêta)
Thinking Adaptive optionnel / thinking off Adaptive seulement ; pas de raw CoT dans la réponse
Mémoire Surtout contexte de session memory tool + mémoire fichier longue durée
Rôle humain Review diff pas à pas Fixer objectif et gates, valider avant merge

Démarrage recommandé sur Cloud Mac :

tmux + Claude Code · long run Fable 5
cd ~/work/your-ios-app
tmux new -s fable-migration

claude
# Dans la session (selon votre version) :
#   /model  → claude-fable-5
#   /effort → xhigh (grosse migration)
# Exemple de prompt :
# « Sur la branche agent/fable-checkout, migrer le module Checkout vers async/await.
#  Plan d’abord, puis exécution autonome ; à chaque phase swift test --filter CheckoutTests ;
#  à la fin git diff --stat. Ne pas push. »

# Ctrl+B D pour détacher ; le portable peut s’éteindre

Même logique que cache CI iOS et accélération xcodebuild : Fable 5 enchaîne les mêmes builds — DerivedData et Pods avec un « chez-soi » fixe économisent temps et credits vs macOS hébergé nu sur GitHub.

Fable 5 ou Opus 4.8 ?

Pas exclusif — choisir selon durée et risque :

  • Fable 5 : migration tout le repo, refactor cross-modules, jobs sur plusieurs jours avec tests et fixes autonomes ; budget en « jours-ingénieur », pas en « messages de chat »
  • Opus 4.8 : pairing quotidien, essais Dynamic Workflows, sujets security/bio à risque de refusal (ou chemin stable après fallback), appels haute fréquence sensibles au coût
  • Cursor local + remote : petites edits IDE dans Cursor ; Fable 5 sur Cloud Mac pour les gros morceaux — même répartition qu’avec Opus 4.8, « gros » juste redéfini plus large

Pourquoi ça doit tourner sur Cloud Mac

« Longue durée autonome » impose au runtime au moins les mêmes exigences que les Dynamic Workflows Opus 4.8 — plutôt plus :

  • La session ne doit pas mourir : jobs en heures et jours ne survivent pas au sleep du portable ; tmux + Cloud Mac 7×24, baseline
  • Vraie toolchain macOS : xcodebuild, Simulator, SPM/CocoaPods — les changements Swift ne se valident que sur Mac
  • RAM et disque : contexte 1M + tests parallèles mangent la mémoire ; M4 24 Go et gros volume ne sont pas du luxe en monorepo
  • Même machine que la CI : l’agent modifie → warm build sur la même box → log d’échec renvoyé à l’agent — boucle de feedback plus courte

L’ID modèle passera peut-être de claude-fable-5 à la prochaine génération Mythos — l’hôte et le workflow restent. C’est pour ça que Cloud Mac est la couche physique de l’agent.

FAQ

Plus grande différence avec Opus 4.8 ?

Capacité agent autonome longue durée. Écart chat limité ; jobs repo entier, multi-jours, auto-vérifiés — énorme.

Fable 5 aussi fort que Mythos 5 ?

Même base. Fable ajoute des classificateurs et retombe sur Opus 4.8 dans certains cas ; Mythos 5 seulement via Glasswing et chemins de confiance.

IDs modèle API ?

claude-fable-5 (public), claude-mythos-5 (restreint).

Disponible maintenant ?

Suspendu globalement depuis le 12 juin 2026 ; reprise selon Anthropic. À la rédaction (15 juin) : vérifier le statut officiel. Opus 4.8 et autres modèles inchangés.

Conflit avec Cursor ?

Non. IDE local + Claude Code distant, classique ; Fable 5 prend le « quart de nuit ».

Conclusion

Qu’est-ce qu’Anthropic a vraiment changé ? En une phrase : les agents tier Mythos longue durée arrivent pour la première fois chez les devs ordinaires. Les sept diffs — tier, autonomie, fossé benchmark, contexte, fallback sécurité, prix, paradigme Claude Code — pointent dans la même direction :

La course au code IA ne se joue plus sur « qui répond le plus malin par tour », mais sur « qui finit sans surveillance ».

80,3 % vs 69,2 % sur SWE-Bench Pro, c’est un signal ; la vraie validation : « laisser tourner la nuit, diff mergeable au matin ». Pour ça, il faut un Cloud Mac qui ne s’endort pas — Fable 5 encore plus qu’Opus 4.8.

Migration Fable 5 la nuit — il faut un Mac qui reste éveillé

Vuncloud Cloud Mac M4 : long runs tmux avec Claude Code, validation xcodebuild sur la même machine, DerivedData persistant — couche d’exécution physique pour agents longue durée.

Voir les offres Cloud Mac · Analyse approfondie Opus 4.8

Carnet du labo · Claude

Un agent Mythos exige un runtime Mythos

Fable 5 · Claude Code · Cloud Mac · tâches longue durée

Lire l'analyse Opus 4.8
Offre limitée Voir les offres