Fable 5 et Mythos 5 d’Anthropic ont été brusquement désactivés le 12 juin 2026 sur ordre du gouvernement américain. Une première dans l’histoire de l’industrie de l’intelligence artificielle.
Trois jours seulement après leur lancement public, les deux modèles les plus puissants d’Anthropic ont disparu des serveurs. Le prétexte : un jailbreak potentiel jugé menaçant pour la sécurité nationale. La réalité, selon Anthropic elle-même, est bien plus nuancée.
Un lancement record, une mise hors ligne brutale
Le 9 juin 2026, Anthropic a mis en ligne Claude Fable 5, le premier modèle de classe Mythos accessible au grand public, accompagné de Claude Mythos 5, sa version aux garde-fous partiellement levés, réservée à un cercle restreint de spécialistes en cyberdéfense. D’après le communiqué officiel d’Anthropic publié le 9 juin 2026, Fable 5 représentait « l’état de l’art sur la quasi-totalité des benchmarks testés », avec des performances exceptionnelles en ingénierie logicielle, recherche scientifique et travaux à contexte long.
La distinction entre les deux modèles tenait uniquement à leurs garde-fous. Fable 5 intégrait des classifieurs de sécurité redirigeant automatiquement vers Claude Opus 4.8 pour toute requête sensible touchant à la cybersécurité, la biologie ou la chimie. Ce mécanisme s’activait dans moins de 5 % des sessions en moyenne. Mythos 5, lui, partageait le même modèle sous-jacent mais avec ces restrictions levées dans certains domaines, déployé dans le cadre du Programme Glasswing en collaboration avec le gouvernement américain.
Le tarif annoncé : 10 dollars par million de tokens en entrée et 50 dollars par million en sortie, soit moins de la moitié du prix du précédent modèle Mythos Preview.
La directive du Département du Commerce : une décision expéditive
Le 12 juin 2026 à 17h21 (heure de la côte Est), Anthropic a reçu une directive de contrôle des exportations. L’injonction était claire : suspendre immédiatement tout accès à Fable 5 et Mythos 5 pour tout ressortissant étranger, qu’il se trouve sur le territoire américain ou non, y compris les employés étrangers d’Anthropic elle-même.
Dans son communiqué officiel publié le 12 juin, Anthropic a précisé que « la lettre ne fournissait pas les détails spécifiques de sa préoccupation en matière de sécurité nationale ». Le gouvernement aurait néanmoins informé verbalement l’entreprise de l’existence d’une méthode de contournement des garde-fous du modèle.
La conséquence directe de cet ordre crée un paradoxe technique : pour garantir sa conformité complète vis-à-vis de la restriction ciblant les ressortissants étrangers, Anthropic n’a eu d’autre choix que de désactiver les deux modèles pour l’ensemble de ses clients, y compris les citoyens américains. Dans la même déclaration officielle, l’entreprise a précisé que « l’accès à tous les autres modèles Anthropic ne sera pas affecté ».
Un jailbreak mineur érigé en menace nationale
Au cœur de cette décision se trouve un jailbreak dit « non universel », une technique permettant de contourner partiellement les garde-fous d’un modèle dans des conditions très spécifiques. D’après le communiqué officiel d’Anthropic du 12 juin, la méthode consiste essentiellement à « demander au modèle de lire une base de code spécifique et d’en corriger les failles logicielles ».
Anthropic a examiné le rapport qu’elle estime être à l’origine de la directive et contesté vigoureusement son caractère préoccupant. L’entreprise affirme dans ce même communiqué que « le niveau de capacité décrit est largement disponible sur d’autres modèles, y compris le GPT-5.5 d’OpenAI », et que cette technique est « utilisée chaque jour par les défenseurs chargés de la sécurité des systèmes ».
La défense d’Anthropic s’appuie sur un historique solide. Avant le lancement, l’entreprise avait collaboré avec le gouvernement américain, l’AISI britannique (AI Safety Institute) et plusieurs organisations tierces privées pour tester les garde-fous de Fable pendant des milliers d’heures de red-teaming. Aucun testeur n’avait réussi à trouver de jailbreak universel, c’est-à-dire une méthode capable de contourner les protections du modèle pour un large spectre de capacités cybersécurité. Ce résultat était lui-même anticipé par Anthropic dans son billet de lancement officiel : l’entreprise y déclarait explicitement qu’une résistance parfaite aux jailbreaks n’était « pas actuellement possible pour aucun fournisseur de modèle ».
La stratégie « défense en profondeur » mise à l’épreuve
Face à cette réalité technique, Anthropic avait adopté une approche documentée de défense en profondeur pour Fable 5. L’objectif : rendre les jailbreaks soit très étroits dans leur portée pour les non-universels, soit très coûteux à produire pour les universels, en combinant cela avec une surveillance renforcée. C’est d’ailleurs pour cette raison qu’Anthropic avait imposé une conservation des données sur 30 jours pour les modèles de classe Mythos, une politique reconnue dans le communiqué officiel comme ayant « un coût réel pour les clients » mais nécessaire pour « rechercher et atténuer les jailbreaks ».
Dans son communiqué du 12 juin, Anthropic a maintenu sa position sans ambiguïté : « Nous respectons la directive légale du gouvernement et supprimons l’accès à Fable 5 et Mythos 5 pour tous les utilisateurs. Cependant, nous ne pensons pas que la découverte d’un potentiel jailbreak limité justifie le retrait d’un modèle commercial déployé auprès de centaines de millions de personnes. » (We are complying with the government’s legal directive and are removing access to Fable 5 and Mythos 5 for all users. However, we disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people.)
Un précédent aux conséquences potentiellement paralysantes pour l’industrie
L’ampleur de cette décision dépasse le seul cas Anthropic. Dans sa déclaration officielle, l’entreprise l’a formulé en termes explicites : « Si cette norme était appliquée à l’ensemble du secteur, nous pensons qu’elle stopperait essentiellement tous les nouveaux déploiements de modèles pour tous les fournisseurs de modèles de pointe. » (If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.)
La comparaison s’impose avec l’inscription de Huawei sur la liste noire du Département du Commerce américain en 2019. Cette décision avait coupé le géant chinois des puces et logiciels américains au nom de la sécurité nationale. Le cas Anthropic inverse cependant la logique : pour la première fois, le gouvernement américain rappelle ses propres actifs logiciels nationaux pour des raisons géopolitiques, touchant au passage ses propres ressortissants.
Si ce type d’intervention devenait systématique, toute vulnérabilité découverte dans un modèle d’IA américain pourrait déclencher une mise hors ligne commerciale immédiate. Un risque commercial et d’image difficile à absorber pour des entreprises ayant investi des milliards de dollars en recherche et développement.
Anthropic a indiqué dans son communiqué qu’elle s’exprimait publiquement sur sa politique en matière d’IA depuis plusieurs semaines, plaidant pour que « le gouvernement ait la capacité de bloquer des déploiements non sécurisés, dans le cadre d’un processus légal transparent, équitable, clair et fondé sur des faits techniques ». La société estime que la directive du 12 juin 2026 « ne respecte pas ces principes » et poursuit ses discussions avec les autorités pour obtenir un rétablissement de l’accès dans les meilleurs délais.
Ce bras de fer entre la première startup d’IA mondiale en valorisation et son propre gouvernement pose une question que toute l’industrie devra résoudre : jusqu’où les États-Unis sont-ils prêts à entraver leurs propres champions technologiques au nom de la sécurité nationale, et quelle doctrine réglementaire transparente peut permettre d’éviter les décisions arbitraires ? La réponse donnée dans les prochains jours déterminera autant le sort de Fable 5 que les règles du jeu pour toute la prochaine génération de modèles d’IA.
