Fable 5 e Mythos 5 sospesi: il governo USA colpisce Anthropic

Fable 5 e Mythos 5 di Anthropic sono stati bruscamente disattivati il 12 giugno 2026 per ordine del governo degli Stati Uniti. Una prima assoluta nella storia dell’industria dell’intelligenza artificiale.

Appena tre giorni dopo il loro lancio pubblico, i due modelli più potenti di Anthropic sono scomparsi dai server. Il pretesto: un potenziale jailbreak ritenuto minaccioso per la sicurezza nazionale. La realtà, secondo Anthropic stessa, è ben più sfumata.

Un lancio da record, una messa offline brutale

Il 9 giugno 2026, Anthropic ha messo online Claude Fable 5, il primo modello di classe Mythos accessibile al grande pubblico, accompagnato da Claude Mythos 5, la sua versione con protezioni parzialmente rimosse, riservata a una cerchia ristretta di specialisti di cyberdifesa. Secondo il comunicato ufficiale di Anthropic pubblicato il 9 giugno 2026, Fable 5 rappresentava « lo stato dell’arte su quasi tutti i benchmark testati », con prestazioni eccezionali in ingegneria del software, ricerca scientifica e lavori a lungo contesto.

La distinzione tra i due modelli consisteva unicamente nelle loro protezioni. Fable 5 integrava classificatori di sicurezza che reindirizzavano automaticamente a Claude Opus 4.8 per qualsiasi richiesta sensibile riguardante la cybersecurity, la biologia o la chimica. Questo meccanismo si attivava in media in meno del 5% delle sessioni. Mythos 5, invece, condivideva lo stesso modello sottostante ma con queste restrizioni rimosse in alcuni ambiti, distribuito nell’ambito del Programma Glasswing in collaborazione con il governo degli Stati Uniti.

Il prezzo annunciato: 10 dollari per milione di token in input e 50 dollari per milione in output, ovvero meno della metà del prezzo del precedente modello Mythos Preview.

La direttiva del Dipartimento del Commercio: una decisione affrettata

Il 12 giugno 2026 alle 17:21 (ora della costa orientale), Anthropic ha ricevuto una direttiva di controllo delle esportazioni. L’ingiunzione era chiara: sospendere immediatamente ogni accesso a Fable 5 e Mythos 5 per qualsiasi cittadino straniero, sia esso sul territorio americano o meno, inclusi i dipendenti stranieri di Anthropic stessa.

Nel suo comunicato ufficiale pubblicato il 12 giugno, Anthropic ha precisato che « la lettera non forniva i dettagli specifici della sua preoccupazione in materia di sicurezza nazionale ». Il governo avrebbe tuttavia informato verbalmente l’azienda dell’esistenza di un metodo per aggirare le protezioni del modello.

La conseguenza diretta di questo ordine crea un paradosso tecnico: per garantire la sua completa conformità alla restrizione mirata ai cittadini stranieri, Anthropic non ha avuto altra scelta che disattivare i due modelli per tutti i suoi clienti, inclusi i cittadini americani. Nella stessa dichiarazione ufficiale, l’azienda ha precisato che « l’accesso a tutti gli altri modelli Anthropic non sarà interessato ».

Un jailbreak minore elevato a minaccia nazionale

Al centro di questa decisione si trova un cosiddetto jailbreak « non universale », una tecnica che consente di aggirare parzialmente le protezioni di un modello in condizioni molto specifiche. Secondo il comunicato ufficiale di Anthropic del 12 giugno, il metodo consiste essenzialmente nel « chiedere al modello di leggere una specifica base di codice e di correggerne le falle software ».

Anthropic ha esaminato il rapporto che ritiene essere all’origine della direttiva e ne ha contestato energicamente il carattere preoccupante. L’azienda afferma nello stesso comunicato che « il livello di capacità descritto è ampiamente disponibile su altri modelli, incluso il GPT-5.5 di OpenAI », e che questa tecnica è « utilizzata ogni giorno dai difensori incaricati della sicurezza dei sistemi ».

La difesa di Anthropic si basa su una solida storia. Prima del lancio, l’azienda aveva collaborato con il governo degli Stati Uniti, l’AISI britannico (AI Safety Institute) e diverse organizzazioni terze private per testare le protezioni di Fable per migliaia di ore di red-teaming. Nessun tester era riuscito a trovare un jailbreak universale, ovvero un metodo in grado di aggirare le protezioni del modello per un ampio spettro di capacità di cybersecurity. Questo risultato era esso stesso anticipato da Anthropic nel suo post di lancio ufficiale: l’azienda dichiarava esplicitamente che una resistenza perfetta ai jailbreak non era « attualmente possibile per nessun fornitore di modelli ».

La strategia « difesa in profondità » messa alla prova

Di fronte a questa realtà tecnica, Anthropic aveva adottato un approccio documentato di difesa in profondità per Fable 5. L’obiettivo: rendere i jailbreak o molto ristretti nella loro portata per quelli non universali, o molto costosi da produrre per quelli universali, combinando ciò con una sorveglianza rafforzata. È per questo motivo che Anthropic aveva imposto una conservazione dei dati per 30 giorni per i modelli di classe Mythos, una politica riconosciuta nel comunicato ufficiale come avente « un costo reale per i clienti », ma necessaria per « ricercare e mitigare i jailbreak ».

Nel suo comunicato del 12 giugno, Anthropic ha mantenuto la sua posizione senza ambiguità: « Rispettiamo la direttiva legale del governo e rimuoviamo l’accesso a Fable 5 e Mythos 5 per tutti gli utenti. Tuttavia, non riteniamo che la scoperta di un potenziale jailbreak limitato giustifichi il ritiro di un modello commerciale distribuito a centinaia di milioni di persone. » (We are complying with the government’s legal directive and are removing access to Fable 5 and Mythos 5 for all users. However, we disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people.)

Un precedente con conseguenze potenzialmente paralizzanti per l’industria

L’entità di questa decisione va oltre il solo caso Anthropic. Nella sua dichiarazione ufficiale, l’azienda l’ha formulato in termini espliciti: « Se questo standard venisse applicato all’intero settore, riteniamo che fermerebbe essenzialmente tutti i nuovi dispiegamenti di modelli per tutti i fornitori di modelli all’avanguardia. » (If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.)

Il paragone si impone con l’inserimento di Huawei nella lista nera del Dipartimento del Commercio americano nel 2019. Questa decisione aveva tagliato il colosso cinese dai chip e software americani in nome della sicurezza nazionale. Il caso Anthropic inverte tuttavia la logica: per la prima volta, il governo americano ritira i propri asset software nazionali per ragioni geopolitiche, colpendo di passaggio i propri cittadini.

Se questo tipo di intervento diventasse sistematico, qualsiasi vulnerabilità scoperta in un modello di IA americano potrebbe innescare una messa offline commerciale immediata. Un rischio commerciale e d’immagine difficile da assorbire per aziende che hanno investito miliardi di dollari in ricerca e sviluppo.

Anthropic ha indicato nel suo comunicato che si stava esprimendo pubblicamente sulla sua politica in materia di IA da diverse settimane, sostenendo che « il governo dovrebbe avere la capacità di bloccare dispiegamenti non sicuri, nell’ambito di un processo legale trasparente, equo, chiaro e basato su fatti tecnici ». La società ritiene che la direttiva del 12 giugno 2026 « non rispetti questi principi » e prosegue le sue discussioni con le autorità per ottenere un ripristino dell’accesso nel più breve tempo possibile.Questo braccio di ferro tra la prima startup di IA al mondo per valutazione e il suo stesso governo solleva una questione che l’intero settore dovrà risolvere: fino a che punto gli Stati Uniti sono disposti a ostacolare i propri campioni tecnologici in nome della sicurezza nazionale, e quale dottrina normativa trasparente può evitare decisioni arbitrarie? La risposta data nei prossimi giorni determinerà tanto il destino di Fable 5 quanto le regole del gioco per l’intera prossima generazione di modelli di IA.