Anthropic の Fable 5 および Mythos 5 は、米国政府の命令により 2026 年 6 月 12 日に突如として無効化されました。これは AI 業界の歴史における初の出来事です。
一般公開からわずか 3 日後、Anthropic の 2 つの最も強力なモデルがサーバーから姿を消しました。その名目は、国家安全保障に対する脅威と見なされた潜在的なジェイルブレイクでした。しかし、Anthropic 自身によれば、その現実ははるかに複雑です。
記録的なローンチ、突然のオフライン化
2026 年 6 月 9 日、Anthropic は Mythos クラスのモデルとして初めて一般公開された Claude Fable 5 と、サイバーセキュリティ専門家限定の、一部の安全策が解除されたバージョンである Claude Mythos 5 をオンラインにしました。2026 年 6 月 9 日に発表された Anthropic の公式声明によると、Fable 5 は「テストされたほぼすべてのベンチマークで最先端の性能」を示し、ソフトウェアエンジニアリング、科学研究、および長文コンテキストでの作業において並外れたパフォーマンスを発揮しました。
2 つのモデルの違いは、その安全策のみでした。Fable 5 は、サイバーセキュリティ、生物学、または化学に関連する機密性の高いリクエストについては、自動的に Claude Opus 4.8 にリダイレクトするセキュリティ分類器を統合していました。このメカニズムは、平均してセッションの 5% 未満でアクティブになりました。Mythos 5 は、同じ基盤モデルを共有していましたが、米国政府との Glasswing プログラムの枠組みで展開され、特定の分野でこれらの制限が解除されていました。
発表された価格は、入力 100 万トークンあたり 10 ドル、出力 100 万トークンあたり 50 ドルで、前モデルの Mythos Preview の半額以下でした。
商務省の指令:迅速な決定
2026 年 6 月 12 日午後 5 時 21 分(米国東部時間)、Anthropic は輸出管理指令を受け取りました。命令は明確でした。米国国内にいるかどうかにかかわらず、また Anthropic 従業員の外国人であっても、すべての外国人に対する Fable 5 および Mythos 5 へのアクセスを直ちに停止すること。
6 月 12 日に発表された公式声明で、Anthropic は「書簡には、国家安全保障に関する懸念の具体的な詳細は提供されなかった」と述べています。しかし、政府はモデルの安全策を回避する方法が存在することを口頭で同社に通知したとされています。
この命令の直接的な結果として、技術的なパラドックスが生じました。外国人に対する制限を完全に遵守するために、Anthropic は米国民を含むすべての顧客に対して 2 つのモデルを無効化せざるを得ませんでした。同じ公式声明で、同社は「他のすべての Anthropic モデルへのアクセスには影響しない」と述べています。
国家安全保障の脅威とされた軽微なジェイルブレイク
この決定の中心にあるのは、「非ユニバーサル」と呼ばれるジェイルブレイク、つまり非常に特定の条件下でモデルの安全策を部分的に回避する技術です。2026 年 6 月 12 日の Anthropic の公式声明によると、この方法は本質的に「モデルに特定のコードベースを読み込ませ、そのソフトウェアの脆弱性を修正するように要求すること」です。
Anthropic は、指令の原因となったとされるレポートを精査し、その懸念事項としての性質を強く異議を唱えました。同社は同じ声明で、「記述されている能力レベルは、OpenAI の GPT-5.5 を含む他のモデルでも広く利用可能」であり、この技術は「システムのセキュリティを保護する担当者によって毎日使用されている」と主張しました。
Anthropic の弁護は、確固たる実績に基づいています。ローンチ前、同社は米国政府、英国の AISI(AI Safety Institute)、およびいくつかの民間のサードパーティ組織と協力し、何千時間ものレッドチーミングで Fable の安全策をテストしました。どのテスターも、ユニバーサルジェイルブレイク、つまりサイバーセキュリティ能力の広範な範囲でモデルの保護を回避できる方法を見つけることができませんでした。この結果は、Anthropic が公式ローンチブログで予測していたものであり、同社はそこで、ジェイルブレイクに対する完全な耐性は「現在、どのモデルプロバイダーにとっても不可能ではない」と明言していました。
「多層防御」戦略の試練
この技術的な現実に対し、Anthropic は Fable 5 のために文書化された多層防御アプローチを採用しました。目的は、非ユニバーサルの場合はジェイルブレイクの範囲を非常に狭くするか、ユニバーサルの場合は生成コストを非常に高くすることで、強化された監視と組み合わせて、ジェイルブレイクを困難にすることでした。実際、Anthropic が Mythos クラスのモデルで 30 日間のデータ保持を義務付けたのはこのためであり、公式声明で「顧客に実際のコストがかかる」ものの、「ジェイルブレイクの調査と緩和」には必要であると認められています。
6 月 12 日の声明で、Anthropic は曖昧さのない立場を維持しました。「私たちは政府の法的指示を遵守し、すべてのユーザーへの Fable 5 および Mythos 5 へのアクセスを削除します。しかし、限定的な潜在的ジェイルブレイクの発見が、何億人もの人々に展開されている商用モデルをリコールする原因になるとは考えていません。」(We are complying with the government’s legal directive and are removing access to Fable 5 and Mythos 5 for all users. However, we disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people.)
業界に麻痺をもたらす可能性のある precedent
この決定の規模は、Anthropic 単独のケースを超えています。同社は公式声明で、「この基準が業界全体に適用されれば、すべての最先端モデルプロバイダーのすべての新しいモデル展開を実質的に停止させると考えています。」(If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.)と明確に述べています。
2019 年に華為技術(Huawei)が米国商務省のブラックリストに登録されたこととの比較が避けられません。この決定は、国家安全保障の名の下に、中国のチップとソフトウェア大手を米国から切り離しました。しかし、Anthropic のケースはその論理を逆転させます。米国政府が地政学的な理由で、自国民にも影響を及ぼす自国のソフトウェア資産を初めて回収したのです。
このような介入が常態化すれば、米国の AI モデルで発見された脆弱性が、即時の商業的オフライン化を引き起こす可能性があります。これは、研究開発に数十億ドルを投資した企業にとって、吸収するのが難しい商業的および評判上のリスクです。
Anthropic は声明で、数週間にわたり AI ポリシーに関する公開意見を表明しており、「政府が、透明性があり、公正で、明確で、技術的事実に基づいた法的プロセスの一環として、安全でない展開をブロックする能力を持つこと」を提唱してきました。同社は、2026 年 6 月 12 日の指令が「これらの原則を尊重していない」と考えており、当局との協議を継続し、できるだけ早くアクセスを回復することを目指しています。世界で最も評価されているAIスタートアップと、その政府との間のこの対立は、業界全体が解決しなければならない問いを投げかけている。国家安全保障の名の下に、米国は自国のテクノロジーチャンピオンをどの程度まで妨げる用意があるのか、そして透明性のある規制原則が恣意的な決定を回避することをどのように可能にするのか。今後数日間で与えられる答えは、Fable 5の運命だけでなく、次世代のAIモデルすべてのゲームのルールを決定するだろう。
