Anthropic의 Fable 5 및 Mythos 5, 2026년 6월 12일 미국 정부 명령으로 갑작스럽게 비활성화
공개 출시 단 3일 만에 Anthropic의 가장 강력한 두 모델이 서버에서 사라졌습니다. 국가 안보에 대한 잠재적인 위협으로 간주된 탈옥(jailbreak) 가능성이 명분이었지만, Anthropic 자체에 따르면 실제 이유는 훨씬 더 복잡합니다.
기록적인 출시, 갑작스러운 서비스 중단
2026년 6월 9일, Anthropic은 최초의 Mythos 등급 모델인 Claude Fable 5를 일반 대중에게 공개했으며, 사이버 보안 전문가 그룹만을 대상으로 한 안전 장치가 부분적으로 해제된 버전인 Claude Mythos 5도 함께 출시했습니다. 2026년 6월 9일에 발표된 Anthropic의 공식 보도 자료에 따르면, Fable 5는 "테스트된 거의 모든 벤치마크에서 최첨단 성능"을 보여주며 소프트웨어 엔지니어링, 과학 연구, 장문 맥락 작업에서 탁월한 성능을 발휘했습니다.
두 모델의 차이는 안전 장치에만 있었습니다. Fable 5는 사이버 보안, 생물학 또는 화학과 관련된 민감한 요청에 대해 자동으로 Claude Opus 4.8로 리디렉션하는 보안 분류기를 통합했습니다. 이 메커니즘은 평균 세션의 5% 미만에서 활성화되었습니다. Mythos 5는 동일한 기본 모델을 공유했지만 특정 영역에서 이러한 제한이 해제되었으며 미국 정부와의 협력 프로그램인 Glasswing Program의 일부로 배포되었습니다.
발표된 가격은 입력당 100만 토큰당 10달러, 출력당 100만 토큰당 50달러로, 이전 Mythos Preview 모델 가격의 절반 미만이었습니다.
상무부의 지침: 긴급 결정
2026년 6월 12일 오후 5시 21분(동부 표준시), Anthropic은 수출 통제 지침을 받았습니다. 이 명령은 미국 영토에 있든 없든 외국 국적자, 심지어 Anthropic 자체의 외국인 직원을 포함하여 모든 외국 국적자에 대한 Fable 5 및 Mythos 5의 접근을 즉시 중단해야 한다는 명확한 내용이었습니다.
6월 12일에 게시된 공식 성명에서 Anthropic은 "이 서한에는 국가 안보에 대한 우려에 대한 구체적인 세부 정보가 제공되지 않았다"고 밝혔습니다. 그러나 정부는 모델의 안전 장치를 우회하는 방법에 대한 정보를 구두로 회사에 전달한 것으로 알려졌습니다.
이 명령의 직접적인 결과는 기술적인 역설을 만들어냈습니다. 외국 국적자를 대상으로 한 제한 규정을 완전히 준수하기 위해 Anthropic은 미국 시민을 포함한 모든 고객에 대해 두 모델을 비활성화할 수밖에 없었습니다. 같은 공식 성명에서 회사는 "다른 모든 Anthropic 모델에 대한 접근은 영향을 받지 않을 것"이라고 밝혔습니다.
국가 안보 위협으로 격상된 사소한 탈옥
이 결정의 핵심에는 매우 특정한 조건에서 모델의 안전 장치를 부분적으로 우회할 수 있는 기술인 « 비보편적(non-universal) » 탈옥이 있습니다. 6월 12일 Anthropic의 공식 보도 자료에 따르면, 이 방법은 본질적으로 "모델에게 특정 코드베이스를 읽고 소프트웨어 결함을 수정하도록 요청"하는 것을 포함합니다.
Anthropic은 지침의 근거가 된 보고서를 검토했으며, 그 우려의 성격을 강력하게 반박했습니다. 회사는 같은 성명에서 « 설명된 능력 수준은 OpenAI의 GPT-5.5를 포함한 다른 모델에서도 광범위하게 사용할 수 있으며 », 이 기술은 "시스템 보안을 책임지는 방어자들에 의해 매일 사용된다"고 주장했습니다.
Anthropic의 방어는 강력한 실적에 기반합니다. 출시 전에 이 회사는 미국 정부, 영국 AISI(AI Safety Institute) 및 여러 민간 제3자 조직과 협력하여 Fable의 안전 장치를 수천 시간 동안 레드 팀 테스트를 거쳤습니다. 어떤 테스터도 사이버 보안 능력의 광범위한 스펙트럼에 대해 모델의 보호 기능을 우회할 수 있는 보편적인 탈옥 방법을 찾지 못했습니다. 이 결과는 Anthropic이 공식 출시 게시물에서 이미 예상했던 것으로, 회사는 여기서 완벽한 탈옥 방지가 "현재 어떤 모델 공급업체에게도 불가능하다"고 명시적으로 밝혔습니다.
« 심층 방어 » 전략 시험대에 오르다
이러한 기술적 현실에 직면하여 Anthropic은 Fable 5에 대해 문서화된 심층 방어 접근 방식을 채택했습니다. 목표는 비보편적 탈옥의 범위를 매우 좁게 만들거나, 강화된 모니터링과 결합하여 보편적 탈옥의 생성 비용을 매우 높게 만드는 것이었습니다. 이것이 바로 Anthropic이 Mythos 등급 모델에 대해 30일간의 데이터 보존을 의무화한 이유이며, 이는 공식 보도 자료에서 "고객에게 실질적인 비용"이라고 인정했지만 "탈옥을 검색하고 완화"하는 데 필요하다고 명시했습니다.
6월 12일 성명에서 Anthropic은 모호함 없는 입장을 유지했습니다. « 우리는 정부의 법적 지침을 존중하며 모든 사용자에 대한 Fable 5 및 Mythos 5 접근을 차단하고 있습니다. 그러나 우리는 제한적인 잠재적 탈옥 발견이 수억 명에게 배포된 상업용 모델을 회수할 이유가 된다고 생각하지 않습니다. » (We are complying with the government’s legal directive and are removing access to Fable 5 and Mythos 5 for all users. However, we disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people.)
업계에 마비될 수 있는 잠재적 영향의 선례
이 결정의 범위는 Anthropic만의 사례를 넘어섭니다. 공식 성명에서 회사는 이를 명확하게 표현했습니다. « 이 표준이 업계 전반에 적용된다면, 모든 최첨단 모델 공급업체의 모든 새로운 모델 배포를 본질적으로 중단시킬 것이라고 생각합니다. » (If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.)
이는 2019년 화웨이가 미국 상무부 블랙리스트에 오른 것과 비교할 수 있습니다. 이 결정은 국가 안보를 이유로 중국 거대 기업을 미국 칩 및 소프트웨어에서 차단했습니다. 그러나 Anthropic 사례는 논리를 뒤집습니다. 미국 정부가 지정학적 이유로 자체적인 국내 소프트웨어 자산을 회수하는 것은 이번이 처음이며, 자국민에게 영향을 미칩니다.
이러한 유형의 개입이 일반화된다면, 미국 AI 모델에서 발견된 모든 취약점은 즉각적인 상업적 서비스 중단을 촉발할 수 있습니다. 이는 수십억 달러를 연구 개발에 투자한 기업들에게는 흡수하기 어려운 상업적 및 이미지 위험입니다.
Anthropic은 성명에서 몇 주 동안 AI 정책에 대해 공개적으로 발언해 왔으며, "정부가 투명하고, 공정하며, 명확하고, 기술적 사실에 근거한 법적 절차의 일부로서 안전하지 않은 배포를 차단할 수 있는 능력을 가져야 한다"고 주장했습니다. 회사는 2026년 6월 12일 지침이 "이러한 원칙을 존중하지 않는다"고 판단하고 당국과 협의를 계속하여 조속한 접근 재개를 확보하고 있습니다.세계에서 가장 가치 있는 AI 스타트업과 자국 정부 간의 이 힘겨루기는 온 산업이 풀어야 할 질문을 제기합니다. 미국은 국가 안보를 위해 자국의 기술 선도 기업을 얼마나 저해할 의향이 있으며, 어떤 투명한 규제 원칙이 자의적인 결정을 피할 수 있도록 할까요? 며칠 안에 주어질 답은 Fable 5의 운명만큼이나 차세대 AI 모델에 대한 규칙을 결정할 것입니다.
