Anthropic отключила глобальный доступ к Fable 5 и Mythos 5 после получения директивы правительства США по экспортному контролю.
Приказ, полученный в 00:21 по московскому времени, ссылается на соображения национальной безопасности, связанные с сообщением о методе джейлбрейка. Все остальные модели Anthropic остаются доступными.
Компания заявляет, что выполняет директиву, оспаривая при этом её техническое обоснование.
Правительство США выпустило директиву, не раскрыв в письменной форме конкретных деталей, касающихся национальной безопасности. Официальные лица в устной форме сообщили, что им стало известно о методе, способном обойти защитные механизмы Fable 5.
Anthropic изучила демонстрацию этой техники и установила, что она выявляет лишь незначительные, ранее известные уязвимости.
Компания ознакомилась с тем, что, по её мнению, является отчётом, лежащим в основе решения правительства. Anthropic заявила, что продемонстрированный уровень возможностей «широко доступен в других моделях, включая GPT-5.5 от OpenAI, и ежедневно используется специалистами по защите систем». Проверка не выявила в результатах каких-либо улучшений, специфичных для Fable.
Описанный джейлбрейк по существу сводился к тому, чтобы попросить модель прочитать кодовую базу и выявить программные уязвимости. Anthropic подтвердила, что «не получала даже раскрытия потенциального неуниверсального джейлбрейка, вызывающего озабоченность и приведшего к вредоносному результату». Раскрытые потенциальные джейлбрейки были либо полностью безобидными, либо классифицированы как незначительные находки.
Директива требует приостановить доступ для всех иностранных граждан, включая сотрудников Anthropic с иностранным гражданством, как на территории США, так и за её пределами. Компания сообщила, что соблюдение директивы означало отключение моделей для всех клиентов во избежание нарушения приказа.
Anthropic запустила Fable 5 со стратегией глубокоэшелонированной защиты, сочетающей ограниченную устойчивость к джейлбрейкам с мониторингом в реальном времени и обязательным 30-дневным хранением данных.
Компания признала при запуске, что «идеальная устойчивость к джейлбрейкам в настоящее время невозможна ни для одного поставщика моделей».
Политика 30-дневного хранения данных была намеренным компромиссом. Она вызвала возражения со стороны клиентов, однако позволила Anthropic оперативно обнаруживать, изучать и реагировать на попытки джейлбрейка.
Anthropic охарактеризовала этот подход как делающий джейлбрейки «либо узкоспециализированными, либо очень затратными в производстве», сохраняя уровни риска, сопоставимые с другими развёрнутыми моделями в отрасли.
Относительно полномочий правительства на действия Anthropic заявила, что «считает: правительство должно иметь возможность блокировать небезопасные развёртывания в рамках законодательного процесса, который является прозрачным, справедливым, понятным и основанным на технических фактах». Компания утверждала, что данная директива не отвечает этим стандартам.
Anthropic предупредила, что широкое применение данного стандарта отзыва «фактически остановит все новые развёртывания моделей для всех поставщиков передовых моделей».
Компания взяла на себя обязательство опубликовать дополнительные технические подробности в течение 24 часов и подтвердила, что все остальные модели в её линейке продолжают работать без ограничений.
Материал Anthropic приостанавливает работу Fable 5 и Mythos 5 после введения правительством США директивы по экспортному контролю впервые опубликован на Blockonomi.

