Mythos 5: что известно и как с этим жить / Хабр

12 июня компания Anthropic сообщила, что правительство США временно запретило доступ к моделям Fable 5 и Mythos 5 пользователям из других стран как за пределами США, так и внутри страны, включая иностранных сотрудников самой Anthropic.

Компания утверждает, что доступ к остальным моделям Anthropic это решение не касается. Однако сам факт принудительного отключения доступа к двум передовым моделям снова поднял главный вопрос последних месяцев: насколько быстро развиваются ИИ-системы и готовы ли бизнес, регуляторы и разработчики к рискам, которые появляются вместе с такими возможностями.

Особенно много внимания привлекла Mythos 5 — модель, вокруг которой ещё до этого шли дискуссии из-за её потенциального влияния на кибербезопасность. Разбираемся, что известно о Mythos, почему власти США вмешались в доступ к модели и что эта история значит для российского рынка.

Что такое Mythos 5

Mythos 5 — это ИИ-модель Anthropic, на которой могут работать чат-боты, ассистенты и другие AI-инструменты. В отличие от обычных пользовательских моделей, Mythos обсуждают прежде всего в контексте кибербезопасности.

По заявлениям Anthropic, Mythos может находить неизвестные ранее уязвимости в IT-системах, в том числе в ОС, браузерах и другой инфраструктуре. Речь идёт о об уязвимостях zero-day, или уязвимостях нулевого дня, о которых разработчики и владельцы систем ещё не знают, а значит, у них не было времени выпустить исправление.

В теории такие уязвимые места могут использоваться двумя способами. С одной стороны, они помогают быстрее находить проблемы, анализировать код, проверять конфигурации и закрывать уязвимости до атаки. С другой — если подобный инструмент окажется в руках злоумышленников, он может ускорить поиск слабых мест и снизить порог входа для атак.

Именно из-за этого Anthropic ранее решила не выпускать Mythos в широкий публичный доступ. При этом отдельные технологические компании и банки получили возможность протестировать модель, чтобы оценить риски для своих систем, клиентов и процессов киберзащиты.

Что изменилось с 12 июня

До 12 июня обсуждение модели Mythos в основном строилось вокруг её технических возможностей: насколько хорошо модель ищет уязвимости, может ли она помогать в эксплуатации слабых мест и насколько эти риски отличаются от возможностей уже существующих моделей.

Теперь ситуация перешла на другой уровень. Правительство США выпустило директиву, по которой Anthropic должна приостановить доступ к моделям Fable 5 и Mythos 5. В результате компания отключает доступ к этим моделям для всех клиентов, чтобы выполнить требование регулятора.

В статье компании говорится, что в документе не было подробного технического объяснения угрозы. Anthropic понимает позицию властей так: правительство считает, что стало известно о способе обхода защитных механизмов Fable 5, то есть о jailbreak-технике, или о технике взлома.

Jailbreak (взлом) в контексте ИИ — это способ заставить модель обойти встроенные в неё ограничения и выдать ответ, который она должна блокировать. В случае с передовыми моделями такие обходы особенно чувствительны, потому что они могут открывать доступ к опасным возможностям. Например, к инструкциям по кибератакам, эксплуатации уязвимостей или другим вредоносным сценариям.

Однако Anthropic не согласна с тем, что описанный случай должен был привести к фактическому отзыву коммерческой модели. По словам компании, речь идёт не об универсальном способе взлома, который массово снимает ограничения и открывает широкий набор кибервозможностей, а об узконаправленном сценарии. В их изложении он сводится к просьбе модели прочитать конкретную кодовую базу и исправить найденные в ней ошибки.

Anthropic утверждает, что продемонстрированные в этом сценарии возможности уже доступны в других публичных моделях и ежедневно используются специалистами по защите систем.

Почему это важно

История с Mythos 5 важна не только из-за самой модели. Эта ситуация показывает, что ИИ в кибербезопасности выходит из плоскости технологических экспериментов в зону регулирования, экспортного контроля и национальной безопасности.

Раньше подобные дискуссии чаще велись в формате экспертных предупреждений: модели становятся сильнее, могут помогать искать уязвимости, автоматизировать атаки и ускорять работу злоумышленников. Теперь мы видим ситуацию, где государство напрямую вмешивается в доступ к конкретным ИИ-моделям.

Это меняет контекст для всего рынка. Если раньше вопрос звучал как «насколько опасны такие модели», то теперь он звучит шире: «кто должен решать, какие модели можно выпускать, по каким критериям ограничивать доступ и как отличать реальную угрозу от возможностей, которые уже стали индустриальным стандартом».

Anthropic в своём заявлении как раз настаивает на этом различии. Компания признаёт, что идеальной защиты от взлома сейчас, вероятно, не существует ни у одного поставщика моделей. Anthropic считает, что ограничения должны вводиться в рамках прозрачной и технически обоснованной процедуры, а не на основании узконаправленного сценария, который не даёт модели уникального преимущества по сравнению с уже доступными инструментами.

Что известно о защите Fable 5 и Mythos 5

Anthropic утверждает, что перед запуском Fable 5 провела масштабное тестирование защитных механизмов. В нём участвовали внутренние команды, сторонние организации, представители правительства США и британский AI Security Institute. По словам компании, суммарно на тестирование ушли тысячи часов.

Цель таких проверок — найти способы, которыми модель можно заставить нарушить правила безопасности. Это стандартная практика для крупных ИИ-моделей, особенно если они потенциально могут помогать в решении киберзадач.

Anthropic заявляет, что тесты не выявили универсального метода, который позволял бы широко обходить ограничения модели и открывать доступ к большому набору опасных кибервозможностей. При этом компания признаёт, что неуниверсальные обходы возможны у всех современных моделей. Они могут срабатывать в отдельных сценариях, но не дают полного контроля над поведением системы.

Anthropic выбрала стратегию многоуровневой защиты. Идея в том, чтобы не полагаться на один механизм безопасности, а сочетать несколько уровней: встроенные ограничения модели, мониторинг, анализ пользовательских запросов, хранение данных для расследования инцидентов и быстрое закрытие обнаруженных обходов.

Для Fable компания ввела 30-дневное хранение пользовательских данных. Это непопулярная для части клиентов мера, но Anthropic объясняет её необходимостью исследовать и оперативно устранять сценарии взлома.

Проверка Mythos независимыми экспертами

Британский AI Security Institute — один из ведущих центров, занимающихся оценкой безопасности ИИ-систем — изучал Mythos Preview. По его выводам, модель стала заметным шагом вперёд по потенциальному влиянию на кибербезопасность.

Среди тревожных признаков эксперты отмечали способность выполнять многошаговые сценарии и находить уязвимости без подробных инструкций со стороны человека. В одном из тестов Mythos Preview работала в 32-шаговой симуляции корпоративной кибератаки The Last Ones: модель прошла сценарий полностью в 3 из 10 попыток, а в среднем выполняла 22 из 32 шагов.

Это не означает, что модель способна взломать любую защищённую систему. Тем не менее такой результат показывает, что ИИ всё ближе подходит к задачам, которые раньше требовали высокой квалификации, времени и ручной работы специалистов.

Часть экспертов считает, что модель Mythos — скорее эволюционный шаг, чем революция. Некоторые уязвимости, о которых говорила Anthropic, могли находить и более дешёвые модели. Кроме того, найти уязвимость и успешно её эксплуатировать — это не одно и то же. Для реальной атаки нужны контекст, доступ, инфраструктура и цепочка действий.

Важно и то, что большинство успешных взломов до сих пор происходят не из-за сложных zero-day уязвимостей, а из-за давно известных проблем: слабой аутентификации, неустановленных обновлений, ошибок конфигурации и уязвимостей, патчи для которых уже давно существуют.

Почему это важно для банков и крупных компаний

Банки, финтех, платёжные сервисы, телеком, промышленность и госсектор особенно чувствительны к таким технологиям. Для них кибератака — это не только утечка данных или простой отдельного сервиса. В худшем случае сбой может затронуть платежи, переводы, онлайн-банкинг, банкоматы, зарплаты, расчёты между компаниями и доверие клиентов.

Именно поэтому доступ к Mythos ранее получили отдельные крупные компании и банки. Им нужно было понять, как такая модель может использоваться в защите, какие риски она создаёт и насколько быстро подобные инструменты могут изменить ландшафт угроз.

История с директивой США усиливает эту тревогу. Даже если Anthropic права и конкретный взлом был узконаправленным, то сама реакция правительства показывает следующее: передовые модели начинают рассматриваться как инфраструктурный и геополитический фактор. Они становятся не просто продуктом, а технологией, доступ к которой может ограничиваться по соображениям национальной безопасности.

Что это значит для российского рынка

Для России история с Mythos 5 важна не только как новость о зарубежной ИИ-модели. Она показывает несколько тенденций, которые напрямую касаются российских организаций.

1. Автоматизация поиска уязвимостей становится всё более доступной.

Даже если самые мощные модели ограничены, то похожие возможности постепенно появляются у других решений. Это значит, что слабые места в инфраструктурах будут находиться быстрее.

2. Устаревшие системы становятся ещё более рискованными.

Legacy-инфраструктура, неподдерживаемые версии ПО, старые библиотеки, неописанные зависимости и нерегулярные обновления могут быстрее попадать в поле зрения автоматизированных инструментов.

3. Растёт значение доверенной цепочки поставки ПО.

Для организаций становится критически важно понимать, откуда взяты компоненты, кто их сопровождает, как выпускаются обновления, кто отвечает за исправление уязвимостей и можно ли подтвердить происхождение артефактов.

4. Подрядчики становятся частью периметра риска.

Если информационную систему для госорганизации, банка или промышленной компании разрабатывает внешний подрядчик, то безопасность его стека, процессов разработки и используемых компонентов напрямую влияет на заказчика.

5. Регуляторные требования будут всё сильнее пересекаться с практической инженерной безопасностью.

Формального соответствия требованиям становится недостаточно, если инфраструктура остаётся непрозрачной, плохо обновляемой и зависит от компонентов, происхождение и сопровождение которых сложно подтвердить.

Почему базовая кибергигиена становится ещё важнее

На фоне новостей о Mythos легко сделать неправильный вывод: главная угроза теперь — это исключительно сверхмощные ИИ-модели, которые умеют находить zero-day уязвимости. На практике же всё сложнее.

Да, такие модели могут усилить кибератаки. В большинстве случаев злоумышленникам не нужны уникальные уязвимости, если в инфраструктуре уже есть известные и не закрытые проблемы. Необновлённые компоненты, слабые пароли, ошибки конфигурации, отсутствие контроля зависимостей и устаревший стек остаются более массовым и более практичным источником риска.

ИИ здесь работает, скорее, как катализатор. Модель не обязательно создаёт принципиально новую проблему, но делает старые проблемы заметнее и доступнее для эксплуатации. То, что раньше требовало ручного анализа, теперь может частично автоматизироваться.

Для российских компаний главный практический вывод остаётся прежним: нужно не ждать появления идеальной модели-атакующего, а закрывать базовые слабые места уже сейчас.

Вывод

Mythos 5 — это не доказательство того, что ИИ уже завтра «взломает всё». Это важный сигнал, что модели становятся достаточно сложными, чтобы их обсуждали не только инженеры и исследователи, но и государственные органы, банки, регуляторы и службы национальной безопасности.

Новость от 12 июня усилила этот сигнал. Теперь вопрос не только в том, на что способны такие модели, но и в том, кто контролирует доступ к ним, по каким правилам вводятся ограничения и как бизнесу жить в мире, где ИИ-инструменты могут одновременно помогать защитникам и усиливать атакующих.

Для организаций это означает необходимость пересмотреть устаревшие компоненты, ускорить обновления, наладить контроль зависимостей, проверить процессы разработки и сопровождения ПО, а также заранее понять, кто отвечает за безопасность каждого элемента IT-стека.

В новой реальности уязвимость может быть найдена не только человеком, который неделями изучает систему, но и моделью, которая ускоряет анализ кода, конфигураций и цепочек атаки. И даже если конкретная модель будет ограничена регулятором, сам тренд уже не исчезнет.

Mythos 5: что известно и как с этим жить