
OpenAI финализирует новую модель с продвинутыми возможностями в кибербезопасности и планирует выдать ее только узкому кругу компаний — по схеме, похожей на ограниченный релиз Mythos от Anthropic. Об этом со ссылкой на источник, знакомый с ситуацией, сообщил Axios. Это уже вторая фронтирная лаборатория за неделю, которая добровольно отказывается от широкого выпуска новой модели из-за страха перед ее же способностями.
Поводом для публикации стал анонс Anthropic от 7 апреля: компания запустила Project Glasswing и раздала доступ к Claude Mythos Preview ограниченному кругу партнеров — AWS, Google, Microsoft, CrowdStrike, JPMorganChase и другим — из-за опасений, что автономные хакерские возможности модели слишком велики для общего релиза. OpenAI, по данным Axios, собирается поступить так же. Инфраструктура под это уже готова: в феврале компания запустила пилотную программу Trusted Access for Cyber после выпуска GPT-5.3-Codex. Участникам программы обещают доступ к моделям с расширенными кибервозможностями и меньшим числом ограничений, а также $10 млн API-кредитов на старте.
О какой именно модели идет речь, Axios не уточняет. В марте OpenAI уже завершила претрейнинг новой модели под внутренним кодовым именем Spud — Сэм Альтман называл ее "очень сильной" и говорил сотрудникам, что она может "действительно ускорить экономику", обещая релиз "в течение нескольких недель". Грег Брокман на подкасте Big Technology описывал Spud как результат "двух лет исследований" и сравнивал ощущение от нее с "запахом новой машины". В сообществе спорят, что это — GPT-6 или промежуточная GPT-5.5. Одна ли это модель с той, о которой говорит источник Axios, или речь идет о разных релизах — пока непонятно.
Но многие эксперты считают, что точка невозврата уже пройдена, даже если лаборатории будут придерживать модели. "Нельзя запретить моделям искать уязвимости в старом коде — такая способность уже существует", — заявил Axios Роб Ли, главный AI-директор института SANS. Венди Уитмор, старший директор по аналитике угроз в Palo Alto Networks, на панели HumanX во вторник сказала, что модель с аналогичными возможностями появится в свободном доступе в течение недель или месяцев. Адам Майерс, вице-президент CrowdStrike по противодействию угрозам, назвал способности Mythos "тревожным звонком для всей индустрии".
Параллели с традиционной индустрией безопасности напрашиваются сами собой. Ли добавил, что поэтапный релиз фронтирных моделей похож на то, как вендоры десятилетиями спорили о принципах ответственного раскрытия уязвимостей. При этом эффект от ограничений может оказаться скромнее, чем хотелось бы: исследователи компании Aisle в среду показали, что общедоступные модели уже способны находить часть тех уязвимостей, которые обнаружила Mythos.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
