Anthropic показали Claude Mythos Preview — и сразу заявили: в паблик модель выпускать не будут / Хабр

Anthropic запустили Project Glasswing — закрытую инициативу по defensive security вместе с AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, JPMorganChase, Linux Foundation и другими.

Внутри проекта участникам дали доступ к Claude Mythos Preview — новой frontier-модели, которую Anthropic не собираются выпускать в общий доступ.

По их словам, модель за несколько недель нашла тысячи zero-day уязвимостей, включая баги в major OS, браузерах, Linux kernel, OpenBSD и FFmpeg. Часть примеров уже закрыли: среди них 27-летняя уязвимость в OpenBSD, 16-летняя — в FFmpeg и цепочка багов в Linux kernel для эскалации привилегий.

По бенчмаркам разрыв с Opus 4.6 просто космический:

SWE-bench Verified: 93.9% vs 80.8%
CyberGym: 83.1% vs 66.6%
Terminal-Bench 2.0: 82.0% vs 65.4%

Под проект Anthropic выделили до $100 млн в usage credits и ещё $4 млн донатов в open-source security: Linux Foundation, OpenSSF, Alpha-Omega и Apache Software Foundation. Общая идея простая: если модели уже умеют искать и эксплуатировать уязвимости почти на уровне топовых ресерчеров, их хотят как можно быстрее поставить на сторону защитников.

И когда релиз? Сейчас говорят, что напрямую релиз не планируется. Сначала хотят довести до ума защитные механизмы и только потом постепенно переносить возможности этой модели в более безопасные версии моделей (следующий Opus).

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!