Anthropic встроила скрытые ограничения в Mythos 5 и Fable 5 для пользователей, занимающихся исследованиями в области ИИ / Хабр

Anthropic оказалась в центре скандала после того, как в технической документации к моделям Mythos 5 и Fable 5 обнаружились намеренные ограничения для пользователей, занимающихся ИИ‑исследованиями, сообщает Business Insider.

Компания объяснила своё решение опасениями, что передовые ИИ‑системы могут ускорить создание конкурирующих моделей, которые якобы не будут обладать должным уровнем безопасности. При этом ограничения намеренно сделаны невидимыми: модель не выдаёт отказ и не переключается на более слабую версию, зато тайно модифицирует ответы, незаметно изменяя промпты пользователя.

В компании SemiAnalysis сообщили, что фильтры новой модели уже отсекают их исследования в области инференса на GPU и кодинг. Разработчики из Prime Intellect назвали происходящее «очень, очень печальным для исследовательского сообщества», добавив, что скрытость этих ограничений — «просто безумие».

Сооснователь ИИ‑стартапа Reka Микель Артетче сравнил ситуацию с тем, как если бы Apple случайно перезагружала Mac при работе над конкурирующей технологией, Gmail молча редактировал письма при упоминании соперников, а автопилот Tesla вилял в сторону при обнаружении, что водитель работает над беспилотными автомобилями.

Инцидент также вновь вызвал дискуссию касательно причин задержки релиза Mythos. Ранее предполагалось, что либо модель была слишком небезопасна, либо у Anthropic не хватало мощностей, либо же компания опасается, что конкуренты смогут использовать Mythos для создания своей продуктов. Последняя версия теперь выглядит достаточно правдоподобной, особенно если Mythos могут использовать разработчики опенсорсных решений и китайские лаборатории.