Anthropic выпустила Fable 5 — и я задумался, не движемся ли мы не в ту сторону / Хабр

Самая мощная публично доступная модель оказалась дороже и медленнее. Разбираю релиз и рассуждаю, почему удешевление и ускорение, возможно, важнее роста потолка

9 июня Anthropic выпустила Claude Fable 5 — первую публично доступную модель класса Mythos. Той самой Mythos, которую в апреле компания сочла настолько мощной (и потенциально опасной в части кибербезопасности), что не стала открывать публике, а раздала ограниченному кругу организаций в рамках программы Project Glasswing. Спустя меньше трёх месяцев Anthropic решила, что готова дать публике модель того же класса — с оговорками.

Релиз я разобрал по первоисточникам (CNBC, TechCrunch, Axios, Fortune, Inc.), и он действительно впечатляет по цифрам. Но чем дольше я его читал, тем сильнее у меня крепло одно ощущение, которым и хочу поделиться. Оно не про то, что Fable 5 плохая. Оно про то, что вектор всей этой гонки, возможно, смещён не туда, куда стоило бы.

Сначала факты, потом мысль.

Что реально выпустили

Fable 5 — это публично доступная версия модели класса Mythos. Под капотом, по словам Anthropic, у Fable 5 и Mythos одна и та же базовая модель. Разница в защитах.

Ключевые факты из официальных источников:

Заявленные способности. Anthropic называет Fable 5 «state-of-the-art практически на всех протестированных бенчмарках» — софтверная инженерия, knowledge work, vision, научные исследования. По заявлению компании, обходит конкурентов от OpenAI и Google DeepMind на всех бенчмарках.
Цена. Вдвое дороже моделей Opus. Это самый дорогой релиз Anthropic. Через API — порядка 10/50 долларов за миллион токенов (input/output).
Защиты. Главная фишка релиза. В высокорисковых областях — кибербезопасность, биология, химия, дистилляция — модель блокирует ответ и откатывается на Claude Opus 4.8. То есть на чувствительных запросах вы получаете ответ от менее мощной модели, а не от Fable.
Доступ по подписке — временный. До 22 июня Fable 5 включена в планы Pro, Max, Team и seat-based Enterprise без доплаты. С 23 июня её убирают из подписок, дальше — только через usage-кредиты или API, с обещанием вернуть в подписку «так быстро, как сможем».
Расход лимитов. В период бесплатного доступа Fable 5 тратит лимиты по удвоенной ставке относительно Opus. Параллельно Anthropic выкатила Mythos 5 — апгрейд для тех, у кого уже был доступ к Mythos Preview (партнёры Project Glasswing, около 150+ организаций в 15 странах). Для Mythos 5 часть защит снимается, и его разворачивают в том числе в сотрудничестве с правительством США для киберзащитников и операторов критической инфраструктуры.

Механика защит — это технически любопытно

Прежде чем переходить к рассуждению, отдам должное инженерному решению защит. Оно нетривиальное.

Обычно safety в LLM реализуется как отказ — модель распознаёт опасный запрос и говорит «не могу помочь». Здесь подход другой: роутинг с понижением. Fable 5 не отказывает — она определяет, что запрос попадает в высокорисковую зону, и молча перенаправляет его на Opus 4.8, менее мощную модель. Пользователь получает ответ, просто не от топовой модели.

Логика понятна: если самая опасная способность Fable — это поиск и эксплуатация уязвимостей и помощь в биологии на уровне «суперчеловека», то для этих конкретных областей достаточно ответа модели послабее, у которой таких способностей нет. А во всём остальном — пожалуйста, полная мощь.

Anthropic заявляет, что red team прогнала больше 1000 часов тестирования, пытаясь обойти эти защиты, и не нашла ни одного рабочего джейлбрейка. Глава продукта Dianne Penn сказала Axios, что компания «намеренно консервативна» на старте — то есть часть легитимных научных и security-запросов тоже будет улетать на Opus, и со временем эти ложные срабатывания планируют сокращать.

Это, кстати, прямо отражено в телеграм-пересказах: «на некоторые запросы скатывается к Opus, какие именно — модель решает сама». Формулировка корявая, но суть верная. И да, на практике это может мешать тем, кто делает легальную security-работу — будет периодически получать ответ от модели послабее без явного объяснения.

Сам факт, что роутинг решает модель, а не человек, и что граница «высокорисковости» непрозрачна — это отдельная тема для дискуссии о том, кто и как проводит эту черту.

А теперь то, что меня смущает

Здесь я перехожу от фактов к мнению, и оно дискуссионное — буду рад возражениям в комментариях.

Читая релиз, я ловлю себя на одной и той же мысли. Каждый новый фронтир-релиз — это «мы круче всех на всех бенчмарках, это поражает, и это так опасно, что нужны особые защиты». Fable 5 не исключение: state-of-the-art, обходит всех, настолько мощная, что родительскую Mythos сначала вообще побоялись выпускать.

Но если отвлечься от риторики и посмотреть на то, что пользователь реально получает:

Модель дороже — вдвое от Opus, самый дорогой релиз компании.
Модель тратит лимиты быстрее — двойная ставка даже в щедрый период.
Доступ временный — три недели бесплатно, потом за деньги, и неизвестно когда вернут.
На части запросов она сама себя понижает до предыдущей модели. И всё это ради прироста на бенчмарках, который впечатляет на графике, но не ощущается как переход в новое качество. Это не AGI-момент, после которого работа меняется радикально. Это «ещё немного лучше, но дольше и дороже».

Мой тезис: движение в сторону ускорения и удешевления как минимум так же важно, как рост потолка способностей. А может, и важнее.

Почему удешевление важнее, чем кажется

Это не просто брюзжание про цены. За этим стоит содержательный аргумент про то, что вообще можно построить.

Исторически в вычислениях главные сдвиги давал не рост абсолютной мощности, а падение стоимости единицы. Мейнфреймы были мощными, но мир изменили дешёвые персоналки. Дорогая модель, доступная немногим под особые задачи, полезна узкому кругу. Дешёвая и быстрая модель меняет то, какие продукты вообще возможны.

Применительно к LLM это особенно остро из-за агентных сценариев. Агент, который крутится в цикле — читает, думает, вызывает инструменты, проверяет себя — делает не один вызов модели, а десятки и сотни. На таких паттернах цена и латентность каждого вызова умножаются. Модель, которая «на 5% умнее, но вдвое дороже и медленнее», в агентном цикле проигрывает более дешёвой и быстрой почти всегда. Потому что вместо одного запроса к гению ты делаешь сто запросов, и сто раз платишь надбавку за гениальность, которая на большинстве шагов не нужна.

То же с кодингом, ради которого многие из нас и держат подписку. В реальной работе важнее быстрый отклик и приемлемая цена на тысячах итераций, чем последние проценты на бенчмарке, которые проявляются на редких сложных задачах. «Дольше думает, но чуть лучше» — для интерактивного кодинга часто хуже, чем «быстро и нормально».

Поэтому когда я вижу, что самый громкий релиз года — это «мощнее, но дороже и медленнее, и доступ ограничен», у меня возникает вопрос: а мы точно оптимизируем то, что нужно большинству пользователей? Или мы оптимизируем то, что красиво смотрится на слайде с бенчмарками и важно для узкого сегмента (киберзащита, биология, фронтир-ресёрч), у которого есть бюджет на максимум?

Контраргумент, который честно надо привести

Чтобы не быть односторонним — есть и сильный контртезис, и я его понимаю.

Удешевление обычно идёт следом за ростом потолка. Сначала появляется дорогая мощная модель, потом её дистиллируют, оптимизируют, делают дешёвую версию с почти теми же способностями. Нельзя удешевить то, чего ещё нет. С этой точки зрения дорогой фронтир — это R&D-инвестиция, которая через год превратится в дешёвый Sonnet/Haiku-аналог, доступный всем.

И структура самих линеек это подтверждает: есть быстрые дешёвые модели для масштаба и дорогие топовые для задач, где не жалко заплатить за максимум. То есть индустрия не игнорирует удешевление — она движется по обоим векторам, просто фронтир-релизы громче звучат.

Плюс есть задачи, где потолок реально решает: поиск уязвимостей в критической инфраструктуре, drug design, научный ресёрч. Там «на 5% лучше» может означать найденную уязвимость или ненайденную, и цена вопроса несопоставима со стоимостью токенов. Для этих задач Fable/Mythos оправданы любой ценой.

Так что честный вывод не «фронтир не нужен», а «фронтир и удешевление — разные продукты для разных задач, и не стоит мерить один линейкой другого».

Что до временного доступа

Отдельно про «три недели бесплатно, потом лимиты улетят в секунду». Это нормальная экономика запуска дорогой модели, и относиться к ней стоит трезво.

Промо-период нужен Anthropic, чтобы собрать нагрузку, фидбек и данные о реальном использовании, субсидируя дорогой инференс из своего кармана. Потом ставится реальная цена. Это не «невиданная щедрость», которая станет новой нормой — это demo. Строить рабочие процессы в расчёте на бесплатный Fable 5 после 22 июня не стоит. Стоит воспринять эти три недели именно как возможность пощупать и понять, нужна ли вам эта модель за деньги под ваши конкретные задачи, или Opus/Sonnet закрывают их с запасом по цене.

Особенно с учётом двойного расхода лимитов: в щедрый период вы реально протестируете немного, прежде чем упрётесь.

И ещё момент про контекст релиза, который стоит держать в голове: Anthropic, по сообщениям, готовится к IPO. Громкий релиз самой мощной модели прямо перед выходом на биржу — это в том числе про инвестиционный momentum, а не только про пользу пользователю. Это не делает модель хуже, но объясняет, почему риторика «капец как это поражает и опасно» накручена.

Резюме

Fable 5 — реальный и сильный релиз: первая публичная модель класса Mythos, с нетривиальным инженерным решением защит через роутинг на Opus в высокорисковых зонах. Если вам нужен абсолютный максимум способностей и вы готовы платить вдвое от Opus — это лучшее, что сейчас доступно публично.

Но мне кажется важным проговорить мысль, которая за хайпом теряется: рост потолка способностей — не единственная ось прогресса, и, возможно, не самая важная для большинства. Для агентных систем, для повседневного кодинга, для массовых продуктов удешевление и ускорение дают больше совокупной пользы, чем очередные проценты на бенчмарке. Дешёвый и быстрый инференс меняет, что вообще можно построить. Дорогой топ полезен немногим задачам, где не жалко заплатить.

Прогресс не остановить, и фронтир нужен — хотя бы как R&D, который потом дистиллируется в доступное. Но когда самый громкий релиз года звучит как «мощнее, но дороже, медленнее и временно» — это хороший повод спросить себя, ту ли ось мы привыкли считать главной.

А что думаете вы — что для вашей работы важнее: потолок способностей или цена и скорость? Интересно, совпадёт ли ощущение.

Источники: официальный анонс Anthropic, репортажи CNBC, TechCrunch, Axios, Fortune, Inc., NBC News от 9 июня 2026. Цифры по ценам и датам доступа приведены на момент релиза и могут измениться — проверяйте актуальное на сайте Anthropic.