Я попросила Claude Fable 5 сделать игру одним промптом. Получился симулятор админа ИИ-канала / Хабр

9 июня Anthropic выпустила Claude Fable 5 - первую публичную модель класса Mythos, на ступень выше привычного Opus. Релиз громкий: 80,3% на SWE-bench Pro, миграция кодбазы Stripe за день, "самая мощная публичная модель в истории компании".

Но бенчмарки - это чужой опыт. Мне было интереснее проверить свое: может ли модель не просто написать кусок кода, а собрать маленький продукт целиком - с идеей, механикой, балансом, интерфейсом и концовками.

Поэтому я не стала просить змейку, To-Do планер или лендинг. Я попросила одним промптом собрать браузерную игру - симулятор админа Telegram-канала про ИИ.

Получился Нейровестник. Поиграть можно и с телефона.

Спойлер: модель сама вшила в баланс мораль. Кликбейт без фактчекинга стабильно убивает канал.

Игра собрана Claude Fable 5 за несколько минут одним промптом, без единой строчки кода руками. Играется с телефона.

Почему именно игра, а не очередная "змейка"

"Сделай змейку", "сделай TODO-лист", "сделай калькулятор" - такие задачи давно умеют все топовые модели. По ним невозможно понять, где реальный прогресс, а где просто CSS стал красивее. Но бенчмарки - это чужой опыт.

Мне хотелось задачу ближе к настоящему продукту: придумать механику, заложить правила и события, сбалансировать показатели, сделать интерфейс, добавить финальные сценарии, и упаковать так, чтобы это запускалось в браузере и в это было не скучно играть. Не "сгенерируй HTML", а собери маленький интерактивный опыт.

Официально Fable 5 позиционируют именно под такое: длинная автономная работа, где модель сама строит план, держит контекст, проверяет себя и доводит дело до результата. Вот это и проверяем.

Что я попросила

Игрок ведет ИИ-канал 30 игровых дней. Каждое утро прилетают четыре новости и четыре единицы энергии (⚡). Новости - узнаваемые до боли: новая модель якобы "порвала бенчмарки" (источник - один твит), в X завирусился тред с сомнительным графиком, подписчик нашел ошибку в цифрах, рекламодатель принес мутный сервис, кто-то опять обещает AGI к следующему вторнику.

Для каждой новости выбираете одно действие - кнопка подсвечивается:

постить сразу - быстрый рост, но рискуете нарваться на фейк;
проверить и запостить - безопаснее, но тратите энергию;
устроить холивар - взрыв охвата, минус доверие;
взять рекламу, проигнорировать или перенести на завтра.

Каждое решение двигает показатели: подписчики, охват, доверие, деньги, усталость, риск фейка. Выбрали действия для всех карточек → жмете "Завершить день" → получаете отчет: что сработало, кто отписался, был ли скандал. Через 30 дней - одна из пяти концовок: от "Легенды ИИ-телеги" до "Канал умер от фейков".

Совет: первые день-два кажутся спокойными. На второй-третий начнут прилетать скандалы и события - и вот тут становится азартно.

Что получилось

Fable 5 собрала игру в одном HTML-файле. Без сборки, без фреймворка, без настройки проекта - просто файл, который открываешь и играешь. На все ушло несколько минут генерации (меньше 10) и один промпт, ни одной строчки кода руками.

Визуально - киберпанк: темный фон, неоновые карточки, бегущая строка со "срочными" новостями, показатели канала, кнопки решений, финальные отчеты. Как прототип - цельно: понятно, куда нажимать, где метрики, где завершить день.

И самое смешное: игра быстро наказывает за типичное поведение реальных ИИ-каналов. Постить все первым без проверки, верить каждому графику из X, брать мутную рекламу, разгонять холивары ради охвата, игнорировать подписчиков с их "а цифры-то не сходятся". Какое-то время подписчики и охваты растут, но доверие падает, потом прилетает скандал, и канал превращается в мем. Примерно как в жизни, только быстрее.

Момент, ради которого я пишу эту статью

В промпте я описала механику: ресурсы, карточки, действия, концовки. Я не просила делать игру нравоучительной. Но модель сама заложила причинно-следственные связи.

Проверка фактов тратит энергию, но снижает риск.
Кликбейт дает быстрый охват, но бьет по доверию.
Холивар поднимает видимость, но увеличивает усталость и вероятность скандала.
Мутная реклама приносит деньги, но портит репутацию.
Игнорирование жалоб экономит силы, но медленно разрушает отношения с аудиторией.

В итоге стратегия "постить все подряд" дает взрывной старт - и стабильно убивает канал к третьей неделе. А скучная стратегия "проверяй, признавай ошибки, не рассматривай сомнительные предложения" медленно ведет к лучшим концовкам. Честность оказалась доминирующей стратегией - и это не отдельное правило, где за фейки "минус 100 очков”, а результат всей игровой экономики, которую модель придумала сама.

Fable 5 не просто сделал HTML-игру, а заложил маленькую модель медийного поведения. И именно здесь видно, зачем нужны такие модели: не потому что они умеют писать div и button - это умели и раньше, а потому что они собирают продуктовую логику целиком: механику, интерфейс, тон, последствия.

Что осталось слабым

До настоящей игры этому, конечно, далеко, скажу честно.

Баланс прозрачный: через несколько прохождений понимаешь, какие решения выгоднее. Событий хочется больше, некоторые формулировки можно сделать острее. Финальным отчетам не хватает графиков и истории решений. Нет сохранений, шаринга результата и режима "хардкор", где фейки выглядят почти как настоящие новости.

Но для одного промпта и нескольких минут это рабочая заготовка продукта, которую можно развивать.

Теперь про саму Fable 5 - без восторгов

Контекст, чтобы вы понимали, чем именно собран этот симулятор и стоит ли вам трогать модель самим.

Что это. Fable 5 - первая общедоступная модель класса Mythos. Под капотом та же нейросеть, что и закрытая Claude Mythos 5, которую без ограничений получают только проверенные организации. Fable - версия "для всех", обернутая в слой классификаторов безопасности.

Цифры. 95% на SWE-bench Verified, 80,3% на SWE-bench Pro (у Opus 4.8 - 69,2%, у GPT-5.5 - 58,6%), первое место на FrontierCode. Кейс Stripe: миграция в Ruby-кодбазе на 50 миллионов строк за один день - работа, на которую у команды ушло бы больше двух месяцев. Hex сообщила о первом прорыве 90% на их бенчмарке длительных аналитических задач, Hebbia назвала Fable сильнейшей моделью для финансов из всех, что тестировала. CodeRabbit подтверждает то, что увидела я:

модель отлично работает с недоописанными задачами - по расплывчатому промпту собирает законченный проект, а не прототип-заглушку. Но для код-ревью они советуют пока оставаться на Opus.

Ограничения. Поверх модели стоят классификаторы по четырем зонам: кибербезопасность, биология, химия и дистилляция (попытки обучать на ответах Fable конкурирующие модели - да, Anthropic одним механизмом защищает и мир, и свой бизнес). Если запрос задевает зону, его тихо передают старому Opus 4.8. По данным Anthropic - менее чем в 5% сессий, биллинг за такие ответы идёт по тарифам Opus. Ложные срабатывания - реальность: пентестеры и исследователи безопасности уже жалуются, что их выкидывает на Opus посреди работы.
Цена и дедлайн. $10 за миллион входных и $50 за миллион выходных токенов - вдвое дороже Opus 4.8. А думает модель глубоко и долго, токенов ест много. Сейчас Fable 5 включена в подписки Pro, Max, Team и Enterprise без доплаты, но только до 22 июня, и лимиты она расходует вдвое быстрее Opus. С 23-го - отдельная оплата кредитами.
Приватность. Весь трафик Fable 5 обязательно хранится 30 дней - даже у корпоративных клиентов с прежними договорами о нулевом хранении. Anthropic клянется, что данные не идут в обучение, но прецедент неприятный: доступ к топ-модели теперь идет в комплекте с обязательным хранением "во имя безопасности".

Мой вывод после теста

Fable 5 не нужна для того, чтобы просто написать пост или сделать саммари - для этого есть Sonnet и Opus: быстрее, дешевле, и никакой классификатор не перекинет вас на другую модель посреди разговора.

Но если задача длинная, не до конца ясная и продуктовая - собрать симулятор, придумать механику, заложить правила, сгенерировать события, упаковать все в один рабочий файл - то уже видно, за что платишь двойную цену.

Мне понравилось не то, что Claude Fable 5 написал игру. Мне понравилось, что модель поняла суть игры: в медиа можно быстро набрать охваты, но если убить доверие - канал долго не живет. Я этого в промпте не прописывала.

Сыграйте и расскажите в комментариях, какая концовка у вас. Мой рекорд пока "Уважаемый эксперт". До "Легенды ИИ-телеги" не доросла: жадничаю на холиварах.

P. S. Вы можете поддержать меня в моем телеграм канале, там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ‑сервисы, инструменты для офиса, бизнеса, маркетинга и видео.