В сети появился слив системного промпта, который якобы управляет поведением новой модели Claude Fable 5. Объём около 120 тысяч символов, публикация от аккаунта Pliny the Liberator. Официально Anthropic утечку не подтверждала, поэтому дальше речь идёт о содержимом текста, а не о подтверждённом факте.
По тексту Fable 5 позиционируется как первая модель семейства Claude 5 и относится к классу Mythos, который стоит выше Opus. Fable 5 и Mythos 5 описаны как одна и та же модель под капотом, но с разной политикой безопасности. У Fable 5 включены дополнительные ограничения для сценариев двойного назначения, Mythos 5 выдают без них только проверенным организациям.
Промпт разбит на блоки: информация о продуктах с перечнем моделей и их строковыми идентификаторами (claude-fable-5, claude-opus-4-8), правила отказов, работа с темами здоровья и психики, осторожность с юридическими и финансовыми советами. Отдельно заданы правила форматирования: проза вместо списков и жирного текста, если пользователь явно не попросил список.
Отдельный блок посвящён защите от промпт-инжекций. В промпте оговаривается, что в конец сообщения пользователя могут попадать напоминания, похожие на служебные инструкции, и модель должна игнорировать их, если они противоречат её базовым правилам. Это прямая попытка закрыть вектор джейлбрейка с подделкой системных сообщений внутри пользовательского ввода.
Из других деталей в тексте фигурируют Claude Cowork для не-разработчиков, режимы Claude в Chrome, Excel и PowerPoint, постоянное хранилище для артефактов через window.storage с методами get, set, delete, list, а также подключение внешних сервисов через MCP с приоритетом поиска коннектора в реестре до предложения альтернатив.
Важная оговорка: подлинность промпта не подтверждена. Модель может нагаллюцинировать свои инструкции или выдать устаревшую версию, так что считать текст официальным документом нельзя.
Коллеги, если вы пишите сами системные промпты, это всё равно полезный референс: видно, как лидер рынка раскладывает правила по слоям, как формулирует отказы и как отделяет доверенный ввод от данных из недоверенных источников.
Источник: https://x.com/elder_plinius/status/2064478648057610422
