
Комментарии 4
Если смотреть с точки зрения обычного человека, то это все не более чем генерация вредного мусора. И хорошо что продвижения сайтов статьями отошло на задний план.
В таком случае 90% цифрового поля - это мусор. Ведь это просто трансформация данных из одного формата/стиля в другой.
Материал мне понравился, лишь поделюсь собственным опытом.
Если работаете с Claude API, на этапе черновика или перед ним пользуйтесь content.citations и трансформируйте интенции в новые переходные (добавляя интонационные связки, лиды, контекстуальные уточнения - на что хватит фантазии и времени/усидчивости).
Дробите пайплайн как можно сильнее, чтобы на всех этапах непосредственно перед написанием текста работать не с текстом, а с JSON. Например, мы пишем образовательный контент сегментами (секциями, либо триплетом абзацев) и соответственно структурируем JSON.
В промпте/промптах для результирующего текста не забудьте оставить нейронке какое-то пространство для маневра. LLM склоняются либо взять источник за истину в первую инстанции, либо наоборот его испоганить. Хотя большинству нужно взять из источника N% интенций, а остальное "потратить" на нарратив.
Во всех промптах не забывайте о XML-тегах. Для меня в промптинге с клодом это изменило все.
Не забывайте, что точно так же с использованием Whisper или даже Google Speech-to-Text API редакторы могут вносить изменения в текст гораздо быстрее, просто передавая "команды" тем же API, причем для данной задачи уже будет достаточно и китайских моделей. На базовом уровне вайбкодится подобное решение за 20 минут - пару часов. Со своим редактором на условном Tiptap.
По моей оценке процент меньше. Но при этом вся беда в том, что именно этот мусор вам подсовывают в первую очередь.
так, срочно нужна подробная статья от вас на эту тему. Утащила пару идей в бэклог. У нас, кстати, тоже сильное дробление пайплайна, JSON между этапами и XML-теги, тут отдельное спасибо антропикам, что они их открыто рекомендуют, на клоде это правда сильно меняет поведение.
У нас новостной рерайт и логика обратная – ноль галлюцинаций по фактам, жёсткая привязка к первоисточнику+стиль конкретного издания поверх. Поэтому у нас отдельный фактчек-этап на апи Яндекс поиска и агент-критик, который сверяет все перед финалом.
Про content.citations отдельное спасибо за наводку. А прототипа конкретно с Tiptap+Whisper у вас в открытом доступе случайно нет?
Рерайт текстов в 2026: большой разбор сервисов для редакций от SEO-помоек начала 10-х до мультиагентных систем