vaganovelena21 фев в 15:15

«Я всё сломал за выходные»: как мы учим LLM писать в стиле конкретного СМИ

Средний

6 мин

7.5K

Машинное обучение * Искусственный интеллектКонтент и копирайтинг * Алгоритмы *

Из песочницы

Комментарии 24

m0226183184 21 фев в 16:06

Copilot за рулем: как «суперавтопилот» GitHub застрял в трех соснах и двух папках

Помните рекламные ролики, где ИИ за секунду переписывает легаси-код? На днях я решил доверить GitHub Copilot задачу уровня «стажер в первый день»: переместить пачку .csv файлов из одной папки в другую внутри репозитория через Codespaces на смартфоне.

Спойлер: восстание машин откладывается. Машины споткнулись о дубликат файла.

Диспозиция

Устройства: Смартфон, Chrome, GitHub Codespaces.
Задача: Переложить данные из папки А в папку Б.
Нюанс: В целевой папке уже лежит копия одного из файлов.

Акт I: Смерть «дефолта»

Сначала я доверился стандартному Copilot, который идет в Codespaces по умолчанию. Результат? Он просто «умер». После первой же ошибки терминала destination exists он перестал подавать признаки жизни. Ни предложений, ни извинений — полный отказ систем. Видимо, осознание того, что файл нельзя просто так сдвинуть, вызвало критический сбой в его «нейронном сознании».

Акт II: ChatGPT-5-mini (из выпадающего списка вариантов AI)

Ладно, подумал я, переключимся на «тяжелую артиллерию». Выбираю из списка GPT-5-mini (который в инсайдерских версиях Codespaces сейчас модно тестировать). Ожидание: сейчас придет интеллект поумнее и разрулит конфликт.

Реальность: этот парень оказался упорнее, но не умнее. Он вошел в бесконечный цикл. Уже полчаса он «думает», пересчитывает дерево файлов, пытается составить план перемещения, натыкается на тот же дубликат и заходит на новый круг. Это уровень водителя, который 15 минут посидел на пассажирском сиденье и решил, что теперь он профи. При виде первого же закрытого шлагбаума он не ищет объезд, а просто жмет на газ, бьется в него, сдает назад и повторяет процедуру.

Почему они так тупят?

Страх «сломать»: ИИ панически боится команд удаления (rm). Для него перезаписать файл — это потенциальная потеря данных пользователя, и он зацикливается в попытке найти «безопасный» путь, которого не существует без -f.
Галлюцинация контроля: Они делают вид, что управляют терминалом, но на самом деле просто генерируют текст. Получив ошибку от реальной системы, они не могут её «переварить» и просто зацикливают свои галлюцинации.

Итог: Bash 1 : 0 ИИ

В итоге проблему решила одна строчка, вбитая вручную в терминал, пока «гений мысли» GPT-4o-mini продолжал жечь серверные мощности Microsoft:

bash

git mv -f старая_папка/*.csv новая_папка/

Используйте код с осторожностью.

Мораль: Пока хайп вокруг ИИ обещает нам автоматизацию всего, реальность натыкается на простейший конфликт имен файлов. Copilot — неплохой навигатор для прямой трассы, но в «грязной» работе с файлами на смартфоне он превращается в капризного пассажира.

Хотите повторить?

fire64 21 фев в 17:11

Хм...

Автор генерирует посты в нейросети - это не хорошо, но привычно. Но вот когда комментарии начинают делать в нейронках - это совсем печально...

m0226183184 21 фев в 17:29

Пусть машины воюют между собой. Разделяй и влавствуй 🤡👹

vaganovelena 21 фев в 17:43

а почему это нехорошо?

Robanni-resu 23 фев в 19:53

Попробуй Claude, он весьма неплохо справляется с такими задачами

vaganovelena 23 фев в 19:54

клод в работе у нас, конечно

vaganovelena 21 фев в 18:33

если минусите, то хоть расскажите за что?

SkaJazz 21 фев в 19:16

Предположу: за то, что строите бизнес на наполнении телеграм-каналов, сайтов региональных СМИ -- а через них новостных агрегаторов, через которые большинство людей и получает новости -- AI-сгенерированным рерайтом с нулевой добавленной ценностью.

К несчастным журналистам региональных изданий оказывается приспособлен ~~сопроцессор фирмы Крей~~ AI-помощник, который позволяет, особо не напрягаясь, удобрять сеть в несколько потоков, ограничиваясь только тиром вашей подписки и собственной совестью.

Чем лучше вы работаете, тем больше нейрослопа вываливают в сеть ваши клиенты и тем выше мотивация у всех игроков рынка начать генерировать ещё больше нейрослопа для того, чтобы не оказаться в отстающих.

vaganovelena 22 фев в 13:10

спасибо за разъяснение! проблема большинства редакций в том, что они из журналистов делают переписывателей текстов инфоагентств и релизов из рассылок. Это тупая работа, которая подменяет собой основной скилл журналиста. Ни грамма позиции, мнения или логики они в эти тексты не привносят, просто меняют слова местами и заменяют на синонимы. Такую работу в первую очередь нужно сгружать нейронке. А самим журналистам заниматься прямой своей работой. Я сама руковожу СМИ и для меня лично это также боль - держать на ставке журналиста по факту рерайтера. А после такой работы журы облениваются и не хотят делать авторские материалы.

Vitrion 22 фев в 07:07

Во-первых, не переживайте. Словить тонну дизлайков в теме ИИ очень легко. Примите, как факт, что скепсис по поводу ИИ высокий. А поскольку Вы показываете план действий как заменить человека там, где и так он делает хорошо, то это вообще плохо. А может просто пост длинный без картинок. В любом случае, в теме ИИ лучше быть осторожным. Поругать и плюнуть ценится выше.

vaganovelena 22 фев в 13:15

спасибо! про скепсис да, есть такое, и это естественно. Про замену - это точно не про сервис, который мы делаем. Пока нейронки не научились делать прямую работу журналиста, то есть работать в полях и иметь свою позицию.
Благодарю еще раз за поддержку

Valao 21 фев в 19:15

Не минусовал, но и не разделяю энтузиазм. Если отбросить раздражение очередным постом с нейросетевыми признаками, лично меня удручает деградация солидных масс-медиа даже на техническом уровне: помарки, ошибки, несогласованности, явно машинный текст и т.д.

Уровень продолжает падать и подрывать остатки доверия. По большому счету, первые три-четыре издания, которые выдают новость без явных косяков, должны закрепляться в топе, а остальные пессимизироваться поисковыми системами и агрегаторами. С признаками нейрорерайта уходить в самый низ.

Хотят быть на виду - пусть становятся проворными и эффектными или живут в региональной нише, что тоже неплохо. Зачем мне 100500 пересказанных версий без новых фактов? Лучше почитать пару интересных новостей из условного Коврова или Калязина, которые теряются в инфо-суматохе.

vaganovelena 22 фев в 13:31

Спасибо большое, что объясняете! Согласна с вами почти во всём, кроме вывода. Деградация медиа реальна. Машинный текст без редактуры, 100500 пересказов без новых фактов, имена с ошибками. Только это не артефакт AI, это артефакт нищих редакций, где один человек делает 15 текстов за смену.
Теперь про то, зачем мы вообще это строим. Региональная редакция из условного Коврова получает за день 40+ новостей, которые "надо отработать", это обязаловка, без которой редактор не получит зарплату. Пока он пересказывает ТАСС, репортаж про местный завод не написан. Вот эту ситуайию мы и хотим убрать. Цель не больше рерайтов, а меньше рерайтов руками и больше времени на то, что реально интересно читать.

Про качество. Вы правы, что признаки машинного текста должны пессимизироваться. Именно поэтому в нашей системе ИИ создаёт черновик, а редактор принимает решение о дополнении и публикации. Для маленькой редакции вот эта экономия в 40 мин на 1 текст это разница между "успею написать что-то живое" и "снова только рерайт".

SkaJazz 21 фев в 19:29

Технически у меня вопрос такой: статья начинается с того, что "стиль — это не набор правил". А в итоге оказывается, что стиль ("профиль стиля") -- это часть промпта, которая собирается из нескольких "аспектов", т.е. правил.

В итоге набор правил для описания стиля работает?

Кстати, по каким метрикам вы судите о качестве работы своего агрегата? Как вы понимаете, что он составил точные аспекты -- и как оцениваете стилистическую схожесть получающихся текстов?

И не очень понятно, зачем нужны теги. Только для подтягивания похожих по темам статей? Но в статье есть вполне корректное замечание, что семантическая схожесть не означает стилистическую схожесть и логичнее было бы подтягивать статьи, которые вы считаете стилистически эталонными для целевого издания в каждом случае рерайта.

vaganovelena 22 фев в 13:43

Спасибо, что смотрите в корень.
Про набор правил. Различие вот в чём: «набор правил» в обычном понимании - это «пиши короткие предложения, избегай пассивного залога и всё в этом роде». Это не работает, потому что правила описывают форму, но не захватывают логику. Аспекты в нашем случае - это скорее размерности описания: как издание строит структуру материала, какую интонацию держит, как работает с загом и лидом. Они как бы фиксируют паттерн.

Но вообще да, вы правы, в итоге это структурированное описание, которое попадает в промпт. Тот же набор правил, выведенных из анализа текстов, а не написанных вручную. Разница есть, но вы правы, что в статье это размыто.

Про метрики. Здесь у нас пока слабое место. Объективных метрик стилистического сходства у нас нет, мы опираемся на субъективную оценку редактора, который знает своё издание. Плюс сравниваем выход с эталонными текстами глазами. Тут в ход идет моя экспертиза и моих коллег главредов и журов. Автоматических метрик типа стилистического расстояния мы не внедрили. Это открытая задача — если у вас есть мысли, как это измерять, мне было бы супер интересно услышать.

Про теги и семантику. Пока и это наш нерешённый вопрос. Теги сейчас работают как фильтр по теме, чтобы подтягивать тематически близкие примеры, а не случайные. Но логика тематически похожее равно стилистически подходящее не очень-то работает. Следующий шаг - отдельно размечать стилистически эталонные тексты для каждого издания и подтягивать именно их. Пока это делается частично вручную при настройке профиля.

Rion333 23 фев в 16:22

Для оценки результата можно запускать тесты, в которых происходит множество генераций статей, затем различные LLM много раз сравнивают с оригиналами по стилю, дают оценку, считается среднее. При достойно большом количестве генераций, сравнений и количестве LLM с разными температурами результат должен сходится к нужному. Или можно попробовать рейтинги основанные на парном сравнении как в шахматах.

smart_alex 22 фев в 07:14

Мы строим AI-систему для автоматизации рерайта новостей в региональных СМИ.

Зачем? К чему это извращение и в чём смысл сего действа? Вы считаете, что в инфопространстве мало мусора и вы решили его ещё добавить (причём в особо извращённой AI форме)?

На что-то более осмысленное и общественно-полезное фантазии не хватает?

vaganovelena 22 фев в 13:49

Если честно, сначала вообще не хотела отвечать на ваш довольно грубый комментарий, тем более что для этого нужно ждать 5 минут. Но поведу себя более воспитанно и отвечу.

Рерайт федеральных новостей в региональных редакциях существует независимо от нас - это обязаловка, которую никто не отменит. Один журналист на весь город обязан отработать 5-10-15 федеральных новостей в день. Пока он это делает руками, местные истории (коммунальные аварии, решения горсовета, местный бизнес) не написаны. Вообще.

Мы не создаём новый вид мусора, а убираем рутину, которая существует без нас и съедает время людей, способных делать что-то живое. Осмысленное и общественно-полезное - это как раз когда местный журналист пишет про своё местное, а не пересказывает РИА по 40 минут.

smart_alex 22 фев в 18:23

Я далёк от этой проблематики - не могли бы вы подробнее пояснить что значит "обязаловка" и что значит "журналист обязан отработать"?

Это какой-то закон или как это понимать?

(минусы я вам не ставил)

vaganovelena 22 фев в 19:58

Это редакционная политика, не закон. Региональное СМИ существует либо на субсидии (от области, города), или на рекламных деньгах. В обоих случаях есть план выпустить столько-то материалов в день. Иначе редакция не выглядит как «живое» СМИ, теряет трафик, падает в выдаче, теряет рекламодателей или финансирование.

Федеральные новости - самый простой способ закрыть этот план. Вышел указ, случилось ЧП, объявили решение - берёшь, пересказываешь, публикуешь. Для сми на госсубсидиях куча обязаловки - то есть материалов, которые валятся от тех, кто дает субсидию. Это все надо отработать - выпустить на своем ресурсе, это тоже рерайты. Никто не заставляет, просто если план не выполнен, денег не дадут

Efimov_pr 23 фев в 04:41

Интересный опыт, но для Хабра такие статьи — как красная тряпка. Тут ненавидят всякие малополезные темы, которые завязаны на способы генерации пустого контента, которым всё и так забито.

Надо было объяснить ваши задачи из комментов в начале текста, тогда может быть и меньше дизлайкали.

vaganovelena 23 фев в 09:30

да, согласна, спасибо

maksa 16 мар в 17:35

Простите, но я не понимаю. Вы говорите, что редакция должна переработать и выдать за сутки 40 спущенных сверху новостей. И вот вы их автоматически переписываете, чтобы журналисты могли заниматься своей работой.

Но неужели никто не задаётся вопросом, а кому нужны эти 40 новостей именно в том издании? Неужели люди подписаны ровно на один канал, у них нет других источников информации? Ведь эти 40 новостей — раз их спускают, то либо это неинтересные пресс-релизы местной администрации, либо федеральные и мировые новости, которые и так будут описаны (если они хоть кому-то нужны).

Если федеральные новости нужны просто как масса, то самый разумный способ — объединиться с другими региональными изданиями и готовить новости сообща. Ничего страшного, если они будут совпадать на сайтах в Калуге и Благовещенске. И да, я не верю, что стили у редакций региональных сайтов прям настолько разные, что нельзя разместить новость без переписывания.

А так, конечно, никто не хочет получать поток новостей, написанных машиной. Зачастую со смысловыми ошибками. Лично я в таких случаях чувствую глубокое неуважение к себе, читателю.

vaganovelena 18 мар в 08:45

Спасибо за комментарий! Про порядку напишу: 40 одинаковых везде новостей мало кому нужны, вы правы, и я с этим не спорю. Это структурная проблема рынка, не наша придумка. Редакция выдаёт эти 40 новостей не потому что читатели требуют, а потому что учредитель, рекламодатель или просто исторически сложившаяся модель. Мы автоматизируем существующий процесс, не проектируем идеальную медиасреду с нуля.

Про объединение региональных редакций идея логичная, но на практике не работает. Большинство региональных СМИ принадлежат разным собственникам: муниципалам, частным издателям, медиагруппам. У каждого своя повестка и свои интересы, иногда прямо конкурирующие. Поделиться контентом с изданием из соседнего города значит просто отдать трафик конкуренту.

Про стили не соглашусь. Фонтанка и какой-нибудь сайт администрации Саратова пишут принципиально по-разному. Аудитория это считывает, это часть доверия к изданию. Про ошибки и неуважение к читателю полностью согласна, и именно поэтому мы строим фактчекинг как отдельный обязательный этап, а не опцию. Текст с ошибкой не должен выходить вообще, автоматический он или нет. Если система снижает количество ошибок ниже уровня уставшего редактора в 11 вечера - это уже польза.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий