Комментарии 22
Copilot за рулем: как «суперавтопилот» GitHub застрял в трех соснах и двух папках
Помните рекламные ролики, где ИИ за секунду переписывает легаси-код? На днях я решил доверить GitHub Copilot задачу уровня «стажер в первый день»: переместить пачку .csv файлов из одной папки в другую внутри репозитория через Codespaces на смартфоне.
Спойлер: восстание машин откладывается. Машины споткнулись о дубликат файла.
Диспозиция
Устройства: Смартфон, Chrome, GitHub Codespaces.
Задача: Переложить данные из папки А в папку Б.
Нюанс: В целевой папке уже лежит копия одного из файлов.
Акт I: Смерть «дефолта»
Сначала я доверился стандартному Copilot, который идет в Codespaces по умолчанию. Результат? Он просто «умер». После первой же ошибки терминала destination exists он перестал подавать признаки жизни. Ни предложений, ни извинений — полный отказ систем. Видимо, осознание того, что файл нельзя просто так сдвинуть, вызвало критический сбой в его «нейронном сознании».
Акт II: ChatGPT-5-mini (из выпадающего списка вариантов AI)
Ладно, подумал я, переключимся на «тяжелую артиллерию». Выбираю из списка GPT-5-mini (который в инсайдерских версиях Codespaces сейчас модно тестировать). Ожидание: сейчас придет интеллект поумнее и разрулит конфликт.
Реальность: этот парень оказался упорнее, но не умнее. Он вошел в бесконечный цикл. Уже полчаса он «думает», пересчитывает дерево файлов, пытается составить план перемещения, натыкается на тот же дубликат и заходит на новый круг. Это уровень водителя, который 15 минут посидел на пассажирском сиденье и решил, что теперь он профи. При виде первого же закрытого шлагбаума он не ищет объезд, а просто жмет на газ, бьется в него, сдает назад и повторяет процедуру.
Почему они так тупят?
Страх «сломать»: ИИ панически боится команд удаления (
rm). Для него перезаписать файл — это потенциальная потеря данных пользователя, и он зацикливается в попытке найти «безопасный» путь, которого не существует без-f.Галлюцинация контроля: Они делают вид, что управляют терминалом, но на самом деле просто генерируют текст. Получив ошибку от реальной системы, они не могут её «переварить» и просто зацикливают свои галлюцинации.
Итог: Bash 1 : 0 ИИ
В итоге проблему решила одна строчка, вбитая вручную в терминал, пока «гений мысли» GPT-4o-mini продолжал жечь серверные мощности Microsoft:
bash
git mv -f старая_папка/*.csv новая_папка/
Используйте код с осторожностью.
Мораль: Пока хайп вокруг ИИ обещает нам автоматизацию всего, реальность натыкается на простейший конфликт имен файлов. Copilot — неплохой навигатор для прямой трассы, но в «грязной» работе с файлами на смартфоне он превращается в капризного пассажира.
Хотите повторить?
Хм...
Автор генерирует посты в нейросети - это не хорошо, но привычно. Но вот когда комментарии начинают делать в нейронках - это совсем печально...
Попробуй Claude, он весьма неплохо справляется с такими задачами
если минусите, то хоть расскажите за что?
Предположу: за то, что строите бизнес на наполнении телеграм-каналов, сайтов региональных СМИ -- а через них новостных агрегаторов, через которые большинство людей и получает новости -- AI-сгенерированным рерайтом с нулевой добавленной ценностью.
К несчастным журналистам региональных изданий оказывается приспособлен сопроцессор фирмы Крей AI-помощник, который позволяет, особо не напрягаясь, удобрять сеть в несколько потоков, ограничиваясь только тиром вашей подписки и собственной совестью.
Чем лучше вы работаете, тем больше нейрослопа вываливают в сеть ваши клиенты и тем выше мотивация у всех игроков рынка начать генерировать ещё больше нейрослопа для того, чтобы не оказаться в отстающих.
спасибо за разъяснение! проблема большинства редакций в том, что они из журналистов делают переписывателей текстов инфоагентств и релизов из рассылок. Это тупая работа, которая подменяет собой основной скилл журналиста. Ни грамма позиции, мнения или логики они в эти тексты не привносят, просто меняют слова местами и заменяют на синонимы. Такую работу в первую очередь нужно сгружать нейронке. А самим журналистам заниматься прямой своей работой. Я сама руковожу СМИ и для меня лично это также боль - держать на ставке журналиста по факту рерайтера. А после такой работы журы облениваются и не хотят делать авторские материалы.
Во-первых, не переживайте. Словить тонну дизлайков в теме ИИ очень легко. Примите, как факт, что скепсис по поводу ИИ высокий. А поскольку Вы показываете план действий как заменить человека там, где и так он делает хорошо, то это вообще плохо. А может просто пост длинный без картинок. В любом случае, в теме ИИ лучше быть осторожным. Поругать и плюнуть ценится выше.
Не минусовал, но и не разделяю энтузиазм. Если отбросить раздражение очередным постом с нейросетевыми признаками, лично меня удручает деградация солидных масс-медиа даже на техническом уровне: помарки, ошибки, несогласованности, явно машинный текст и т.д.
Уровень продолжает падать и подрывать остатки доверия. По большому счету, первые три-четыре издания, которые выдают новость без явных косяков, должны закрепляться в топе, а остальные пессимизироваться поисковыми системами и агрегаторами. С признаками нейрорерайта уходить в самый низ.
Хотят быть на виду - пусть становятся проворными и эффектными или живут в региональной нише, что тоже неплохо. Зачем мне 100500 пересказанных версий без новых фактов? Лучше почитать пару интересных новостей из условного Коврова или Калязина, которые теряются в инфо-суматохе.
Спасибо большое, что объясняете! Согласна с вами почти во всём, кроме вывода. Деградация медиа реальна. Машинный текст без редактуры, 100500 пересказов без новых фактов, имена с ошибками. Только это не артефакт AI, это артефакт нищих редакций, где один человек делает 15 текстов за смену.
Теперь про то, зачем мы вообще это строим. Региональная редакция из условного Коврова получает за день 40+ новостей, которые "надо отработать", это обязаловка, без которой редактор не получит зарплату. Пока он пересказывает ТАСС, репортаж про местный завод не написан. Вот эту ситуайию мы и хотим убрать. Цель не больше рерайтов, а меньше рерайтов руками и больше времени на то, что реально интересно читать.
Про качество. Вы правы, что признаки машинного текста должны пессимизироваться. Именно поэтому в нашей системе ИИ создаёт черновик, а редактор принимает решение о дополнении и публикации. Для маленькой редакции вот эта экономия в 40 мин на 1 текст это разница между "успею написать что-то живое" и "снова только рерайт".
Технически у меня вопрос такой: статья начинается с того, что "стиль — это не набор правил". А в итоге оказывается, что стиль ("профиль стиля") -- это часть промпта, которая собирается из нескольких "аспектов", т.е. правил.
В итоге набор правил для описания стиля работает?
Кстати, по каким метрикам вы судите о качестве работы своего агрегата? Как вы понимаете, что он составил точные аспекты -- и как оцениваете стилистическую схожесть получающихся текстов?
И не очень понятно, зачем нужны теги. Только для подтягивания похожих по темам статей? Но в статье есть вполне корректное замечание, что семантическая схожесть не означает стилистическую схожесть и логичнее было бы подтягивать статьи, которые вы считаете стилистически эталонными для целевого издания в каждом случае рерайта.
Спасибо, что смотрите в корень.
Про набор правил. Различие вот в чём: «набор правил» в обычном понимании - это «пиши короткие предложения, избегай пассивного залога и всё в этом роде». Это не работает, потому что правила описывают форму, но не захватывают логику. Аспекты в нашем случае - это скорее размерности описания: как издание строит структуру материала, какую интонацию держит, как работает с загом и лидом. Они как бы фиксируют паттерн.
Но вообще да, вы правы, в итоге это структурированное описание, которое попадает в промпт. Тот же набор правил, выведенных из анализа текстов, а не написанных вручную. Разница есть, но вы правы, что в статье это размыто.
Про метрики. Здесь у нас пока слабое место. Объективных метрик стилистического сходства у нас нет, мы опираемся на субъективную оценку редактора, который знает своё издание. Плюс сравниваем выход с эталонными текстами глазами. Тут в ход идет моя экспертиза и моих коллег главредов и журов. Автоматических метрик типа стилистического расстояния мы не внедрили. Это открытая задача — если у вас есть мысли, как это измерять, мне было бы супер интересно услышать.
Про теги и семантику. Пока и это наш нерешённый вопрос. Теги сейчас работают как фильтр по теме, чтобы подтягивать тематически близкие примеры, а не случайные. Но логика тематически похожее равно стилистически подходящее не очень-то работает. Следующий шаг - отдельно размечать стилистически эталонные тексты для каждого издания и подтягивать именно их. Пока это делается частично вручную при настройке профиля.
Для оценки результата можно запускать тесты, в которых происходит множество генераций статей, затем различные LLM много раз сравнивают с оригиналами по стилю, дают оценку, считается среднее. При достойно большом количестве генераций, сравнений и количестве LLM с разными температурами результат должен сходится к нужному. Или можно попробовать рейтинги основанные на парном сравнении как в шахматах.
Мы строим AI-систему для автоматизации рерайта новостей в региональных СМИ.
Зачем? К чему это извращение и в чём смысл сего действа? Вы считаете, что в инфопространстве мало мусора и вы решили его ещё добавить (причём в особо извращённой AI форме)?
На что-то более осмысленное и общественно-полезное фантазии не хватает?
Если честно, сначала вообще не хотела отвечать на ваш довольно грубый комментарий, тем более что для этого нужно ждать 5 минут. Но поведу себя более воспитанно и отвечу.
Рерайт федеральных новостей в региональных редакциях существует независимо от нас - это обязаловка, которую никто не отменит. Один журналист на весь город обязан отработать 5-10-15 федеральных новостей в день. Пока он это делает руками, местные истории (коммунальные аварии, решения горсовета, местный бизнес) не написаны. Вообще.
Мы не создаём новый вид мусора, а убираем рутину, которая существует без нас и съедает время людей, способных делать что-то живое. Осмысленное и общественно-полезное - это как раз когда местный журналист пишет про своё местное, а не пересказывает РИА по 40 минут.
Я далёк от этой проблематики - не могли бы вы подробнее пояснить что значит "обязаловка" и что значит "журналист обязан отработать"?
Это какой-то закон или как это понимать?
(минусы я вам не ставил)
Это редакционная политика, не закон. Региональное СМИ существует либо на субсидии (от области, города), или на рекламных деньгах. В обоих случаях есть план выпустить столько-то материалов в день. Иначе редакция не выглядит как «живое» СМИ, теряет трафик, падает в выдаче, теряет рекламодателей или финансирование.
Федеральные новости - самый простой способ закрыть этот план. Вышел указ, случилось ЧП, объявили решение - берёшь, пересказываешь, публикуешь. Для сми на госсубсидиях куча обязаловки - то есть материалов, которые валятся от тех, кто дает субсидию. Это все надо отработать - выпустить на своем ресурсе, это тоже рерайты. Никто не заставляет, просто если план не выполнен, денег не дадут
Интересный опыт, но для Хабра такие статьи — как красная тряпка. Тут ненавидят всякие малополезные темы, которые завязаны на способы генерации пустого контента, которым всё и так забито.
Надо было объяснить ваши задачи из комментов в начале текста, тогда может быть и меньше дизлайкали.

«Я всё сломал за выходные»: как мы учим LLM писать в стиле конкретного СМИ