Comments 25
Большинство региональных редакций не имеют
Вы придёте к тому, что в региональной газете будет только 2 сотрудника, не так ли? Бухгалтер и верстальщик? Тексты будет поставлять автоматический обработчик, собирая общественную часть по локальным соцсетям, а официальную часть — по сайту региональной администрации?
У нас давно мечтают о том, чтобы программа научилась писать и иллюстрировать городскую газету, потому что платить за это трём людям (бухгалтер, верстальщик и автор) получается слишком дорого.
И, конечно, совсем здорово будет, если ваша программа позволит переиначивать чужие тексты и изображения так, чтобы суд не заставил заказчика платить какие-либо авторские отчисления. Денег едва хватает на личного фотографа для губернатора и мэра!
Верстальщика тоже автоматизировать можно
Можно, но мы не об этом. Вёрстка автоматизируется давно и без AI. Мы занимаемся текстом, потому что там автоматизация сложнее и боль острее. 15 рерайтов в день руками - это 6 часов одного человека. Вёрстка при современных возможностях столько не съедает.
К сожалению, автоматизировать вёрстку в верстальной программе до сих пор не удаётся, потому что человек должен нажимать там кнопки и двигать мышкой.
15 рерайтов в день может сделать любой человек за 15—20 тысяч рублей в месяц, ведь всё, что требуется от такого рерайтера — это переставить местами чужие слова, чтобы они выглядели как свои.
Потому что human in the loop, у нас то же самое. Журналист читает рерайт, правит, публикует. Верстальщик двигает мышкой, но уже не тратит час на то, что шаблон делает за секунду.
Рерайтер за 15-20К? найдите его, прошу. Редакции именно это и пытаются сделать по полгода, потом берут студента, он уходит через два мес, и круг замкнулся. Кадровый голод в региональных СМИ -это первое что слышишь на любом интервью с главредом, а я их много провела
Ну так пусть ищут в районных городах, в деревнях и сёлах.
А региональные СМИ, это богатые жители областных миллионников, которые привыкли черпать из областного бюджета. Именно эти люди уже привели к банкротству почти всю областную печать, потому что очень хотели получать больше денег, чем страна может им платить.
Останется один сотрудник: системный администратор. Кто-то же должен перезагружать роутер, когда у ИИ-редакции отвалится коннект к серверу генерации)
Без бухгалтера нельзя принимать деньги за объявления!
1С уже лет двадцать автоматизирует большую часть того, что бухгалтер делал руками.Так работает автоматизация вообще: убирает не профессию, а рутину внутри неё.
И не всем давно уже нужен бух, как отдельная штатная единица.
Сценарий с двумя сотрудниками уже реализуется и без нашей системы. Редакции сокращаются не из-за ИИ, а потому что денег нет. Мы не ускоряем этот процесс, а пытаемся сделать так, чтобы оставшиеся три человека не работали по 60 часов в неделю на рерайте пресс-релизов.
Мечтательные запросы автоматизировать всё ради экономии мы получаем. Но это не к нам. Наш продукт заточен, чтобы журналист контролировал результат, а не исчезал из процесса.
Про авторские права - рерайт как жанр существует давно и имеет устоявшуюся правовую практику. Пересказ своими словами с атрибуцией источника - это основа работы информационных агентств. Если кто-то хочет использовать систему для обхода авторских прав - это их юридический риск.
Они всю жизнь занимались рерайтом пресс-релизов. Теперь что-то изменилось?
Изменилась цена. Раньше рерайт стоил 20-30 минут журналиста. Теперь 8 рублей и 5 минут на проверку. Когда цена операции падает на порядок, объём обычно растёт, а люди переходят на то, чем должны заниматься по роду службы - в данном случае журналистикой. А если он хочет дальше переставлять слова, то мне такой как собственнику СМИ такой сотрудник не нужен
А вы не пробовали делать fine-tune? Что то мне подсказывает, что это могло бы дать гораздо лучшие результаты, чем любые трюки с промтами.
fine-tune современных LLM вроде тоже промптами делается? Или в реальности классический fine-tuning тоже используется?
файнтюнинг как обновление весов используется и работает, опен аи его например продает. Это не промпты, оно реально меняет модель под ваши данные. LoRA - более дешёвый вариант того же, обновляет меньше параметров. Тоже живой и популярный. Есть еще промпт-тюнинг, отдельная техника, слабее по результату. Так что @debagger прав - fine-tune мог бы помочь. Вопрос в экономике, дорого это
Думали, не делали. Главная проблема - у нас каждый клиент это отдельный стиль. Fine-tune под каждого будет отдельная модель под каждого, это не масштабируется. Один общий fine-tune сожрет индивидуальный голос издания.
Плюс данных мало - 70-100 статей на клиента против нужных тысяч с разметкой. Экономика пока не складывается. Если объём данных вырастет, это будет следующий шаг. Пока RAG с тематическими примерами как рабочий компромисс.
Потратили три месяца на написание мультиагентного пайплайна, чтобы выяснить, что алгоритм не умеет в сочувствие и литературный контраст. Сюрприз, однако :)
Парень, мальчик, подросток... Вы это серьезно? Тут на местных новостных сайтах постоянно опечатки, путают -тся и -ться, чудовищные обороты. А вы про какой-то стиль Фонтанки.
Главная проблема в России и особенно в местной прессе в содержании новостей, а не в их подаче. А уж как там мальчика назовут — для рядового читателя дело десятое.
Итак, читаем источник из СК:
В Уфе задержали подростка, который вербовал старшеклассников и планировал теракт в православном храме. ФСБ задержала 16-летнего парня из Башкортостана...
Теперь смотрим "эталонный" рерайт Фонтанки:
В Уфе задержали школьника, его подозревают в подготовке теракта в храме по заданию кураторов. Мальчик, по данным правоохранителей, был завербован.
Все круто у Фонтанки: противопоставление ребенка и казенного, мальчика и террориста. Вот только в оригинале новости подросток / парень сам вербовал старшеклассников на нехорошее дело.
А вот у Фонтанки зачем-то перевернули все предложение и использовали пассивный залог. В итоге мальчик / школьник был завербован неким неизвестным. Т.е. извратили смысл с точностью до наоборот.
В общем, в очередной раз "ученый изнасиловал журналиста", по другому не скажешь.
Мальчик или подросток: где заканчиваются правила и начинается голос