strannik9616 ноя 2025 в 11:13

Апокалипсис контента? Взгляд юриста и разбор LLM

Простой

15 мин

7.3K

Из песочницы

Комментарии 6

eeglab 16 ноя 2025 в 11:48

Проблема ИИ контента - объем, он генерит огромные складные тексты, которые скучно читать. llm сгенерировала текст, ты "Вау, круто, я бы раньше на такой объем потратил бы месяц, а здесь 2 часа". Отличное решение для написания текстов где формально требуется "вода". Такие тексты и раньше никто не читал. Но, надеюсь, пройдет может пара лет и люди поймут, что нужно доносить кратко и по существу.

flancer 16 ноя 2025 в 13:21

Значит, надо генерить короткие тексты. Внимание читателя - это ресурс. Который быстро исчерпывается. Эту идею, кстати, мне нейронка подсказала.

Текст публикации начал читать, потом у меня закончился ресурс и я переключился на выводы. Обычно там самое полезное. Не ошибся.

Я уже писал публикацию в таком стиле - сначала выводы, а потом уже размышления, почему так. Пересмотрел её сейчас, нужно ещё жестче ужимать смыслы. Можно даже нейронкой, у неё это хорошо получается. Попробую как-нибудь...

eeglab 16 ноя 2025 в 11:50

И позволю не согласиться с автором - LLM генерит вполне нормальный текст, причем именно тот текст (!) который просит автор текста. И вполне он может заменить человека, сейчас это вайбрайтинг, если можно сказать так

pg_expecto 16 ноя 2025 в 12:09

Конечная цель этого обучения — статистически предсказать, какой токен (слово или его часть) является наиболее вероятным следующим элементом в последовательности.

И в этом и состоит главная и нерешаемая проблема - нейросеть неспособна выйти за рамки шаблонов.

Например , начав пытаться использовать нейросети для анализа производительности СУБД , я с недавнего времени пребываю в состоянии перманентного шока - КАК НЕЙРОСЕТЯМ ДОВЕРЯЮТ МЕДИЦИНСКИЕ ЗАДАЧИ ?

Нейросеть иногда не способна даже дать совет по оптимизации производительности СУБД - или дает ложную информацию или бесполезную. Всё, абсолютно всё, что советует нейросеть нужно проверять в ходе эксперимента.

А ведь СУБД принципиально проще чем , человеческий организм. Возможно, это моя личная версия , в области медицины на порядки больше научных данных подтверждённых в ходе экспериментов. В области СУБД - научных экспериментов практически нет . Как в средневековье - набор "best practice" , мануалы и вокруг шаманские танцы тех , кто назначил себя в эксперты.

P.S. А иногда доходит до смешного - спрашиваешь у нейросети - почему рекомендация ложная и не подтверждена экспериментально . В ответ - сам дурак , у меня все точно подтверждено документацией и эмпирически, а эксперимент твой эксперимент плохой и дает неправильные данные.

Нейросети хороши там где они хороши - семантический анализ текстов , генерация текстов , оформление , рецензирование . Но до экспертиз , по крайней мере в области СУБД современным нейросетям очень далеко, потому , что

Модель же, обученная на миллиардах старых текстов, склонна генерировать усредненные и стандартные ответы, которые могут быть бесполезны в нетиповой ситуации, требующей интеллектуального прорыва, а не просто "логичного" продолжения текста.

Moog_Prodigy 16 ноя 2025 в 13:03

Сама статья написана нейронкой. И ладно бы разбирались насущные задачи, так нет, наверное промпт был "напиши как молодой юрист начинается разбираться в LLM, приведи примеры и сделай выводы". Ну LLM и написала "для дошкольного среднего возраста". Нахрена это знать юристу, эту архитектуру трансформеров, ему надо знать одно - всегда проверяй факты. Нейронка пишет или человек - неважно. Уже не один "юрист" погорел на этом. Юрист должен читать и учить законы, ну там всякое такое, а не изучать эти все Q4_K_M.

Ну и разумеется, судя по всему, юрист из ТС как из меня планета Плутон.

arhip1986 17 ноя 2025 в 05:21

Сейчас можно пройти любую детекцию на плагиат, если очеловечить в Lexicon Rephraser одним кликом.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий