Комментарии 20
Странно- сначала тратить ресурсы и время на то, чтобы текст сгенерированный LLM был логически связанным , полезным и полным.
Затем зачем то тратить силы и время на , чтобы искать некоторые маркеры?
Ситуация описанна в классическом анекдоте -"вам шашечки или ехать".
P.S. мне важно содержание, практический смысл и техническая польза публикации. Никогда не трачу время на бессмысленные поиски неких маркеров .
Что я точно не буду делать это усложнять свои инструкции и промпты , чтобы ответ не содержал описанные в статье маркеры .
Забавнее другое: если пользоваться готовыми промтами, то очень быстро текст снова будет восприниматься, как сгенерированный. А если каждый раз тратить время на то, чтобы составить похожую на правду статью - проще и быстрее самому написать.
Эти маркеры ищете не вы, а алгоритмы, оценивающие ценность текста.
провокационный вопрос... А можно какое-либо утверждение или обоснование, которое не будет подверженно ни одной из перечисленных проблем?...
Просто почти все, что ты написал, я, например, использую в своей речи постоянно. Следует отметить, что я не ЛЛМ =))
-----
А вообще я бы сказал, и это играет ключевую роль в выявленной мною проблеме, что рекомендации сродни совету "Дует ветер? Укройся!"... То есть автор борется со следствием, а копать нужно сильно глубже.
Например, автор правильно отметил, что ЛЛМ зачастую делает предложения одной длины. Только бороться с этим следует двумя установками:
- Делай фразы рваными, не нужно разжевывать каждую мысль
- Оставляй читателю простор для того, чтобы он фразу додумал
Уже в таком виде ЛЛМ начнет писать неоднородно и читать станет в разы интереснее.
Проблема не в LLM тексте, как таковом, а в том, что тот, кто его публикует потом - не делает вычитку "своей" статьи, оставляя нелепые формулировки, ложные факты и явный бред.
Не делать заключение - это весьма странная рекомендация. Модели в принципе стремятся обучать на качественном материале, который содержит лучшее и по структуре и по стилю (та же ритмика длин абзацев прекрасно моделируется нынче).
Если делать текст непохожим на ИИ-генерацию, достаточно одного совета:
пишите плохо.
И никто не поднимет гневный палец, мол, ай-ай-ай, AI писал.
В заключение: пишите заключения спокойно. И длинное тире тоже
Когда просишь LLM сделать текст, допустим, для тикета, и потом очередной итерацией полученный текст просишь модель сделать так, чтобы он не выглядел как сгенерированный моделью, то - о, чудо - модель понимает о речь и может в собственном тексте подметить обороты и структуру, как люди не говорят. Иногда итоговая писанина получается человечнее без ручных правок.
для меня почему-то эти полоски маркер ИИ

Маркеры ИИ-текста — это не магия и не «секретная утечка из обучения»
А уж это "X это не Y и не Z" вообще в зубах навязло.
Выделение жирным в статьях было фишкой 1% авторов наверно. Сейчас в каждой второй статье. Эмейзинг.
Как здорово, что ваше мнение ни на что не влияет, абсолютно.
Объясните мне кто-нибудь, какой вообще практический смысл генерировать "описания товаров, ответы техподдержки или внутреннюю документацию" с помощью ЛЛМ?
То есть если вы хотите, чтобы у вас вроде как были описания товаров, ответы техподдержки и внутренняя документация - а по факту было бы издевательство - пожалуйста, но какой в этом смысл?
Максимально быстро уничтожить свою клиентскую базу, испортить техподдержку и сделать внутреннюю документацию абсолютно бессмысленной?
Если вам не нужны описания товаров - не делайте их, зачем делать фальшивые?
Если вы хотите отказаться от поддержки клиентов - ну перестаньте отвечать на вопросы, или настройте скрипт, присылающий инструкцию по пользованию, зачем людей дополнительно бесить?
Если вы не хотите вести внутреннюю документацию, не ведите её - зачем делать фальшивую?
Своеобразное чувство юмора у Господа Бога нашего, хочу я сказать. В печёнках пробки сидят - ок, на тебе свободные дороги. И перемещение по QR-кодам. Взмолились чтобы это кончилось - лады, но только после 24.02. Выбешивали "вообщем" и рандомно расставляемые знаки препинания - прекрасно, вот тебе идеальное правописание и озвучка дикторами центрального телевидения. И заодно темы про трёхбуквенные утилиты.
Осторожней со своими желаниями. Иногда мысль возникает - а может быть дело конкретно во мне? loooool
Данная статья написана ИИ: "Результат: моделям буквально..." - человек так не пишет.
Забавно что раньше люди писали тексты для машин, а теперь машины пишут тексты для людей. Борьба мочи с гоvном, seo-копирайтеров c ии-генерацией, ведь одни учились у других


Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей