Comments 29
Странно- сначала тратить ресурсы и время на то, чтобы текст сгенерированный LLM был логически связанным , полезным и полным.
Затем зачем то тратить силы и время на , чтобы искать некоторые маркеры?
Ситуация описанна в классическом анекдоте -"вам шашечки или ехать".
P.S. мне важно содержание, практический смысл и техническая польза публикации. Никогда не трачу время на бессмысленные поиски неких маркеров .
Что я точно не буду делать это усложнять свои инструкции и промпты , чтобы ответ не содержал описанные в статье маркеры .
Забавнее другое: если пользоваться готовыми промтами, то очень быстро текст снова будет восприниматься, как сгенерированный. А если каждый раз тратить время на то, чтобы составить похожую на правду статью - проще и быстрее самому написать.
Эти маркеры ищете не вы, а алгоритмы, оценивающие ценность текста.
провокационный вопрос... А можно какое-либо утверждение или обоснование, которое не будет подверженно ни одной из перечисленных проблем?...
Просто почти все, что ты написал, я, например, использую в своей речи постоянно. Следует отметить, что я не ЛЛМ =))
-----
А вообще я бы сказал, и это играет ключевую роль в выявленной мною проблеме, что рекомендации сродни совету "Дует ветер? Укройся!"... То есть автор борется со следствием, а копать нужно сильно глубже.
Например, автор правильно отметил, что ЛЛМ зачастую делает предложения одной длины. Только бороться с этим следует двумя установками:
- Делай фразы рваными, не нужно разжевывать каждую мысль
- Оставляй читателю простор для того, чтобы он фразу додумал
Уже в таком виде ЛЛМ начнет писать неоднородно и читать станет в разы интереснее.
Проблема не в LLM тексте, как таковом, а в том, что тот, кто его публикует потом - не делает вычитку "своей" статьи, оставляя нелепые формулировки, ложные факты и явный бред.
Не делать заключение - это весьма странная рекомендация. Модели в принципе стремятся обучать на качественном материале, который содержит лучшее и по структуре и по стилю (та же ритмика длин абзацев прекрасно моделируется нынче).
Если делать текст непохожим на ИИ-генерацию, достаточно одного совета:
пишите плохо.
И никто не поднимет гневный палец, мол, ай-ай-ай, AI писал.
В заключение: пишите заключения спокойно. И длинное тире тоже
Когда просишь LLM сделать текст, допустим, для тикета, и потом очередной итерацией полученный текст просишь модель сделать так, чтобы он не выглядел как сгенерированный моделью, то - о, чудо - модель понимает о речь и может в собственном тексте подметить обороты и структуру, как люди не говорят. Иногда итоговая писанина получается человечнее без ручных правок.
для меня почему-то эти полоски маркер ИИ

Маркеры ИИ-текста — это не магия и не «секретная утечка из обучения»
А уж это "X это не Y и не Z" вообще в зубах навязло.
Выделение жирным в статьях было фишкой 1% авторов наверно. Сейчас в каждой второй статье. Эмейзинг.
Как здорово, что ваше мнение ни на что не влияет, абсолютно.
Как раз то их то ставит человек)
Объясните мне кто-нибудь, какой вообще практический смысл генерировать "описания товаров, ответы техподдержки или внутреннюю документацию" с помощью ЛЛМ?
То есть если вы хотите, чтобы у вас вроде как были описания товаров, ответы техподдержки и внутренняя документация - а по факту было бы издевательство - пожалуйста, но какой в этом смысл?
Максимально быстро уничтожить свою клиентскую базу, испортить техподдержку и сделать внутреннюю документацию абсолютно бессмысленной?
Если вам не нужны описания товаров - не делайте их, зачем делать фальшивые?
Если вы хотите отказаться от поддержки клиентов - ну перестаньте отвечать на вопросы, или настройте скрипт, присылающий инструкцию по пользованию, зачем людей дополнительно бесить?
Если вы не хотите вести внутреннюю документацию, не ведите её - зачем делать фальшивую?
О чём вы?
Зачем шить одежду на машинке или станке, вместо ручного ткачества? Если вам не нужна одежда – не делайте, зачем делать фальшивую?

У вас есть тикет “добавить новое поле Категория клиента”. Вы руководство пользователя / внутреннюю документацию сами будете переписывать? В каком месте она станет фальшивой? Наоборот, можно все поля будет посмотреть в одном месте, а не рыскать по таск трекеру.
Своеобразное чувство юмора у Господа Бога нашего, хочу я сказать. В печёнках пробки сидят - ок, на тебе свободные дороги. И перемещение по QR-кодам. Взмолились чтобы это кончилось - лады, но только после 24.02. Выбешивали "вообщем" и рандомно расставляемые знаки препинания - прекрасно, вот тебе идеальное правописание и озвучка дикторами центрального телевидения. И заодно темы про трёхбуквенные утилиты.
Осторожней со своими желаниями. Иногда мысль возникает - а может быть дело конкретно во мне? loooool
Данная статья написана ИИ: "Результат: моделям буквально..." - человек так не пишет.
Забавно что раньше люди писали тексты для машин, а теперь машины пишут тексты для людей. Борьба мочи с гоvном, seo-копирайтеров c ии-генерацией, ведь одни учились у других
Скоро вместо капчи будут просить написать сочинение. Написал грамотно, логично и стройно? Ты --- робот! По нынешним временам звания человека достойны лишь шизофреничные неучи?
Не вижу проблемы в грамотной интересной статье, написанной AI. Главное чтобы это было новое исследование а не простая перепечатка новости в тысячный раз. Если кто-то потратил 200$ на токены чтобы исследовать интересную тему - why not.
Не увидел в статье маркеры, которые подметил сам. Но зато увидел те, которые сам не подметил, полезно.
А насчёт борьбы с маркерами: мне кажется, нет ничего лучше, чем раз и навсегда написанный плотный промпт, приправленный 3-4 фью-шотами. И даже в этом случае нужно хорошенько вычитывать
А зачем статье "не выглядеть как написанной ИИ"? Что бы удовлетворить нытиков? Это борьба с ветряными мельницами.
Проверять статью на ошибки - да, это нужно. Но стиль и вид, который обучен быть лучшим, красивым и структурированным - странное дело.
Помогает, такой вариант: Пиши текст так чтобы не уличили, что текст написан иИ)
И его производные, можно также добавить о том что не использовать длинные тире, проверять логику и семантику на основе русского языка, не использовать markdown форматирование и кавычки и 100500 других мелочей, которые якобы бесят людей). Обязательно поставить то что аудитория русская и фанаты такой то темы.
Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей