Обновить

Проблема ИИ текстов, но не та, которую обсуждают все

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели9.4K
Всего голосов 13: ↑11 и ↓2+12
Комментарии47

Комментарии 47

я отвечу чем отличается - уровнем

равномерно средний текст остается средним, при том что человек не пишет равномерно (если это только не унылая юриспруденция) и даже плохой текст может иметь хорошие пики, как и хороший текст провалы

вообще я считаю проблема у вас не в том что "нейросеть хорошая", а в том что бытие определяет сознание и постоянное взаимодействие с нейросетью (особенно как редактор, с вычитками и тд) подменяет ваши привычки

да вы обучаетесь новому, меньше ошибок, понятнее слог и тд, но ценой того что вы становитесь похожим на "учителя".

плохо это или хорошо решать вам. я уже встречал в реальности "нейродетей" которые строят фразы как нейросеть не задумываясь.

Да, я вот тоже замечаю подобное. Мне вот интересно, существовали ли раньше в статьях слова типа Ключевые, Современный, длинные тире, а особенно конструкции типа "не, а".

Потому что мне режет глаз и слух такое, но я проводил небольшой опрос и по его результатам – такое режет глаз только мне и еще паре спецов кто тоже работает с ИИ.

Возможно это только у меня уже когнитивное искажение такое.

в том то и проблема - насмотренность

для простого обывателя разницы нет, он слишком редко читает длинные сложные тексты что бы заметить разницу, плюс нужно время что бы набралась статистика чисто по диалогам с нейросетью

а вот для тех кто нейротексты читает больше чем книги (чаты ответов это тоже нейротексты), такие люди уже сразу подмечают знакомые паттерны и ключевые моменты

проблема нейротекстов в слопе - я вот на хабре зачастую скипаю нейростатьи потому что если мне будет интересно такое почитать я спрошу нейросеть и она мне даст развернутый ответ с пояснениями персонально для меня. вычитанные нейросетью авторские статьи читать еще можно, хотя временами прям видны куски что добавила нейросеть что бы "выпрямить подачу", но чистый нейрослоп годен только для документаций

Но кстати по уровню спорно. Кто лучше напишет текст на сложную тему Джун или ИИ. Я ставлю 100% что ИИ даже с базовым "напиши статью на тему".

спорно ваше спорно)

если джун за результат работает, а не за процесс, то он потратит кучу времени, перелопатит кучу похожих текстов что бы понимать как вообше писать и в итоге сделает что то среднее между копипастом и пересказом

то есть не прямо уж топ-топ, но и не полный провал. как плюс забавные моменты что были скопированы без понимания темы.

нейронка же своей "одинаковостью" очень хорошо скроет галлюцинации и ошибки - у новичка хотя бы понятно по тексту в чем он плавает и неуверен (даже если сам не написал) а нейросеть как плохой копираейтер работает на обьем даже если просить строго факты

современные нейросети уже очень редко галюцинируют к счастью, но теперь они научились ленится. в отношении текстов это значит что они скорее нальют воды там где новичок бы просто скопипастил данные из другого источника

Да но статистически из 10 джунов за результат работают от силы трое. Остальные просто хотят чинить сделать через нейронки и получить деньги.

Понимание необходимости саморазвития приходит к джунам когда они уже мидлы куда их дотащили сеньоры)

Но кстати на счет галлюцинаций согласен, проверить бред будет некому и появится очередной текст с тупым сожержанием в интернете на котором обучат следующее поколение нейронок и они будут еще тупее)

на счет редкости галлюцинаций – по коду их стало меньше да, но по простым темам тем более если задан тупой вопрос все еще много глюков.

Помню еще GPT 3.5 на запрос "как коровы влияют на SEO" написал очень правдоподобный текст о том что ты купил больше коров и их тепло перегревает сервер который за стенкой стоит. Потому у меня медленно грузится сайт. Я помню я тогда очень орал с этого.

я противник "тянуть", если человек не хочет то это его право, потому рассматривал с точки зрения "заинтересованого джуна"

за коров спасибо, поорал чаечкой, это просто эпик

я даже добавлю это в свой словарь антиИИ (простой генератор для страниц что я не хочу что бы индексировал ИИ - в шапке генерируется промт-пояснение каждый раз разный и чертовски наркоманистый что бы ИИ сходила с ума и не цитировала этот сайт в результатах поиска)

я возьму за основу ваш документ если вы не против

интересно что можно будет получить от нейронки максимально наркоманистое по этой теме, учитывая что я к SEO вообще не имею отношения, то есть не будет понимания всей глубины из-за некомпетентности

Статья про коров и SEO из 3.5 не удалось найти. Очень давно было. А вот когда вышла gpt4 – тоже пробовал подобное. Тоже тот еще бред

не, ну это просто вызов

давно я не занимался публицистикой но вы сумели зажечь мне вдохновение)

Кстати новые модели справились лучше. я в комменте выше дал ссылку. Они уже не галлюционировали и даже попытались дать какие-то дельные советы)

Ага, уже прочитал. Поржал)

Муу-оптимизации вам!

Чтобы не терять свой стиль, нужно больше читать классику или хорошую публицистику. Если вариться только в котле сео статей и промптов, язык неизбежно деградирует

Спасибо, что так чётко разложил проблему. Тут ведь действительно абсурд: чем качественнее и структурированнее текст, тем выше шанс, что тебя назовут ботом. А если добавить воды, сломать ритм и вставить кота — детектор счастлив, это "человек".

Особенно ценный момент про перплексию и ритмические всплески. Почему-то об этом мало говорят, хотя это куда более честные маркеры, чем подзаголовки или списки. Твой тест с доработкой сырого вывода вторым ИИ-агентом — вообще бомба: детекторы пропускают отполированную машину и валят живого автора за аккуратность.

Твоя гипотеза в конце ("поисковикам придётся переключиться") очень похожа на правду. Вопрос только — когда. Пока же наблюдаем патологию: редактор просит ясность, SEO — структуру, а детектор ИИ за это же наказывает. Классическая противоречивая оптимизация под метрики, а не под смысл.

Ору с твоего коммента. Мы оба знаем почему)

Даже на хабре поставили минут что текст похож на сгенренный, а я в теле статьи указал что нет и что AI детектор тоже считает что текст сгенеренный)

Люди так не пишут, братан)

Сама мысль отличать тексты сгенерированые нежностью от текстов человеческих - дефектная.
текст они или полезен, либо бесполезен, либо лжив (отрицательная полезность).
это зависит от идеи заложенной в тексте, за идею отвечает человек.
основывать свою оценку на следах применения технологии - это буквальная леность ума.
это по содержанию.
по эмоциональной причинности:
есть заметный показатель, который позволяет сказать автору - намекнуть, и так далее -
что он недостоин.
ну вот просто так - напишите человеку в - ты тупой - как то так нельзя.
а вот напишите человеку, который текст написал с помощью нейросети:
"нейрослоп" - это дозволительное поведения и народ даже подтянется.

а я вот смотрю на свои текст написанные 20 лет назад, и знаете - там есть длинное тире, деление на небольшие абзацы, и списки и буллеты (ага там где нейросеть училась я писал :). для меня это образец правильного текста, по этому когда нейросеть для меня пишет это меня не раздражает.


Вот у меня так же, потому и родил этоу статью. Жаль что ее прочитает всего пара тысяч человек и оставят всего 10-15 коментов. Хотя по мне тема достойна большей общественности)

Хм... Вы меня сломали. Прогнал текст статьи, что я готовлю через три детектора. Один сказал, что текст стопроцентно писал ИИ. Но этот детектор подозрительный какой-то, так что его не считаем. Ещё два детектора сказали, что текст стопроцентно писал человек. Вот сижу теперь и думаю... Неужели так плохо написано, что меня стопроцентно в люди засчитывают :(

Я все проверяю по GPTZero. Пробовал море разных от Copyleaks до прости господи GigaCheck от сбера. все говно

Я не могу сейчас найти источник, но я где-то читал, что именно лингвистическое ядро у современных топовых моделей мощнее того, которое в человеческом мозге. И вот тут, как мне кажется, у всех рассуждающих кроется основная ошибка. Любая заведомо более мощная система всегда сможет съэмитировать более простую. Другими словами, я могу дать мощной ИИ свои тексты и попросить её писать так же (я уже пробовал). Могу попросить вставлять неожиданные слова синонимы по тексту, могу попросить писать "неровным" ритмом. А могу попросить делать мелкие ошибки и опечатки, свойственные среднесатистическому человеку. И топовые модели всё это исполнят, просто потому что они мощнее в лингвистике.
Единственным выходом я вижу открытие самими ИИ-компаниями некоторых API, которые бы смогли по запросу сказать, писался ли когда-то некоторый большой кусок текста их моделями или нет. Но и тут есть проблема - открытые модели.
Лично мне кажется, что в конце концов все сдадутся и перестанут обращать внимание на то кем писался текст, а будут работать со смыслом текста. Никто же сейчас не интересуется считалась ли какая-нибудь сложная формула человеком-компьютером (https://habr.com/en/companies/gazprombank/articles/791536/) или современным электронным компьютером.

а зачем это определять?
вот, как известно декларация независимости США написана ИИ, в чем собственно говоря проблема?

Проблема в том что поисковики это детектят и считают минусом

Хотя конечно официально об этом не написано нигде

Для поисковиков это вопрос выживания их бизнес-модели. Если выдача будет состоять на 100% из ИИ-копипасты, люди перестанут гуглить и уйдут напрямую в чатботы

они уже ушли.
зачем?
поисковики закончились уже давно, я в интернет с прошлого века, когда-то в период мой молодости (скриплю коленями, хны хнык какой я старый) в интернет на первой странице поиска можно было найти. я еще в альта висте искал.
помню когда яндекс был проксиком к какому то другому поисковику.
так вот - со временем интернет все больше заполнялся мусором - всякими дорвеями,
контентом сгенерированными алгоритмами (удивительно прям за десятилетич до нейросетей) и результаты поисковиков - становились все хуже и хуже.
не нейросети испортили поиск - люди.
потом как я понимаю стратегия оценки эффективности поиска - сколько времени пользователь бегает на сайте на который перешел пользователь из поиска-
привела к тому что поиск стал все больше и больше наполнятся мусором.
ту ту - поиск сломался.
так что да ушли в нейросети, мне буквально проще использовать любую неросеть.
поиск умер ЕЩЕ до появления неростей, потому что поисковые компании стали большими и забили на пользователей.

И вот тут начинается самое интересное, потому что это не баг конкретного сервиса. Это системная дыра во всей логике, по которой сейчас поисковики и детекторы пытаются отделить машинный текст от человеческого.

А вот это ИИ-текст ))

Боюсь что нет, к сожалению для меня) Просто я по 6-8 часов в сутки работаю с нейронками

Это не ии-текст. Наличие противопоставления "это не... это другое ..." ещё не доказывает, что текст написан через ИИ. Я подобные связки использовал еще в 18 году, когда писал на биржах просто потому что удобно.

Что делать, если опыта и историй дохрена, есть что рассказать и чем поделиться, но я косноязычный интроверт? К тому же это случается сплошь и рядом, чем больше человек погружен в какую-то тему, тем сложнее ему о ней рассказать... Что плохого чтобы дать ЛЛМ свои мысли, и чтобы она их разложила по порядку и красиво оформила? Даже профессиональные писатели используют редакторов и корректоров. Мне кажеться нет ничего плохого чтобы ЛЛМ помогла.

Я считаю вообще ничего. Я пишу статьи именно так (все кроме этой), за что мне стабильно пихают минусов в карму и еще кое чего за воротник как говорится. Я пишу все свои статьи через свой же webwize, там сделал для себя годный редактор потока сознания в оформленную статью.

Полезность я лично отслеживаю не по карме статьи а как много ее добавили в закладки. Добавляют – значит полезная.

ну во первых оцените наличии проблемы.
есть люди которые будут дискриминировать ваш интелект потому что вы пользуетесь неросетью.
это совсем не значит что эти люди вообще что то могут создать, это только значит что по этому признаку "можно дискриминировать", можно написать человеку - нейрослоп -
написать человеку - ты дурак нельзя. а написать: "нерослоп" можно.
а людям нравится сам процесс - когда можно сгруппироваться и гасить кого то.


да у меня совершенно такая же проблема.

Главная проблема сеошников в том, что ценность их текстов равна нулю, кто бы их не писал, а нейросетки уже умеют делать это дешевле и быстрее.

Главная проблема остальных людей - что SEO-тексты существуют

Ну тут мы щас ударимся в область качества. Что для вас SEO текст? Есть проекты типа Тинькофф Журнал где вы и не скажете что у них Seo тексты, а перед публикацией каждый текст проходит редактуру, куда у них встроен целый SEO отдел. Если для вас SEO текст это текст в котором условно встречается невпопад ключ типа "Прут каленый квадратного сечения на 40 мм купить в Москве без регистрации и СМС" то либо ваш взгляд на индустрию застрял году так в 2010 либо, либо я не знаю что)

Качественный Seo текст не выглядит как SEO текст вовсе. А так условный блог любой компании, любое бренд медиа это SEO текста.

Есть проекты типа Тинькофф Журнал где вы и не скажете что у них Seo тексты

"Что с чем носить летом: 6 лучших комбо"
"Где дешево поесть в Москве: 13 столо­вых и кафе с чеком до 700 ₽"

Пожалуй скажу. Но там хотя бы коменты есть забавные и полезные, так что какая-то ценность все же есть, за счет большой аудитории

 Что для вас SEO текст?

То, что высосано из пальца

Так это вполне здравые статьи. Прикол в том что такого понимания как SEO статья особо не существует. Есть некий миф что некие SEO статьи сложно читать, но я повторюсь, сложно читать плохую статью и не важно прикладывался к ней SEO или нет.

SEO-текст, это текст, написанный исключительно ради того, чтобы выйти в топ поиска и привлечь клик. То есть цели донести какую-нибудь идею, сообщить полезную инфу, вызвать эмоциональный отклик и т.п. у автора нет от слова совсем. Цель только одна — завлечь на страницу и показать рекламу. И да, таки тексты это сейчас более 90% контента в сети. И да, началось это ещё до нейросетей.

Ты описал концепцию коммерческого текста. Любой портал привлекает посетителей из поиска. Создание портала с полезными статьями без чёткого интента не имеет смысла. Согласно твоему определению, понять интент и написать текст по нему – уже означает создать SEO-текст. "Цель только одна — завлечь на страницу и показать рекламу" – это одна из основных целей. Реклама может быть как от внешней площадки, так и продвижение собственного продукта.

Понятно, что никто не работает бесплатно. А чтобы платить сотрудникам, нужно зарабатывать деньги.

Кроме того, статья вроде "Где дешево поесть в Москве: 13 столо­вых и кафе с чеком до 700 ₽" может быть бесполезна для тебя, но полезна для других, например, для студентов. Это пример того, как хороший SEO-текст может быть полезен для определённой аудитории. Если SEO-текст не несёт пользы, он считается некачественным.

"Текст писал я. Руками. Без всяких подсказок от ИИ." - фразы-обрубки - первый симптом нейрослопа или человека, который думает, как искусственная нейросеть, что тоже не интересно.

Полнейшая глупость. Короткие предложения это старейший прием в текстах. Он задает динамику для прочтения. Там где надо. Когда надо. Хемингуэй, Бабель и Довлатов рубили текст на такие фразы за много лет до появления ИИ)

Я позвонил Бушу. Буш отсутствовал. Я позвонил Шаблинскому. Шаблинский был пьян. Я набрал номер Осипова. Осипов уехал в командировку.

«Компромисс» Довлатова

... фраза "доброго времени суток" в сове время часто встречающаяся на Хабре, ...

Похоже и даже опечатки не помогают...

Детекторы ИИ бесполезны как инструмент оценки качества контента. Ранжирование определяется поведенческими факторами, E-E-A-T, ссылочным профилем, и многими другими факторами — и ни один из этих сигналов не коррелирует с тем, что показывает GPTZero. Раньше не уникальные тексты тоже попадали в топ, хоть и считали их некачественными. Видел сайты со сгенерированным текстом в топе и сайты с текстом от человека в нигде. Детектор тут вообще ни при чём, есть много других значимых факторов ранжирования контента.

Детекторы ИИ-текстов изначально были мертворожденной идеей. Это игра в кошки-мышки, где генераторы всегда будут на шаг впереди, потому что могут учиться на алгоритмах этих самых детекторов

Самое смешное что все эти детекторы работают на ИИ основе. Условно по промпту "ты эксперт по Ии статьям, изучи текст и скажи написал его человек или ИИ". Разумеется я утрирую, но работают они именно так.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации