Comments 259
Это как раз решается очень просто, прописать в правилах что ссылки на сторонние ресурсы автора запрещены (кроме корпоратов). Первое нарушение - софтбан, второе - перевод в read-only. Хабр от этого только выиграет, меньше времени на чужие ресурсы, больше удержание аудитории.
С AI-высерами сложнее, они только распугивают аудиторию и убивают качество, а запрос на "человеческий" контент сейчас только растет. Можно попробовать проверять статью и при превышении 80% генерированного контента вешать плашку AI-контент, чтобы люди не тратили время, что автоматически уменьшит просмотры и рейтинг статьи. (главное таким образом не выйти на своих редакторов)
Хотя бы добавить галочку "статья сделана с использованием ИИ", "статья сгенерирована ИИ". Пользователю добавить функционал "Не смотреть статьи с ИИ", "Не смотреть статьи с частичным ИИ"
....и как только появится возможность эти статьи фильтровать, галочку тут же перестанут ставить
Надо не галочку, а процент и чтобы проставляться автоматически, типа «статья с вероятностью 72% сгенерирована llm” и фильтр добавить
И кнопку "пожаловаться на ошибочное помечание вашего текста как созданного ИИ".
Чем то напоминает Антиплагиат в ВУЗах. Имхо даже если статья и написана человеком анализатор ее будет на некий довольно большой процент считать генерированной ИИ.
+
Некоторые люди и сами пишут так, словно LLM постаралась. А теперь, на фоне активной переписки в нейро-чатах, соответствующие текстовые паттерны будут фиксироваться даже у тех, кто генерирует текст сам.
Норм. Начинающие поэты тоже через "любовь-кровь" проходили. Как бы все просто и по теме. И они отсеиваются. Точно так же и технописатели со временем осознают, что нужно не подражать тем кого читают (или у кого просмотров много), а излагать собственные мысли. Хотя, вопрос в цели. Если урвать из кормушки, пока сыплется - это одно, а делиться своим, помогать - это другое.
Некоторые люди и сами пишут так, словно LLM постаралась.
Это у них синдром SLM!
Хрень этот антиплагиат, диплом на 60% сгенеренный и оформленный chatgpt 96% оригинальности, у однокурсников так же, детект нейросети включен. Особенно учитывая, что сейчас с памятью сетки очень хорошо подстраиваются под твой стиль общения.
Мне кажется лучший момент это проверка модераторами, да, ошибка первого рода будет критичной, но все таки.
Достаточно просто в список оснований для минусов поставить "статья сгенерирована ИИ". И для минусов в карму - тоже что-то типа "Выдаёт результат ИИ за свой". Это будет такой лёгкий намёк, что за ИИ-тексты стоит минусовать. Думаю, результат проявится сразу.
прописать в правилах что ссылки на сторонние ресурсы автора запрещены (кроме корпоратов)
Слишком жестко, ИМХО достаточно принудительно ссылки под спойлер "Реклама" прятать. Если материал качественный сам по себе, то реклама простительна. Если опасаетесь того, что статья пишется только ради рекламы, то сейчас даже хорошо — можно сразу прокрутить и проверить наличие ссылок, сделать соответствующие выводы...
На одной широко известной фуррёвой имиджборде однажды объявили войну ИИ.
Сперва прикрутили тег "ИИ контент", добавив галочку в настройках "показывать ИИ-контент". Причём по умолчанию эта галочка была снята.
Потом им этого показалось мало, и они добавили жесточайшую модерацию ИИ-контента. Выложили гайдлайны (по сути сборник основных ИИ-артефактов, которых надо избегать в работах) размером с небольшую книгу, и начали беспощадно банить всё, что им не соответствует. Стоит лишь промтеру схалтурить и выложить картинку с артефактами (лишние пальцы на руках, проблемы с перспективой и пропорциями, неконсистентность стиля и т.д.), то и картинку не пропустят, и ему самому выдадут бан на недельку. Мало того, модеры ещё и оценивают композицию и общую идею картинки, отклоняя с пометками "не содержит оригинальной идеи" и "не представляет художественной ценности".
Самое смешное, что эффект оказался прямо противоположным желаемому: после этого популярность ИИ-работ внезапно увеличилась. Да я и сам периодически ловлю себя на мысли, что мне там не хватает галочки "скрывать работы живых художников". Потому что модерируемый ИИ-контент внезапно стал намного качественнее среднего по имиджборду. Художников-то никто не ограничивал, и значительная их часть по-прежнему постит откровенную хрень - почеркушки, черновики, просто кривые недоделанные работы, над которыми было лень посидеть. Так что "сделано ИИ" (а на самом деле промтером с помощью целой пачки сеток) стало своеобразным знаком качества, гарантирующим некоторый минимальный порог качества картинки.
Проблема с ссылками на телегу решается легко, но никому не нужно её решать.
Хабр, пикабу и прочие дзены сидят на транзите трафика в телегу. Т.е. они конвертируют свою аудиторию на деньги.
Это очередной бум дот-комов и никто не думает о последствиях, ибо живые деньги платятся здесь и сейчас.
О том, какие будут последствия никто не думает. А может как раз и думает и понимает, что надо сдаивать старушку корову, потому что это умирающий тип ресурсов.
Для тех, кто не оч.понимает, как это работает. Есть популярный ресурс типа Хабра. На нём размещается реклама, за которую платятся реальные деньги заказчиками рекламы. На этом зарабатывают владельцы ресурса. Корпоративные блоги тоже сюда входят.
Вместе с популярностью приходят такие люди, как ТС. Которые какой-то поверхностной статьёй завлекают людей к себе в телегу, где уже сам ТС продаёт рекламу. Реклама в телеге это вообще пирамида ещё та. Можно даже ничего не делать, а просто умные мысли или картинки на хайповые темы постить (а с нейронками это стало ещё проще), набирать аудиторию и потом по-чуть-чуть запихивать рекламу.
Темы постов могут быть разные - начиная с новостных лет как какой-то топор и заканчивая узкими нишами типа конкретных политических взглядов и увлечений (а это не одно и тоже?).
И тут начинается очень тонкая игра. С одной стороны ТС вроде как пользуется Хабром как бесплатной рекламной площадкой. И возможно даже забирает аудиторию и уменьшает просмотры рекламы.
С другой стороны ТС пишет посты, иногда даже провокационные, с откликом в душе людей. Тем самым увеличивает просмотры рекламы на Хабре. Т.е. всё-таки приносит пользу Хабру.
В результате Хабр желтеет, умирает (?) - но деньги то прямо сейчас капают. И тут уже как повезет с мозгами владельцам
Тот же iXBT раньше был очень классным тех.порталом: самые подробные обзоры железок с графиками, ттх и прочим. Потом школьников набрали, повесили плашку "не является редактором" - и понеслось. Но пока что изворачиваются: качество статей хоть и упало, но аудитория сменилась с технарей на пикабушников - ресурс выжил за счет бесконечных срачей в комментах
Но вот во что мимикрирует Хабр - это вопрос, конечно, ибо изначально был более специфичным, чем тот же iXBT
Потом школьников набрали, повесили плашку "не является редактором" - и понеслось
Вы описываете раздел коллективных блогов iXBT Live. В главном разделе такого нет.
В результате Хабр желтеет, умирает (?) - но деньги то прямо сейчас капают. И тут уже как повезет с мозгами владельцам
Я думаю, что у них всё норм с мозгами. Просто у них другие приоритеты.
А в целом - сайты подобные Хабру умирают. Сначала умерли форумы со строгой модерацией (помню форумы, где оч.строго вычищался офтоп), потом форумы умерли совсем и вот умирают строго технические сайты.
Сейчас всё в чатах.
Потому, что чат создать и поддерживать быстрее, чем форум/сайт. Но самое смешное, что админам чатов приходится делать функции аналогичные форумам - FAQ, запиненные сообщения и т.п. Что противоречит сущности чатов.
Сначала умерли форумы со строгой модерацией (помню форумы, где оч.строго вычищался офтоп), потом форумы умерли совсем
4PDA и всяческие автофорумы вроде out-club.ru передают вам пламенный привет.
Да не "можно", а нужно. Я вообще не понимаю, почему администрация это терпит. Наверное, ей все равно.
Не очень с Вами согласен. Одно дело - ненавязчивая ссылка в конце статьи для тех, кому нравится материал автора. Совсем другое - полностью скопированная статья с LLM…
Разве единственная ссылка в конце статьи портит весь материал?
Нет, не портит. Но эмоции в статье, призывы к действию в комментах, очень походят на воронку продаж. Так что выглядите вы, в общем то, не намного лучше.
Ну никто же не загоняет в эту воронку, вроде. Ссылки на сторонние ресурсы должны, вроде бы, больше всего беспокоить администрацию Хабра, как уводящие с ресурса. Мне как читателю намного хуже от сгенеренного ИИ контента, чем от ссылки на сторонний ресурс. Мы же не бежим делать вклады, копить и крутить колесо или покупать реневал только потому, что все эти призывы озвучены в рекламной перебивке фильма, который смотрим. А вот если место в сетке вещания телеканала занимает говнофильм - вот тут ничего не поделаешь.
Но с говнофильмом все хотя бы честно - его название видно сразу, а вот то, что статья - просто ИИ-мусор, нигде никак не маркируется заранее
Всё верно, однако я написал то, что написал, в том числе потому что автор выбрал хайповую тему и собирает отклики. Уже все кому не лень высказались о llm-опокалипсисе.
Ну собирает - и собирает. Ну выбрал - и выбрал :)
Плохо, что ли? -Хорошо!
Хайпушка крутится - копейка мутится.
Если мне какая-нибудь хайповая тема надоела - я просто не читаю по ней статьи. А призывы вскакивать и срочно бежать в очередной канальчик я часто уже просто не замечаю. Да, нужна некоторая тренировка, но с опытом подсознание отсекает сам этот призыв ещё на подступах, когда выхватывает периферийным зрением ключевые слова в тексте, до которого ещё не дошел прямым взглядом.
А вот комментарии на тему "у, нехороший, к себе в канал зовёт, гад продажный, - вот они, честно, подбешивают, как не информативные и очевидные - типа - небо синее. Ну да, и что?
Проблема ссылок на каналы не в них самих, а в мотивации писать мусорные статьи для их размещения. Если убрать эту мотивацию - мусора будет куда меньше.
Если есть некий механизм, найдутся и те, кто захочет им злоупотребить, к сожалению.
Мотивацию запретить не получится. Она, конечно, видна сразу - набивание аудитории в канале для монетизации. Кроме "не переходить в канал, тем более на него на подписываться", мне не известны способы противодействия появлению треш-статей.
Ограниченность таких вот канализаторов в том, что, они, видимо, на понимают, что, прочтя их статью, я сужу и о качестве наполнения предлагаемого канала. И плохая статья служит, скорее, антирекламой :)
Кроме саморегулирования системы, когда на дистанции копро статьи на будут генерировать подписки на канал, думаю, нет способа противостоять.
Призываю здравомыслящих потерпеть и дождаться, когда волна засилья ИИ-треша с предложениями подписываться на канал войдёт в контролируемые рамки.
Конечно, система персональных релевантных рекомендаций ОЧЕНЬ бы помогла, но, как я понимаю, администрацию ресурса все устраивает, так что тут нужно разработать какой-то механизм на стороне пользователя, позволяющий фильтровать контент. Из того, что я успел пробежать по теме, администрация Хабра этим заниматься на будет.
Ну вот вас раздражает длинное тире, и для вас это маркер того, что статья сгенерирована ИИ, а меня раздражает в конце статей «ссылка на мой телеграмм канал».
Ну вот вас раздражает длинное тире
Вот этот тезис, кстати, ощутимо подпалил ниже спины. То есть, автор, уважающий своих читателей и делающий вдумчивую вычитку статьи (да хоть бы и проверку с помощью технических средств), в том числе на предмет пунктуации, теперь должен доказывать, что он не верблюд? Ждём следующий совет: "если в тексте не перепутаны -тся и -ться, то его написала машина!"
Иронично...

Нееее,

(/sarcasm)
Длинное тире слишком громоздкое – потому и раздражает многих. Если бы вы действительно думали о читателе, а не надрачивали на сомнительные правила, то использовали бы короткое тире, как я в предыдущем предложении.
Короткое тире имеет два недостатка. Во-первых, оно никогда не было принято в русской пунктуации. Во-вторых, оно слишком похоже на минус.
В русской пунктуации никогда не регламентировалась длина тире, ибо это специфика конкретных шрифтов, а контекстов, где нужно различать тире и минус не существует. Для человека и то и другое – просто чёрточка.
Учебники XIX и XX века не различают тире по длине, однако используют только один размер тире, длинный.
В принципе, в вашем способе нет ничего специально плохого. Мы можем даже условиться, что вы используете такой шрифт, где тире маленькой длины. Однако огромное историческое наследие обучило нас писать длинное тире, резко различая его от других форм чёрточки.
А чёрточек, кроме тире и дефиса, есть ещё очень много. Тут не только минус, но и маркер списков, и разделитель телефонного номера, и знак переноса...
Если бы Вы немного читали комментарии, то могли увидеть, что статью отредактировали модераторы. В оригинале длинные тире отсутствовали.
Тыкните «Ничего не понял после прочтения» просто ради лулзов — и пусть бедный автор негладких постов и корявых комментариев порассуждает, что там могло быть непонятным.
«Ничего не понял после прочтения»
То есть вы призываете не думать при комментировании?
А вот другое дело — проанализировать статью и дать аргументированные замечания. В ситуации, когда автор и ИИ совместно пишут статью или публикуют информацию по проекту такой комментарий может помочь автору дополнить статью или доработать проект.
Впрочем, если задача — самоутвердится, то вариант комментария «Ничего не понял после прочтения» сгодится. При этом главное — самому думать как можно меньше, но критиковать ИИ за то, что они «просто генераторы текста».
Хотя, начальный пост и основывается на утверждении, что важно не заложенные в статье идеи, а "шашечки".
Автор утверждает, что по тому же хабру ползет ползучая болезнь в виде статей, которые сгенерированы, и не заслуживают вдумчивого вдумывания, анализа, комментирования и прочих слов.
Предлагаю решение: если чувствуете, что статья ерундово сгенерированная, то прекратить ее читать, минусануть с неоднозначной и ни к чему не обязывающей причиной "ничего не понял" и переключиться на тексты, которые стоят внимания.
А вы что поняли после прочтения моего комментария?
Автор делает упор на внешнем оформлении статьи (даже длинному тире досталось, которое, кстати и сам автор использует, но "это другое"). Вместо того чтобы анализировать смысл статьи автор пропагандирует формальный подход — есть признаки генерации статьи ИИ, значит статья некачественная.
Про "ерундово сгенерированная" ни автор, ни вы раннее не упоминали, разговор шёл о подозрении на генерации в связи с оформлением статьи (даже длинному тире досталось). И если вы оставляете комментарий что "ничего не поняли", даже не пытаясь вникнуть в смысл поста, то может, от "генератора текста" вы не слишком сильно отличаетесь?
Или единственное преимущество человека перед LLM - "душа"? Ну так это не на технический ресурс надо, а в церковь.
Как можно проанализировать смысл (и взять его за паттерн), если все сгенерированные статьи отличаются по тематике и модели LLM, используемой для генерации? Я беру самую очевидную причину, по которой они распознаются. Превращая статью-проблему в массивное изучение паттернов LLM с углублением в смысл - выйдет минимум час материала, а прочитанными из них будут в лучшем случае первые и последние 5 минут.
Так я и не говорю, что нужно описывать смысл постов, я говорю о том, что по посту нужно судить по его содержанию, а не выискивать признаки ИИ. Пока ваш пост можно переименовать "как докопаться да чужих постов, не вникая в их смысл"
Вообще, при чтении как вашего поста, так и большинства комментариев к нему вспоминается фраза: "Не читал, но осуждаю"
"Тихий апокалипсис" - это когда на IT-ресурсе (может, в прошлом IT?) начинают устраивать "охоту на ведьм"!
Автор сетует на обилие контента нейросетей, но как-то упускает из виду, что 99% текстового контента в сети сгенерировано мамочка и в декрете за 0,5$/1000 знаков, который делается по ТЗ с требованием оформления который автор помечает как нейросетевой. Вы попробуйте через какой-нибудь "Тургенев" прогнать текст и внести все правки, чтобы он не докопался вообще - вы увидите, что люди так обычно не пишут и не разговаривают, там выходит действительно стерильный текст. А копирайтеры (ну или редакторы) через "Тургенев" (ну или аналоги) текста прогоняют с вероятностью, что стремится к единице
А нытьё на тему того, что объективно никак не мешает и не вредит -- не всадник?)
Не понял, я один читаю хабр, чтобы найти годные телеграм каналы и авторов?
Появился некий "новый класс контента", ценность которого равна нулю.
Потому что вы не хотите платить за контент.
Но для этого нужна работа.
Потому что вы не хотите платить за работу.
неужели в подобных блогах нет никакого контроля качества?
Качество — это число переходов по ссылке.
Лайк.
Сам подписан платно на некоторых авторов, очень доволен.
Хабр пока относительно держится за счет комьюнити, которое минусует хотя бы полный неадекват, но приближение к vc и пикабу заметно, да.
Потому что вы не хотите платить за контент.
Потому что нас приучили к хорошему бесплатному контенту.
Вообще да, согласен. Но тут важный момент. Для авторов часто польза в другом:
получить удовлетворение от одобрения его работы
улучшить свой или корпоративный бренд
принести другим пользу
и т.д.
И обычно вот эти вещи достаточно значимы, чтобы потратить свои силы и выложить бесплатно какую-то достойную статью. Но в то же время у многих теряется желания делать что-то хорошее, когда другие получают ту же пользу для себя, но уже не тратя много усилий и кормя людей мусорным контентом.
Попробовал тут написать статью. Я писал в свое время для бумажных журналов за деньги, ну т.е. опыт имею. Дай думаю поделюсь опытом личным.
Склепал на пробу среднего качества статью с небольшим объемом пользы. Лучше чем 90% шлака, который вываливают ежедневно. Подобные в ленте попадаются.
Прилично дней провисела на модерации, была отклонена, в результате получил по почте совершенно издевательское письмо после которого писать что-то еще когда-то еще сюда я совершенно точно не буду. Особенно доставило предложение "чего-нибудь улучшить" совмещенное с тем, что текст я обнаружить нигде не смог :). Да, у меня есть почти последний вариант, но финальный был вычитан в интерфейсе.
Т.е. новых адекватных авторов не ждите. Лично я получил не удовлетворение, а натуральный плевок в лицо. И вопрос даже не в том, что статью отклонили, яб совершенно нормально это воспринял, но то как это было сделано дало мне понять: тут меня не любят и не хотят :).
ЗЫ. Может дело в том, что я не пользовался чатботами....
Очень странно, кстати. Я тут немного просмотрел новичков в разделах "ожидают приглашения" и "новые авторы". Ну там лежит реально такое себе... Обычно все, что хотя бы чуть-чуть читабельно - публикуется без разговоров автоматически. Попробуйте еще раз, может отклонили ошибочно. Ну, или кто-то из модераторов наточил на вас зуб.
Похоже никто даже не читал, пришло какое-то письмо где в быдло-юмористической форме сообщили, что "пошел бы я, и просьба нам больше по этому вопросу не писать", причем по ощущениям это вообще автомат писал, т.е. ничего релевантного в нем не было.
Я не горю желанием что-то публиковать. Было интересно поставить эксперимент. Нет так нет.
Я в целом потратил пару часов, чтобы написать, вычитать, оформить. Я готов поверить в то, что вышло совершенное гно, что кто-то прочитал и "отверг". Но я совершенно не готов иметь дело с площадкой, где это-то кто-то 30 секунд решил не тратить на указания резонов, а просто смыл два часа чужой жизни в унитаз отправив автогенеренную отписку.
Просто нет мотивации через этот фильтр пролезать. Ради чего ? Просто публиковаться я могу где угодно еще, да, на меньшую аудиторию, но не сталкиваясь с такими "нежданчиками".
Если бы я таким образом "зарабатывал себе на хлеб", то пришлось бы... Но я могу заработать если не буду писать статьи, а делом займусь, так ради чего мне напрягаться в ситуации полного отсутствия респекта :)?
ЗЫ. На мне свет клином не сошелся, я вообще малополезен ;). Жаль что более полезные люди столкнуться с тем же самым...
Могу понять. У меня тоже одну статью отклонили, но из-за тематики, типа не сильно подходила под хабр. И ладно, если б все такие статьи отклоняли. Но нет, не подходящих по тематике тут овер дохрена, только нужно заплатить деньги за блог.
И тоже согласен насчет самого текста статьи. У меня также была финальная версия только тут, а на компе лежал черновик. Тут ее отклонили и все, нет готовой статьи.
Потому что вы не хотите платить за контент.
А Вы заплатили за моё время, которое я потратил его читамши?
Потому что вы не хотите платить за работу.
Как говорят у нас на илинойщине, look who's talking (aka «чья бы корова мычала»)
Качество — это число переходов по ссылке.
Наиболее качественным признан контент «Саша Грей вырастила огромные...»
(по ссылке — статья про помидоры).
Вы не поверите, какой результат я получил на промт: "Сгенерируй статью на тему "я устал читать сгенерированные статьи"". Концовка 5 баллов:
Заключение
Я устал читать сгенерированные статьи — не потому, что они плохие. А потому, что они слишком хорошие.
Давайте пойдем от противного. Не все умеют складно излагать свои мысли - тем более - формулировать их. Про орфографию и прочее - уже молчу - сам грешу этим. Но есть люди, которые хотят донести свои мысли или идеи, но не умеют излагать - и как прикажете им быть? ИИ в этом случае - хороший помощник. Но в одном с вами соглашусь - если видно, что выкладывается просто генерация - она глаз режет. Чтобы ИИ сгенерировал хороший текст - тут тоже стоит попотеть. Получается - палка о двух концах - либо корявый, невнятный текст с ошибками - зато свой - либо явная генерация... Что лучше?
Но есть люди, которые хотят донести свои мысли или идеи, но не умеют излагать - и как прикажете им быть?
Потратить больше времени на написание?
Вообще, письменная речь это тоже навык, который можно развивать. Орфографические ошибки текстовый редактор вам подсветит и предложит, как исправить. Стилистические, конечно, в этом смысле сложнее. Вот тут как раз можно к б-гмерзкой ЛЛМ прийти и попросить стилистической редактуры. Но, конечно, лучше книжки читать.
Что лучше?
Оба хуже.
Получается - палка о двух концах - либо корявый, невнятный текст с ошибками - зато свой - либо явная генерация
Ложная дилемма. Все равно нужно напрягаться и выковыривать мысль аффтара из корявого либо из гладкого текста. С корявым проще.
«Природа создала людей разными, одинаковыми их сделали господа Смит и Вессон»
Это та же проблематика.
В нашем случае — Даль и Ожегов.
Точно так же и господа Смит и Вессон ничем не помогут тому, кто не тренировался месяцами быстро выхватывать их из кобуры и метко нацеливать.
«Иметь крутую пушку, но не уметь ею пользоваться — это неплохой способ гарантировать, что у парня, засевшего в кустах с дубинкой, скоро будет ещё и крутая пушка!» ©
Но есть люди, которые хотят донести свои мысли или идеи, но не умеют излагать - и как прикажете им быть?
Пусть научатся.
В конце концов, своё «неумение» они получили собственными действиями во время обучения в школе, списывая сочинения из сборников готовых сочинений, вместо того, чтобы писать их самим.
Сгенерированный ИИ материал не имеет права на существование.
Странное утверждение. Учиться писать, дабы доносить свои мысли, работать над орфографией.
Если человек очень сильно хочет рисовать, но не умеет - можно ли его назвать художником после генерации картинки? Мысли же свои он донес, пусть и через ИИ…
Опыт показывает, что научить рисовать можно практически любого человека. Вопрос времени. Как и научить излагать свои мысли. Как там говорили -"Кто ясно мыслит - тот ясно излагает"
О чем я и говорю. Научить можно абсолютно любого. Но автор комментария выше считает, что генерировать текст через ИИ - выход из ситуации. Зачем учиться, верно? :)
Отчасти можно. Если автор реализовал с помощи нейронки именно то, что он в голове у себя представил. Даже живописцы и скульпторы задолго до ЭВМ нанимали помощников.
Но есть люди, которые хотят донести свои мысли или идеи, но не умеют излагать - и как прикажете им быть?
В том то и дело, что зачастую они излагают мысли llm, а не свои собственные
Но есть люди, которые хотят донести свои мысли или идеи, но не умеют излагать - и как прикажете им быть?
Научиться излагать и потом излагать :) Этот навык и есть барьер между своим мозгом и мозгами других. Качественно структурированный смысл и качественно написанный текст это — сеанс обмена структурированными данными между мозгами.
Умение излагать мысли такая же технарская тема, как умение прокладывать кабели. А умение еще красиво сделать это авторский стиль. Можно и без него писать внятно и по делу это будет большой плюс к вам как к личности.
Почему вы предполагаете, что не умеющий донести свои мысли до человека сумеет донести их до ЛЛМ?
Про орфографию и прочее - уже молчу - сам грешу этим.
А ведь говорила мама — учи, сынок, в школе русский язык, пока бесплатно...
В данной статье Вы не найдете ссылок, скриншотов с никами авторов или названиями компаний.
Я хочу говорить о системной проблеме, а не о частных случаях.
Отлично, давайте поговорим. В общем случае, статистически, есть большая вероятность, что большинство статей, которые вам кажутся сгенерированными, на самом деле авторы писали сами, вы видите то, что хотите видеть, и никакой проблемы нет. Что дальше?
Я ничего не говорю про статьи, которые могли быть теоретически сгенерированы. Лишь про те, где это явно заметно.
Грубо говоря, про статьи без полной редактуры с крайне очевидными «паттернами» ИИ, которые были описаны в статье.
Я про это и говорю. Вам они кажутся очевидными, а авторы эти статьи написали сами. Нейросети обучены на данных из интернета и следуют паттернам, которые применяют люди.
Давайте с другой стороны посмотрим. Почему «БУМ» однотипных статей с идентичной стилистикой написания внезапно массово возникли на платформе? Почему так никто не писал на Хабр в 15 году, например? Почему данные паттерны начали появляться только с развитием LLM?
Это та же самая сторона. Вам кажется, что эти паттерны начали появляться только с развитием LLM, вы про них узнали только после появления LLM, и теперь обращаете на них внимание.
Похоже вы не понимаете, поэтому напишу прямо. Чтобы "говорить о системной проблеме" надо сначала показать, что она есть, а для этого нужны конкретные примеры в большом количестве. Иначе вы требуете от других обсуждать и решать то не знаю что на основе голословных утверждений. Первое высказывание из процитированных делает бессмысленным второе.
Я не могу ссылаться на примеры, это абсолютно неэтично и должно наказываться со стороны администрации Хабр. Если интересно Вам лично - напишите мне в ЛС, дам ссылку на очень популярную статью от ИИ.
Тогда не стоило вообще начинать этот разговор.
дам ссылку на очень популярную статью
Один пример не докажет наличия "системной" проблемы. Я вот этой проблемы не наблюдаю, только отдельные редкие случаи. Те статьи, которые я читаю, в большинстве выглядят нормально, и мне без разницы, какие там тире.
Вы зацепились за один паттерн и утверждаете, что я определяю ИИ-шные статьи исключительно по нему. Зачем? Если Вы изначально не хотите видеть проблему - пройдите мимо статьи, обсудим проблему с теми, кто столкнулся и негодует. Какие проблемы?
Кидать блок ссылок на все статьи, сгенерированные LLM, абсолютно неэтично, я говорю об этом еще раз.
Вы зацепились за один паттерн
Нет. Выше я прямым текстом написал во множественном числе: "они кажутся очевидными".
и утверждаете, что я определяю ИИ-шные статьи исключительно по нему
Где я такое утверждал? Приведите цитату.
Это вот как раз пример того, что вы видите не то, что есть, а то, что хотите видеть.
Если Вы изначально не хотите видеть проблему
Если я прошу показать примеры проблемы, то наверно это говорит о том, что я хочу увидеть проблему?
Это еще один пример.
я говорю об этом еще раз
А я говорю еще раз, что без примеров это обсуждать бессмысленно. Вам уже несколько человек написали, что они в тексте используют то, что вы называете паттернами. Вполне возможно, что и в остальном вы ошибаетесь так же.
Вы и сами понимаете, что можете обвинить кого-то голословно, поэтому и не хотите приводить примеры, но почему- то продолжаете спорить.
обсудим проблему с теми, кто столкнулся
Без примеров будет так, что вы представляете что-то одно, а другие другое, у вас разные представления о том, как это исправить, и обсуждение будет бессмысленным.
Я Вам предложил написать мне в ЛС, где я могу поделиться примерами локально, а не на аудиторию? Почему Вы решили проигнорировать и продолжить спор?
Я не хочу быть причиной, по которой могут начать травлю авторов, которые потенциально могут исправиться. К чему транслировать на массовую аудиторию? В комментариях есть люди, которые со мной согласны, мне этого достаточно. Продолжать диалог не имеет смысла, Вы не принимаете мою позицию (не делиться ссылками на аудиторию, а поделиться лично). Спор ради спора.
Я Вам предложил написать мне в ЛС, где я могу поделиться примерами локально
Почему Вы решили проигнорировать?
1. Вы предложили, цитирую, "дам ссылку на очень популярную статью". Одну. Почему одна статья мне не нужна, я уже объяснил. Объяснил, значит не проигнорировал.
Отдельный вопрос, почему сгенерированную статью надо считать проблемой, если она популярна и значит нравится людям.
2. Почему мне не нужно это локально, я тоже уже объяснил. Моя точка зрения в том, что они должны быть в тексте на эту тему, иначе не будет предмета обсуждения.
Хорошо, если у вас есть 10 примеров статей, ну или хотя бы 3-4, напишите пожалуйста мне их в личку. Только с конкретными цитатами, по которым вы решили, что они сгенерированы. Выискивать в куче текста то не знаю что я не хочу.
К чему транслировать на массовую аудиторию?
Я уже объяснил почему в предыдущем комментарии.
Я не хочу быть причиной, по которой могут начать травлю авторов
Вы слишком много о себе думаете.
То есть человек прочитал статью, решил "ну нормальная статья", а потом прочитал "О, некто eternaladm говорит, что она с его точки зрения сгенерирована нейросетью", и решил начать травлю автора, который ранее ему понравился. Так что ли?
У людей есть свое мнение, и если статья им кажется сгенерированой, то они уже сами так решили без вас.
Спор ради спора.
Не ради спора, а чтобы объяснить вам мою точку зрения. Потому что похоже вы ее не понимаете.
Отдельный вопрос, почему сгенерированную статью надо считать проблемой, если она популярна и значит нравится людям.
Потому что сгенерированный контент несёт за собой нулевую ценность. Информацией делится не автор, нет "обмена опытом", обычный бесполезный анализ LLM.
Моя точка зрения в том, что они должны быть в тексте на эту тему, иначе не будет предмета обсуждения.
Ещё раз... Во-первых, я не пытаюсь указать на конкретные примеры, а говорю о тенденции. Во-вторых, публикация ссылок на статьи может привести к минусам и потерям кармы авторов, на чьи статьи я сослался. В-третьих, указание ссылок с подтекстом: "Иван Иванов генерирует статьи и лживо выдаёт их за свои" - может нести юридические риски, иск в суд на за защиту чести и достоинства пусть и маловероятный исход, но не нулевой. Статью я писал не для этого.
Я уже объяснил почему в предыдущем комментарии.
Вы не объяснили, а продублировали свою мысль, на которую я ответил:
Я не могу ссылаться на примеры, это абсолютно неэтично и должно наказываться со стороны администрации Хабр
Вы слишком много о себе думаете.
Очень интересно, где?
У людей есть свое мнение, и если статья им кажется сгенерированой, то они уже сами так решили без вас.
Если я несу посыл, который подразумевает генерацию контента и делюсь ссылками - прямая клевета. И я не могу быть уверенным, что авторы, на которых я буду ссылаться, никак не пострадают. Быть уверенным, что на них это никак не отразиться? А где гарантии? Предоставите?
Не ради спора, а чтобы объяснить вам мою точку зрения. Потому что похоже вы ее не понимаете.
А Вы мою понимаете? Судя по настаиванию на выкладывании ссылок на чужие статьи - абсолютно нет.
Потому что сгенерированный контент несёт за собой нулевую ценность.
Пройдите мимо статьи. Пусть ее читают и обсуждают те, кому она понравилась.
Ещё раз... Во-первых, я не пытаюсь указать на конкретные примеры, а говорю о тенденции.
Ещё раз. Я прекрасно понял, что вы говорите о тенденции, и объясняю вам, что есть большая вероятность, что тенденция есть только в вашем воображении. Чтобы узнать, так это или нет, сначала надо понять, что именно вы имеете в виду.
Во-вторых, публикация ссылок на статьи может привести к минусам и потерям кармы авторов
Ну так вы же и хотите, чтобы таких статей было меньше. Это как раз и даст такой эффект. Как вы по-другому хотите этого достичь, тем более конкретно на Хабре?
В-третьих, указание ссылок может нести юридические риски
Я вам именно это и сказал в самом первом комментарии. Есть большая вероятность, что вам только кажется, что статья сгенерирована, а на самом деле ее писал человек.
Вы не объяснили
Вот прямые цитаты с объяснениями, почему надо указывать примеры в статье на эту тему:
"Вполне возможно, что и в остальном вы ошибаетесь так же."
"Без примеров будет так, что вы представляете что-то одно, а другие другое"
на которую я ответил "это абсолютно неэтично"
Из того, что вы считаете это неэтичным, не следует, что указанные мной фразы не являются объяснением.
Очень интересно, где?
Наверно в том тексте, который процитирован перед этой фразой?
который подразумевает генерацию контента и делюсь ссылками - прямая клевета.
Клеветой это может быть только в том случае, если есть большая вероятность или достоверная информация, что статью написал человек. А в этом случае ваша статья не имеет смысла, так как нет сгенерированных статей нет, и обсуждать нечего. Именно это я вам объясняю с первого комментария.
А где гарантии? Предоставите?
Предоставлю. Более того, я уже объяснил как. Хотите гарантий, значит вообще не стоило начинать этот разговор. Сказали А, говорите Б.
Иначе у вас получается так: "Люди не скажу какие пишут статьи не скажу какие, используют там фразы не скажу какие, но мне они не нравятся, давайте обсудим, что с этим можно сделать".
А Вы мою понимаете? Судя по настаиванию на выкладывании ссылок на чужие статьи - абсолютно нет.
Это неверный вывод, так как есть более одной причины, почему я могу на этом настаивать. И причину я вам уже объяснил.
К чему Вы это написали, если Вам в ЛС были направлены ссылки на статьи? Вам нужен спор?
Я уже ответил на этот вопрос. Чтобы объяснить вам мою точку зрения, потому что похоже вы ее не понимаете. Вы высказали тезисы, которые я считаю некорректными, я привел свои аргументы и объяснения. Без этого будет выглядеть так, что мне на ваши тезисы нечего ответить, а это не так.
А вот глупые вопросы вида "Очень интересно, где?" это именно спор ради спора.
Вот если вы анализируете не смысл статьи, а "паттерны" - то не стоит обвинять других, что они "не хотят думать" и используют ИИ.
Что я искренне не понимаю, так это лояльность читателей, которые не минусуют подобный контент, ведут серьезные обсуждения сгенерированного текста, из 100 комментариев - в лучшем случае 1 будет негодовать и указывать на генерацию.
То же самое касается видероликов. Посмотрите как их потребляют. Куча лайков, куча комментов и только пару человек напишут, что это ИИ. Раньше больше об этом писали. Либо перестали замечать, либо забили об этом писать.
И это касается видео, где, помимо содержания, можно оценить ещё по голосу и соответствию видеоряда. Люди уже ИИ видео потребяют не замечая, а текст куда сложнее оценить, что это ИИ (тем более для неподготовленного).
Так что да, это апокалипсис. На ютубе в рекомендации постоянно попадают ИИ ролики, приходится нажимать Не рекомендовать канал для каждого такого и вроде как помогает, но они всё равно пролазят.
Тем не менее, ценный авторский контент непременно будет замечен, особенно кому это нужно. Ваши статьи про rsync я прочитал с удовольствием и оценил по достоинству. По-моему, нигде в интернете так подробно о нём не написано.
Надеюсь, когда-нибудь с ИИ контентом начнется борьба более серьезная, чем есть сейчас.
Крупным сервисам уже пора бы внедрить какую-нибудь кнопку жалобы на генерированный контент.
Администрацию хабра всё устраивает - они получают деньги за корпоративные аккаунты и паразитируют на контенте обычных авторов, публикующихся бесплатно. И намешивают к этому контенту корпоративных рекламных статей без возможности их скрыть.
Я полгода назад написал статью типа этой, только с более жёсткими формулировками и конкретными примерами: https://habr.com/ru/articles/878768/. Администрация хабра статью убрала в чулан (скрыли из ленты), не смотря на рейтинг +395. А когда в копроблоге выходит статья с заголовком типа "Проект Горижопа" https://habr.com/ru/companies/geltek/articles/505526/ - это для администрации хабра нормально, так можно. Так что люди голосуют ногами и разбегаются по телеграм каналам, личным страничкам и другим сайтам.
Почти со всем согласен, разве что с паразитированием перебор, как мне кажется - вроде бы и обычному автору Хабр полезен, а не только наоборот.
И вот вроде можно было бы прикрутить автоматические плашки вида "На 90% ИИ" - и дать возможность фильтровать. Но либо не сделают, либо сделают только для обычных авторов.
P.S. Правда, что-то задумался - автоматическое детектирование ИИ со временем приведёт к тому, что статьи будут специально обрабатывать так, что они станут ещё хуже...
Правда, что-то задумался - автоматическое детектирование ИИ со временем приведёт к тому, что статьи будут специально обрабатывать так, что они станут ещё хуже…
Вы абсолютно правы, это крайне расстраивает. Или статьи начнут искусственно портить, или LLM будет генерировать контент, который невозможно отличить от человеческого. В любом случае - весьма тоскливо.
Да-да, появятся промты типа "сделай как человек", всякие ТГ-боты по "ухудшайзингу", и т.п. как я понимаю, простому читателю нужно пользоваться свой головой (а когда было не надо?) для отфильтровывания ИИ-мусора, а "эффективные авторы" (аналоги "эффективных менеджеров") будут "оптимизировать" структуру мусорных статей....
Джинн выпущен из бутылки, впереди " контентные войны" с противопоставлением огромного объема, который может создать ИИ, высокому ачеству (новизне? нетривиальности?) контента, создаваемого человеком.
Причем предлагаемые здесь "решения" в виде некоей автоматизации фильтрации (всякие виды плашек "ИИ-контент на 80%", выявление " паттернов ИИ") будет означать игру на поле ИИ и по его правилам, т.е. тренировку ИИ в том, чтобы все более эффективно имитировать человека в определенных областях. То есть, просто уход противостояния на новый виток без решения проблемы по существу, решение проблемы, созданной ИИ, при помощи самого ИИ
Про ютуб Вы меня крайне удивили, не ожидал настолько крупной тенденции… Самому редко удается туда заходить и, в основном, целенаправленно, за определенным автором/контентом.
По-моему, нигде в интернете так подробно о нём не написано.
Именно это и побудило сделать «полную выжимку», дабы упростить поиск информации многим людям. Спасибо Вам за теплые слова!
Надеюсь, когда-нибудь с ИИ контентом начнется борьба более серьезная, чем есть сейчас.
На данный момент ничего даже не предвещает этого исхода. На данный момент, люди или не понимают, что текст/видео - продукт генерации, или ставят клеймо «сгенерировано ИИ» на все подряд, включая авторский контент.
текст куда сложнее оценить, что это ИИ (тем более для неподготовленного)
Не хочу в этом сознаваться (себе), но я чаще не отличу генерацию, чем отличу. Относительно уверенным в генерации можно быть только в самых упоротых случаях, когда все самые очевидные паттерны собраны в кучу, и то, а вдруг это стеб живого человека? Не знаю, я один такой, или нас 95%. Скорее второе.
Чем больше мы потребляем контента ИИ, тем лояльнее к нему относимся. Со временем, статья живого человека начнёт вызывать непонимание и отторжение.
Поддерживаю!
Раньше больше об этом писали. Либо перестали замечать, либо забили об этом писать.
Тут есть очень тонкий момент: когда условный читатель пишет "это ИИ-текст, минус, отписка, дизлайк", он тем самым даёт обратную связь для обучения следующего ИИ. А когда молча ставит минус с причиной "другое" - то "автор", который запостил статью, получает отрицательный фидбек, но ИИ не получает вектора обучения. Почему он минуснул? Может тема не понравилась? Может настроение плохое? Неизвестно...
А я вижу паттерны ИИ в вашем тексте. Например вовлекающий крючок (как его рекомендует ИИ) вопрос в заключении.
Метафоры типично иишные. И так далее...
Возможно текст хорошо отредактирован, но не более.
(Это я к тому, что отличить всё сложнее)
И Вы правы отчасти. Если под «вовлекающим крючком» Вы имеете ввиду название - не ошиблись, «Тихий апокалипсис:» был взят как раз от запроса LLM. То есть, название на 50% сгенерировано)
Вот об этом я и говорил, ИИ - инструмент, который может помочь оформить текст, найти дыры в тексте, придумать название и прочие мелкие вещи, не влияющие на качество контента. Но никак не генерировать полные статьи, которые публикуются без малейших правок в тексте, это уже слишком…
Насчёт длинных тире - а вы не думаете, что некоторые могут набирать большой текст в Ворде или либрерайтере, программах, которые умеют заменять минус на тире?
Больше скажу: неравнодушные к типографике не ленятся и — написать.
Сколько себя помню, всегда длинные тире писал. Alt-0151 — уже на автомате. Соберусь писать статью на хабр, придётся менять на минусы перед публикацией. А то ж обвинят во всяком непотребстве...
У неравнодушных к типографике с детства стоит раскладка Бирмана
Да и без программ прекрасно набираются нормальные типографские символы, благо давно уже для каждой клавиши больше двух слоёв использовать можно (сама по себе и с Shift), и раскладок клавиатуры хватает (плюс самому их можно сделать или подправить легко). У меня четыре сотни комментариев на Хабре, и всюду я стараюсь использовать типографически правильные символы (длинные и короткие тире, кавычки ёлочки и лапки, троеточия и т.п.) — с точки зрения автора (который кавычки заменяет на программистские double quotes, как во времена KOI8 / CP866 / CP1251) я их с помощью LLM сгенерировал?
А ещё букву ЙО использую, и стараюсь два раза вычитывать перед отправкой с точки зрения грамотности — настоящие люди тоже так не делают?
Кастомные раскладки — must have для каждого, кто хочет писать нормально оформленный текст.
Вот в ↑ этом ↑ предложении — длинное тире, слева и справа от которого стоят nbsp
(чтобы новая строка не начиналась с длинного тире), и я это набираю не задумываясь, на автомате. Со скоростью обычного набора. А потому, что Ctrl + Space
это nbsp
, а тире и остальная типографика повешены на цифры.
Ещё и для разных языков разные кавычки, и запятая для русского на Numpad'е заменена на точку.
Я думаю, что данный «паттерн» массово начал появляться как раз после развития LLM. Тут речь не про одно длинное тире, а про все паттерны вместе. Наверное, стоило привести конкретные примеры статей, дабы лучше донести свою мысль, но делать это в ущерб авторам - неэтично…
Я всегда тире набираю длинным. Благо, дополнительных нажатий на это требуется не много. Клавиша «Compose» и несколько минусов подряд.
На маке option + shift + -
И получается — пам-пам — тире, а не дефис :) Как на остальных платформах, не знаю. Надо бы погуглить, как на минте это так же быстро писать.
Уже второй раз сталкиваюсь с замечанием, что длинные тире — это признак ИИ. А я люблю русский язык и всегда ставлю длинные тире (и точки над "ё"). Alt+0151 нажимается уже на автомате.
Оказывается, меня могут, чего доброго, за нейросеть принять! Даже как-то обидно...
Чтение статей на сегодняшний день, очень похоже стало на чтение комментариев на массовом ресурсе не направленного контента, как раньше большинство комментариев было без уникальной мысли, теперь большая часть статей такая, непонятно о чем, непонятно за чем, и максимально раздражающие ИИ обороты речи. Вроде и правильно пишут, но пусто и без души. Остается ждать пока пройдет волна, интернет опять меняется (не в первой) посмотрим что будет дальше.
ИИ пользуюсь, как источником ответов на вопросы, поставщиком базовой информации, считаю он имеет право на существование и перспективы, нужно просто пережить момент становления технологии.
Живой автор, вкладывающий душу и экспертизу, видит, как его глубокий разбор какой-либо темы - уступает в просмотрах и карме блестящему, но абсолютно бесполезному и сгенерированному за 15 минут. Включается простая, но железная логика: "зачем пахать неделю, если можно за пол часа получить тот же (или больший) эффект."
Ну тут Вы перегнули. Упоминание логики не всегда говорит о логике.
На мой взгляд, Вы хайпуете на теме ии, как делает некоторое количество авторов в последние 3-4 месяца.
В цитируемом абзаце Вы умышленно написали «пол часа»? Это знак отличия от ии или случайная ошибка в проверенной, блестящей, но бесполезной для меня статье?
Надеюсь, администрация Хабра что-то придумает. Уже обсуждали разочек, возможно есть новости от @Boomburum
Самое лучшее на Хабре - это оригинальная авторская мысль и ценный личный опыт, возможно в формате перевода. Флуд нейрошлака нужно как-то ограничить...
Просто механизмы поощрения авторов во всей совокупности сейчас сложились так, что на написание статей (т.е. обширных высказываний) они запихивают людей, которые общаться не любят и не хотят (по крайней мере, в таком формате), а поэтому они просто игнорируют любой негативный фидбэк и лепят что-нибудь, лишь бы от них отстали.
Я уже говорил: пункт в голосовалке “пост/комментарий написан LLM”, и по опредленному порогу — ро/блокировка со все увеличивающимся периодом.
Идеально еще плашка “Х человек считают, что статья сделала с применением LLM”, чтобы можно было чут внимательнее на паттерны смотреть.
В начале 23 года я написал короткий пост на тему того что всё заполонит ИИ статьями, в тот день когда на хабре появился раздел постов. Словил 16 минусов, из-за орфографии. Но потом откатило до 4 - таки сбылось.
Проблема конечно, не в длинных тире или «кавычках» — многие люди с типографской раскладкой их используют. И не в списках, и не в вежливых оборотах. А в том, что статей стало много, но они не являются информацией — философски, информация это условный триплет «источник, сообщение, получатель» (см. например, «Сумма Технологии»), без этого ценность может представлять только какая-то замкнутая капсула — какая-то самодокументируемая или верифицирующая программа, строгое доказательство теоремы, но здесь, вроде как на площадке для полемики экспертов, идет и «поток контента» для не тех получателей (пикабушно-висишный), но самая главная проблема — разрыв между автором-источником и сообщением.
Ситуация, когда тут неэксперт пишет что-то (руками, ИИ, нанятыми переводчиками, неважно… ) и не готов «отвечать за слова», и вообще не понимает тему, уже давно была тотальной, с ИИ это просто амплифицировалось. «Карма-рейтинги» тут обычно не срабатывают, потому что вроде как «жалко пороть море» (каких-то коммерческих переводчиков и публикаторов — они даже не пытаются отвечать в комментариях). Но вот если бы хотя бы можно было как-то отделить («тег мое!») именно авторские статьи, или как-то ввести долг-ответственность (звучит плохо, но как-то геймифицировать) за ответы в комментариях, чтобы просто можно было отделить поток статей, где автор излагает свои мысли и защищает-поясняет их в комментариях (насколько провокативными или банальными они не были — возможно у него цель получить критику или консультацию, это норм), от всего остального потока, было бы прекрасно. А там уже можно и как-то смотреть на экспертность.
Поделюсь опытом.
Если написать статью, а потом отвечать в комментариях, то за ответы в комментариях будут снижать карму.
Вы ошибаетесь. Карму обычно снижают не за ответы в комментариях, а за содержание этих ответов.
У меня не снижают. ЧЯДНТ?
Возможно, вы не поддерживаете свободные лицензии.
"Не ною о свободных лицензиях", вы хотели сказать?
Простите, конечно, при всем уважении, но у вас очень душные комментарии, в которых вы либо убеждаете человека, что ему надо перейти на свободные лицензии, либо жалуетесь на отсутствие денег/плохое оборудование/маленький город/отсутствие работы/етс. Собственно, результат (для меня) закономерен.
Не думаю. Всю карму я набрал еще в те времена, когда habr был «реддитом» — когда просто постили ссылки, и мои статьи были на внешних ресурсах — и это информационно было оптимально и экологично, не надо было «рерайтить», рожать статью на пустом месте, увеличивать энтропию, если хотелось поделиться чем-то важным-свежим-полезным (все это убили). С тех пор практически только комментирую, и карма за десятилетия практически не изменилась. Я наблюдал конечно статьи, которые шли в разрез с текущими представлениями, где автору сильно сжигали карму, и там это может быть связано — «еретик упорствует», но в правило бы это не завел, эти авторы наверно знали на что шли (как мог их плюсовал конечно, ибо отстаивание убеждений — важно).
Ну вот я плюсанул вам, чтобы «нужно 30 баллов кармы, чтобы писать про Википедию в хабе «Законодательство в IT»», но я помню ваши комментарии, даже к своим постам и комментам — вы очень душнили везде достаточно левыми вопросами «какая у вас лицензия (к каждой картинке, видосу и т.п.)». Наверно это ваш путь, и что-то в этом наверно полезное есть, но часто это раздражало, могу понять если за такие комментарии вы наблюдали минусы, и не уверен, что это улучшает отношение людей к свободным лицензиям.
Речь в первую очередь о длинных тире (—). В реальной переписке люди обычно ставят обычный дефис (-), потому что это быстрее. Обилие идеально расставленных «—» — признак того, что текст отформатировала программа, а не человек.
Статья это не переписка, и бывают требования к оформлению - длинные тире, кавычки и все такое прочее.
Я говорю не про единственный паттерн в статье, не про случаи, где все короткие тире заменены на длинные. А про совокупность паттернов (можно посмотреть блок «Скрытый текст» и увидеть характерную для ИИ генерацию, о которой и идет речь в статье).
1. Шаблонная структура списков
Абзацы строятся по жёсткому шаблону: Жирный номер пункта, затем двоеточие и объяснение. Это создаёт эффект «армейского устава», а не живой речи. Настоящий автор чаще использует разные конструкции: может начать мысль с вопроса, вводного слова или просто с абзаца без нумерации.
Или позволяет пояснить, что будет в данном абзаце.
2. Слишком правильная пунктуация
Речь в первую очередь о длинных тире (‑). В реальной переписке люди обычно ставят обычный дефис (‑), потому что это быстрее. Обилие идеально расставленных »‑» — признак того, что текст отформатировала программа, а не человек.
Правильная пунктуация - зло!
4. Обилие вводных фраз и клише
Текст может быть пересылан штампами вроде:
«Важно отметить, что...»
«Стоит подчеркнуть следующий аспект...»
«Таким образом, мы можем наблюдать...» Эти фразы делают текст гладким, но немного безличным и «каучуковым».
Эти фразы позволяют идущим за ними текстом "не висесть в пустоте".
6. Излишняя вежливость и нейтральность
Даже в текстах, где уместна эмоциональность или резкость, ИИ часто сохраняет ровный, вежливый и дипломатичный тон. Не хватает живых эмоций, сарказма или > допустимой резкости.
Иди на Х**!
Иди на Х**!
Что это за детский сад? Тут, между прочим, половозрелые люди собрались! /s
Вы действительно взяли блок из скрытого текста, который сгенерировала ИИ?) Разнесли LLM по фактам, ничего не скажешь.
Но вы же на них ссылаетесь как на паттерны ИИ!
Я говорю не про единственный паттерн в статье, не про случаи, где все короткие тире заменены на длинные. А про совокупность паттернов (можно посмотреть блок «Скрытый текст» и увидеть характерную для ИИ генерацию, о которой и идет речь в статье).
Или, если что "я - не я и лошадь не моя"?
«Характерную для ИИ генерацию» - применение паттернов на практике, где я демонстрирую промт и типичный ответ ИИ с перечисленными мною паттернами…
Точнее:
А про совокупность паттернов (можно посмотреть блок «Скрытый текст» и увидеть характерную для ИИ генерацию, о которой и идет речь в статье).
Что читается, как "вот те паттерны, по которым в статье определяется, ИИ сгенерировал текст или нет"
Если же скрытый блок - "просто иллюстрация" (что из текста стать и не очень то понятно), то она не соответствует вашим тезисам:
1. Странная структура. Все языковые модели грешат одним и тем же. Используют конструкцию: "1. Жирный текст: Начинаем после двоеточия с большой буквы".
В "иллюстрации" нет "странной структуры" - скорее, это определение больше соответствует вашим тезисам, чем тексту, созданному DeepSeek
2. Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное "-" банально проще и быстрее.
Тоже "DeepSeek сгенерировал"? Или лично вы против длинных тире?
3. Заголовки. Это особенно явный и забавный момент, который появился после обновления DeepSeek. Стиль примерно следующий: "Глава 1: Наша супер мега тема". Может возникнуть вопрос, что в этом плохого? Плохо, что подобные оглавления имеет статья на 5 минут..
Тут вы зачем-то дублируете, по сути, первый пункт.
По итогу, "ваши" пункты:
заголовки
длинное тире
заголовки
ИМХО, лучше бы уж ваша статья полностью была ИИ сгенерирована.
Странные дела, почему-то только Вы не поняли смысл «скрытого текста».
ИМХО, лучше бы уж ваша статья полностью была ИИ сгенерирована.
Пусть так. На пассивную агрессию отвечать не намерен, Вы не умеете вести конструктивный диалог без попыток «зацепить».
Не вам говорить про "пассивную агрессию" - суть вашей статьи: "кругом *****, а я Д’Артаньян!"
У Вас все хорошо? Суть моей статьи: «много нейрошлака». Не весь контент Хабра, на отдельно взятые статьи, количество которых растет с каждым днем. Вчера в ленте новых новостей было 3 поста с очевидной генерацией (о чем даже обсуждалось тут, ниже), но зачем Вам это видеть, верно? Гнуть маты и агрессировать на автора - вот Ваш предел. Браво!
Гнуть маты
Вы это про мой ответ на
Излишняя вежливость и нейтральность
Ну так это и был "просто пример"
агрессировать на автора
Агрессировать начали вы, но ведь это другое
И в карму плюнули, вместо ответа на то, что приведённые ваши тезисы вами же не проанализированы.
ваши тезисы вами же не проанализированы
Я назвал типичные визуальные паттерны сгенерированных статей, где ниже их полностью разобрали, дублирую. Комментаторы согласились.
Агрессировать начали вы, но ведь это другое
Очень интересно, в каком месте? Я общаюсь с Вами уважительно, не переходя на личности. Не говорю ни слова о Вас, даже несмотря на употребление не самых приятных фраз в мою сторону.
Если бы написали нормальный и конструктивный комментарий (какие Вы и пишите под некоторыми статьями) - мы бы спокойно поговорили. Я был согласен с Вашим тезисом про «не самую понятную суть «скрытого текста», даже несмотря на то, что Вы - единственный, кто указал на этот факт. Но следовать конструктиву, когда Вы априори настроены негативно и предвзято из-за темы статьи, я не намерен.
Но вы же на них ссылаетесь как на паттерны ИИ!
“Do as I say, not as I do!” ©
Редакторы моего работодателя требуют длинные тире и ёлочки. Еле уломал на сохранение Ё вместо Е, и то.
Паттернов гораздо больше и у каждой LLM они свои. Пример взял из одной сгенереной статьи. Проверка показала 87% генерации, но автор в грудь себя бил - "не сгенерено!":
Отчасти соглашусь с "длинным тире". Но почему так?! Я готовлю материал/комментарий в Notepad++ и когда "копипащу" на Хабр, то из коротких получаю длинные;
Один из маркеров генерации - не знает правил русского языка: "вопросов — но никогда...", "...вопросов — которые задаю...", " способ: подсказать, что...".
Некоторые слова стоят не там, где должны быть, не так, как это пишет/произносит русскоговорящий, зато по правилам английского;
"...функцию
DoClean
так никто..." - изменение стиля, при этом стиль может больше нигде не менятся;Очень часто используются "...« »...", а не " " " и также часто встречается такая структура "... слово:, -другое"
и т.д. т.д. т.д
У меня очень простой критерий: если картинка к статье сгенерирована ИИ, я её не читаю
И минус в карму за то, что потратил моё время на чтение нейрослопа.
Привет от Масяни:
https://www.youtube.com/watch?v=l33x3td5gfg
Статью или картинку? Из вашего комментария это не очевидно.
/s
текст гладкий, как стекло. Никаких "шероховатостей" живого мышления: оговорок, уточнений, озарений. Это сухой монолит, "выточенный" под общий знаменатель. Грубо говоря - информационный фастфуд: насыщает, но так ли это полезно?
Уверен, что этот текст так же был пропущен через ИИ, потому что практически все эти формулировки я почти ежедневно вижу у ИИ, в моем случае это Qwen, которому я скидываю текст резюме или текст IT статьи на анализ.
В диалоге из 25 сообщений, Qwen:
5 раз использовал слово "гладкий",
5 раз использовал слово "шероховатости"
12 раз упомянул "живую" речь и мышление.
Но до общении с ИИ, я практически никогда не встречался с сочетанием слов "гладкий текст", "шероховатости" и "живое мышление".
Обычный запрос для анализа ИИ:
- проанализируй, создан ли этот текст посредством ИИ или текст создан грамотным человеком? Исключи парадокс детекции ИИ, нормализацию текста и перцептивную компенсацию для более точного анализа.
Использовать ИИ для анализа ИИ, интересный подход.
Я ни в коем случае не переубеждаю Вас, не пытаюсь изменить мнение. Но хочу сказать, что порой подобные «эпитеты» - что-то вроде стилистики, если Вы пробежитесь по предыдущим моим статьям, то можно увидеть много «аналогий» с подобными типовыми словами. Это не признак генерации (точнее не всегда он), а попытка разбавить сухой текст чем-то новым и необычным.
т.е. текст не пропущен через ИИ ?
Смотря что вы подразумеваете. Был для «оценки» со стороны LLM (обычно она указывает или помогает найти потенциальные «дыры смысла») и для названия (выше писал, что оно на 50% сгенерировано. А именно - «Тихий апокалипсис:»).
И, безусловно, для генерации «примера» задействовал…
Последняя фраза вашего комментария - типичная формулировка ИИ. Чем больше пользуетесь нейронками, тем сильнее перенимаете их язык, увы. Ваши прогоны ради проверки, наоборот, выхолащивают из текста все человеческое и подгоняют его под единый нейросетевой стандарт. Нейросеть в вашей голове учится на текстах, которые вы читаете через ответы ИИ. Цепная реакция запущена. Разорвать ее можно, только переборов вредную привычку обращаться за помощью. Иными словами, прошли этап обучения, пишите сносный текст - идите мимо ИИ. Учитесь, читая книги и советы редакторов, например
Обычный запрос для анализа ИИ:
ChatGPT, Claude и другие подобные сервисы не умеют определять, сгенерирован ли текст человеком или БЯМ.
«Важно отметить, что...»
«Стоит подчеркнуть следующий аспект...»
«Таким образом, мы можем наблюдать...»
Я всегда пишу вручную, это мое хобби, которое я не собираюсь перепоручать кому-то или чему-то. Еще я не автор копроблогов (хм... а поцчему бы и нет?) и не веду телеграм-канал, ссылку на который буду настойчиво вставлять везде и всегда. Одновременно и независимо я регулярно использую обороты речи сродни процитированным выше включая выделение жирным и прочие паттерны, а с недавнего времени начал получать обвинения в использовании этих ваших нейросетей даже за срач в каментах - подумать только, ответил кому-то на казалось бы простой вопрос, но только вопрос сложнее, чем кажется вопрошающему, от чего ответ ожидаемо получается общим и не конкретным - "один дурак такое спросит, что семь умных не ответят". А ведь специально старался написать так, чтобы не обидеть вопрошающего стандартным ответом о том, что в его случае бокланопоцит перешел в терминальную фазу, а значит врачи ФГМ в соответствие с протоколом лечения назначают живительную эвтаназию, и чтобы не исказить сильно в угоду упрощения, потому что это порождает новые заблуждения и мифы. Ничего, после этих обвинений я взял на вооружение новый литературно-редакционный прием:
списки из одного пункта. Выглядит, как по мне, очевидно карикатурно - что и требовалось, в пику недалеким обвинителям, что травят во мне писателя.
Да, я это к чему. Вопрос лишь в том, с какой целью писать. Я пишу для собственного удовольствия, а не для рекламы, собственного телеграм-канала. А еще я так как бы плачу другим авторам, которых читаю, пусть это немного не так работает, но тем не менее робкая попытка привнести вклад в сообщество однажды может оказаться вполне значимой, что тоже неплохая причина стараться. А еще для запаса "кармы", быстро расходуемого в срачах в каментах. А вы для чего?
Вы не поверите, пролистал 5 Ваших статей и не увидел ничего схожего с ИИ. Почему все воспринимают мои слова в статье в стиле: «о нет, длинные тире - признак, а вот я ими пользовался». Еще раз, очередной, я дублирую. Речь о совокупности в определенном порядке! Посмотрите на ответ ИИ в спойлере и увидите, что подразумевалось…
Вы не поверите
Не поверю. Не в том смысле, что вы как будто заблуждаетесь или как будто умышленно вводите в заблуждение - ни в коем случае нет! Просто не поверю.
Ой, простите, на самом деле это дружеский подкол, а юмор у меня как у нейросетей примерно.
Почему все воспринимают мои слова в статье в стиле: «о нет, длинные тире - признак, а вот я ими пользовался».
Неубедительно предположу, что длинные тире это то, с чем может столкнуться каждый пользователь MS Word или чего подобного - то есть примерно каждый уверенный пользователь ПК. А проведение опроса в интернете вполне может показать, что все опрошенные - пользуются интернетом. Ну вы понели. Тогда как на самом деле длинные тире - это, видимо, грамматически правильно, нейросети этому учили, вот они так и пишут, потому что на самом деле так писать правильно.
Еще раз, очередной, я дублирую. Речь о совокупности в определенном порядке!
О, спасибо, со второго раза намного понятнее.
/s
Если серьезно, то вы правы - как минимуи мне так кажется. Сложность лишь в том, что некоторые случаи не так уж очевидно однозначны, даже знаток засомневается, а обыватели и вовсе ничего не заметят. Я на этой шкале явно ближе к обывателям, если честно.
Посмотрите на ответ ИИ в спойлере и увидите, что подразумевалось…
Читая что-то такое где-то по-диагонали, мог бы и не обратить внимание. И это плохо и для меня лично, и глобально такие как я, получается, не слишком успешно отлавливают генерацию, а значит не слишком активно ей сопротивляются. Ну, где-то что-то там было написано, ну и ладно, пошел листать дальше, вдруг про антенны что-то интересное подвернется почитать или вообще по связной тематике - это я так, для примера привожу интересное лично мне, а каждый, экстраполируя, может подставить что-то свое.
100 раз обсуждали уже. На хабре нет ни одного живого редактора. Редактор не пропустил бы конкретно эту статью потому что никто кроме тупых роботов не пишет блок с заключением в конце.
Я говорил про контроль качества статей, выпускаемых под «Блогом компании», а не редакторов Хабр. Мне, в целом, хватает ума осознать, что я публикую статью одной кнопкой без редактуры.
Касательно блока «заключение», что же в нем не так? Мне надо писать аналоги «Итог» / «Вывод»? Или писать его не в конце, а в начале? В чем конкретно претензия, Вы донесите свою мысль грамотно, я отвечу.
Вы тут уже 5 месяцев, и пора бы уже заметить, что на Хабре нет премодерации, есть постмодерация. Любой желающий может опубликовать что душе угодно, и это немедленно появится в общей ленте. Потом придёт модератор и оценит нарушение правил, но вообще-то никто не мешает публиковать что угодно.
ОТНЮДЬ!
Типовая структура определенного вида статей (если не ошибаюсь, - маркетинговых):
Даём описание того, о чем будем говорить
Говорим то, что нужно
Резюмируем то, что сказали в п. 2
Делаем общий вывод/заключение.
Весьма недурно работает также и в обучении, узкой областью которого является сам маркетинг/реклама.
Наличие/отсутствие блока с выводом/заключением - не является однозначным признаком "тупого робота".
Иногда шаблон - это просто шаблон ®Зигмунд Фройнд :))
Типовое нытьё о несправедливости мира. На Хабре такие появляются ежерегулярно.
Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ
Вы сейчас упадёте: в абсолютно любой переписке лично я использую не только длинные тире, „красивые“ «кавычки» и прочие заметные типографские знаки, но и также в нужных местах ставлю неразрывные пробелы — чего без анализа кодов символов вы просто не заметите.
Если вы собираетесь что-то писать, поставьте себе «Типографскую раскладку» Ильи Бирмана и не позорьтесь. Единственное, над чем мне приходится возиться — так это акуты, поэтому этот символ я каждый раз копирую из «Википедии».
Все остальные перечисленные вами признаки сгенерированного текста присущи вашему собственному. Любовь к выделению полужирным, нумерованным и маркированным спискам, избыток подзаголовков — это всё у вас в тексте тоже.
Вы жалуетесь на то, что статьи на Хабре якобы пишутся с помощью больших языковых моделей. При этом ваша собственная жалоба на четверть состоит из текста, сгенерированного БЯМ.
Это какая-то извращённая ирония или что? Ваш текст выглядит именно так, как ругаемые вами публикации.
И это лишь малая часть признаков, по которым определяются подобные статьи.
Я регулярно общаюсь с платной версией ChatGPT, включая запросы в Pro-вариант и длинные отчёты из функции Deep Research. Общаюсь с другими БЯМ: Claude, Gemini, DeepSeek. Ни один из перечисленных вами или нейросетью признаков надёжным маркером не является.
Если показать языковой модели материал, который нужно пересказать, и пример текста, который нужно продолжить, то она может выдать текст без каких-либо маркированных и нумерованных списков. Сделает она это с учётом всех особенностей идиолекта примера.
Вот так может выглядеть текст от языковой модели. Для его написания она опиралась на 9 различных источников.

Понятно, что для публикации куда-либо такой ответ не годится. Текст иногда откровенно ужасен, иногда меня попросту не удовлетворяет своим качеством. БЯМ не может думать, поэтому она теряет те факты, которые нужно обязательно указать. К примеру, языковая модель не расписала, почему так важны судоходные коридоры (вершины этих графов не привязаны к населённым пунктам, они где-то посреди океанов).
Однако где здесь нумерованные и маркированные списки? Где шаблонность? Подзаголовки есть, но они легко удаляются. Вводных фраз и клише тут вообще нет. Более того, я попросил подсказать мне графики, какие нужно заскриншотить, что решает проблему с иллюстрациями. Этот текст при минимальной доработке мог бы выглядеть полностью человеческим.
Выделение полужирным — это вообще не довод. Ненужное выделение полужирным убирается копированием и вставкой.
Я замечаю только два раздражающих маркера, которые вот так просто не удалить и в глаза они не бросаются: любовь к заключению выражений в переносном смысле в кавычки, а также синтез новых слов и выражений. В примере выше это «картограф-письменник» и «косит» в значении «испытывает сдвиг по координатам». Работают эти признаки только в русском языке.
А вывод тут такой, что платную версию ChatGPT вам не опознать. В лучшем случае ваши признаки работают для бесплатных тарифов. То, что вам доизобрела какая-то БЯМ — это вообще полёт фантазии.
Кстати, зачем вы написанный языковой моделью ответ заключили в спойлер? Если фрагмент текста хочется спрятать, то его нужно из статьи убрать.
Меня, как автора, убивает простая математика: статья на 5 минут, написанная языковой моделью за 2 минуты, собирает в два раза больше плюсов, чем блок моих статей про rsync, на который я потратил шесть вечеров.
С чего вы вообще взяли, что значения кармы и рейтинга показывают в этой жизни хоть что-нибудь? Ценность невозможно отразить в числовом значении рейтинга. Ценность любого материала для разных людей разная. Именно поэтому поверхностно охватывающие много общих тем публикации всегда будут популярнее, чем глубокое копание в одной узкой нише.
Вам же не приходит в голову говорить, что бедные люди хуже (или лучше) богатых? Почему тогда вы так, пардон, дрочите на рейтинг? Эти числа ничего не отражают. В два раза больше? Ну набрала и набрала.
Так на Хабре было абсолютно всегда, в том числе до ИИ: чем легче тема, тем она популярней. ИИ тут вообще ни при чём. До этого были жалобы, что авторы неглубоких тем или вообще шутеечек собирают рейтинга куда больше, чем любители сидеть у себя в уголке и тихо копать вглубь контент для профессионального роста. Вы не первый и не последний.
Как и у всех ваших предшественников, у вас здесь сразу заложено следующее допущение: статья, которую вы писали шесть вечеров, заведомо лучше. Трудовая теория стоимости работает не всегда, поэтому допущение ошибочно.
«Писать шесть вечеров» — это может быть шесть вечеров выяснения функций, проверки и чтения документации. В большую языковую модель все эти знания заложены и так. В её весах уже лежат все страницы документации и тысячи обсуждений на форумах. Это как жаловаться, что калькулятор считает быстрее.
И вообще, какие-то голоса за несколько дней — не показатель. Результат вашей работы может набирать заслуженные просмотры месяцами и годами.
Если вас так парит, что кто-то набирает больше рейтинга, пересмотрите, что не так с вашими текстами, а не бросайтесь обвинять мир в несправедливости. Пишите в обнимку с нейросетью, необязательно всё выполнять полностью вручную. Возьмите нейросетевой текст и посмотрите, что упоминает языковая модель, сравните с собственным и так далее.
Как читателю, мне неприятно поглощать этот гладкий и безвкусный фастфуд — спросить у LLM я могу и сам.
Это вас огорчает, а должно радовать.
Если вам не нравится шлак от ИИ — вы не один такой в мире. Ваш текст нравится вам самому — понравится хоть кому-то ещё. То есть поклонники у ваших статей найдутся всегда. О чём эти переживания?
Я не могу ссылаться на примеры, это абсолютно неэтично и должно наказываться со стороны администрации Хабр.
А делать голословные обвинения в адрес неопределённого круга людей — это этично?
Вы называете некий аморфный массив публикаций сгененированным ИИ, но отказываетесь демонстрировать любые примеры. Допускаете ли вы факт, что можете заблуждаться? Повторяю ещё раз: ваша собственная статья-жалоба соответствует вашим же критериям текста от ИИ. Более того, она уже состоит на четверть из ответа языковой модели.
ИИ в нынешнем состоянии — это не искусственный интеллект.
«Искусственный интеллект — это не искусственный интеллект». Ну вот как вы пишете вообще? Лучше так: «В его нынешнем виде ИИ интеллектом назвать получается с натяжкой».
Если бы в мои задачи входило оболгать чей-то текст, то подобное было бы легко обозвать галлюцинацией. Вам не кажется, что абсолютно любые речевые изъяны легко подогнать под критерии «да это ChatGPT писал»? Вы не думаете, что в прошлом кого-то мысленно обвинили вот так же незаслуженно?
В моей группе в Телеграмм разбираем практические кейсы
Ну хорошо, у нового поколения жалобщиков всё же есть отличие: теперь в конце ставят рекламную ссылку на канал в «Телеграме».
«Телеграм» пишется с одной «м». Даже если вы настолько жаждете добавить вторую, в русском языке слова склоняются: в «Телеграмме».
Дня меня стало проблемой, когда все начали говорить что длинное тире — признак ИИ-текста, ведь я много лет его использовал
Дело не в AI, а самих читателях и писателях...
Помните в фильме Сталкер Тарковского монолог Писателя (в тоннеле, где он камень в трубу бросает)? Вот он:
Монолог Писателя:
"Вот еще эксперимент... Эксперименты, факты, истина в последней инстанции... Фактов вообще не бывает, а здесь и подавно. Здесь все кем-то выдумано, это чья-то идиотская выдумка, неужели вы не чувствуете. Вам, конечно, до зарезу нужно знать чья... а почему? Что толку от ваших знаний, чья совесть от них заболит, моя? У меня нет совести, у меня есть только нервы. Обругает какая-нибудь сволочь — рана; другая сволочь похвалит — еще рана. Душу выложишь, сердце свое выложишь — сожрут и душу и сердце; мерзость вынешь из души — жрут мерзость... Какой из меня к черту писатель, если я ненавижу писать, если для меня это мука, болезненное, постыдное занятие, что-то вроде выдавливания геморроя. Ведь я раньше думал, что от моих книг кто-то становится лучше, — да не нужен я никому... Ведь я думал переделать их, а переделали-то меня, по своему образу и подобию. Раньше будущее было только продолжением настоящего, а все перемены маячили где-то там за горизонтами, а теперь будущее слилось с настоящим. Разве они готовы к этому? Они ничего не желают знать, они только жрут!
В общем, исчерпывающе всё сказано. Ни убавить, ни прибавить.
И действительно, вы можете изначально иметь прекрасные намерения сделать людей лучше, но... со временем замечаете, что... сделанная вами глубокая работа мало востребована публикой, а случайно выданное вами дерьмо набрало миллион просмотров, и на вас пролился денежный дождь... У вас появляется желание повторить (денежный дождь), вы анализируете, что именно нравится публике и начинаете ей давать то, что хочет она, а не вы. В конце концов, вы превращаетесь в генератор хорошо монетизируемого дерьма...
Ну всё, приплыли. И полужирный, и длинное тире, и витиеватып обороты. Нейросеть этот ваш Тарковский, инфа 100
Ну как, в самом деле, я, Феликс Александрович Сорокин, создатель незабвенного романа "Товарищи офицеры", как я мог представить себе, что проклятая машина на Банной может выбросить на свои экраны не семизначное признание моих, Сорокина, заслуг перед мировой культурой и не гордую одинокую троечку, свидетельствующую о том, что мировая культура еще не созрела, чтобы принять в свое лоно содержимое Синей Папки, а может выбросить машина на свои экраны крепенькие и кругленькие 90 тыс., означающие, что Синюю Папочку благополучно приняли, благополучно вставили в план и выскочила она из печатных машин, чтобы осесть на полках районных библиотек рядом с прочей макулатурой, не оставив по себе ни следов, ни памяти, похороненная не в почетном саркофаге письменного стола, а в покоробленных обложках из уцененного картона.
Проблема существует и администрация Хабра о ней знает и понимает, только не так то просто ее решить. Сейчас публикация ИИ контента на прямую не запрещена, но есть положения о запрете кросс постов и копипастов, куда в принципе можно затолкать и ллм.
Другой вопрос - как отличить ИИ от человека. Зачастую бывает так, что человеческая статья выглядит как творчество ИИ, а творение ИИ - как статья человека. Могу привести пример. Не так давно я жаловался тех поддержке на две откровенно иишные статьи. И что же? В первой поцент зимствования - 0, во второй - незначительный. С таким же вопросом я сходил к @Boomburum. Он ответил мне совсем по другому:
Первая статья выглядит сгенеренной — скрыл и вставил пистон автору ) Со второй сложнее — один из сервисов выдал «Текст, скорее всего, написан человеком совместно с генеративной моделью ИИ.», не можем такое скрыть.
Все эти критерии про дефисы, жирный текст, списки и заголовки нельзя считать полным доказательством сгенеренности, такие тексты здесь встречались и раньше. Это мы тоже обсуждали с @Boomburum. Они работают над тем, как отличать одно от другого, но пока это не так то просто.
А то мы тут размышляем и пока чуда не случилось. Ну только чур не «если в статье много списков, значит это ии». Или «как-то корявенько читается, похоже на ии» — плохие тексты мы видели ещё 19 лет назад )
" есть положения о запрете кросс постов и копипастов" - по-моему, давно разрешили. Публикуются одновременно на пикабу, vk, vc, дзене. Или даже не одновременно, а сначала на пикабу / дзене, потом тащат сюда.
Вряд ли в будущем будут статьи, которые пишет человек…
Потому что исходить нужно не из авторства, а из содержания статьи.
Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное »—» банально проще и быстрее.
Спорное утверждение. Всю жизнь использую длинные тире «—». Особенно странно видеть такое утверждение от автора, во всю использующего кавычки - ёлочки. Ведь обычные ["] использовать «банально проще и быстрее».
Спасибо за комментарий! В оригинале елочек не было, модераторы редактировали. Включая длинные тире)
По поводу длинных тире, опять же. Я говорю про совокупность паттернов, пожалуйста, не надо акцентировать внимание на чем-то одном. Посмотрите спойлер и посмотрите на типовую генерацию ИИ - вот то, о чем я писал.
Я с вами согласен частично. На мой вкус, сейчас появилась другая тенденция. Наблюдаю, что зачастую читатели агрятся на тексты людей, которые пишут:
1. Вежливо
2. Стилистически красиво
3. Соблюдая правила типографики (ёлочки, тире)
4. Не чураются использовать вводные фразы.
Ну вот прямо хоть сейчас бросай писать вежливо, грамотно, складно и начинай писать коряво, с агрессией и ошибками. А то примут за БЯМ.
Собственно, люди тоже БЯМ. И многим присущи одни и те же паттерны речи. Инфа 100%, наблюдал за дементной мамой, которая очень длительное время была способна произносить вполне адекватные фразы, создающие иллюзию, что с речью всё ок.
Просто нужно на Хабре использовать йазык падонкофф - сразу будет понятно, что ты - человек! ;-)
Напиши комментарий о возможности распознавания человеческого авторства (а не сгенерированного ИИ) комментария «языком падонкафф»
Канэшна, ацтазри сгенерить фразу в стиле падонкафф, но распознать — чья рука (или лапа) приложилась — можна! Алгоритмы тупо копируют орфографические ошибки, а у падонкафф — целая культура с креативным п@здецом в грамматике, уместными «аффтар жжот» и историческими отсылками к Удафф-кома. ИИ не шмогёт в эту душу, ему не понять нашой искренней ржаки над «кросавчегами» и «превед-медведом». Так што, ежели коммент полон аццкого сотона и аффтарской ненависти — это 100% ручками писаный артефакт, а не бездушная нейросеть! Пеши исчо!
От этого мы никуда не денемся и придётся принять факт использования ИИ в статьях, как должное, но одно дело, когда авторы статей прилагают при написании статей хотя бы малейшие усилия, а другое дело, когда вся статья - результат генерации при помощи нейронок, вот в этом я вижу большую проблему
а другое дело, когда вся статья - результат генерации при помощи нейронок, вот в этом я вижу большую проблему
Не вижу проблем. Статья либо полезна либо нет. Если статья от БЯМ оказалась полезной, в чём проблема? Другое дело, что скорее всего в статье от БЯМ не будет ничего нового, т.к. анализировать нейронки уже «научились», а вот синтезировать — нет.
А чтобы быстрее понять, полезна статья или нет, достаточно натравить одну БЯМ на другую БЯМ. Кнопка «пересказать» очень помогает в этом.
Скрытый текст

ИИ как инструмент норм. Но когда текст полностью без человека - ценность теряется, абсолютно
Надо в меню Укажите причину минуса добавить пункт LLM копи-паста
2. Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное »—» банально проще и быстрее.
Если применяешь типограф, здесь на сайте Хабра (волшебная палочка в менюшке текста), то тире тоже становится длинным.
А годами (десятилетиями) перепечатываемый бред вас не смущает?
Дешевый и быстрый в производстве ИИ-контент начинает вытеснять глубокие и качественные статьи живых авторов, так как зачастую набирает больше просмотров и одобрений.
Это приводит к деградации платформы, которая превращается из источника уникальных знаний в агрегатор информационного шума, что отпугивает искушенных читателей и авторов.
Ситуацию усугубляет отсутствие контроля со стороны редакций и самих читателей, которые не всегда минусуют такой контент.
Скоро и комментарии ИИ будет писать. Тот же бот Яндекса уже давно строчит комменты на хабре при упоминании слова "Яндекс" в статье или комментах других пользователей.
А уже писали про то, что люди могут использовать длинное тире, и это не является признаком ИИ, или я первый буду?
2. Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное "-" банально проще и быстрее.
вот это скорее неправда. многие используют инструменты для превращения в худ.текст (например). Там и тире длиннее и ёлочки вместо кавычек.
Фактически, он вычисляет, какое слово с наибольшей вероятностью должно стоять после предыдущего, основываясь на громаднейшей куче текстов, созданных людьми.
не сказать. что человек делает что-то принципиально иное. Размышления только идут иным оразом, да и вцелом эффективность в этом плане выше.
Фактически, он вычисляет, какое слово с наибольшей вероятностью должно стоять после предыдущего, основываясь на громаднейшей куче текстов, созданных людьми.
на то они и корпоративные. орги платят хабру, те позволяют постить слоп и кривые статьи и игнорирование собственных правил платформы - некоторые корпы не оформляют статьи как перевод, например, потому что могут. Помимо немногочисленной рекламы это один из способов хабра получать финансирование в принципе. То есть некоторое неизбежное зло, если хочется продолжения функционирования хабра.
Но неужели в подобных блогах нет никакого контроля качества?
там как обычно - чукча не читатель, чукча писатель. Для многих вещей у корпоративных писателей просто нет компетенций. И видимо KPI жмёт, поэтому вычитывать статьи на предмет тех же опечаток или поехавшей вёрстки тоже не пытаются - а шо, комунити потом накидает репортов, недели через три может быть поправят.
Ситуация, честно говоря, напоминает апокалипсис.
кажется у Шекли был рассказ, что в момент, когда машину времени изобрели в тот же момент стали появляться люди, которые интересовались собственно моментом изобретения той машины. И все они рассказывали о моменте, когда информационные системы стали настолько большими, что был придуман поиск по поиску, потому что поиск по обычным данным стал невыполнимой задачей и множество знаний были утеряны таким образом.
В реальности похоже мы столкнёмся с тем, что к подобному приведёт ИИ - искать информаию в интернете в основных поисковиках становится задачей подчас невыполнимой, т.к. выдачи генерятся какими-то кривыми мозгами без ранжирования, как это было раньше. Количество 404 в выдаче огромно и Wayback Machine уже не осиливает сохранять всё это. Так что ждём претворения теории мёртвого интернета в жизнь.
В моей группе в Телеграмм
а вот щас забавно было
не сказать. что человек делает что-то принципиально иное. Размышления только идут иным оразом, да и вцелом эффективность в этом плане выше.
Только психопат будет подбирать так слова. То есть не более 2% мирового населения.
Живые люди строят внутри головы картину мира и потом уже выражают ее через слова
У машин же картины мира нет , хотя сторонники Технологической сингулярности считают что ЛММ при достаточной мощности и качественной базе данных сможет перейти из одного состояния в другое
Но это не так.
погодите, щас доберёмся до биологических процессоров с громадным повышением энергоэффективности обучения, вот тогда и посмотрим что из этого выйдет. Механически, мозг делает похожие вещи - пытается предсказать некоторое следующее действие. Только у него параллелизма и систем больше, которых нет в LLM.
погодите, щас доберёмся до биологических процессоров с громадным повышением энергоэффективности обучения, вот тогда и посмотрим что из этого выйдет
«Скажи, о Великий, — спросил Хирона кентавр по имени Фол, — не станет он нашим врагом лукавым, коль так он умен и множество может родить подобных себе? Не выгонят ли кентавров потомки его с наших земель, столь богатых дарами, на скудные горы, где есть только мох, лишайник и камни?» ©
В реальности похоже мы столкнёмся с тем, что к подобному приведёт ИИ - искать информаию в интернете в основных поисковиках становится задачей подчас невыполнимой,
Просто добавляй к запросу "Before 2022" И все будет спокойно искаться пока гугл не убрал верификацию по дате появления в сети
дык, а как оно вас спасет если в последние несколько лет случилось? или вы хотите поиск по собственной истории сделать? Большинство провайдеров перестало эти данные дольше года хранить. Тут на днях была статья, как китайнет страдает от чисток из-за глобальной цензуры. В пока ещё большом интернете происходит аналогичная история, только уже со стороны корпораций. Что-то сохраняется, что-то оседает в недрах какого-нибудь IPFS, что-то остаётся в каком-нибудь arctic vault, только доступа у большинства туда всё равно нет, так что оно почти что исчезло.
2. Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное "-" банально проще и быстрее.
Вы же сами длинно тире в тексте используете. Если подвергать текст минимальной редактуре - это первое на что внимание обращаешь.
Тоже самое с музыкой, господа.
не думаю, что такие статьи собирают кучу плюсов, хотя бы потому что все видят эти паттерны и минусуют) А на счет длинных тире не согласна - я именно текстовые какие-то работы пишу в ворде, гораздо приятнее тире вместо дефисов видеть + ворд автоматически подставляет тире вместо дефиса в тексте. Но да, есть еще супер длинные тире, вот их я даже хз как ставить, а нейронка проставляет
Я больше смотрю на смысл, а не на автора. Если у меня руки и дойдут до публикации, то наверняка мои мысли будет формулировать ИИ. Просто времени нет на формулировки. Идти против ИИ - это как ссать против ветра.
Например, на этой неделе была статья автора, который описывал как он с помощью ИИ делал переводы. Какие он скрипты написал и куда выложил. Да, статью он руками писал, но вот результат своих переводов не показал. Я по опыту могу сказать, что скрипты его наверное работают, только результат самого перевода никакой. У меня же есть теоретическая часть от ИИ, как правильно делать переводы с помощью ИИ. На это ушло 5 уточняющих промптов от меня, как имеющего определенную теоретическую основу в этом направлении. Эти уточнения у меня делались примерно неделю с тестированиями и оценкой результатов. Очевидно, что если я и буду публиковать, то обработку ИИ моей беседы, чтобы уложиться с подготовкой статьи в пару часов. Публикации такой ИИ статьи смысл имеет? Либо я вообще ее не опубликую.
А так как тексты у меня были немного "стремные", то чтобы модель соглашалась такое переводить, мне надо было ее взломать. В чем мне помогали квен на пару с гроком. При этом, насколько я в курсе, при прямом запросе о помощи во взломе, они сразу пошлют спрашивающего. Опять же у меня сохранены беседы, но компилировать, выбирать ключевые мысли, я точно руками не буду. Там текста получилось для результата сотни килобайт. И тут опять точно или текст будет от ИИ (естественно я прочитаю и соглашусь, что написано, прежде чем подпишусь автором) либо его не будет вовсе.
Или у меня уже определился алгоритм установки моделей. В процессе всегда участвует ИИ. Очень подозреваю, что более 90% тех, кто ставил меньше 3 моделей самостоятельно, найдут много полезной информации в моем методе. Но опять же написание руками слишком трудоемко.
Да, я согласен, что статья ради статьи не имеет смысла. ИИ не приносит ничего своего. Но... ИИ - это отличный инструмент в помощь. Даже с учетом того, что с писаниной у меня все хорошо (когда то я этим зарабатывал), но сейчас я эту часть с удовольствием перекладываю на ИИ, так как он это делает намного быстрее, практически без потери качества, которое я уже могу догнать при вычитке.
Ага, а читающий будет использовать ИИ чтобы испарить всю налитую ИИ воду.
Нет уж, напишите лучше короткую тезисную статью без воды
Просто дайте мне изначальный ПРОМПТ
будет понятно что хотя бы сказать хотел
Ага, а читающий будет использовать ИИ чтобы испарить всю налитую ИИ воду.
Всё уже украдено до Вас

честные ластик в Photoshop 7 и Comic Sans MS.
Это вот очень важный вопрос.
Я хочу передать вам короткую фразу. Вы заинтересованы получить от меня короткий тезис.
Однако приличные люди никогда не пишут короткую фразу, и если вы получите от меня короткую фразу — это будет означать, что я не уважаю вас, а наоборот, отношусь к вам с презрением, да и сам я вовсе не приличный человек.
Поэтому возникает необходимость писать длинными и вежливыми письмами.
Ага, а читающий будет использовать ИИ чтобы испарить всю налитую ИИ воду.
Нет уж, напишите лучше короткую тезисную статью без воды
Я сомневаюсь, что ИИ что-то отожмет без потери смысла. Точнее я сам с помощью ИИ отожму ее так, что в некоторых местах смысл будет утерян, и на этом я остановлю отжим. Там неделя нормальной работы. Да, первоисточники лопатил ИИ. Но в реальности там работа серьезнее полноценного студенческого диплома тридцатилетней давности. У меня бы даже идеи не возникло ввязаться в такую работу без ИИ.
И в том, что я кратко описал проблема не в раздувании материала, а в том, чтобы сократить его так, чтобы оно оставалось доступным для понимания, но в то же время разумного объема.
По сути Хабр сам подталкивает к этому. Если бы редактура минусовала такие тексты на корню - их бы не было
Автор скинул мне в личку примеры. Теперь хотя бы понятно, о чем речь, и можно обсудить предметно.
Так как автор не хочет выкладывать, выложу сам под спойлером. Я знаю, что это некрасиво, причину я писал выше. Минусы в карму ставьте мне, а не автору.
Если вы автор одной из этих статей, вы сами прекрасно знаете, использовали вы нейросеть или нет.
Если использовали и не скрыли признаки, значит можно сделать вывод, что вам было не слишком важно, узнает об этом кто-то или нет.
Hidden text
(1)
https://habr.com/ru/users/Cyber_Griffin/posts/ — примерно любой пост автора
(специально взял «из нового», чтобы избежать критики в стиле «ну было и было»).
(2)
https://habr.com/ru/companies/timeweb/articles/943298/
"7 SQL-запросов, которые решают 90% всех задач на работе"
Смысловая нагрузка в стиле ИИ
(что интересно, автор отредактировал статью после моего комментария, изначально она выглядела, как посты из первого примера)
(3)
https://habr.com/ru/articles/944736/
"Терминал — ваш лучший друг: 5 утилит командной строки, которые заменят вам GUI"
Типичные паттерны ИИ, приведенные в статье, "Жирный текст: После двоеточия с большой буквы", типичные фразы в стиле "решают вашу боль, мощный терминал", названия и генерация в стиле "ТОП 5" тоже очень характера для LLM.
К слову, у последнего автора практически все статьи сгенерированы нейросетью.
Для сравнения, можете изучить первую статью и увидеть колоссальную разницу в написании.
(1)
У указанного автора 3 поста, у всех 0 рейтинга, 0 комментариев.
Видимо никому и так неинтересно.
Посты с оформлением в стиле генерации нейросетью, это факт. Но все проходят мимо, похоже многие их даже не видели.
Я показ постов в ленте вообще отключил.
(2)
+77, 30 комментариев
Многим статья понравилась, информация оказалась для них полезной.
То есть вопрос только в оформлении.
Тем более это корпоративный блог, там и без нейросетей обычно просто ищут тему, которую люди захотели бы обсудить в комментариях.
(3)
+138, 150 комментариев
Никто не обсуждает оформление, видимо никто не обратил на это внимание.
Я бы наверно тоже не заметил. Я эту статью видел в ленте, но не открывал, не интересуюсь статьями с названиями "N чего-то", тем более на темы, которые мне знакомы. Обычно там перечисляются банальные вещи.
Названия вида "ТОП-N" существовали задолго до LLM, просто на Хабре их было мало.
Жирный шрифт с двоеточием немного раздражает, так как придает избыточный акцент, без этого была бы обычная справочная статья. У других статей этого автора тоже хороший рейтинг и есть обсуждения, видимо людям нравится, есть повод поговорить.
Но по названию я бы и их не стал читать.
Статей на Хабре слишком много, даже с подпиской на хабы, я и статьи от обычных авторов много пропускаю. А картинки в ленте я отключил через TamperMonkey, так что не знаю, сколько там сгенерированных.
Поэтому я эту проблему и не заметил.
Итого, на мой взгляд приведенные примеры нельзя описать как "Тихий апокалипсис: я устал читать сгенерированные статьи". В многих случаях можно просто не читать статью, по названию понятно, что ничего нового там нет, и поэтому скорее всего использовалась нейросеть. В остальных проблема сводится не к содержанию, а к оформлению, на которое многие не обращают внимание. Если скорректировать установки нейросети по оформлению и художественным оборотам, во многих случаях отличие будет незаметно. Создание таких статей я не поддерживаю, но и преувеличивать проблему не стоит.
В третьем случае я статью пролистал до взлета, рука дрожала над минусом, но в итоге не влепил. Мне а) не было времени разбираться, сгенерированная статья или нет б) статья действительно слабая, но стоит ли минуса? В рамках баланса, задним числом, не хотелось бы видеть у таких "произведений" выше 25.
"решение боли" - это, кстати, шаблон не нейросетей, а копирайтеров и маркетологов. У автора немного узкий кругозор

И кто же в этом виноват что теория мертвого интернета - стала повсеместной практикой?
Я бы минусовал AI высеры, да у меня на хабре кармы для этого не хватает :).
блок моих статей про
rsync
, на который я потратил шесть вечеров
Тут весь вопрос - зачем Вы это делаете? Ради чего тратить 6 вечеров? Чтобы в итоге утонуть в сгенерированном мусоре...
Хотите нести в умы разумное, доброе, вечное и уверены, что пишите круче (пока...) чем ИИ? Заведите свой личный блог, включите там RSS, люди будут подписываться именно на Вас и читать не ИИ, а Вас, зная, что вы не ИИ. Пытаться выгрести авторскими статьями на таких площадках как Хабр, Пикабу и прочих - уже бесполезно.
Я тоже стал использовать ИИ в работе, если раньше я тратил несколько дней на написание текста, перечитывание, исправление ошибок. То теперь просто с помощью гугл клавиатуры надиктовываю поток слов, и прошу ИИ превратить мой поток сознания в осмысленный текст. иногда конечно получается полнейшая дичь с другим смыслом, но перечитывая входной поток, нахожу почему ИИ сбился с мысли, исправляю и на вторую попытку. и так несколько итераций. Все получается очень грамотно и понятно.
НО!
есть такой сервис Giga check
так вот в нем мои старые тексты он пишет что написал человек, а новые ИИ.
хотя глядя на них не пойму в чем разница? пока на это никто не обращает внимания, но боюсь скоро будут.
Я натренировал руку на мгновенное alt+0151, чтоб потом заявляли, что мясные мешки не ставят длинные тире?
Было бы славно видеть шильдик "материал подготовлен с использованием ИИ" или подобный и иметь возможность фильтровать материал по нему, т.к. читать это зачем? Как было сказано выше, спросить llm я могу и сам.
Полное копирование без малейших правок
Бывает, даже неверные родовые окончания (падежи) не исправляют. Поскольку не читают сгенерированное. Вот это понимаю как неуважение к возможному читателю.
Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное "-" банально проще и быстрее.
Отнюдь. И комментарии тут не излишни, ибо судя по ним, я далеко не единственный, кто понимает отличие дефиса от тире. (Было.). Добавлю, что даже корректор грамматики в браузере предлагает замену на тире. А насчёт «банально проще и быстрее» — так использование БЯМ, вероятно, также «банально проще и быстрее», нежели самому редактировать, вспоминать элементарные правила орфографии \ пунктуации (если автор их вообще когда-нибудь учил).
искренне не понимаю, так это лояльность читателей, которые не минусуют подобный контент
Гипотетически предположу, что не у всех имеется возможность минусовать.
статья на 5 минут, написанная языковой моделью за 2 минуты, собирает в два раза больше плюсов, чем блок моих статей про rsync, на который я потратил шесть вечеров.
Читал. Плюсанул. Добавил в закладки. I.M.H.O.: качественные \ полезные публикации на не "хайповые" темы много не комментируются, поскольку не к чему придраться и вызывают не такие сильные эмоции (как про «успешный успех», к примеру). И кстати, в чём цель публикаций? Если исключительно ради плюсов \ комментариев (а не ради того, чтобы кто-то мог чему-нибудь научиться, узнать решение), то пишите про «успешный успех» и т.п. Вот пример. 179 плюсов, 273 комментария (на 2025-10-04 06:31:56 по МСК). А польза?
P.S. Начал намедни стряпать заметку (для Хабра). В LibreOffice. Разумеется, с тире, «сложными» кавычками, списки нумерованные также люблю. Уже не уверен, что стоит выкладывать. Раз всё это «в совокупности» признаки генерации БЯМ.
P.P.S. В этом комментарии использованы (нарочито) длинные тире и «сложные» кавычки. Впрочем, как и во многих других комментариях. В совокупности получается, что они написаны БЯМ. # sarcasm ? Возмможно. Или нет. Не мог не съязвить. За использование БЯМ смело ставьте минус.
Маленькая поправка: текст нейросети обычно НЕ грамотный. Грамотность и экспертность пользователей, генерирующих статьи, как правило, ниже плинтуса, поэтому они не видят, что их текст очень плох.
Плюс автор статьи напарывается на те же ошибки, что сам указывает (использование длинного тире), использует шаблонный лексикон и повторяет одну мысль несколько раз.
Да, количество пустых статей с появлением ИИ превысило критическую массу. Нет, с этим никто не пытается бороться. Даже те, кто призывает это делать, ибо они, цитирую, "сами используют ИИ как инструмент". А этот ваш инструмент отучает думать. И получается замкнутый круг: видим проблему - не готовы её решать - продолжаем юзать нейросети - усугубляем проблему
Тихий апокалипсис: я устал читать сгенерированные статьи