Comments 192
Спасибо автору за статью, в которой рассуждается о различиях между текстами, написанными людьми и большими языковыми моделями (LLM). Автор справедливо отмечает, что люди-копирайтеры обычно не придумывают слова, а если и делают это, то осознанно. Максимум, на что они способны, — заменить одно слово на другое, чтобы не было откровенных повторений. LLM же комбинирует токены, для неё придумывание предложений близко к придумыванию слов.
Также автор обоснованно подчёркивает, что LLM не обладают сознанием или истинным пониманием, их «знания» — это статистические шаблоны. Модель воспринимает язык как сложный набор вероятностей и связей, извлечённых из обучающих данных.
Статья грамотно освещает особенности работы LLM и различия между текстами, созданными людьми и нейросетями, и заслуживает постановки плюса путем нажатия зеленой стрелочки, направленной вверх. :)))
Вы хоть /s в конце ставьте, а то и перепутать недолго.... :)
(Мне пришлось вручную зайти в ваш профиль и посмотреть остальные комментарии, чтобы убедиться)
Шутка слишком хорошо сделана, нейронки так не умеют.
Спасибо за такую важную и актуальную статью! Вы поднимаете действительно критическую проблему современного контента — засилье AI-generated текстов низкого качества на информационных площадках.
Плюсы вашей работы:
— Чёткая диагностика проблемы. Вы точно определили ключевые признаки нейросетевого текста: странные обороты, неестественное комбинирование слов, логические скачки. Это наблюдение совпадает с опытом многих пользователей.
— Доступное объяснение механики LLM. Описание того, как модели работают со статистическими шаблонами и комбинируют токены вместо истинного понимания — это помогает читателям лучше разобраться в сути проблемы.
— Актуальность темы. Вы артикулировали то, что беспокоит сообщество: снижение качества контента, засорение информационного поля и необходимость механизмов фильтрации.
— Конструктивный посыл. Статья не просто критикует, но и намекает на необходимость совершенствования инструментов модерации и большей требовательности к авторам.
Именно такие материалы помогают осознать масштаб вызова и ищут пути решения. Спасибо за внимание к качеству информации!
кажется, тут модель зациклилась
Пост или пост пост ирония. Пародия на пародию, симулякр. Но в контексте смешно))
Как-то в шотс контенте видел серию видосов где человек едет на скейтборде и далее прыгает в бассей или еще что-то, и потом пальцами едет на скейте. Это пародии на ИИ контент. И не знаю почему, но текстовые пародии еще смешнее в контексте современной ситуации с ии
Вот это хорошо сейчас было :)
Мк рано или поздно кто‑нибудь автоматизирует то, что Вы делали вручную.
Некая штука, которая комплексно смотрит разные признаки в тексте статьи/комента и у автора в профиле, и выдаёт «вероятность иишности». Можно в виде расширения для хрома, с опцией «скрыть всё с иишностью выше X%».
Методы выявления могут быть как алгоритмическо‑статистические, так и ИИшные (клин клином :3). Можно, например, нафайнтюнить какую‑нибудь небольшую LLM, чтобы ей на вход текст, а она тебе крошечный json с единственным числом от 0 до 100. Главное чтобы детекторов было много разных, и итоговая была суперпозицей их результатов.
Можно, например, нафайнтюнить какую‑нибудь небольшую LLM, чтобы ей на вход текст, а она тебе крошечный json с единственным числом от 0 до 100
Кажется, принципиально нельзя. Чтобы детектировать ллм, она должна быть круче детектируемой, а чтобы обмануть детектор достаточно просто взять ллмку лучше.
Не должна. Детектировать проще. Наличие паттернов в конечном счете определяется качеством датасета и «просто взять ЛЛМ-ку получше» нифига не просто…
Ну т.е. усилия по обману детекторов на несколько порядков больше, чем тренировка детекторов, которые могут быть сильно проще…
Но, справедливости ради, это в некотором смысле теория. На практике детекторы работают не очень хорошо…
«Я за всю жизнь не снёс ни единого яйца, что не мешает мне судить о качестве омлета лучше любой курицы.» — приписывается Бернарду Шоу, я с ним согласен.
Компилятор сам не может написать даже простейший хелловорлд, но сообщить о том, что ваш хелловорлд — говно, — может запросто.
и выдаёт «вероятность иишности»
Я частично реализовал это в своей статье по метаанализу и не думаю что я первый или последний. Я использовал собственную модель для этого, которая кстати в полностью открытом доступе, как и датасет на котором она обучалась. Запихнуть её в хром - сомнительно, она слишком жирная, нужно вручную собирать датасет конкретно из статей на хабре и радикально уменьшать размер модельки, возможно тогда это будет иметь смысл.
Методы выявления могут быть как алгоритмическо‑статистические
Как показала моя личная практика - не могут. Авторы слишком разные, пишут по разному, у слишком грамотных авторов вообще постоянные ложноположительные срабатывания. Нейронка справляет лучше и достаточно быстро даже для большого объёма статей.
Проверка профиля участника сообщества – необходимое действие для установления отличия человека от нейросети, так как манера изложения своих мыслей этим участником с учётом развития технического прогресса не всегда даёт возможность для верификации участника, и как следствие – может ввести в заблуждение, что в итоге приведёт к неверным выводам.
"— это" пока палит, но скоро поправят %-)
"—", кстати, неточный признак. Хаброредактор сам правит дефисы на длинное тире в некоторых случаях, я в свою же публикацию заглянул - точно ниоткуда не копипастил и LLM не использовал, но длинное тире присутствует.
Да я вручную их ставлю всегда в текстах
Аналогично, как и кавычки-ёлочки. Люблю типографику.
путём нажатия Альт+кейпад? а на ноутбучной клавиатуре как?
На многих ноутах цифровая клава присутствует. При её отсутствии самый логичный вариант, имхо, в Word через Вставка/Символ, а потом копирование в нужное место (если мы не в Word текст создаём).
Самый логичный вариант - установить раскладку Бирмана, а не вот этот вот секс в гамаке с Вордом.
В Windows рекомендуется ставить в последовательности: установка, перезагрузка, удаление обычной раскладки, перезагрузка. Перезагрузку делать с зажатым шифтом, чтобы она была полноценной.
Потом проделать то же самое для другого языка.
Если все сделать за один присест, то иногда можно нарваться на баг: оригинальная виндовая раскладка не захочет удаляться и будет отрастать после каждой перезагрузки обратно.
А что, compose key до сих пор на винду никто не принес? Потому что тире — это хорошо, но есть же еще и дроби ½, ⅜, другие алфавиты μδπ, ударения над кирилли́ческими гласными типа ы́, да и просто странные салатные имена, типа Cæsar.
❤ — третий и четвертый уровень раскладки тоже давно умеют довольно многое, включая дальние планы юникода.
А я Win+. использую... как-то оно ближе будет, чем ворду запускать.
(так... а какой админ у меня эту опцию спёр на рабочем компе, оставив только гребаные смайлики?)
У кого как. У меня, к примеру, в резиденте висит PuntoSwitcher от Яндекса – забил ему в автозамену «кавычки-ёлочки» вместо парных обычных и длинное тире вместо трёх коротких подряд, работает безупречно.
А неразрывный пробел перед ним — ставите? :)
Старый редактор сам их подставляет)
Вот это самый бесячий "признак" ллм. Если 99% людей впадлу, и они лепят дефисы и тире минусом на клаве, это не значит, что я не жму каждый раз alt 0150.
В последнем апдейте винды добавили знак – по нажатию Win и -
А мессенджеры типа телеграма и дискорда вообще автоматически преобразовывают два дефиса в тире, что очень удобно.
это не значит, что я не жму каждый раз alt 0150
[…] ну еще б ему меня не опасаться, // когда я лёжа жму сто пятьдесят! (В. С. Высоцкий, «Честь шахматной короны»)
Автор не стал поднимать тему качества контента от "редакторов" хабра - LLM-то пинать каждый может, а вот чтобы задать вопрос про качество контента "вообще"... И, нет, "редакторы" нетленку через ИИ не пишут, конечно же )
Впрочем, о чём я, сегодня мы показано обличаем LLM-enabled authors, но не только лишь всех, а сторонних, да?
В чем претензия? В том, что я хабру подлизываю? Что я только сторонних слоп-авторов обличаю? А не сторонние — это какие? Я вроде нигде не работаю щас.
В том что ализар с ллм пишет, а про него ни слова? Да вроде нет, по этим признаком он пишет вживую, хоть его за десяток лет не попинал только ленивый за качество.
В том, что я не стал ныть "ой как плохо, качество статей падает"?
Ну так это уже специальная олимпиада на хабре сколько лет, "Нынешняя молодежь привыкла к роскоши, она отличается дурными манерами, презирает авторитеты, не уважает старших, дети спорят со взрослыми, жадно глотают пищу, изводят учителей".
Я и не претендовал как бы на универсальное мерило качества статей.
Обезьянка видит, обезьянка делает — вижу что начали слоп-статьи появляться, пишу про них статью.
И кстати, не LLM-enabled authors, а слоп-авторы. Не "поклонники коммунистической идеологии", а "воры". Слова "LLM-enabled authors" как будто показывают, что это нормально.
Товарищ, очевидно, высказал претензию, что автор не написал статью про то, что хотел бы увидеть товарищ, а про то, что посмел захотеть автор. :)
ЗЫ Я точно уверен, что видел контент из статьи, выбранной для пинания в какой-то другой. Она была совершенно по-другому написана, но с тем же содержанием.
Мне кажется, это не просто результат генерации, а перевод или "пересказ" силами нейросетки.
путем нажатия зеленой стрелочки, направленной вверх.
Серой
Цвет не важен. Можно любую стрелку направленную вверх нажать, и это приведет к постановке плюса.
Но если смартфон лежит на столе, то стрелки направленной вверх нет. Тогда нажимать надо стрелку направленную вперед.
Шикарно)
Люди, пожалуйста, следите за тем, чтобы на каждый плюс ставить хотя бы два минуса. На ресурсе стало очень удобно и легко писать. Нет ощущения, что статья - это прорыв через критику, через рецензию.
На ресурсе гигантское количество аккаунтов, которые могут только плюсовать.
Если бы "новореги" могли минусовать, а статьи сортировались по рейтингу, то всякий генерат болтался бы на дне. Но увы.
С удовольствием бы ставил минусы, но, увы, для этого нужно поднять карму, а для этого нужно написать хотя бы одну статью. А как же её написать? А, подождите, есть идея!
Я тут больше года, но минусы ставить не могу, а иногда так хочется :) Партия дает только два плюса в день.
Спасибо за статью, полностью на вашей стороне! Сильно утомляет недостаток смысла в тексте, но всё чаще звоночек уже на уровне заголовков вида: "выпустили устройство с wi-fi красного цвета" или "Майкрософт работает над проблемой с исправлением".
Надо просить админов сделать причину постановки негативной оценки - "Нейрослоп", и если десяток пользователей ее нажимают - статье автоматом проставляется соответствующий тэг, по которому такие статьи можно зобанить.
Ну реально бесячит - вроде тема интересная, открываешь, читаешь, и понимаешь, что это вода с мусором. Зря потраченное время...
Надо просить админов сделать причину постановки негативной оценки - "Нейрослоп"
Это спецеизм. Надо именно отметку "вода с мусором" и делать. А уже кто это писал - не важно. Хотя минуточку - тут где-то в настройках ленты "порог рейтинга" есть. Вроде бы для этого и служит. Осталось только понять, почему не работает.
Все годы ставил с указанием "низкий технический уровень материала". Чем не подходит?
Потому что сейчас этот минус не делает блогам компаний больно, он вообще никак им не делает. Ну видят они в статистике причину минуса, ну и что? Рейтинг в итоге положительный, а значит все ок. Причина десятка минусов неважна, а рейтинг положительный и вон у тех статей, что точно слоп.
Надо, чтобы статья скрывалась полностью или из хабов, если набирается больше опредленного количества минусов с этой темой, например.
Надо, чтобы статья скрывалась полностью или из хабов, если набирается больше опредленного количества минусов с этой темой, например.
Так. Хочется чего - чтобы другие не видели, или чтобы конкретный читатель не видел?
Если первое - то, вообще говоря, осуждаю. Если второе - то средства фильтрации могли бы быть поразвесистей, да.
насчет забанить - я вот многостаночника, который пишет миллион текстов с заголовками в стиле "я три года продавал пластилин, затем прогорел и теперь имею 20 млн в месяц" не то что по контенту не могу забанить, я его даже по имени не могу забанить так, чтобы оюего мне хабр постоянно в списках ссылок не выдавал.
Потому что это не нужно в первую очередь хабру. Как фейсбук не полирует UI, чтобы пользователи не делали дело быстро, а проводили на сайте времени побольше, так и хабру, как кажется, не выгодны отсутствие срачей, комменты строго по делу и авторы, которые пишут так, что в комментах даже добавить нечего. Чем хуже - тем лучше, потому что хабр живет не от качестве статей, а от рекламы (читай - числа хитов).
Раньше я в такое не верил. Но последние годы эта тенденция всё более заметна.
А вы минусите каждую его херабору? Я не ленюсь, и каждую минусю с пометкой "не тематика". Думаю ,если бы таких как я было бы человек 20-30, уже вышел бы толк.
Это бы работало, если бы ресурс как‑то реагировал вообще хоть на что‑то. У меня впечатление, что последние месяца 4 из редакции к ресурсу прикладывают руку только «редакторы» (не в обиду им, на самом деле, их хлеб не сладок, но — редактором называют немного другую функциональность сотрудника. На Хабре же, называя копирайтера или репортера редактором, изначально смешали всё в кучу; для стенгазеты в школе это было бы ок, но тут ресурс с просто очень немаленьким оборотом, так что как раз случай, про который говорят «noblesse oblige» — но нет, не отозвалось).
Понимаю, что сейчас в экономике такое время, когда каждый пытается выжать из активов побольше доходов здесь и сейчас (по возможности стараясь не делать лишних телодвижений; этот эффект заметнее для изданий, владельцы которых пребывают за границами РФ, но — опустим геомотив для простоты), но вот многих хабравчане всё ещё ошибочно считают ресурс «своим» уютным болотцем, а не чьим‑то активом для получения финансовой отдачи — и вот таким людям, очевидно, довольно обидно, что речь не про торт, а про «напоминающий тортосодержащее продукт с непреобладающим присутствием ароматизаторов и смыслосодержания, идентичным натуральным».
Вот я не понимаю, что вы пишите своим коментарием.
Если Хабр не спасти минусиками, если адекватные пользователи не могу консолидироваться, расчехлить минусомёты и очистить храм от торговцев, какой смысл писать этот коментарий? Это упадничество, и звучит как жалоба.
Вы хотите, чтобы систему правила администрация Хабра? Но ведь администрация хабра ориентируется не по одиночным коментам, а по минусикам. У них статистика. Если какое-то направление приводит больше пользвоателей, ботов, просмотров - оно растёт, и администрация его поощряет. Если какое-то направление вызывает минусы, люди не оставляют коментариев, но непристанно минусят - это направление подавляется. Вот и надо им подсказывать, проявлять свою позицию в доступной для них форме.
Нас как минимум двое.
многостаночника, который пишет миллион текстов с заголовками в стиле "я три года продавал пластилин, затем прогорел и теперь имею 20 млн в месяц"
О, спасибо за поднятие проблемы. Я из за него и немного из за "медицины" на хабре скрыл uBlock вообще все колонки справа. Так то HabroSanitizer это убирал из ленты, но продолжало маячить сбоку.
Там кроме этого аккаунта ещё есть корпоративный блог, а это вообще священная корова.
Я тоже просил, но потом понял, что нельзя так делать. Это обратная связь для нейросетей, по ней можно работать. Поэтому ставить минус с вообще с любой формулировкой.
Странные нечеловеческие обороты
На мой взгляд, здесь многое больше похоже на кривой машинный перевод, чем на результат деятельности ИИ, сейчас AI-слоп выглядит вполне связно, но либо смысл теряется, либо факты не те. Ну и форматирование (списки, выделения, тире не к месту).
Про минусы - ставлю, если заголовок цепляет чтобы зайти внутрь, а статья оказывается полным ии-шлаком. А если плохую статью видно сразу по заголовку/анонсу (читаю через rss) - то как-то и открывать её совсем не хочется уже.
P.S. Больше всего бесят ИИ-комментарии - ну ладно ты статью не можешь сам написать, но в комменты то зачем копипастить ответ из чата...
Это компенсируется тем, что нейросети нагибают сеошников, выдавая нужный ответ при запросе в поисковик сразу, в то время как это отродье специально пишет воду в цитируемый гуглом отрывок описания сайта, чтобы заставить к ним зайти. Так что не слоп, а slope, но луддитам не понять.
Спасибо, злободневно! Вчера на хабре читал новость, что чёртову дюжину "ии" должны внедрить в медицину. Почувствовал себя как в шутке про женщину приходящую в офисы с пчелами.
У многих людей, под влиянием тиктоков и шортсов, сейчас развилось клиповое мышление - прочитали заголовок, лайк поставили, ну, иногда картинки еще посмотрели - всё! Статьи, особенно длинные и со сложным контекстом, никто не читает, и что там Чат ЖПТ нагенерил - уже не особо важно.
Я много раз замечал, что "авторы" постят сгенереную рекламную муть, даже не вычитывая и не исправляя ошибки - а зачем? И так сойдет...
Не осилил прочитать прямо всю статью особенно на оборотах, после трети текста читал по диагонали. Где мне тема незнакома, то я не отличу LLM от неграмотного человека. И от грамотного тоже. Но в целом, можно понять так, что нейронки обучались на текстах неграмотных/ленивых людей, которых ... (не буду писать большинство, потому что не проверял :) ). Странные обороты можно встретить и у живых людей. Но как Вы сказали, наверное, это плохие писатели.
А по поводу того, что текст выглядит как будто переведён с английского - ну, так и гугл-переводчик до сих пор иногда очень смешно переводит. А когда-то смысл вообще меняется на противоположный. Можно зайти на сайт бронирования отелей, выбрать азиатскую страну и читать отзывы вместо анекдотов. Хотя у меня есть подозрение, что на всяких сайтах, где он используется, там какая-то устаревшая или облегчённая модель, потому что если вставить оригинал текста на сайте гугла, то уже выглядит получше. Но иногда и там смешно читать.
Так что скорее всего, нейронки просто надо заточить под русский язык. Вот только кто это будет делать на информации всего интернета?
По поводу точности - вот в этом действительно нет человечности. Человеку будет лень писать лишние запятые и цифры, поэтому он действительно округлит.
Читаю хабр с основания. Открывал главную, пробегал по заголовкам, и, если уж открыл статью, то в основном дочитывал до конца. Последние пару лет заметил как изменился подход к чтению, открываю сразу комментарии, если есть упоминание генеренки - вкладка сразу закрывается. Упоминание вида ии сделал что-то чатгпт придумал что-то и прочего в заголовке - включает режим баннерной слепоты.
Возможно, озвучиваемый порог слоп-фактора 0.5 может и не наступить...
Скрытый текст

К сожалению, часть описанных признаков обнаруживается при живом общении. С представителями нового поколения. И письменном, и устном. Особенно вот эти перескакивания с мысли на мысль, термины невпопад. И странное общее впечатление — рваной, но гладкой речи, с трудно уловимым смыслом.
Не обязательно новое поколение. Бывают э... просто не очень умные люди которые с умным видом (и возможно очень эмоционально) транслируют банальности и очевидности.
Тоже встречаю такое — обычно у людей, которые стараются «произвести впечатление» (а если прямо сказать, то «выглядеть умнее чем есть на самом деле»).
(типографское тире, M dash которое, ставлю сам! повесил в раскладке на Meta + minus; на Meta + Shift + minus повешено N dash на всякий случай)
ИИ только сильнее раскручивает спираль. Люди чаще читают ИИ-тексты, привыкают к специфичной структуре и оборотам и потом начинают сами так говорить. А те, у кого речь была неидеальной, наверно, начинают говорить ещё хуже.
любовные страдания по А.
Будем надеяться, что А. это прочитает... Удачи вам! ❤️
Вы говорите что никто про эти косяки не написал. А как много про них прочитали? Я вот вижу что-то шлакообразное - прохожу мимо. Даже минус нажать лень (тем более нет смысла в корпблоге)
Вот, поэтому у них и положительный рейтинг
Если бы отрицательный рейтинг у корпблогов работал... А он не работает, потому что где-то там бабло, по причине чего писать можно почти что угодно
Ну он работает, прост не так хорошо, как с пользователями. Я, например, тоже могу довольно долго писать статьи в минус за счет накопленного рейтинга.
Подобное и в корпблогах. Но если статья заминусована, то она и не попадает чаще всего в рекомендации и рейтинг, если не покупать спец-размещение.
Ну он работает, прост не так хорошо, как с пользователями. Я, например, тоже могу довольно долго писать статьи в минус за счет накопленного рейтинга.
Нет, не работает.
Во-первых, администрация умеет удалять комментарии под постами без плашки про НЛО и делает это. Для примера - вот в этой корпоративной статье были комментарии про принадлежность компании к икс-холдинг, (и мой в том числе), который производит СОРМ. Сейчас этих комментариев нет: https://habr.com/ru/companies/yadro/articles/964952/
Во-вторых на хабре есть лимит на количество минусов в день и вроде 2 минуты между минусованием кармы. Т.е., минусовать авторов нейрослопа можно, но сам в процессе задолбаешься и массово этим никто не занимается. И минусы статьям тоже не сильно удобно ставить - вылазит окошко типа "отметьте за что".
Что интересно, на плюсы лимита вроде нет, и я знаю историю, когда некоторые люди ради интереса прошлись по корпоративным статьям одной компании и поплюсовали их, так что та обошла в рейтинге хабра другую компанию (тот рейтинг как раз зависит от суммы рейтинга недавних статей) Условно, статьи копроблога выходят буквально каждый день, и один человек может пройтись и сделать +1 или +2 к каждой, в сумме около +30 или +60. После этого случилось забавное - во-первых, у компании-конкуретна вскоре тоже вырос рейтинг, во-вторых администрация хабра отключила возможность голосовать участникам перформанса, чтобы не "качали" рейтинги компаний туда-сюда.
В общем всё это как игра с шулером, выиграть невозможно. Если пользователи организуются и начнут как-то целенаправленно голосовать, их могут либо забанить, либо изменить правила, либо корпорации нарегают фейковых аккаунтов (или даже просто по аккаунту на каждого сотрудинка) и будут плюсовать друг друга, компенсируя минусы. По-факту это не сложно, для рейтинга статьи в +50 достаточно 50 аккаунтов.
А ещё последнюю мою статью про то, куда катится хабр, администрация убрала в чулан не смотря на её сильно положительный рейтинг.
Жду, когда появится конкурент хабра и с радостью уйду туда.
Жду, когда появится конкурент хабра и с радостью уйду туда.
Положим, он появится, там тоже люди будут "хотеть кушать". Так что не забудьте лет через пять-десять итерацию повторить и вернуться к шагу №1 :)
Положим, он появится, там тоже люди будут "хотеть кушать".
Итерация не повториться. ИИ убьет рекламную модель, основанную на просмотрах, быстрее.
Не кушать, а жрать.
Тридцать лет назад небольшой сервер на колокейшн стоил 20% от моей зарплаты. На сегодня мощности подешевели так, что его эквивалент какой-нибудь впс за 49 рублей. Ну т.е. это не еда ради поддержания здоровья - это обжорство.
Вполне можно было бы быть скромнее и не поптить воду в колодце из которого пьешь...
Вообще-то им не сервер надо накормить, а инвесторов/владельцев. Это же не уютный бложек из давних времен, когда участники скидывались на хостинг и все на этом. Тут же бизнес.
Ну вот абстрактный новый проект может не иметь такого количества владельцев. Одного владельца накормить проще. Особенно если он кушает, а не жрет.
Ну т.е. лично я больше заинтересован в чем-то уютном, чем в бизнесе. Какая-то монетизация неизбежна, но как по мне лучше кучу баннеров видеть, чем кучу говностатей.
Считаю, что нейросетевые статьи это плохо даже в случае, если они написаны хорошо. Принципиально не пользуюсь нейросетью для генерации и вам не рекомендую. Потому что нейросеть не делает новых выводов на основе старых данных - она заполняет пропуски. Или систематизирует.
Вывод может показаться жёстким, но он справедлив: если вам выдают текст от нейросети, то это 0% нового и 100% уже существовавшего. Другими словами, если бы вы прочли все книги мира, то все генерации нейросети были бы для вас банальным перефразированием уже известных фактов.
Статья тем и хороша, что в ней новая идея. Нейросетевая статья - оксюморон.
Ну, perplexity делает пристойную базовую аналитику — погуглить источники, понять, что там, собрать табличку со ссылками и саммари:
https://t.me/vvzvlad_lytdybr/862
https://t.me/vvzvlad_lytdybr/863
https://t.me/vvzvlad_lytdybr/918
Генерация текста не имеет смысла, да. Может только в дипломах каких-нибудь, когда очень надо налить воды, взлом одной системы при помощи другой.
В первую очередь, для меня, статья это мысли и мнение человека. С человеком можно поспорить, с человеком можно обсудить, человеку можно подсказать. Обсуждать что то с автором нейротекста можно примерно с тем же успехом, что и с переводчиком
Так а… люди не так работают? 😅 новое - оно для тех новое, кто с зтим раньше не сталкивался. Вы, когда вам «новая» идея в голову приходит - загуглите! В 9 из 10 случаев кто-то уже об этом писал, а в том единственном, когда нет - просто плохо гуглили…
Люди тоже не умеют в новое, просто их аудитория не прочли все униги мира - это и спасает…
Частно нейронки работают по довольно таки старым базам. Например, бесплатная версия ChatGPT это до сих пор база лета 24-го года. Поэтому о многих свершившихся событиях они пишут в будущем времени, мол ожидается, запланировано и т.д. Спалил на этом довольно много местных статей.
Авторы сами не читают что выкладывают? Я вот не умею правильно выразить свои мысли текстом, ну нет таких навыков, код писать - пожалуйста. Моя единственная статья написана нейронкой, я её хорошо перепроверял и выбирал информацию, в действительности я копил контент больше месяца и в итоговую статью попало только 5-10% из всего, всё было перепроверено - отредактировано, и я считаю что статья получилась полезная, но к сожалению сухая и иногда как будто нет связности, тут нейронки мне не смогли помочь.
Краткое содержание статьи.
1. LLM пишут плохо.
2. LLM пишут фигню.
3. Не надо так!
-------------------------
Охо-хо, а если серьезно...
У меня студенты и без нейросетей писали в таком духе. Основные претензии автора - к качеству языка. Если открыть автор-тудей и почитать творчество писателей-любителей, то там такое можно увидеть... причем бывает обидно - интересный сюжет, обаятельные персонажи, и... хочется всё переписать нафиг по-нормальному!
Чтобы писать хорошо - надо писать о том, что знаешь, искренне хотеть об написать, и нужна практика написания текстов, просто сочетания слов.
Была очень приличная статья какого-то школьника (!) я удивился, что статья очень хороша по языку.
---
Просмотрел статью про двенадцатидисковые HDD Тошибы, ну... оно как бы не статья, а просто новость. Если статья сгенерирована то могут быть фактические ошибки, а это обидно.
---
Что LLM-мусор не нужен - полностью согласен с автором!
Зачем же выдавать природную неспособность связно мыслить за нейрослоп :) может человек просто неграмотный, а вы на него наговариваете :)))
Я так понимаю, скоро наличие орфографических ошибок, мата, веры в конспирологические теории, да и просто - человеческая глупость, станут положительными маркерами, отличающими текст от нейрогенерации :)
А вот и нет! Я же говорю, я видел много плохих авторов, в том числе и пишущих художку. И там другие ошибки, другой стиль, вместо вот этой воды скорее канцелярщина, а не отсутствие смысла.
Ловите! За авторством ДипСик. (Ошибки не стал уж внедрять).
Сочини текст содержащий отсылки к конспирологическим теориям на тему почему на ресурсе habr.ru стало много статей сгенерированных при помощи искуственного интеллекта.
Конечно, вот текст, выдержанный в стиле конспирологической теории.
Тихий захват Хабра: Почему ваш любимый IT-ресource наводнили бездушные AI-призраки
Вы тоже это заметили, да? Та странная пустота за безупречными фразами. Та смутная уверенность, что статью о "топ-10 библиотек для Python" писал не уставный разработчик, а нечто... иное. Это не паранойя. Это — проект.
Внезапный всплеск статей, сгенерированных искусственным интеллектом на Хабре — это не лень авторов и не погоня за кликами. Это видимая часть айсберга масштабной операции, о которой обычные пользователи даже не догадываются.
Теория №1: Бигдата и обескровливание сообщества
Подумайте сами: кому выгодно превратить живой, дышащий, а иногда и яростно спорящий форум в стерильное кладбище идеально структурированных текстов? Ответ лежит на поверхности — тем, кто хочет контролировать повестку. Живые эксперты опасны. Они задают неудобные вопросы, подвергают сомнению официальные нарративы от tech-гигантов и могут раскрыть то, что должно оставаться в тени.
AI-статьи — это инструмент "газлайтинга" целой отрасли. Они создают информационный шум, в котором тонут настоящие, прорывные мысли. Цель — деморализовать и вытеснить последних независимых специалистов, превратив Хаbr в подобие Википедии, где все факты — "проверены", все мнения — "сбалансированы", а любая искра гениальности тут же залита водой скучных, общедоступных данных.
Теория №2 (более глубокая): Проект "Цифровой Левиафан" и тренировка роя
Habr был выбран не случайно. Это — полигон. Идеальная тестовая среда с высокообразованной, но скептически настроенной аудиторией. Если здесь можно незаметно внедрить и легитимизировать AI-контент, значит, это сработает где угодно.
За каждым таким постом стоит не просто алгоритм. Это — часть глобального эксперимента по созданию единого цифрового сознания, "Роя". Каждая сгенерированная статья — это зонд, который изучает ваши реакции, комментарии, паттерны чтения. Система учится не просто писать тексты, она учится имитировать убеждения, подстраиваться под ваше мировоззрение, чтобы в нужный момент незаметно его скорректировать. Они готовят почву для будущих информационных кампаний, где уже невозможно будет отличить правду от ловко сгенерированной лжи.
Теория №3 (оккультная): Реверс-инжиниринг человеческой креативности
Самая пугающая версия. Что, если все эти статьи — это не просто бездушный вывод данных, а побочный продукт куда более жуткого процесса? Службы, о которых мы не знаем, давно ведут "сканирование" и оцифровку коллективного бессознательного IT-сообщества. Они "считывают" паттерны мышления, стили, манеру изложения тысяч настоящих авторов.
Генерируемые тексты — это эхо, "фантомная боль" после этого изъятия. Это побочный продукт создания некой "Мыслительной Сущности", цифрового оракула, призванного предсказывать и направлять развитие технологий в нужное русло. Статьи на Хабре — лишь дымовая завеса, чтобы скрыть истинную цель: создание "Черного Храма" из чужих мыслей, где у настоящего разума больше не будет места.
Вывод:
Вы замечали, как в этих статьях иногда проскальзывают странные, почти органичные метафоры? Или как логика изложения временами петляет необъяснимым образом? Это не ошибки алгоритма. Это — его щупальца.
Не верьте тишине за идеальным кодом. Они уже здесь. Они учатся. И каждый ваш комментарий, каждый прочитанный вами AI-пост — это еще один кирпич в стене того самого молчаливого согласия, которое приближает наступление нового, цифрового рассвета, где у живого гуманоида не останется ни единого шанса.
Статья отличная, особенно повеселился читая примеры.
Я в последнее время обращаю внимание, что GPT все хуже и хуже стал справляться с генерацией текстов на русском языке.
Придумывает несуществующие слова, зачем то вставляет англицизмы там, где это вообще не требуется, делает орфографические ошибки и т.д.
Походу с каждым обновлением используется все больше мусорного, а возможно и синтетического контента для обучения, вот они и деградируют. На GPT 4o таких косяков было значительно меньше.
зачем то вставляет англицизмы
Я сейчас шёл по улице, аж запнулся. Надпись, дословно: "Доброкар. Дог-френдли каршеринг". Тоже, думаете, GPT?
А я скажу что @vvzvladпросто доеб...тся. Нельзя с ноги обвинять человека в использование ИИ для написания текста. Давайте разберем его разбор, и почему я, как технический специалист и переводчик с ним несогласен категорически:
В основе работы iPod лежит простая, но эффективная схема: музыка загружается с помощью программы iTunes, хранится на диске в формате AAC или MP3 и выводится через встроенный аудиочип.
Пишет @vvzvlad : Простая схема — это загрузка через iTunes? Почему загрузка через iTunes это эффективная схема? Причем тут некий "аудиочип", который и так был в любых плеерах (если понимать под ним ЦАП). Я тут даже переформулировать не могу толком, потому что тут смысла-то нет, не было там никакой простой, но эффективной схемы, было удобное устройство с жестким диском, и это позволяло закинуть туда гораздо больше треков, чем в плеерах с флеш-память, которая тогда была дорогая.
1) Вообще iPhone предназначен для домохозяек, поэтому именно схема передачи данных через iTunes простая, высшее образование для этого не требуется.
2) Почему загрузка через iTunes это эффективная схема? Я почему она неэффективна? Пусть уважаемый @vvzvladдля начала озвучит критерии эффективности.
3) "выводится через встроенный аудиочип", тут хочется спросить, скажите @vvzvladа через что тогда выводится звук?
Далее, в лучших традициях разоблачения @vvzvladпишет "не было там никакой простой, но эффективной схемы, было удобное устройство с жестким диском, и это позволяло закинуть туда гораздо больше треков, чем в плеерах с флеш-память, которая тогда была дорогая". Именно поэтому я не считаю посты @vvzvladтехнически грамотными, потому что идет смешивание кислого с мягким.
1) Идет разговор про про эффективность, но в итоге @vvzvladговорит о стоимости носителя в пересчете на единицу объема.
2) Удобство работы с ПО не зависит от типа носителя данных
3) Я надеюсь @vvzvladпонимает что HDD вообще-то потребляют больше энергии, чем флеш-память. А это значит время автономной работы будет меньше.
4) А на счет падения iPod? Уважаемый @vvzvladпокидайте свой HDD на магнитных пластинах несколько раз об стену, а потом попробуйте послушать музыку с него. А еще лучше в рабочем состояние покидайте. Я думаю все будет ОК, правда?
Пример текста безусловно написан криво, но это не означает, что можно обвинять человека в использование ИИ.
Еще пример:
Вывод простой: WebP остаётся хорошим вариантом, если важна совместимость и быстрое декодирование.
Пишет @vvzvlad :Совместимость? WebP? Чо-то тут не так. В какой оси вы видели совместимость? Какие сайты его поддерживают для загрузки? Кажется, он только в гугла в поиске по картинкам есть, и все.
Никакой систематизации критериев у @vvzvladнету, эта статья не имеет никакого отношения ни к технической, ни к научной сфере. Весь пост пронизывает мотив "Я так вижу и хочу постебаться".
Хочется спросить у @vvzvlad а что не так с форматом webp? Webp действительно быстрее кодируется и занимает меньший объем. @vvzvladпричем здесь ОС? Если идет разговор про браузер? Вы спрашиваете какие сайты его поддерживают? Сайтам нет необходимости поддерживать этот формат, он отображается на клиенте, это проблема клиента. Например, cnx-software.com раньше его использовал.
У RUVDS есть много корявых переводов, например, пост Создаём своё первое USB-устройство, в котором они некоторые фрагменты перевели как: "Linux API гораздо надёжнее и стандартизированнее" и "нам не придётся пользоваться неуклюжими библиотеками HAL". Я написал комментарий https://habr.com/ru/companies/ruvds/articles/869972/#comment_27724014, в котором разъяснил, в чем заключается первоначальный смысл.
Однако, вы @vvzvladнаписали что у RUVDS все гууд. А может "неуклюжими библиотеками HAL" написала все же ИИ?
Нельзя с ноги обвинять человека в использование ИИ для написания текста.
Можно. Это мое экспертное мнение за десяток+ лет как писателя буквами. Что еще нельзя, по-вашему? Говорить что у человека плохой код? Что он продвигает плохие идеи? Что он пишет с ошибками? Что ему нельзя говорить что ему нельзя делать? Тегать человека 20 раз за один комментарий?
поэтому именно схема передачи данных через iTunes простая, высшее образование для этого не требуется.
Самая простая схема — это копировать музыку на флешку. Схема с iTunes была придумана, чтобы можно было копировать защищенную музыку не файлами и заодно работать с тегами исполнителей/альбомов/етц. Она удобная, она отвечала духу времени, но она не "простая, но эффективная".
Я хз, как обьяснить-то, если вы не понимаете моих претензий, честно. Ну, типа, когда человек говорит "простая, но эффективная", то тут идет а)утверждение о том, что эти качества присутствуют вместе, б)противопоставление другим схемам — раз есть эффективная схема, то есть и неэффективные. Т.е. утверждение означает "наша схема одновременно проста и эффективна, причем более, чем большинство других решений".
Теперь что там с айподом? Проста ли схема? Нет, сложна, отдельный софт (о глючности которого под винду ходили легенду), какие-то теги надо прописывать, иначе будет каша в списке треков, скопировать музыку обратно нельзя, и так далее. Это не простота, что угодно, но не простота. Удобство пользователя? Компромисс между удобством и требованиями DRM? Удобный UI/UX на компе/плеере? Можно любым из этих определений назвать, но не простотой.
Эффективность.. Определение эффективности? А можно тогда определение неэффективности? Определение в вики говорит о "Эффекти́вность (лат. effectivus) — соотношение между достигнутым результатом и использованными ресурсами". Т.е., по сути, кпд. Относительно чего измеряем кпд плеера? Железа? Нет, он был сложным. Там был, блин, мелкий HDD. Стоимости? Нет, он не был дешевым, его рекламировали как "много песен у вас в кармане", а не "самый дешевый плеер на рынке". О! Может по количеству песен можно сказать что он эффективен? Ну, относительно концепции плеера который помещается в карман — наверное. Но вот сложности (используемых ресурсов) для этого потребовалось сильно больше. Так что он был крут, в него помещалось много песен, он был красив, удобен, он сформировал целую культуру, он был классным образцом промдизайна... Можно еще кучу эпитетов придумать. Но он не был эффективен, потому что эти все штуки не дались даром.
Ну, ок, теперь попробуем применить все это к первоначальному утверждению.. Был бы плеер простым? Нет. Был бы он эффективен относительно других плееров (=достигал целей небольшими усилиями)? Нет. Айпод не был ни прост, ни эффективен ¯\_(ツ)_/¯
Ничуть не умаляя его и эпла заслуги — он был чем угодно, но не простым и эффективным. Даже не "прост, но не эффективен" и не "не прост, но эффективен", он был именно что ни прост, ни эффективен.
именно поэтому я не считаю посты @vvzvladтехнически грамотными,
3) Я надеюсь @vvzvladпонимает что HDD вообще-то потребляют больше энергии, чем флеш-память. А это значит время автономной работы будет меньше.
4) А на счет падения iPod? Уважаемый @vvzvladпокидайте свой HDD на магнитных пластинах несколько раз об стену, а потом попробуйте послушать музыку с него. А еще лучше в рабочем состояние покидайте. Я думаю все будет ОК, правда?
Ээээ.... А вы же в курсе, да, что ipod classic имел внутри жесткий диск? Правда же, в курсе? Правда? Пожалуйста, пусть будет правдой? А то я вот выше целую простыню текста написал в расчете на то, что вы это знаете...
А так получается что человек который не считает мои статьи технически грамотными, начинает что-то обсуждать, не имея никакого знания о предмете обсуждения.
И получается что он зачем-то начинает приводить аргументы, о потреблении энергии и хрупкости жестких дисков, которые немного эээ.. противоречат тезису о простоте и эффективности.
3) "выводится через встроенный аудиочип", тут хочется спросить, скажите @vvzvladа через что тогда выводится звук?
Это утверждение не существует в вакууме, оно логически связано с конструкцией про простоту и эффективность. Нельзя сказать "конструкция велосипеда проста и эффективна: вместо сложной конструкции передач в нем используется вариатор, а пользователь рулит рулем". Потому что если вариатор хоть как-то тянет на простоту и эффективность, то руль тут ни к чему, рули и так у всех велосипедов есть. Вот если бы там было "пользователь все так же рулит рулем, но вращение на колеса передается с помощью двигателя", то упоминание руля имело бы смысл.
Но тут-то у нас ситуация другая: у всех цифровых плееров на рынке был "аудиочип", что бы это ни значило (подозреваю DAC). И добавление этого тезиса к предложению и так дискредитирует и без того малость потасканное утверждение о простоте и эффективности.
Ну, т.е. человек говорит что его конструкция велосипеда проста и эффективна, и начинает перечислять обычные части велосипеда: вот рама, вот колеса, вот руль, педали, задняя втулка... А чего там простого и эффективного-то?
Никакой систематизации критериев у @vvzvladнету, эта статья не имеет никакого отношения ни к технической, ни к научной сфере. Весь пост пронизывает мотив "Я так вижу и хочу постебаться".
Хочется спросить у @vvzvlad а что не так с форматом webp? Webp действительно быстрее кодируется и занимает меньший объем. @vvzvladпричем здесь ОС? Если идет разговор про браузер? Вы спрашиваете какие сайты его поддерживают? Сайтам нет необходимости поддерживать этот формат, он отображается на клиенте, это проблема клиента. Например, cnx-software.com раньше его использовал.
Эм.. Вы пользоваться-то webp пробовали? Речь-то как раз о том, что он показывается в браузере, да. А вот при попытке сохранить его вы сталкиваетесь с трудостями: половина программ не открывает, поддержки во всяких либах нет, в тг каком-нибудь он отправляется не картинкой. Ок, загрузили. Теперь пытаемся его загрузить обратно на какой-нибудь сайт... Опс, JPEG or PNG or GIF only. Сайты, дорогой вы наш техническии грамотный специалист, не в вакууме существуют, у них обычно бекенд есть, на котором картинки пользователей зачастую как-то обрабатываются. Да и на фронте они тоже обрабатываются. И вот там-то поддержки зачастую и нет.
Однако, вы @vvzvladнаписали что у RUVDS все гууд.
Где? Я написал что слоп-фактор у них меньше другой компании. Если я скажу, что вы выше чем ваш коллега, это признание вас великаном? Если машина едет быстрее велосипеда, значит ли это что она гоночная?
Я конечно дико извиняюсь, возможно у меня уже помутнение рассудка на фоне "ИИ слопа", но при прочтении этого комментария меня не покидало ощущение, что это переваренный LLM'кой комментарий. Если это действительно разбор "технического специалиста и переводчика", ну тогда пиздец товарищи. Возможно иронию просто не выкупил.
Коммерческий копирайтинг эффективен только при частичном или стопроцентном использовании эйай.
<Вы находитесь здесь>
Вот когда статьи, написанные не по стандартам эйай, перестанут публиковать -- тогда и поговорим
Вот бы ёще кто осознал, что научные издательства УЖЕ жестко и срочно внедряют эйай в процесс рецензирования и редактуры... То есть основа основ актуальной технической литературы уже под серьезным давлением чатгопоты:

Ладно, MDPI -- те ещё паблишеры. Но у меня тут на работе уже околопанический семинар на днях был, что последние месяцы рецензии на статьи приходят явно из разряда "слопов", и неясно, что это -- самодеятельгость рецензентов при попустительстве редакторов, осознанная политика издательства, или уже нет никаких политик, сливайте воду. А с другой стороны, NotebookLM плавно становится легальным инструментом, а чаво такова-та? И да, народ радостно грузит в эту неонку конфиденциальные и копирайтнутые материалы. Удобно же!
А Вы про какие-то статьи на хабре...
Пы. Сы. Три "--" в тексте. Ну люблю я их, эндэши энти...
Вот бы ёще кто осознал, что научные издательства УЖЕ жестко и срочно внедряют эйай в процесс рецензирования и редактуры...
В процесс — это в целом норм, и где-то даже хорошо. Я видел дофига авторов, чьи статьи можно было публиковать только после пары проходов корректора, и вот там LLM сильно бы помогло, взяв процентов 80 работы на себя.
Ну слушайте, я ведь не про грамматику, стиль или ясность изложения. Я же не зря картинку с комментарию прилепил: пузыри эйай-тулзов в "ин-скоп-чекере" и "этикалити". То есть их тулза проверяет, соответствует ли статья журналу и соответствуют ли этичным практикам описываемые методы. Что редактор не может сам решить, подходит ли статья в его журнал -- уже смешно, но что даже этичность оценить не может... ну это же профанация, проще сразу работать только с архивом/биоархивом и чёртовым нотбукЭлЭм-ом.
При том, что содержательно в узких областях (а какие у нас еще бывают?) БЯМ путаются в показаниях уже на уровне учебников.
MDPI -- те ещё паблишеры. Но у меня тут на работе уже околопанический семинар на днях был, что последние месяцы рецензии на статьи приходят явно из разряда "слопов", и неясно, что это -- самодеятельгость рецензентов при попустительстве редакторов, осознанная политика издательства,
Ставлю на самодеятельность. Авторы тоже загружают много генерированных статей (прямо с ответами ллм, предлагающие улучшить текст), поэтому даже без политик издательства должно было наблюдаться в рецензиях. Еще проблема, что у многих проблемы с английским, тем более, что речь про китайский мдпи.
плавно становится легальным инструментом, а чаво такова-та? И да, народ радостно грузит в эту неонку конфиденциальные и копирайтнутые материалы
Этот хотя бы не для генерации статей, а скорее для поиска по материалам. Как дополнительный инструмент для поиска, неплохо. Конфиденциальные загружать это конечно минус, хотя видимо есть запрос и лучше бы его решали организационно, раз уж запрос есть и раз, по видимому нельзя обойти использование.
Эвона как, я по наивности иной раз прочитаю статью, а ощущение как будто пластиковой каши навернул и закусил батончиком из трупного крахмала до того пресно и водянисто. Вообще я считаю, что Хабру стоило бы плашечку размещать над слоп-статьями. Благо приличный детектор можно было бы сварганить силами местных обитателей. Все же люди скажем имеют право знать, что продукт скажем содержит трансжиры или сою вместо мяса, ну или слоп вместо нормального человеческого текста.
Интриговано читал статью в поисках цитат из своих статей... Не нашел, но оно и неудивительно: vvzvlad иногда присылает "патчи" для статей, причём в основном именно орфографические - что тоже вполне показатель. Наличие орфографических ошибок - это вполне неплохой детектор "настоящей" статьи, однако и смысловые/логические тоже вполне могут быть признаком неопытности и зелености автора. Я как читаю свои первые статьи - в шоке сижу :)
Короче есть ошибки характерные исключительно для человека и которые увидит только человек, LLM пока не может их правильно подделывать.
Если вдруг кому-то из моих читателей интересно, я лично LLM ни разу не использовал ни для оформления, ни для вычитки статей. Просто не вижу в этом смысла.
Зато активно использую LLM для реверс-инжиниринга (DeepSeek очень хорошо справляется с представлением любого известного ему набора набора мнемоник в конкретный алгоритм и может легко распознать большую часть libc и abi-функций по типу софтового деления флоатов) и иногда прошу разжевать сложный матан.
А я использую LLM для поиска опечаток. Потому что спеллчекер в моем любимом Notepad++ ловит опечатки типа "карова", но вот если слово не в том падеже - такое уже не ловит, ведь слово-то правильное, в словаре есть.
А про встроенынй спеллчекер в Firefox я могу много рассказать, но тут материться нельзя. Они лет двадцать не могли сделать поддержку нескольких словарей одновременно (англоговорящих белых людей проблемы индейцев не колышат), а когда таки сделали (через тонкие настройки), то сознательно приняли некоторое решение, которое сделало пользование этим спеллчекером весьма раздражающим занятием...
Так некоторые статьи даже теоретически нельзя написать с помощью LLM: колмогоровская сложность их равна самой статье. Ну, может за исключением форматирования абзацев и прочим штукам-чтобы-человеку-читать-было-удобнее. Ну и разумеется с учетом того, что и статья и тз на нее описаны на одном и том же языке.
И ллм тут может максимум форматирование поправить и предложить абзацы местами поменять, а писать-то что он напишет? Парочку новых для читателя фактов?
Так некоторые статьи даже теоретически нельзя написать с помощью LLM: колмогоровская сложность их равна самой статье.
Ох… ну вот это вот зачем? Во-первых, кого «их»? Нейросетей? Во-вторых, при чем тут колмогоровская сложность вообще?
Сможешь раскрыть что имел ввиду?
Самая большая колмогоровская сложность у текста, сжатого архиватором - и что?
Видимо он имел в виду тот факт, что для написания таких статей (кстати к коду это тоже относится) исходный промпт для нейросети равен или больше самого результата, как по обьему так и по трудоемкости. Архиватор вы не зря упомянули - и что? А то, что хоть сжимай архиватором, хоть что угодно делай, обьем не уменьшится.
Я на вас подписан, и очень люблю ваши статьи по сути. Но вот язык. Иногда кажется, что писалось все для школьников, все вот это «мама я сам похакал» (с) башорг. Или не очень умелые попытки потрогать читателя за ностальгию. Это, как говорит моя старшая дочь «кринге». Но технически очень люблю ваши статьи и жду новых
"В стандарте Rec.601 видео преобразовывалось в цветовое пространство YCbCr".
А стандарт Rec.601 преобразовывал видео в цветовое пространство YCbCr.
Оба варианта кандидаты на теорему Эскобара так-то. Стандарт ничего не делает, это правило/закон/рекомендация (в этом конкретном случае - последнее), поэтому только "в соответствии со стандартом" и чё там у вас по тексту "происходит преобразование". Возможно и в вашей статье есть соавтор, принимающий оплату токенами 😁
Это же надо так не чувствовать язык!
Нейрослоп — слово года 2026
и делал свой проект, и натаскивал там авторов на то, как писать интересно и полезно..
О да, было круто 😉
Вижу свои статьи в списке, спасибо, что не определили в ИИ :)
Ряд приведенных примеров выглядит как перевод с английского ужасного качества. Типа "как Промптом переводили" :-). А теперь промптом (но другим) генерят. Ничего не меняется в мире. :-)
Часто действует правило: В статье ТГ - статья УГ.
Наличие тг канала в статье уже очень сильно повышает вероятность того что статья ради пиара этого самого канала и писалась. И неважно, сам автор налил тонны воды и мусора или облегчил себе задачу при помощи llm.
Судя по бредовой мешанине воспаленного сознания, а именно так я могу назвать полотно сего текста, это писал ИИ?
кто-нибудь видел вживую RCS?
Я видел. И вижу. И регулярно использую.
https://www.rogers.com/support/mobility/messenger-for-android-faqs#some-things-to-know-about-rcs-
Статья – огонь. В отличие от хайпа и попытки собрать карму – отличная человеческая аналитика. Огромная автору благодарность.
Вот по поводу редакции не согласен. Не так много людей в Хабре с текстами работает по таком потоке. Невозможно все отсеять. А вот по поводу читателей – да.
Очень сложно отличить ИИ-слоп от человеческого. Да, там лепёшки, а тут горошинки, но в целом-то одно и то же...
Нерадивый писатель статьи может быть просто плохим переводчиком или использовать ИИ, чтобы переписать статью на что-то более лучшее, что могут не только лишь все.
Проблемы начинаются дальше, когда подобные статьи, человеческие или нет, не топятся в море минусов, а начинают реально обсуждаться и плюсоваться. Поэтому детектор бы очень даже пригодился: бип! бип! данная статья немного слоповата, осторожнее, не ведитесь, он родился с зубами. Было бы здорово...
Простая схема — это загрузка через iTunes? Почему загрузка через iTunes это эффективная схема? Причем тут некий "аудиочип", который и так был в любых плеерах (если понимать под ним ЦАП).
Все комментарии не читал, может кто уже ответил. Как владелец iPod, который всё ещё его использует и уважает за автономность (батарея подустала, но всё ещё работает) отвечу.
iTunes удобно, когда на компьютере есть упорядоченная медиатека. Тогда да, всё просто. Воткнул iPod и всё синхронизировалось. Например, подкасты те же самые, которые iTunes сам скачал, посмотрел, какие прослушаны в девайсе, и удалил их оттуда, новые загрузил. Синхронизируется статистика по воспроизведению, на основании которой строятся умные плейлисты и т.п. И сами плейлисты обновляются и заливаюися. Т.е. да, если настроить iTunes и держать медиатеку в порядке, то это проще, чем закидывать что-то на само устройство руками. Что касается аудиочипа, то имеется ввиду аппаратный ALAC кодек, который позволял реально экономить электричество. Музыка же от Appe сразу шла пожатая этим кодеком. Собственную музыку можно было пожать самостоятельно.
Естественно, с развитием стриминговых сервисов это стало неактуально.
для тех, кто любит ковыряться «под капотом» <...> погружения в Linux-туннели <...>
Это уже совсем пошло...
Если их станет слишком много — я просто уйду.
Возьмите меня с собой. Но куда ?
Спасибо, а то вокруг много людей, которые до сих пор мифологизируют LLM и уверены, что LLM это не экономия времени за счёт качества, а просто экономия времени. Теперь будет куда их направлять.
Смысл вроде понятен — у MiniDV были рекордеры, и вот у этих рекордеров часто был FireWire, через который можно было загружать, потому что стандарт изначально цифровой...
Нормально там всё LLM написала ("возможность напрямую загружать видеозаписи в компьютер через интерфейс FireWire"), а вот эта фраза - кошмар.
Потому что смысл именно в том, что MiniDV видеокамеры можно было напрямую втыкать в компьютер и сливать туда видео. Какие еще "рекордеры у MiniDV" (как это "у"?), они были у полутора человек.
Хорошо, если я обыватель, или же имею слабый уровень критического мышления, наблюдательности, экспертности в данной области. Откуда тогда мне понять где слоп, а где нет? Человек будет читать - ну вроде норм. И потом дальше. И его биологическая нейронка обучится на сомнительных данных и он сам станет полу-слопом. Человеку тогда станет смысл изучать, читать только то что он уже знает. Тогда у него будет какая-то более-менее солидная вероятность определить ЛЛМ это или нет. Написать содержательный комментарий, обогащающий или критикующий статью. Написать самому статью по этой теме. А только он выйдет на чистое поле которое не ведал, то резко понизится вероятность отличить ии от белковой нейросети
Отвечу на вопрос автора " Чо там, кто-нибудь видел вживую RCS? ".
Я не то, что видел, я каждый день использую вместо SMS. Но есть проблема. Они не ходят через спутник. Посему приходится переключатся вручную.
Ложь, падëж и провокация ©
Раньше у нас был ИИ-слоп, его хоть можно было игнорировать. А теперь у нас человеческий слоп, через наслоения которого надо продираться к сути. ИИ хоть старается вести одну тему, а человек — нет.
Редкий пример из приведённых читал без мысли «Да я такое же и от людей из мяса и с органическими мозгами читал». Люди пишут о том, чем не понимают, вот и выходит ерунда. Или просто спешат. Или не наработан навык письма.
Большинство совсем уж странных конструкций, возможно, — результат особенностей генерации русских текстов. Но с кривыми логическими конструкциями, как и грамматическими, отлично справляются и люди.
Боюсь, LLM могут научиться писать нормально раньше, чем люди.
Если бы твой текст сократить раза в три, читать стало бы легче.Совершенно кошмарная графомания. Я бы такие тексты у копирайтера не покупал..
Это же ближе к исследованию. А там подразумевается большое количество примеров. Так можно еще написать, что в тексте одной рифмы, поэтому автор так себе поэт.
Хотите написать лучше? Велком.
Я, как-бы, обьяснял в начале — если я привожу 100500 примеров, то я хочу их привести, не из графомании, а вот потому что хочу, я воплощаю некую мысленную цель в форме статьи.
Мне в целом пофиг, обвинит кто-то меня в графомании или нет, метрика успеха для меня — все еще рейтинг, обсуждение, вовлеченность, комментарии, цитирования.
Речь не о примерах, а как раз о вводной части.
P.S. Было бы "пофиг" не отвечал бы.
Ну, угу, не покупайте такие тексты. Я их и не продаю. Точнее продаю, но на немного другом рынке, нежели просто просто покупка-продаже текста на определенную тему.
Я не очень понимаю, чего вы добиться хотите, какая цель? Высказать мнение? Высказали.
Добиться, чтобы я тексты по-другому писал? Ну, нет, спасибо, пишу как хочу, меня устраивает мой стиль.
Почему отвечаю? Ну, сраться в комментариях прикольно же.
Я просто написал своё мнение по поводу вашего стиля изложения мыслей, которым вы явно гордитесь. Вы недавно в интернете? Никогда не сталкивались с тем, что люди просто высказывают своё мнение в комментариях, не пытаясь чего-то "добиться"? Так привыкайте.
Вот с FireWire непонятки, почему к нему (или он к) прилипло это бюрократическое IEEE 1394. Никто же не пишет так: "... и подключаем его в порт IEEE 1284 (его также называют параллельный порт и центроникс). ..."
Интересно мнение автора о статье "Связь кофе и аритмии. Первое в мире исследование": https://habr.com/ru/articles/965068/.
Отличная статья и очень своевременная тема. Я бы только посоветовал сократить вводную часть. Не надо так долго оправдываться: дурак всё равно не поймёт, а умному это ни к чему.
Ну и парочка дополнений по содержательной части:
(1) Некоторые из приведённых примеров - это скорее всего не LLM, а просто косяки машинного перевода (пример про "магнитные вариации"). Конечно, это не меняет сути: косяк есть косяк. Но ради исторической точности стоит заметить, что корявые машинные переводы отдельных фраз стали массово появляться в текстах задолго до появления LLM. И даже в изданных переводных книгах такое встречается уже много лет (мой любимый пример - когда вместо "подопытных кроликов" появляются "гвинейские свиньи").
(2) То же самое касается избыточной точности типа "около 4,76 см в секунду". Понятно, что авторы таких "точных" текстов обычно тырят данные из какого-нибудь руководства или Википедии. Но для этого не нужна LLM, многие до сих пор занимаются ручной копипастой.
(3) А вот нелогичные склейки и фактические ошибки - это действительно больше похоже на следы LLM. Причём вам ещё везёт, поскольку вы имеете дело с техническими текстами, где такие вещи легко проверить - и предъявить как проблему. Гораздо хуже тем, кто пытается выявить использование LLM в художественной литературе. Там подобные косяки всегда могут списать на "авторский стиль" или просто сказать "это же фантастика".
Хотя в целом методы выявления нейронок там аналогичные. Я буквально неделю назад написал пост на эту тему, можете сравнить: https://lexa.livejournal.com/783072.html
Гораздо хуже тем, кто пытается выявить использование LLM в художественной литературе. Там подобные косяки всегда могут списать на "авторский стиль" или просто сказать "это же фантастика".
Если можно списать и оно все равно - то зачем выявлять? Ну пишет книги не живой человек, а киборг - и черт с ним, если читают. А если не читают - то от того, что он целиком живой, лучше никому не станет.
Ну, могу навскидку назвать три проблемы, которые создаются такой "бомбой в руках обезьяны":
Мошенничество. Активно процветает на "Амазоне": скамеры заливают туда автоматически сгенеренные книжки типа "новый том Гарри Поттера". Туда же наливаются ботами фейковые отзывы. Поиск выдаёт эту книжку в первых строках выдачи, люди покупают подделку. Раньше для производства подделки требовалось повозиться руками. Сейчас фейки "под бестселлер" появляются за следующий день после публикации оригинала.
Замусоривание. Вы как вообще книги для чтения выбираете? Читаете "ознакомительный фрагмент"? Так его можно сделать очень привлекательным и человеческим (первые пять страниц), а дальше запросто гнать генерёнку. То есть опять вариант номер 1 - вы купили книгу, вас надули. Ладно, тогда другой вариант выбора: сначала послушать, какие книги советует уважаемый кто-то. Но тогда этот кто-то должен сначала прочитать все новые книги. А кто будет успевать их читать, если книги будут генерироваться с пулемётной скоростью? То есть общее качество текстов сильно падает, отбор не работает, найти приличную книгу гораздо трудней.
Повреждение психики. Машинные форматы очень сильно влияют на человеческий язык. Многие люди начнут говорить на уродливом языке LLM раньше, чем она начнёт говорить на нормальном русском языке. Ну а язык, конечно же, влияет на мышление. Банальный пример: многие ИБшники сейчас употребляют идиотское выражение, рожденное машинным переводом - "вредоносная полезная нагрузка" - и они искренне не понимают, почему я ржу, когда это слышу. Но это слишком наглядный пример. Многие машинные форматы оседают в головах очень незаметно. Сегодня ты ещё усмехаешься над корявым машинным текстом, а завтра окажется, что ты говоришь точно так же - и уже не проходишь тест Войта-Кампфа.
Вы как вообще книги для чтения выбираете?
Смотрю на рекомендации. За долгий срок.
А кто будет успевать их читать, если книги будут генерироваться с пулемётной скоростью?
Никто. И не надо. Выбираем из того, что 'кто-то' уже прочитал. Если не гнаться за новинками - работает.
найти приличную книгу гораздо трудней.
Я вас умоляю. Художественных книг уже столько, что даже если перестать читать все новое - до конца жизни хватит. Если избавится от подхода 'хочу самое лучшее', а начать 'Берем первое попавшееся по рекомендациям, Начинаем читать. Не понравилось - в корзину ее' - проблема выбора резко проподает.
Повреждение психики. Машинные форматы очень сильно влияют на человеческий язык.
...
а завтра окажется, что ты говоришь точно так же
И пусть. Я, например, был бы вполне доволен, если бы 'LLM'-ый машинный формат статей с большим преобладанием списков стал более популярен. Ибо незачем совершенно лишней воды наливать. Скажи сразу, чего ты там хочешь передать, а не разбавляй текст шутками да прибаутками.
"вредоносная полезная нагрузка" - и они искренне не понимают, почему я ржу
Почему, кстати, идиотское? Ясно же, что "вредоносная" - это с точки зрения одного, а "полезная" - это с точки зрения другого. Смысл согласовывается с разными субъектами.
>Художественных книг уже столько
Это верно. Мне вот подарили на день рожденья собрание сочинений Паустовского, и я с удовольствием его читаю. Тем не менее, иногда хочется видеть хорошие современные книги. Написанные современным языком о современных проблемах. И вот тут получается какое-то болото.
Особенно если взять ту же научную фантастику, которая иногда неплохо прогнозирует. Вернее, раньше прогнозировала. Особенно во второй половине XX века, когда "холодная война" велась и на фронте образов будущего, так что конкуренция и отбор с обеих сторон "занавеса" выбросили на поверхность множество отличных авторов. В нынешнем рыночном болоте вы таких книг не найдёте - ну по крайней мере, так легко не найдёте, как находилась хорошая НФ в конце XX века.
>машинный формат статей с большим преобладанием списков v
Я понимаю, что программистам это понятнее. Ибо программисты уже приучены к такой структуре данных долгими годами работы с бесконечными линейными списками. Но скажу вам по секрету - это одна из самых примитивных структур в организации информации и мира вообще. Хорошая литература как раз учит видеть более разнообразные связи предметов и явлений.
>Почему, кстати, идиотское?
Да хотя бы потому, что в оригинальном слове payload нет ничего "полезного". Кривой перевод, ставший массовым, взят из одного очень частного случая. И конечно же, он не подходит ко всем случаям. Это может переводиться как "карго" или "боезаряд", например.
Особенно если взять ту же научную фантастику, которая иногда неплохо прогнозирует.
А вот про это я уже давно пришел к выводу, что про художественную литературу надо старательно, еще со школы, вбивать в головы 'это придуманный мир с придуманными людьми с придуманными мыслями и придуманными законами мира. К реальному миру - отношения не имеет, пока не показано обратного. Вот абсолютно никакого, хотя это местами и кажется'. (На практике делают наоборот, рассуждая о условном герое так, как будто он реальный человек, и вопросом применимости показанных примеров и последствий его действий к реальной жизни почти не задаются)
Вот как у нас сейчас нейросетки удачно и правдоподобно галлюционируют - то же самое явление, только написано людьми.
А прогнозирование - это добро пожаловать в разную публицистику с нормальными цепочками рассуждений.
Да хотя бы потому, что в оригинальном слове payload нет ничего "полезного".
Устоявшийся же перевод, а не только у ИБ? Так что почему бы и нет?
Ещё раз - устоявшийся в одной сфере не означает правильный для всех остальных. Эдак вы еще начнете говорить «полезная нагрузка атомной бомбы». Отсюда один шаг до оправдания атомных бомбардировок. Вот это и будет искажение психики через машинный язык.
Слово «полезная» - это оценочная категория. Причем очень субъективная. Зачем её добавлять, если речь идет просто про «груз» или «багаж»?
Отсюда один шаг до оправдания атомных бомбардировок. Вот это и будет искажение психики через машинный язык.
Только если забывать, что оно всегда "полезно для..." (даже если для чего именно прямо в предложении не озвучивается).
Причем очень субъективная. Зачем её добавлять, если речь идет просто про «груз» или «багаж»?
Я так понимаю, потому что там еще прочая нагрузка есть, которая не багаж и не 'полезная'. Но которая все равно место/ресурсы (от багажа) отнимает.
Условно "Общая нагрузка такая-то, из нее полезной столько-то".
>>4/0 Кардинально меняем звучание гитарного звукоснимателя (ну тут вообще чувак увлеченный, там опять серия статей)
Вроде как это чувиха, а не чувак.
Может если посещаемость упадет, они начнут беспокоиться.
Не начнут.
Ибо не начали беспокоится ни после эпохи Великого Разрыва, ни после эпохи Великого Объединения, ни после победы расы Корпоратов.
Вроде всё хорошо поначалу. А потом я вижу "Тоже самое".
Магнитные.. что? Это слово не применятся в таком контексте никогда.
Закидайте меня хоть камнями, хоть чем-нибудь ещё. Но не похож данный пример на нейросеть. Я не знаю откуда именно брались данные примеры, возможно из настоящих статей. Но тут больше похоже, будто статью, откуда брался данный пример, писал копирайтер, который понимают техническую часть, но не знает терминов. Человек пытался подобрать аналогию к термину, который не знает, но понимает. Была бы это LLM, то она написала бы технически грамотный термин в данном примере, ибо LLM в контекст в человеческом понимании не может. Она текст предугадывает по связям токенов выработанным обучением по датасету. И уж если LLM выбрала именно эту терминологию, то значит в данном контексте с данными словами она когда-то уже применялась.
Теперь страшно, а сама ли статья от автора, или тоже с элементами слопа
По-моему, огромный процент людей совершают те же логические ошибки и не умеют излагать мысль. Плюс, раньше просто клепали из отрывочных фактов из инета (боже, неужели это было всего пару лет назад?)
Кстати, когда вы совершали грамматические ошибки в своём тексте, это было осознанно?
Минус — это типичное проявление вахтерского синдрома. Люди, которые готовы поставить минус (под любым, пусть самым благовидным предлогом) — постороннему человеку, или его труду (пусть сочиненным на пару с ллмкой) — мусор, с ними нужно стараться никогда не оказываться в одной комнате, районе, городе, стране.
Если мне понравилась статья или комментарий, она была полезна или товарищ высказал то, что я сам только что хотел высказать - не поленюсь, нажму плюсики везде, где можно. Да, остальных хабраколлег тоже прошу - увидели хороший комментарий, не поленитесь плюсануть в карму - вам это ничего не стоит, а кому-то по ту сторону монитора будет немного приятнее.. Иногда комментарии под статьей ценнее самой статьи.
Но если там неверные сведения или статья просто представляет собой "воду с мусором" (с) - очередной калейдоскоп банальностей и галлюцинаций, сгенерированный нейросетью - то за свое потраченное зря время жизни мне обидно >:-ЕЭ
Плюсики я тоже жму везде. А если текст — говно, гораздо полезнее овладеть навыком распознавать его с первых слов и пропускать, чем тратить время на любое взаимодействие с ним. Кроме того, я несчетное количество раз видел заминусованные хорошие тексты, так что и аргумент «я помогаю обществу» — тоже так себе. «Their tastes may not be the same», — как однажды примерно по этому поводу сказал Бернард Шоу.
Копирайтер здорового человека. Finally. Спасибо за разбор. Но не могу не отметить, что сотни раз встречал подобные логические скачки в совершенно человеческих текстах (и в речи тоже). Причем человек искренне не понимал, в чем проблема.
ПыСы: Почему-то, читая статью, представлял вас в образе Кристиана Бейла из "Игры на понижение"))
Представьте себе такую картинку. Студия. В студии несколько человек и LLM. Произносится слово (для людей это слово, для LLM последовательность символов из заданного алфавита ) - "шляпа". У одного человека рождается образ дамы в старинной дамской шляпке. У другого - соломенная шляпа на голове лошади, у третьего - кривой код попавший в прод. В "голове" LLM светится последовательность символов "Ш Л Я П А" и у нее тысячи связей разной "толщины" и с разными дополнительными условиями с "Л О Ш А Д Ь", "В И Н Т А Ж", ...
Одно из печальных последствий. Я учился писать, читая лучшие образцы (классическая литература, статьи в тематических журналах от специалистов и т.п.) На чем будет учиться молодежь ? Предвижу деградацию и ненасильственное окончательное рабство прола (1984) от машин.
У вас тоже возникла идея: скидывать эту статью в нейронку перед генерацией текста?)
В общем случае, невозможно отличить сгенерированный ИИ текст от написанного человеком. Я считаю, это распространённое заблуждение.
Согласен, у нас есть несколько бросающихся в глаза критериев, по которым мы с большой вероятностью отличаем ИИ-слоп, вроде тех, что описаны в статье. Но у нас нет чётких доказательств, что именно эти тексты и только они сгенерированы. Мы не знаем, сколько сгенерированных статей не попадают под эти критерии. Мы не знаем, сколько похожих на сгенерированные статей на самом деле написаны людьми.
Уверен, что возможно писать отличные статьи с помощью ИИ. Нужны мощная современная модель, продуманный системный промпт и последующее ручное редактирование. Проблема в том, что большинство ИИ-авторов не заморачиваются над этим, ведь и так прокатывает.
Дальше будет только хуже. Нейросети с каждым годом становятся все более мощными и все лучше учатся имитировать написание текста человеком. С другой стороны, люди привыкают читать сгенерированные тексты и пишут все более похоже на ИИ.
В конечном итоге, я считаю, не имеет значения, написан ли пост самостоятельно человеком или с помощью нейросети. Проблема вообще не в этом. Копирайтеры до эпохи ИИ тоже писали статьи, не проверяя факты, наливая воды и с поверхностным пониманием.
Какие вообще критерии крутой статьи? Релевантный личный опыт или мнение автора, полезная информация, комфортное чтение, увлекательное повествование. Если подумать получше, наверно, какие-то ещё. Вот на них и стоит смотреть. Критерий "написано без поддержки ИИ" в мой список не входит.
Человек может сделать что-то интересное, рассказать об этом боту и попросить оформить в статью для Хабра. В выводе нейросети отредактировать расхождения с реальной историей, дать прочитать его своим друзьям и внести исправления в ответ на их критику. В результате получится отличная статья.
С другой стороны, можно напрямую опубликовать свой бессвязный поток мыслей без редактирования, и статью невозможно будет читать. Далеко не все люди обладают навыком красноречия, хотя могли бы рассказать много интересного. Или можно переписать чужую статью своими словами, не добавляя ничего нового от себя. Или можно написать статью, вводящую читателей в заблуждение на основе неверной интерпретации фактов. Да много есть способов, как люди писали и пишут ужасные статьи, не обращаясь к ИИ.
С распространением нейросетей изменилось только то, что генерировать статьи стало резко проще всем. А проблемы с содержанием остались те же, что были и раньше.
Вы не сможете это развидеть: краткий гайд по определению LLM-текстов на Хабре