Обновить
5
0

Пользователь

Отправить сообщение

Такое чувство, что вы пишете из Северной Кореи. А книга, как можно заметить, написана в России. Где одни люди могут свободно топить против анонимности, а другие - столь же свободно писать книги под псевдонимами. Совершенно непонятно, с чего вы предлагаете этим людям какие-то ваши выборы. Может, это вас мучает травмирующий опыт? А ваш псевдоним - это следствие многолетней работы в коммунистическом подполье?

Вместо сочинения такого длинного комментария вы могли набрать очень короткий запрос в поисковике - и через несколько секунд узнать реальные имена авторов. Но вы пишите, пишите. На Хабре любят длинные дискуссии за справедливость.

Интересно, а в женщинах вам тоже интересны "знания"? Тогда вам и вправду достаточно "Нетфликса" вместо реальных женщин.

Но вообще-то многие нормальные люди до сих пор ценят ещё такую вещь, как удовольствие. Бумажные, качественно изданные книги гораздо приятнее читать, чем пялиться в экранчик смартфона.

Смешной коммент от чувака с ником Maccimo. Типа под итальянца косить это круто, а под серба прям низзя?

Видимо, вы просто не в курсе, что «цифровое» давно уже стало синонимом «ширпотреба для нищебродов». Реальные пацаны читают книги на качественной бумаге. И музыку слушают с винила, а не в mp3-плеере из ларька у метро. Ну самое тяжелое для вас - женщины у этих пацанов настоящие, а не цифровые, как у вас.

Там всё хитрее: в этой книге Лаборатория Касперского не упомянута НИ РАЗУ.

Так что, формально говоря, никакого признания нет )

Да никого они не нагибают. Потому что сеошники давно уже начали затачивать свои сайты под ИИ-агенты, а не только под поисковые запросы людей. Так что в «нужном ответе» может быть не меньше мусора, чем в ссылке на фейковый сайт.

Ещё раз - устоявшийся в одной сфере не означает правильный для всех остальных. Эдак вы еще начнете говорить «полезная нагрузка атомной бомбы». Отсюда один шаг до оправдания атомных бомбардировок. Вот это и будет искажение психики через машинный язык.

Слово «полезная» - это оценочная категория. Причем очень субъективная. Зачем её добавлять, если речь идет просто про «груз» или «багаж»?

>Художественных книг уже столько

Это верно. Мне вот подарили на день рожденья собрание сочинений Паустовского, и я с удовольствием его читаю. Тем не менее, иногда хочется видеть хорошие современные книги. Написанные современным языком о современных проблемах. И вот тут получается какое-то болото.

Особенно если взять ту же научную фантастику, которая иногда неплохо прогнозирует. Вернее, раньше прогнозировала. Особенно во второй половине XX века, когда "холодная война" велась и на фронте образов будущего, так что конкуренция и отбор с обеих сторон "занавеса" выбросили на поверхность множество отличных авторов. В нынешнем рыночном болоте вы таких книг не найдёте - ну по крайней мере, так легко не найдёте, как находилась хорошая НФ в конце XX века.

>машинный формат статей с большим преобладанием списков v

Я понимаю, что программистам это понятнее. Ибо программисты уже приучены к такой структуре данных долгими годами работы с бесконечными линейными списками. Но скажу вам по секрету - это одна из самых примитивных структур в организации информации и мира вообще. Хорошая литература как раз учит видеть более разнообразные связи предметов и явлений.

>Почему, кстати, идиотское?

Да хотя бы потому, что в оригинальном слове payload нет ничего "полезного". Кривой перевод, ставший массовым, взят из одного очень частного случая. И конечно же, он не подходит ко всем случаям. Это может переводиться как "карго" или "боезаряд", например.

Ну, могу навскидку назвать три проблемы, которые создаются такой "бомбой в руках обезьяны":

  • Мошенничество. Активно процветает на "Амазоне": скамеры заливают туда автоматически сгенеренные книжки типа "новый том Гарри Поттера". Туда же наливаются ботами фейковые отзывы. Поиск выдаёт эту книжку в первых строках выдачи, люди покупают подделку. Раньше для производства подделки требовалось повозиться руками. Сейчас фейки "под бестселлер" появляются за следующий день после публикации оригинала.

  • Замусоривание. Вы как вообще книги для чтения выбираете? Читаете "ознакомительный фрагмент"? Так его можно сделать очень привлекательным и человеческим (первые пять страниц), а дальше запросто гнать генерёнку. То есть опять вариант номер 1 - вы купили книгу, вас надули. Ладно, тогда другой вариант выбора: сначала послушать, какие книги советует уважаемый кто-то. Но тогда этот кто-то должен сначала прочитать все новые книги. А кто будет успевать их читать, если книги будут генерироваться с пулемётной скоростью? То есть общее качество текстов сильно падает, отбор не работает, найти приличную книгу гораздо трудней.

  • Повреждение психики. Машинные форматы очень сильно влияют на человеческий язык. Многие люди начнут говорить на уродливом языке LLM раньше, чем она начнёт говорить на нормальном русском языке. Ну а язык, конечно же, влияет на мышление. Банальный пример: многие ИБшники сейчас употребляют идиотское выражение, рожденное машинным переводом - "вредоносная полезная нагрузка" - и они искренне не понимают, почему я ржу, когда это слышу. Но это слишком наглядный пример. Многие машинные форматы оседают в головах очень незаметно. Сегодня ты ещё усмехаешься над корявым машинным текстом, а завтра окажется, что ты говоришь точно так же - и уже не проходишь тест Войта-Кампфа.

Отличная статья и очень своевременная тема. Я бы только посоветовал сократить вводную часть. Не надо так долго оправдываться: дурак всё равно не поймёт, а умному это ни к чему.

Ну и парочка дополнений по содержательной части:

(1) Некоторые из приведённых примеров - это скорее всего не LLM, а просто косяки машинного перевода (пример про "магнитные вариации"). Конечно, это не меняет сути: косяк есть косяк. Но ради исторической точности стоит заметить, что корявые машинные переводы отдельных фраз стали массово появляться в текстах задолго до появления LLM. И даже в изданных переводных книгах такое встречается уже много лет (мой любимый пример - когда вместо "подопытных кроликов" появляются "гвинейские свиньи").

(2) То же самое касается избыточной точности типа "около 4,76 см в секунду". Понятно, что авторы таких "точных" текстов обычно тырят данные из какого-нибудь руководства или Википедии. Но для этого не нужна LLM, многие до сих пор занимаются ручной копипастой.

(3) А вот нелогичные склейки и фактические ошибки - это действительно больше похоже на следы LLM. Причём вам ещё везёт, поскольку вы имеете дело с техническими текстами, где такие вещи легко проверить - и предъявить как проблему. Гораздо хуже тем, кто пытается выявить использование LLM в художественной литературе. Там подобные косяки всегда могут списать на "авторский стиль" или просто сказать "это же фантастика".

Хотя в целом методы выявления нейронок там аналогичные. Я буквально неделю назад написал пост на эту тему, можете сравнить: https://lexa.livejournal.com/783072.html

"Полдень" Стругацких был ответом на "Туманность Андромеды". Как сейчас сказали бы - это фанфик. Причём фанфик довольно вялый: если у Ефремова были описаны действительно новые люди, новый вид социума и новые виды угроз (например, техногенная монокультура), то мир Стругацких не особенно отличался от жизни советской богемы 60-х, со всеми их мелкими кухонными проблемками.

Поэтому рассказывать о Стругацких как о "миротворцах", и при этом не упоминать Ефремова - это всё равно что расхваливать Ника Перумова, не упоминая Толкина.

Иными словами, аргументы кончились и слив засчитан?

Ну, тогда добавим второй косяк, после которого статью уж точно можно не дочитывать (ну бывает, человек разок облажался, можно пропустить - но дважды это уже чёткий сигнал)

>Это уровень Толкина, Роулинг, Гомера и Стругацких. 

Вот эта строчка совсем бредовая. Толкин и Роулинг - действительно создали свои миры. Гомер собственных миров не создавал, он - собиратель и аранжировщик народных мифов (в которых жили все греки его времени). А Стругацкие вообще никаких новых миров не создавали: более того, их узнаваемый стиль заключается в том, что в каждом романе герой трусливо зависает перед дверью в новый мир.

А вот Иван Ефремов в "Туманности Андромеды" действительно создал новый мир. Но автор поста не может цитировать Ефремова. Ведь он читает только антисоветские книги.

Конечно могу. Книжка "Атлант расправил плечи" показалась мне наскволь фальшивой ещё до того, как я узнал историю её автора. Тот же американский индивидуализм гораздо грамотнее и реалистичнее показан у Теодора Драйзера. Во всей красе показан: когда люди ради своего личного успеха гробят других, даже близких. Не хуже писал на ту же тему и Джек Лондон. Честно и жёстко. Настоящие американцы, которые свою страну знали.

После этого поневоле удивишься - почему так сильно раскручена фальшивая иммигрантская сказочка под названием "Атлант расправил плечи"? Идешь читать историю автора... и тут понимаешь, какой тут работает вентилятор. Сначала "Красная пешка", а потом вот это всё.

Так что это скорее к вам вопрос: способны ли вы оценить текст отдельно от огромной пропагандистской машины, которая этот текст раскрутила и вам подсунула - вместо Драйзера и Джека Лондона?

Так ведь было с Оруэллом: когда вышел "1984", сами британцы плевались и писали, что это там всё содрано у Замятина ("Мы") - и сюжет, и герои, и устройство общества. Причём содрано на 20 лет позже Замятина, когда уже и не актуально нифига.

Однако тут к делу подключились американские "кураторы", которым очень надо было ответить на успехи Советского Союза. Идите почитайте, кто спонсировал выпуск мультфильма "Скотный двор". Те же самые кураторы включили "1984" в школьную программу. И вуаля - унылая и вторичная страшилка вдруг везде становится "классикой".

На таких книгах, кстати, очень легко выявить, насколько у человека действительно есть литературный вкус. Я же говорю: вы запороли свою статью с самого начала, упомянув "Атланта" рядом с Библией и Кораном. Дальше можно не читать. Если автор так обделался, он вряд ли что-то еще вменяемое может сказать о литературе.

>Это уровень Корана и Библии, Капитала и Проснувшегося Атланта

На этой фразе я понял, что дальше можно не читать. Но все-таки давайте для широких масс поясним. Какой-такой Проснувшийся Атлант? Неужели антисоветская агитка Анечки Рэнд? В которой все герои неимоверно фальшивые, но зато повестка (прославление индивидуализма) отработана на пять с плюсом? От этого Анечка причислена к лику небожителей?

"Он устроился работать с подростками — помогать им не сходить с ума в мире, где ты никому не нужен"

Что за сопливая концовка? Клинический лузер писал, что ли? Должно быть так:

""Он устроился работать с подростками — учил их быстро бегать, метко стрелять, вырубать роботов-доставщиков одим ударом фомки, взламывать любые сети обычной сапёрной лопаткой и делать многие другие вещи, которые ИИ делать не умел, потому что у него рук нет, да и ног тоже".

Ну, это не худший случай. Помнится, на первой Интернет-премии (ныне Премия Рунета) компания Яндекс победила в шести номинациях, включая «Человека года»… им оказался Аркадий Волож из Яндекса, который одновременно оказался и председателем жюри конкурса. И за 20 лет ничего не изменилось. Хочешь заранее узнать победителей Премии Рунета? - просто посмотри список компаний-спонсоров.

Здешний конкурс пока не дошел до такого размаха… Ну, подождём. Наверняка у профессора Воронцова ещё много учеников. Можно их награждать год за годом.

Но всё-таки банку ВТБ стоило бы подумать о своей репутации - поаккуратнее организовывать такие промо-акции. В анонсе написано, что жюри получит Топ-10 рассказов. Ну так расскажите нам, кто был в жюри, кроме профессора Воронцова? И видело ли жюри все 10 топ-рассказов? Или оно видело только один рассказ, прославлявший Воронцова в первых же строках?

она передаётся от человека к человеку таким же примерно способом, каким она передаётся от человека к ИИ - текстами и картинками.

Думаю, у вас нет детей. Иначе бы вы знали, что модель мира не «передается текстами и картинками». Ребенок обучается ходить задолго до того, как начинает говорить. И кстати, умение ходить на двух ногах - гораздо сложнее, чем умение говорить (именно поэтому у нас куча чатботов, но никаких двуногих роботов вокруг нет). Так вот, ребенок бы не научился ходить, отличать своих от чужих, и много ещё чего - если бы у него не было модели мира. Которая задолго до текстов строится.

И кстати, я думаю, что детей типа Маугли вы тоже не встречали. Это вроде красивой легенды - из которой вы почему-то берете только одну часть. Ну да, Маугли в сказке Киплинга не умел говорить на человеческом языке. Но он умел многое, чего человек не умеет. На звериных языках говорил, придумывал планы для победы над врагами. Выходит, умел строить именно модели мира. А не модели текста.

Зачем брать фантастического Маугли (даже неизвестно, какими свойствами вы его наделили), если можно взять обычного человека. Допустим, человека обучили, что Земля -плоская. Во всех книгах это написано. Однако человек замечает нестыковки с другими данными и ощущениями, особенно если он занимается астрономией или хотя бы мореплаванием. И в итоге он строит другую модель мира, более адекватную (практически полезную для жизни).

А что происходит в случае LLM? Тут всё останавливается на том, что написано в текстах. Земля плоская. Точка. Никакой мультимодальности данных. Никакой мультиагентности разумов (когда ощущения и интуитивный опыт спорят с традицией и логикой). И самое главное - никакого стимула для смены чужой заученной модели на другую (а зачем?)

Короче, они не строят модель мира. Они строят модель текста. Разница может быть незаметна для тех, кто верит текстам. Для остальных разница есть.

Нет. Эмбеддинг - это способ ввести грубую метрику для определения "близости" слов в некотором понятийном аппарате. Но это не смысл. Вы можете с помощью эмбеддинга научить машину, что "соль" и "перец" близки как специи. Но это не передаёт смысл использования таких специй в рецепте (например, то, как именно они меняют вкус).

Да, можно прописать и более сложные отношения между понятиями (включая тот же вкус). Но построение таких семантических сетей - это уже не текстовая нейронка, которая просто подбирает самые частотные сочетания слов (как ChatGPT и другие LLM). Это будет другая архитектура ИИ.

А здешняя дискуссия посвящена буму нейронок. И в комментарии, на который я ответил, утверждается, что системы типа ChatGPT уже умеют строить внятные модели мира и даже обладают theory of mind (то есть могут моделировать собеседника). Это конечно чушь. LLM в принципе не строят никаких "теорий".

Информация

В рейтинге
5 874-й
Зарегистрирован
Активность