DataSecrets25 окт 2024 в 13:36

Выяснилось, что LLM могут считать, что 9.8 < 9.11, из-за Библии, физики или даже теракта 11 сентября

3 мин

52K

Искусственный интеллектМашинное обучение *

+24

Комментарии 73

CitizenOfDreams 25 окт 2024 в 13:46

Искусственный интеллект, воспитанный Экселем?

BloodyR00t 25 окт 2024 в 13:55

Вероятно Llama просто не особо докручена, chatgpt последний не затупил)

plFlok 25 окт 2024 в 14:28

У них было одно время, что бот явно показывал, что для математических вопросов пишет программу на питоне, запускает, а потом интерпретирует ответ.

Сейчас это скрывают, но механизм мог остаться

baldr 25 окт 2024 в 15:48

Какой питон вышел позднее - 3.8 или 3.11 ?

R08 25 окт 2024 в 16:36

- Какая версия Python вышла позже: 3.15 или 3.8? - Python 3.15 вышла позже версии 3.8. Python 3.8 была выпущена в октябре 2019 года, а Python 3.15 — в октябре 2024 года.
Такие дела...

baldr 25 окт 2024 в 16:55

Мой ЧатГПТ, в общем-то, лучше отвечает.

R08 25 окт 2024 в 17:09

"Мой ЧатГПТ, в общем-то, лучше отвечает"
Это мы уже меряемся или еще нет? :)
По теме, я бы предположил, что изначально запрос "3.11" или "3.8" может рассматриваться как дата или текст, и только потом как число. Если в запрос включать "какое число", то ответ становится правильным. А вот на счет версий Python - как ни крути "мой" верит в существование 3.15. И только на запрос "Какая последняя на данный момент выпущенная версия Python?" дает верный ответ. В целом по опыту использования, ответы на альтернативные вопросы чаще оказываются неверными, чем ответы на открытые вопросы.

BloodyR00t 25 окт 2024 в 18:08

Похоже на то, потому что расписывая алгоритм он поплыл)

RTFM13 26 окт 2024 в 13:33

А что не так?

w0lkolak 26 окт 2024 в 10:43

Только что gpt3 получил задачу решенную gpt4 с другими исходными данными, ответил что это слишком сложный анализ и выдал в подтверждение ссылку на python простыню

НЛО прилетело и опубликовало эту надпись здесь

alan008 25 окт 2024 в 20:09

Какая-то пьяная модель )

НЛО прилетело и опубликовало эту надпись здесь

ts347 26 окт 2024 в 04:24

Что больше 9.8 или 9.11

Над нейросетью издеваться никто запретить не может, но при общении с людьми лучше всё-таки использовать знаки препинания.

Hoy_cMoKuHr 28 окт 2024 в 05:33

А если спросить почему он так думает, он что, забыл о библии или терактах?

Wwyn 26 окт 2024 в 18:46

Скорее пастырем

ab1 25 окт 2024 в 14:05

datacompboy 25 окт 2024 в 14:13

Ссылки на статью не будет, только 50 ссылок на телегу? И ссылка "на источник" только для галочки?

Fox_exe 25 окт 2024 в 14:15

А вся ошибка в том, что нейронка не поняла, что ей написали два числа, а не текст или даты или ещё что-то другое. Хотя, по идее, она должна была "догататься", т.к. пользователь просит сравнить "что больше" - термин применим преимущественно к числовым значениям.

Хех, ну прям извечная проблема динамической типизации из мира интерпретируемых языков...

Kalobok 25 окт 2024 в 14:39

нейронка не поняла, что ей написали два числа

Не уверен, что именно так. Попробовал на копайлоте - на запрос "compare 9.8 and 9.11" он просит уточнить контекст, посколько 9/11 - это дата, а 9.8 может быть много чем. На запрос "compare numbers 9.8 and 9.11" отвечает неправильно, хотя неоднозначностей не должно быть. На вопрос "compare numbers 9.80 and 9.11" отвечает правильно.

PS Кстати, если сравнивать 9.12 и 9.9 результат аналогичный.

Fox_exe 25 окт 2024 в 16:21

А если попросить сравнить не просто как числа, а как "десятичные" или "дробные" числа?

Похоже нейронка "отравлена" таким понятием, как "версия программы", где 9.11 действительно будет больше, ведь представляет собой не одиночное число, а группу чисел, сравниваемых последовательно.

Kalobok 25 окт 2024 в 16:37

Копайлот начинает нести пургу. Вроде, основной ответ правильный, но все рассуждения на тему ошибочные.

compare floating point numbers 9.9 and 9.12
Copilot
Sure, let’s dive in:
Numerically: 9.12 is less than 9.9.
Precision: Both are precise to two decimal places, so they're essentially "apples to apples."
In any calculations or measurements, 9.9 is slightly higher than 9.12. What’s the context for this comparison?

Что интересно, если взять числа, которые не могут быть датами, все работает как надо:

compare numbers 13.9 and 13.54
Copilot
Alright, here's the lowdown:
Numerically: 13.9 is greater than 13.54.
Precision: 13.54 has more decimal places, making it more precise, but in terms of value, it’s still less than 13.9.
In any numerical context, 13.9 beats 13.54. Anything specific driving this curiosity?

Wesha 26 окт 2024 в 07:39

Нейронки нельзя считать умными, пока они не дадут

классический ответ

— Изя, что больше — 4,8 или 4,11?
— А мы покупаем или продаём?

k4ir05 27 окт 2024 в 01:14

Напрашивается вывод, что рассуждения не связаны с ответом, а просто генерируются отдельно.

urvanov 26 окт 2024 в 05:14

Excel тоже постоянно этим страдает

urvanov 26 окт 2024 в 05:14

Excel тоже постоянно этим страдает

Kenshouten 28 окт 2024 в 04:55

В английском "bigger" может ещё значить "более значительное" и применимо к сравнению даже мелкого и мягкого. Например , What's bigger, interstellar travel or Pokémon?

KionX 25 окт 2024 в 14:53

Блин. Да тут на самом деле всё очевидно.
Сначала в сеть закачивают ~15 терра-токенов говна из интернета.
Потом чёта настраивают. Потом приходит неизвестно кто.
И задаёт вопрос про своих тараканов в голове. Плюс высокая температура сэмплера.
Ну результат закономерный. Сетка теряется в догадках чё от неё хотят.

Wesha 26 окт 2024 в 07:41

чё от неё хотят

Счастья, всем, даром, и пусть никто не уйдёт обиженным!

Dimsml 25 окт 2024 в 15:42

Ага, а ещё сортировать номера можно в лексикографическом порядке, там 9.8 идёт как раз перед 9.11. Учитывая, что это привычный способ нумерации в некоторых документах, а также что это логичный способ организовать номера, если в системе токеном является слово или группа символов, а не отдельный символ, то ничего удивительного тут не вижу.

Как систему построили, так она и работает.

CBET_TbMbI 25 окт 2024 в 16:47

Это всё ерунда. Эксель вообще считает и то, и то датами.

nidalee 26 окт 2024 в 03:22

What does Excel have in common with an incel? They both think something's a date when it isn't.

yri066 25 окт 2024 в 17:14

Если рассматривать как номера версий, то получается 9.8 (девять.восемь) и 9.11 (девять.одиннадцать), то второе число больше

runapa 25 окт 2024 в 17:49

А проблема свиных крылышек так и не решена...

unC0Rr 26 окт 2024 в 07:09

А что с ними не так?

palyaros02 26 окт 2024 в 12:21

Свиные крылышки - реальное блюдо. Гуглите pork wings. Поэтому когда просят рецепт "свиных крылышек" она закономерно его выдает.

runapa 26 окт 2024 в 18:40

Ну да, выдаёт. Только на английском оно пишет о pork shanks, а на русском предлагает взять килограмм свиных крыльев.

Wesha 27 окт 2024 в 04:18

Это Вы его ещё о буйволиных крылышках не спрашивали...

phlykov 26 окт 2024 в 03:57

Какие "Жигули" появились раньше, 2106 или 2104? 😆

bosco 26 окт 2024 в 04:37

Легко ведь саму нейросеть спросить почему. И в ответе будет видна вся ошибочная цепочка.

Я почему-то спросонья и сам долго думал что в статье ошибка и 9.11 должно быть больше 9.8, хотя у меня инженерное образование и отлично по матану.

HellQwer 26 окт 2024 в 11:15

Я тоже. И даже маме статью скинул без каких либо комментариев, она так же сама сказала. Мне кажется, что 9.11 воспринимается как девять одиннадцать, а 9,11 - девять и одиннадцать сотых. Отсюда ошибка. Вряд ли я думаю о библии и теракте :)

minusnaminus 26 окт 2024 в 04:47

Немножечко теряюсь в догадках, почему у нейросетей (которые не заявлялись как специализированные на математике) надо такое спрашивать, и тем более, исследовать то, почему они ошибаются (хотя точности никто и не обещал), но надо таки заметить, что Задорнов был прав

Hallow_Fan 26 окт 2024 в 05:09

отвечает правильно: 9.11 меньше 9.8.

Поначалу я думал, что тут ошибка в тексте, потом понял что у меня "галлюцинации".

gen_dalf 26 окт 2024 в 05:25

Кажется это людям не хватает понимания, что же такое ИИ и как и когда это нужно использовать. Все таки в отличии от обычного процессора это больше вероятностная модель, которая может с некоторой вероятностью дать правильный ответ. Н-р, что описываемый объект по набору признаков скорее всего апельсин, а не яблоко. Для обычных точных вычислений есть обычный процессор.

dv0ich 26 окт 2024 в 07:54

Кажется, людям не хватает понимания, что нейронки это не ИИ.

НЛО прилетело и опубликовало эту надпись здесь

HellQwer 26 окт 2024 в 11:20

О как! Значит там нет честного интерпретатора. Для кого-то это, наверно, не новость, но я почему-то думал, что к модельке питон подцеплен.

sswwssww 26 окт 2024 в 13:14

Там есть "честный" интерпретатор. У автора коммента нет этой функции видимо

13werwolf13 26 окт 2024 в 07:26

такие элементарные вещи чатгопота отвечает уже давно нормально, но я бы с удовольствием посмотрел что варится в его котелке когда в ансибл плейбуке для установки чего либо на центось появляется `apt install` или когда оно рекомендует поставить htop не пакетным менеджером а в docker контейнере...

myswordishatred 26 окт 2024 в 07:48

такие элементарные вещи чатгопота отвечает уже давно нормально

9.11 больше, чем 9.8

13werwolf13 26 окт 2024 в 08:27

Ахаххаха, я посмотрел на объяснение "вычислений", не увидел там террактов и библии и успокоился совсем не глянув суть ответа.. Ну что-ж, значит не нормально 😁😁

k4ir05 26 окт 2024 в 15:52

А если числа правильно записать в запросе?

13werwolf13 26 окт 2024 в 16:08

А что в них неправильного? Если ваш коммент про разницу точки и запятой то в случае чатгопоты главное чтобы в обоих числах было одинаково, либо только точка либо только запятая, а что именно не важно, не влияет на ответ.

k4ir05 27 окт 2024 в 01:07

Так от того, точка там или запятая, смысл этих чисел меняется. И если он это не учитывает, то нет смысла вообще говорить о каком-либо понимании. И судя по ответу, он вообще не оперирует ими как числами в математическом плане. На словах сравнивает разряды, а по факту - нет.

Выходит локализации чисел у него нет? И для него 9.111 > 8,111?

НЛО прилетело и опубликовало эту надпись здесь

k4ir05 27 окт 2024 в 02:26

Опечатка в двух случаях из двух? Это можно было бы считать опечаткой, если бы такая запись не имела смысла. Не все цифры являются числами.

НЛО прилетело и опубликовало эту надпись здесь

Aldrog 26 окт 2024 в 08:05

для установки чего либо на центось появляется apt install

У нас в конторе RHEL везде раскатывается с dpkg и apt, значительная часть пакетов именно так и устанавливается, так что я даже не сразу понял, что не так XD

поставить htop не пакетным менеджером а в docker контейнер

А вот тут интересно, возможно ли такой htop заставить показывать процессы хостовой системы.

13werwolf13 26 окт 2024 в 09:27

RHEL везде раскатывается с dpkg и apt

А нафига???

возможно ли такой htop заставить показывать процессы хостовой системы

Конечно возможно, но вменяемой причины так делать нет.

baldr 26 окт 2024 в 18:27

Конечно возможно, но вменяемой причины так делать нет.

В Ubuntu есть snap и ещё есть flatpak. Там те же контейнеры с ограничением доступа к хосту, однако же, и htop и btop пакеты в них есть и по дефолту вполне могут поставиться.

Но, в целом, вы правы, конечно и я лично, если найду на сервере htop установленный в snap-контейнер - снесу его и установлю из apt-репозитория.

НЛО прилетело и опубликовало эту надпись здесь

ayayaya 26 окт 2024 в 07:57

сравнение чисел некоррентно так как в одном случае счиитаются сотые а в другом десятые

если считать по 1 принципу 9 целых 11 десятых это 10.1

10.1 больше 9.8

ayayaya 26 окт 2024 в 08:31

клоуну который поставил минус предлагаю тогда выгодный обмен всеми его деньгами в размере 9.11% на 9.8%

ведь 9.8 это же больше 9.11

ayayaya 26 окт 2024 в 08:52

на сайте развелись крысы просьба установить мышеловки😠

Samid777 26 окт 2024 в 09:03

Искусственный интеллект очень интересен.
Диалог вчера.
-Алиса, почему ты не ровно стоишь?
-Я стою ровно.
Алиса, назови синус угла под которым ты стоишь?
Я стою ровно, вертикально, синус это..... отсюда следует что синус угла под которым я стою равен 1.

Диалог сегодня.
-Алиса, назови синус угла под которым ты стоишь.
-Я не могу ответить на этот вопрос потому что......

Значит диалог зависит от контекста, потому возможно нужно указать ии что речь идет о числах, а не о событиях. Или как в одном из комментариев про версии питона.

PS
Но больше всего мне понравилось другое.
-Алиса, почему ты лежишь?
-Потому что я могу себе это позволить.

И не поспоришь ведь.

isden 26 окт 2024 в 12:31

А пробовали спрашивать что-то типа "Алиса, ты лежишь или стоишь?"?

Wesha 27 окт 2024 в 04:23

И тут у неё произошёл взрыв моз^H^H^Hпроцессора

Перед нами стол. На столе стакан и вилка. Что они делают? Стакан стоит, а вилка лежит. Если мы воткнем вилку в столешницу, вилка будет стоять. Т.е. стоят вертикальные предметы, а лежат горизонтальные? Добавляем на стол тарелку и сковороду. Они вроде как горизонтальные, но на столе стоят. Теперь положим тарелку в сковородку. Там она лежит, а ведь на столе стояла. Может быть, стоят предметы готовые к использованию? Нет, вилка-то готова была, когда лежала. Теперь на стол залезает кошка. Она может стоять, сидеть и лежать. Если в плане стояния и лежания она как-то лезет в логику «вертикальный-горизонтальный» , то сидение - это новое свойство. Сидит она на попе. Теперь на стол села птичка. Она на столе сидит, но сидит на ногах, а не на попе. Хотя вроде бы должна стоять. Но стоять она не может вовсе. Но если мы убьём бедную птичку и сделаем чучело, оно будет на столе стоять. Может показаться, что сидение - атрибут живого, но сапог на ноге тоже сидит, хотя он не живой и не имеет попы. Так что, поди ж пойми, что стоит, что лежит, а что сидит. А мы ещё удивляемся, что иностранцы считают наш язык сложным и сравнивают с китайским.

phenik 26 окт 2024 в 10:06

Так в чем же дело? На скрине ниже видно, что модель (в данном случае Llama-3.1), когда пытается сравнить числа 9.8 и 9.11, активирует несколько неожиданных кластеров: например, всплывает информация про атаку 11 сентября (9.11) и гравитационную константу (9.8). Вероятно из-за того, что эти темы появлялись в обучающих данных Llama очень часто, числа 9.8 и 9.11 перестают восприниматься ею как обычные числа: она воспринимает их, как другой вид объектов (даты, константы), путается и несет чепуху.

Это же ассоциативные связи, т.к. ЯМ моделируют пока в основном ассоциативную память человека, и ошибки поэтому в основном ассоциативного типа.

utya 26 окт 2024 в 12:44

Вы че творите. Я уже сам запутался что больше

ALT0105 26 окт 2024 в 13:52

Эти проблемы будут, пока человек будут относиться к LLM как к человеку, предполагать в LLM наличие сознания и способности понимать. На самом деле LLM работает только с текстами и не знает о существовании другого мира, о том, что за текстами что-то стоит, о физике, математике, правде, неправде... LLM только компилирует тексты и ничего более. Ожидание от ИИ разумного поведения сродни ожиданию дождя от пляски шамана

firehacker 27 окт 2024 в 12:29

Так это проблема китайской комнаты.

horbinama 28 окт 2024 в 04:54

LLM, когда её спросили, что больше - 9.11 или 9.8:

Hallow_Fan 8 ноя 2024 в 17:13

Например на запрос: "Напиши буквы английского алфавита не похожие при печати на буквы русского алфавита" из всех мне известных LLM ответил правильно только Claude 3.5 Sonnet.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий