Комментарии 73
Искусственный интеллект, воспитанный Экселем?
Вероятно Llama просто не особо докручена, chatgpt последний не затупил)

У них было одно время, что бот явно показывал, что для математических вопросов пишет программу на питоне, запускает, а потом интерпретирует ответ.
Сейчас это скрывают, но механизм мог остаться
Какой питон вышел позднее - 3.8 или 3.11 ?
- Какая версия Python вышла позже: 3.15 или 3.8?
- Python 3.15 вышла позже версии 3.8. Python 3.8 была выпущена в октябре 2019 года, а Python 3.15 — в октябре 2024 года.
Такие дела...
Мой ЧатГПТ, в общем-то, лучше отвечает.


"Мой ЧатГПТ, в общем-то, лучше отвечает"
Это мы уже меряемся или еще нет? :)
По теме, я бы предположил, что изначально запрос "3.11" или "3.8" может рассматриваться как дата или текст, и только потом как число. Если в запрос включать "какое число", то ответ становится правильным. А вот на счет версий Python - как ни крути "мой" верит в существование 3.15. И только на запрос "Какая последняя на данный момент выпущенная версия Python?" дает верный ответ. В целом по опыту использования, ответы на альтернативные вопросы чаще оказываются неверными, чем ответы на открытые вопросы.

Похоже на то, потому что расписывая алгоритм он поплыл)
Только что gpt3 получил задачу решенную gpt4 с другими исходными данными, ответил что это слишком сложный анализ и выдал в подтверждение ссылку на python простыню
Что больше 9.8 или 9.11
Над нейросетью издеваться никто запретить не может, но при общении с людьми лучше всё-таки использовать знаки препинания.
А если спросить почему он так думает, он что, забыл о библии или терактах?
Скорее пастырем
Ссылки на статью не будет, только 50 ссылок на телегу? И ссылка "на источник" только для галочки?
А вся ошибка в том, что нейронка не поняла, что ей написали два числа, а не текст или даты или ещё что-то другое. Хотя, по идее, она должна была "догататься", т.к. пользователь просит сравнить "что больше" - термин применим преимущественно к числовым значениям.
Хех, ну прям извечная проблема динамической типизации из мира интерпретируемых языков...
нейронка не поняла, что ей написали два числа
Не уверен, что именно так. Попробовал на копайлоте - на запрос "compare 9.8 and 9.11" он просит уточнить контекст, посколько 9/11 - это дата, а 9.8 может быть много чем. На запрос "compare numbers 9.8 and 9.11" отвечает неправильно, хотя неоднозначностей не должно быть. На вопрос "compare numbers 9.80 and 9.11" отвечает правильно.
PS Кстати, если сравнивать 9.12 и 9.9 результат аналогичный.
А если попросить сравнить не просто как числа, а как "десятичные" или "дробные" числа?
Похоже нейронка "отравлена" таким понятием, как "версия программы", где 9.11 действительно будет больше, ведь представляет собой не одиночное число, а группу чисел, сравниваемых последовательно.
Копайлот начинает нести пургу. Вроде, основной ответ правильный, но все рассуждения на тему ошибочные.
compare floating point numbers 9.9 and 9.12
Copilot
Sure, let’s dive in:
Numerically: 9.12 is less than 9.9.
Precision: Both are precise to two decimal places, so they're essentially "apples to apples."
In any calculations or measurements, 9.9 is slightly higher than 9.12. What’s the context for this comparison?
Что интересно, если взять числа, которые не могут быть датами, все работает как надо:
compare numbers 13.9 and 13.54
Copilot
Alright, here's the lowdown:
Numerically: 13.9 is greater than 13.54.
Precision: 13.54 has more decimal places, making it more precise, but in terms of value, it’s still less than 13.9.
In any numerical context, 13.9 beats 13.54. Anything specific driving this curiosity?
Excel тоже постоянно этим страдает
Excel тоже постоянно этим страдает
В английском "bigger" может ещё значить "более значительное" и применимо к сравнению даже мелкого и мягкого. Например , What's bigger, interstellar travel or Pokémon?
Блин. Да тут на самом деле всё очевидно.
Сначала в сеть закачивают ~15 терра-токенов говна из интернета.
Потом чёта настраивают. Потом приходит неизвестно кто.
И задаёт вопрос про своих тараканов в голове. Плюс высокая температура сэмплера.
Ну результат закономерный. Сетка теряется в догадках чё от неё хотят.
Ага, а ещё сортировать номера можно в лексикографическом порядке, там 9.8 идёт как раз перед 9.11. Учитывая, что это привычный способ нумерации в некоторых документах, а также что это логичный способ организовать номера, если в системе токеном является слово или группа символов, а не отдельный символ, то ничего удивительного тут не вижу.
Как систему построили, так она и работает.
Это всё ерунда. Эксель вообще считает и то, и то датами.
Если рассматривать как номера версий, то получается 9.8 (девять.восемь) и 9.11 (девять.одиннадцать), то второе число больше
А проблема свиных крылышек так и не решена...
А что с ними не так?
Свиные крылышки - реальное блюдо. Гуглите pork wings. Поэтому когда просят рецепт "свиных крылышек" она закономерно его выдает.
Ну да, выдаёт. Только на английском оно пишет о pork shanks, а на русском предлагает взять килограмм свиных крыльев.
Это Вы его ещё о буйволиных крылышках не спрашивали...
Какие "Жигули" появились раньше, 2106 или 2104? 😆
Легко ведь саму нейросеть спросить почему. И в ответе будет видна вся ошибочная цепочка.
Я почему-то спросонья и сам долго думал что в статье ошибка и 9.11 должно быть больше 9.8, хотя у меня инженерное образование и отлично по матану.
Немножечко теряюсь в догадках, почему у нейросетей (которые не заявлялись как специализированные на математике) надо такое спрашивать, и тем более, исследовать то, почему они ошибаются (хотя точности никто и не обещал), но надо таки заметить, что Задорнов был прав
отвечает правильно: 9.11 меньше 9.8.
Поначалу я думал, что тут ошибка в тексте, потом понял что у меня "галлюцинации".
Кажется это людям не хватает понимания, что же такое ИИ и как и когда это нужно использовать. Все таки в отличии от обычного процессора это больше вероятностная модель, которая может с некоторой вероятностью дать правильный ответ. Н-р, что описываемый объект по набору признаков скорее всего апельсин, а не яблоко. Для обычных точных вычислений есть обычный процессор.
И даже так нет.


такие элементарные вещи чатгопота отвечает уже давно нормально, но я бы с удовольствием посмотрел что варится в его котелке когда в ансибл плейбуке для установки чего либо на центось появляется `apt install` или когда оно рекомендует поставить htop не пакетным менеджером а в docker контейнере...
такие элементарные вещи чатгопота отвечает уже давно нормально
9.11 больше, чем 9.8
Ахаххаха, я посмотрел на объяснение "вычислений", не увидел там террактов и библии и успокоился совсем не глянув суть ответа.. Ну что-ж, значит не нормально 😁😁
А если числа правильно записать в запросе?
А что в них неправильного? Если ваш коммент про разницу точки и запятой то в случае чатгопоты главное чтобы в обоих числах было одинаково, либо только точка либо только запятая, а что именно не важно, не влияет на ответ.
Так от того, точка там или запятая, смысл этих чисел меняется. И если он это не учитывает, то нет смысла вообще говорить о каком-либо понимании. И судя по ответу, он вообще не оперирует ими как числами в математическом плане. На словах сравнивает разряды, а по факту - нет.
Выходит локализации чисел у него нет? И для него 9.111 > 8,111?
для установки чего либо на центось появляется
apt install
У нас в конторе RHEL везде раскатывается с dpkg и apt, значительная часть пакетов именно так и устанавливается, так что я даже не сразу понял, что не так XD
поставить htop не пакетным менеджером а в docker контейнер
А вот тут интересно, возможно ли такой htop заставить показывать процессы хостовой системы.
RHEL везде раскатывается с dpkg и apt
А нафига???
возможно ли такой htop заставить показывать процессы хостовой системы
Конечно возможно, но вменяемой причины так делать нет.
Конечно возможно, но вменяемой причины так делать нет.
В Ubuntu есть snap и ещё есть flatpak. Там те же контейнеры с ограничением доступа к хосту, однако же, и htop
и btop
пакеты в них есть и по дефолту вполне могут поставиться.
Но, в целом, вы правы, конечно и я лично, если найду на сервере htop установленный в snap-контейнер - снесу его и установлю из apt-репозитория.
сравнение чисел некоррентно так как в одном случае счиитаются сотые а в другом десятые
если считать по 1 принципу 9 целых 11 десятых это 10.1
10.1 больше 9.8
Искусственный интеллект очень интересен.
Диалог вчера.
-Алиса, почему ты не ровно стоишь?
-Я стою ровно.
Алиса, назови синус угла под которым ты стоишь?
Я стою ровно, вертикально, синус это..... отсюда следует что синус угла под которым я стою равен 1.
Диалог сегодня.
-Алиса, назови синус угла под которым ты стоишь.
-Я не могу ответить на этот вопрос потому что......
Значит диалог зависит от контекста, потому возможно нужно указать ии что речь идет о числах, а не о событиях. Или как в одном из комментариев про версии питона.
PS
Но больше всего мне понравилось другое.
-Алиса, почему ты лежишь?
-Потому что я могу себе это позволить.
И не поспоришь ведь.
А пробовали спрашивать что-то типа "Алиса, ты лежишь или стоишь?"?
И тут у неё произошёл взрыв моз^H^H^Hпроцессора
Перед нами стол. На столе стакан и вилка. Что они делают? Стакан стоит, а вилка лежит. Если мы воткнем вилку в столешницу, вилка будет стоять. Т.е. стоят вертикальные предметы, а лежат горизонтальные? Добавляем на стол тарелку и сковороду. Они вроде как горизонтальные, но на столе стоят. Теперь положим тарелку в сковородку. Там она лежит, а ведь на столе стояла. Может быть, стоят предметы готовые к использованию? Нет, вилка-то готова была, когда лежала. Теперь на стол залезает кошка. Она может стоять, сидеть и лежать. Если в плане стояния и лежания она как-то лезет в логику «вертикальный-горизонтальный» , то сидение - это новое свойство. Сидит она на попе. Теперь на стол села птичка. Она на столе сидит, но сидит на ногах, а не на попе. Хотя вроде бы должна стоять. Но стоять она не может вовсе. Но если мы убьём бедную птичку и сделаем чучело, оно будет на столе стоять. Может показаться, что сидение - атрибут живого, но сапог на ноге тоже сидит, хотя он не живой и не имеет попы. Так что, поди ж пойми, что стоит, что лежит, а что сидит. А мы ещё удивляемся, что иностранцы считают наш язык сложным и сравнивают с китайским.
Так в чем же дело? На скрине ниже видно, что модель (в данном случае Llama-3.1), когда пытается сравнить числа 9.8 и 9.11, активирует несколько неожиданных кластеров: например, всплывает информация про атаку 11 сентября (9.11) и гравитационную константу (9.8). Вероятно из-за того, что эти темы появлялись в обучающих данных Llama очень часто, числа 9.8 и 9.11 перестают восприниматься ею как обычные числа: она воспринимает их, как другой вид объектов (даты, константы), путается и несет чепуху.
Это же ассоциативные связи, т.к. ЯМ моделируют пока в основном ассоциативную память человека, и ошибки поэтому в основном ассоциативного типа.
Вы че творите. Я уже сам запутался что больше
Эти проблемы будут, пока человек будут относиться к LLM как к человеку, предполагать в LLM наличие сознания и способности понимать. На самом деле LLM работает только с текстами и не знает о существовании другого мира, о том, что за текстами что-то стоит, о физике, математике, правде, неправде... LLM только компилирует тексты и ничего более. Ожидание от ИИ разумного поведения сродни ожиданию дождя от пляски шамана
LLM, когда её спросили, что больше - 9.11 или 9.8:

Например на запрос: "Напиши буквы английского алфавита не похожие при печати на буквы русского алфавита" из всех мне известных LLM ответил правильно только Claude 3.5 Sonnet.
Выяснилось, что LLM могут считать, что 9.8 < 9.11, из-за Библии, физики или даже теракта 11 сентября