Комментарии 6
https://habr.com/ru/articles/1001244/ линейная алгебра в нейросети
Кстати хороший вопрос, почему самый бы не использовать самый лучший способ умножения - это дать модели встроенный или внешний MCP?
Встроить WebAssembly в нейронку - идея клевая ) мне лично очень нравится, но какой же пипец сразу начнется, безопасность выйдет из чата навсегда. Но других вариантов не особо много(лично я не вижу ни одного, варианты встроить питон или яву это то же самое). И надо просто быстрее научиться жить в мире где в нейронке может быть исполняемый код, отгребсти все проблемы с безопасностью, успешно их решить и двигаться дальше. А еще лучше дать нейронке среду где она сможет дописывать себе в песочнице новые инструменты ) что бы вообще жизнь малиной не казалась и все максимально поплохело ))) хаха
хочется спросить... А есть человека попросить умножить 37 на 121, как он поступит? Разложит на составляющие 37*100 + 37*10*2 + 37*1 и сложит. Не так ли действует ИИ? Раскладывает на "знакомые паттерны" и "сложение".
просто нейросеть (что в голове человека, что в весах ЛЛМ) не умеет выполнять операцию умножения, зато отлично умеет выполнять операцию сложения (хотя и тоже не так отлично, как хотелось бы, особенно с длинными числами. ЛЛМ разбивает на "чанки" и путается. Человек делает хорошо только контролируя каждый разряд отдельно - воспроизводя сложение в столбик в своей оперативке)
так что тут удивительного то в итоге?
Отличный вопрос. Заставляет задуматься... В случае - сети надо было посчитать один раз умножение (что она не очень умеет делать). Если сеть пойдет по "человеческому пути", то ей же придется три раза умножать (
, и еще потом
). Умножить на 100 и на 10 легко, это верно, но вот на 2 в данном случае - уже не очевидно.
Хочется спросить: а как умножать не через сложение и не через заученную таблицу?
Скажем, 4*8?
Только не говорите, что это 32, это в таблице умножения написано. А вот сделайте прям расчёт, и без сложения. Задача со звёздочкой, так-то.
ИМХО, попытка запихнуть все в саму нейросеть тупиковая.
Нейросеть должна распознавать задачу и активно использовать дополнительные источники.
Если требуется математика - задействовать отдельный математический софт, который существует уже десятилетия и работает четко и предсказуемо. Если в задаче запрос каких-то конкретных справочных знаний - запросить эти данные из встроенной базы знаний.

На шаг ближе к Скайнету: научились ли нейросети умножать?