Comments 10
Эту бы энергию, да в мирных целях.
Выводы
Главного вывода нет. К реальной бухгалтерии никого подпускать нельзя. Старый добрый эксель на голову лучше этих ИИ. Для реальной работы нужна 100% точность.
Это архитектурное ограничение ЯМ связанное с использованием трансформеров, как прямых сетей. С развитием архитектуры, с включением реальной рекуррентности в структуру модели, хотя бы в виде специализированного блока, а не только с использованием во внешнем авторегрессионном цикле, как сейчас, эта проблема должна решиться.
в моей модели мира я узнал из статьи - что сейчас доверять ассистентам, которые что-то считают - стремно. Либо у них должен быть продекларирован и верифицирован спецмодуль для вычислений
LLM как была так и остается - "говорилкой"
Потыкал
О3 умножает пятизначные на пятизначные точно. Только медленно
Большой тест 12 LLM моделей на арифметику (~100 тыс запросов)