fanat50310 мар в 13:46

Как я поймал Трансформер на читерстве: гроккинг, математика и Mechanistic Interpretability

Сложный

4 мин

6.5K

Машинное обучение * Искусственный интеллектPython *

Кейс

Из песочницы

Комментарии 3

SGordon123 10 мар в 13:53

Так и не понял, а другие то ллм как складывают?

Bardakan 11 мар в 10:39

1)llm при грубом приближении - набор вероятностей, а вы пытаетесь заставить ее решить точную задачу. Может у более сложных llm сложение каких-нибудь небольших чисел отработало нормально, потому что вероятность этого ответа была достаточно большой.
2)читал в книге, что подобные ошибки из-за того, что модели работают с токенами. Т.е. у вас модель видит не "14+35=", а например, "14", "+3" и "5=" (токены), которые могут быть интерпретированы как угодно

March228 13 мар в 20:28

Просто знают.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий