bvv2311 12 июл 2024 в 11:41

Поговорим с языковой моделью

13 мин

1.2K

Комментарии 8

ainu 12 июл 2024 в 11:50

Вот всегда удивляла попытка дать именно LLMкам задачи на поиск совпадений или паттернов, или расшифровать скрытый шифр, и так далее. Не надо так. Вот эти вот поиски паттернов - это же типичная задача для теста на IQ (не буду сейчас обсуждать их коллизию с общей интеллектуальностью, не об этом) - и тут как раз общеизвестно что LLMки сейчас имеют около 100IQ (claude, в этом плане там выше, чем у ChatGPT). То есть именно в задаче поиска паттернов LLM нейросеть чуть хуже чем средний человек. А тут еще и паттерны нетиповые. То есть это не та задача, которую можно эффективно дать текстовой нейросети, по крайней мере сейчас, это не тот инструмент и не та задача.

bvv2311 12 июл 2024 в 13:39

Разница между LLM-многомиллионной и LLM-копеечной в том, что последняя не отягощена "как надо правильно думать". И поэтому она закономерность находит.

bvv2311 12 июл 2024 в 14:29

Что человек, что машина ищут так же.

bvv2311 12 июл 2024 в 14:33

А что происходит, если ранее обученная машина (на множестве таких вот выученных закономерностей), начинает пытаться понять нечто-новое? Происходит то, что она уже выученными пытается интерпретировать новые данные. .. Это называется "глаза зашорены". Поэтому иногда маленькая LLМ лучше большой обученной

bvv2311 12 июл 2024 в 14:34

Кстати, здесь тоже 2 переменные

bvv2311 12 июл 2024 в 14:54

Politura 12 июл 2024 в 15:35

А что за модель?

bvv2311 12 июл 2024 в 15:38

Что по ссылке? Упрощённая версия от Андрея Карпаты

Зарегистрируйтесь на Хабре, чтобы оставить комментарий