SGERCEN Oct 28 2024 at 18:16

Насколько хороши LLM?

Easy

7 min

9.3K

Machine learning * Natural Language Processing *

From sandbox

Comments 8

avshkol Oct 28 2024 at 20:29

Точкой отсчета особого интереса к языковым моделям ИИ стал март 2023 года, а именно - открытие публичного доступа к ChatGPT 4.0, что сделало LLM доступными широкой публике.

Справедливости ради, точкой отсчёта и началом бума LLM стало открытие доступа к chat gpt 3.5. 30 ноября 2022 года. После чего количество пользователей выросло до 100 млн. к февралю 2023.

PDEMON Oct 29 2024 at 06:14

Согласен. Лента была забита новостями ChatGPT месяца три. Рекомендаций в ютубе вся страница в LLM.

Spyman Oct 29 2024 at 00:43

В статье как будто нехватает главного - оценок llm полученных этим бенчмарком. Особенно интересно было бы посмотреть какие из моделей которые можно развернуть локально приемлимо работают с русским языком.

SGERCEN Oct 29 2024 at 08:06

Ага, но пока не вышла вторая часть с подробным описанием как получилась таблица оценок, можно посмотреть лидерборд на huggingface (туда недавно добавили еще Claude-3.5 и GPT-4o)

tamer202 Oct 29 2024 at 08:46

Во всех этих статьях про ИИ мы сразу антропоморфизируем, (это значит очеловечеваем). С чего вы вообще взяли, что ИИ, основанный вообще на каких то алгоритмах токенизации и перебора вероятностей, должен себя вести как мы, как какой-то совершенно другой биологический вид? То, что он обучается на наших данных, далеко не гарантия, что он будет как человек, у него не то чтобы другое мышление, сама суть его любого мышления совершенно иная, это тоже самое что инопланетянину с совершенно другим строением мозга, к примеру он ориентируется по эхолокации, рассказать ему про людей и он почему то должен будет также любить, хотеть чего-то как мы и т.д. Почему уровень его "интеллекта" нужно проверять обязательно какими-то человеческими проверками, которыми проверяют именно людей?

SGERCEN Oct 29 2024 at 08:53

Хм... мы же не про должен, а про померить открыто фактологию. Разные ЦА (пользователи умных колонок, сервисов), особенно в школьном периоде, могут же понимать что ответы LLM не идеальны ;-) Вообще круто, если сами скачают фреймворк и проверят любимые модельки по нашему открытому набору данных или по своему (что скорее всего)

ENick Oct 31 2024 at 09:38

Позвольте не согласиться. Позиция авторов определена цитатой К.В.Воронцова: "Генеративные модели текста – это не интеллект, а новый языковой интерфейс "

eigrad Oct 29 2024 at 09:04

БЯМ - каждый раз глаз режет это сокращение. Назвали бы хоть БоЯзМ-ами, было бы по-русски и оригинально обыгрывало страх грядущей эпохи человека под гнетом машин. А лучше аббревиатуру и вовсе не переводить, а то так и до МШП (Мирово-Широкой-Паутины) дойдём.