Comments 8
Точкой отсчета особого интереса к языковым моделям ИИ стал март 2023 года, а именно - открытие публичного доступа к ChatGPT 4.0, что сделало LLM доступными широкой публике.
Справедливости ради, точкой отсчёта и началом бума LLM стало открытие доступа к chat gpt 3.5. 30 ноября 2022 года. После чего количество пользователей выросло до 100 млн. к февралю 2023.
В статье как будто нехватает главного - оценок llm полученных этим бенчмарком. Особенно интересно было бы посмотреть какие из моделей которые можно развернуть локально приемлимо работают с русским языком.
Ага, но пока не вышла вторая часть с подробным описанием как получилась таблица оценок, можно посмотреть лидерборд на huggingface (туда недавно добавили еще Claude-3.5 и GPT-4o)
Во всех этих статьях про ИИ мы сразу антропоморфизируем, (это значит очеловечеваем). С чего вы вообще взяли, что ИИ, основанный вообще на каких то алгоритмах токенизации и перебора вероятностей, должен себя вести как мы, как какой-то совершенно другой биологический вид? То, что он обучается на наших данных, далеко не гарантия, что он будет как человек, у него не то чтобы другое мышление, сама суть его любого мышления совершенно иная, это тоже самое что инопланетянину с совершенно другим строением мозга, к примеру он ориентируется по эхолокации, рассказать ему про людей и он почему то должен будет также любить, хотеть чего-то как мы и т.д. Почему уровень его "интеллекта" нужно проверять обязательно какими-то человеческими проверками, которыми проверяют именно людей?
Хм... мы же не про должен, а про померить открыто фактологию. Разные ЦА (пользователи умных колонок, сервисов), особенно в школьном периоде, могут же понимать что ответы LLM не идеальны ;-) Вообще круто, если сами скачают фреймворк и проверят любимые модельки по нашему открытому набору данных или по своему (что скорее всего)
Позвольте не согласиться. Позиция авторов определена цитатой К.В.Воронцова: "Генеративные модели текста – это не интеллект, а новый языковой интерфейс "
БЯМ - каждый раз глаз режет это сокращение. Назвали бы хоть БоЯзМ-ами, было бы по-русски и оригинально обыгрывало страх грядущей эпохи человека под гнетом машин. А лучше аббревиатуру и вовсе не переводить, а то так и до МШП (Мирово-Широкой-Паутины) дойдём.
Насколько хороши LLM?