Comments 9
Grok 3 возглавляет рейтинг Chatbot Arena с оценкой около 1400, значительно превосходя другие крупные AI-модели в слепом тестировании пользователей. (Источник: xAI)
Вторая модель на графике с оценкой около 1380. Разница в 20 баллов, около 1,5%.
Это реально значительное превосходство? Кто плотно в теме разбирается, можете растолковать?
Просто если этот график построить с началом координат в 0, то там разница визуально будет весьма малозаметна.
На этом графике очень не хватает усреднённого по десятку людей значения. 1400 - это много или мало? Хз. Одно дело, если люди выдают 5000, другое - если 500.
Всё просто на самом деле, разница в 20 баллов (то, какая это часть от общего рейтинга, никакого значения не имеет) означает лучший ответ в примерно 53% случаев. Думается, разгромной победой не назовёшь, но и пренебрегать этой разницей не стоит.
В одной статье пишут, что он не лучше других, тут пишут, что опередил, сам Маск заявил, что у него вообще самый умный ИИ. Кому верить то?)
Поскольку самый умный, вот и не высовывается слишком.
А то скажут, самый умный, штоле!?
нейронки как люди, хорошо в одной области, а в другой могут проседать.
Поэтому тесты и результаты разнятся, кто-то текст хорошо пишет, а другой програет, третий ищет в интернете и т.д.
Думаю так рынок и попилят потом, каждый человек найдёт себе определённый ИИ под свою задачу.
Умный он, или нет, но цензуры напихали в него не меньше, чем опенаи и дипсики.. скучно..
Она уже бесплатно работает внутри "X". Сегодня её юзал, надо было сделать формулы в Excel для вычислений ряда задач по определённым параметрам.
Реально Грок справился на много лучше, чем ЧатГПТ и Джемини.
Искусственный интеллект нового поколения: как Grok 3 Маска опередил ведущие AI-системы