Комментарии 25
исключение, подтверждающее правило
Меня стриггерила эта фраза, простите.
Ну т.е. имея как минимум вдвое большую вычислительную мощность(ну так в этой статье написано) контора Маска обучила сеть примерно того же уровня как DeepSeek? Ну да, пошла она в лес эта ваша оптимизация.
Грок 3 лидер чатбот арены во всех категориях. Поэтому они сделали лучшую ИИ из доступных на рынке.
не во всех



Ну похоже категорий больше чем я думал
https://miro.medium.com/v2/resize:fit:1400/1*KkAv753haQsNKN6e5ta4qA.png
Арена это далеко не показательный бенчмарк. Те же Гемини еще с версии 1.5 про уже там сидят в топе и "обходят" какой-нибудь Claude 3.5, но на деле Gemini 1.5 Pro даже рядом с Клодом не валялся.
Ну так чат бот арена, это слепые тесты массовые. Тут важно помнить про среднее. Что подходит большей части может не подходить вам лично. А
На арене все модели вызываются через апи без функций. Вполне возможно что клод работает хуже чем флеш если запускать их без "калькулятора" и с одинаковым системным промптом.
Когда сделают новую архитектуру и ИИ перестанет тратить мегаваты на стохастическое попугайничество, а начнёт учится человеко подобным способом, пойдёт вал статей о том что архитектура наше все. Сумма технологий Лема вышла 60 лет назад, а люди все ещё не могут осознать что успех экстенсисивного развития это лишь следствие затора в интенсивном.
Пока слышно только маркетинговые вбросы. Кто-нибудь реально с этой моделью поработал? Они даже не дают пару бесплатных запросов в день, а сразу сделали платный доступ. Жадные коммерсанты
На арене как найти Грок 3? Вижу только Грок 2.
Какой ссылкой вы сами пользовались?
мне очень нравится как грок пишет код.
А кто-то там Галактику захватил, фримены или те, кто в комфорте под дождем сидели?
Grok-3: ещё одна победа «Горького урока»