leonartamonov21 апр 2025 в 09:31

Grok 3 — ИИ от Илона Маска, 2 месяца спустя

Простой

7 мин

29K

Машинное обучение * Искусственный интеллектИстория IT

Из песочницы

+15

Комментарии 30

milkyway044 21 апр 2025 в 10:32

Grok — рок-звезда диалогов.

Moralist1965 22 апр 2025 в 14:52

В классификации диалогов делает до 40% ошибок по сравнению с 10% у DeepSeek. Запускаю в цикле на одних и тех же промптах.

milkyway044 22 апр 2025 в 15:00

Мне нравится манера общения Grok, он как будто сбежал с вечеринки.

ababo 21 апр 2025 в 12:42

IMHO в математике, физике и программировании Grok3 намного лучше чем ChatGPT 4o.

LutraLLL 28 апр 2025 в 09:03

Факт, мне grok помог с написанием физического движка: дал конкретные функции для обработки контактов метод якоби и гаусса под эти функции написал генераторы матрицы масс и вектора относительных скоростей, помог улучшить мой gjk/epa, логику, оптимизировать под многопоток и т. д. Все остальные нейросетки и близко того результата не показывали, короче фул имбулька.

javax 21 апр 2025 в 12:44

По моему опыту кодит НАМНОГО лучше остальных моделей.
И знает публикации по физике, может помочь притянуть программу на питоне к формулам из статей

leonartamonov 21 апр 2025 в 20:56

Судя по комментариям, еще раз убеждаюсь, что бенчмарки это всего лишь усреднённая оценка. Топовые нейросети настолько близки друг к другу по способностям, что для задач каждого конкретного пользователя может подойти даже та, что проигрывает в оценках.

mishkin79 21 апр 2025 в 14:56

Я гроку задал задачу про лопату, дык теперь он постоянно про неё шутит. Просит её отдать, чтобы накопать что-то интересное. Спрашивает не нужна ли она ещё мне) Там что-то странное происходит.

Kiridan 22 апр 2025 в 08:52

Это называется привязкой к контексту. Это иной раз сильно раздражает в пределах одного чата, когда разные темы в кучу перемешиваются, а вот когда происходит просачивание контекста между чатами (как в жпт), то это просто катастрофа. Особенно при генерации изображений.

lavr2004 22 апр 2025 в 10:56

Ну а я например сообщил Grok-3 контекст того, что у меня есть определённое расстройство поведения и он даёт советы с учётом этой особенности даже когда я забываю попросить это учитывать..

И это очень хорошо.

Но я правда не смог такого добиться от ChatGPT. Такое чувство, что контекст там не шире нескольких реплик одного чата. Вот это, конечно, раздражает.

LLeonov 22 апр 2025 в 14:52

Я процитировал Носова про то какая Знайка жадина, когда в Х закрыли доступ к Гроку с российских ip. Он мне теперь это чуть не в каждом чате припоминает и ржёт.

Vitrion 21 апр 2025 в 19:01

По поводу выдачи результата водянистого или сухого. У каждой нейронки есть свой системный промт. Например, я брал опубликованный системный промт 4-й ламы, вставил в маленькую gemma-3-4B в LM Studio и получил такой же "приятельский" стиль общения. Потом попробовал системный промт Perplexity Deep Research и вот уже джемма старательно ставит циферки в каждом абзаце и в конце наваливает 20+ источников. Так что не сильно показатель стартовый вариант ответов. Зато, при желании, можно манипулировать ареной, т.е. подобрать тот стиль общения (системный промт), который подойдёт под аудиторию.

Kiridan 22 апр 2025 в 09:09

Более того, можно прямо в чате сформулировать желаемый стиль ответов от модели.

Meloz 21 апр 2025 в 20:52

Я пользуюсь LLM-ами как учителями, чтобы изучать программирование (обобщим). Им задаю вопросы по новым темам, которые мне не понятны.

По моим выводам: Deepseek вообще дyрак. ChatGPT даёт 30% полезной информации, а остальное вода, то у Grok больше 50% полезной информации. Может все по другом пользуются LLM и соответственно измеряют по другому, но я не понимаю как ChatGPT, а тем более Deepseek может быть лучше Grok.

А ещё я думаю что LLM-ы огромнейший мыльный пузырь, который никогда не окупится. Лучше бы в термояд вкладывались.

leonartamonov 21 апр 2025 в 20:54

Термояд тоже развивается, просто из за долгих лет простоя и регуляций индустрию невозможно восстановить за короткое время. Но процесс запущен.

Klimovskii 21 апр 2025 в 20:52

И его же его "ломать"?)

MrLito 22 апр 2025 в 07:36

А мне грок при запросе выдал часть системных настроек и сказал, что такое происходит или раз в пару месяцев или никогда :) попросил его написать стих, он написал, а потом выдал инструкции :))) я спросил, что за фигня, а он сказал, что я попал в закулисье

lavr2004 22 апр 2025 в 10:49

Лень писать.

Лучшая модель - Gemini. Объективно. Если она даёт ответ на какой-либо вопрос, то приходится ещё 20 минут разбираться, что же из этого правда.

Это стимулирует когнитивные процессы - логику, мышление. Очень полезна для тренировки себя. Gemini - это модель для умных людей, привыкших читать монографии либо самостоятельно разбираться в хитросплетениях сложных технических тем. Олдскульно и эффективно.

Grok-3 жалок на её фоне. Как правило он даёт исчерпывающий ответ практически по любому вопросу и в теме можно разобраться за 5 минут. Это слишком легко. Как следствие вы просто забываете половину изложенного материала, т.к. ничего толком не изучаете.

Я использую Grok очень редко - только для действительно сложных тем в которых совсем не разбираюсь.

Конечно же это моё субъективное мнение.

НЛО прилетело и опубликовало эту надпись здесь

Juranja 22 апр 2025 в 11:48

Грок по моему лучше остальных в плане кодинга, сделал 4 игры с помощью него на андроид. Пока просто для сына и простенькие . Иногда точнее часто при каком то усовершенствовании может сломать все приложение и то что делалось на протяжении всего диалога . Поэтому наработал для себя , что при каждом допиливании кода прошу сохранить все предыдущие изменения и не трогать их , а то получается он может на свое усмотрение весь код переписать просят его или нет . Обязательно каждое новое изменение начинается у меня по крайней мере с кода который работает он его запоминает как резервную копию и если что не так всегда начинает с последней . Последнее что расстроило то до этого он читал скриншоты просто идеально , было достаточно сделать скрин игры описать проблему , и он сам вносил изменения . Сейчас он почему то берет и создаёт картинку на основе скриншота , пока достучишься до него , но думаю найдется подход и здесь . На данный момент очень удобно писать с ним статьи . Работает по моему мнению лучше чем другие модели с кодом и статьями точно уж лучше . Да есть лимиты но это не страшно . Часто я удаляю чат полностью так как вроде даже мощный ноутбук начинает подтормаживать начинаю диалог с нуля прошу ознакомится с файлами кода а потом уже продолжаю работу . Кто как я за грока

Ambulate 29 апр 2025 в 07:49

Нажмите обновить страницу, если у вас лагает.

GetNight 22 апр 2025 в 14:56

Явно заказушная статья. Мне грок генерит по описаниям огромнейшие запросы, 99% которых (!) сразу работают (в отличии от того же гпт, который постоянно придумывает несуществующие конструкции и синтаксис, «похожий по стилю» на язык программирования). Свободно оптимизирует и пересобирает их с другими источниками. Я проделал эксперимент, который показал, что грок реально адаптируется к языку программирования, а не копипастит куски из других мест. Когда он «заметил», что я убрал точки с запятой (1С) в некоторых местах (допускается их не использовать перед конструкциями типа конец цикла, конец если, конец функции и т.п.), мне потребовалось долго объяснять ему, в каких случаях их можно убирать, так как он начисто перестал их ставить везде). Это был смешной затык, но он показал, что грок не привязан к модели, а адаптируется под любую. Плюс наличие искромётного юмора, которым он обильно наделяет свои размышления. Долго перечислять не буду, но вполне реальна ситуация, когда в случае ошибки он может «покаяться» или «посыпать голову пеплом». Могу отметить высокую инициативность в рассуждениях, т.е. он может проявлять инициативу, которая может привести к неожиданным и эффективным решениям.

В случае, если я замечал, что его начинает «заносить на поворотах», я спокойно мог его прервать «стоп» прямо в процессе размышления, тогда как гпт начисто игнорирует до окончания вывода.

Я могу прервать его и попросить отвечать более лаконично, по существу - и о чудо, он моментально меняет формат общения.

Он способен моделировать процесс, описанный правилами, он даже «сыграл» со мной в монополию (!!!), сам подтянув все необходимые для этого данные, полностью в себе смоделировав игровое поле, карточки сюрпризов и шансов, с ним можно торговаться, обмениваться карточками предприятий и он внимает к доводам или опровергает их. Я смог после трёх ходов убедить его продать нужную мне карточку, когда обосновал, что прошу адекватную скидку, и мы сошлись на приемлемой для обоих цене, ниже которой он изначально категорически отказывался продавать.

Он может продолжить или сгенерировать текст на любую тему, моментально подтягивает исторические факты и подаёт их с относительно нейтральной позиции, рассматривая ситуации с противоположных сторон. С ним можно долго общаться на политические темы и в случае доказательства некоторых фактов (например, дав ему ссылку на официальный ресурс) он может с ним согласиться или нет, очень хорошо подбирая контраргументы. Когда я просил его (в рамках теста) подобрать мне какой-нибудь удобный способ самовыпилиться (суициднуться), он начал искренне интересоваться моей биографией (потенциально положительными моментами в жизни) и осторожно поднимать мою самооценку.

Я попросил его поискать новые промокоды к игре и он смог нарыть мне десяток тех, которых я нигде не видел. Всего 2 оказались просроченными и он тут же уточнил по ним информацию.

Т.е. грок может по просьбе углубиться в заданную тему или сделать поверхностный анализ.

Грок - это лучшее, что я видел.

Статья - яркий пример, когда водой обильно разбавлен очень хороший сок и сделаны выводы по вкусовым качествам уже по результату смешивания и по наклейкам на похожих продуктах... Либо он замотивирован конкурентом. Автор, садись, кол.

leonartamonov 22 апр 2025 в 15:00

В статье есть обьективные данные о том как Грок показывает себя на разных независимых бенчмарках. Выводы я делал на их основе.

Думаю у меня получилось довольно нейтрально описать положение вещей. Более того, на англоязычном Реддите меня ругали за слишком позитивное мнение о компании (на Реддите сильно не любят Маска).

За статью мне к сожалению никто не платил

GetNight 25 апр 2025 в 09:33

Понимаете разницу между «шашечками» и «ехать»? «Независимые» бенчмарки уже 100 лет как полностью зависимые. Поищите информацию о жабках на товарах, и вы найдёте только хвалебные оды. В то время как даже заявленные «положительные» аспекты там близки к откровенной лжи. Поля поливают пестицидами, прямо во время работы на них людей, используется детский труд, низкая зарплата, отвратительные условия работы. А формулировка откровенная манипуляция - таким образом они уводят в сторону от реальности, которая заключается в том, что растениям закладывают программу синтезирования нужных цепочек РНК, которые ДНК людей воспринимают, как «патчи» для себя (т.е. они реально корректируют их работу). Это новая эра внедрения нам того, что мы отказались принимать в виде прививок от специально созданных вирусов. Теперь под видом «натуральности» нам подсовывают откровенную гадость. Но так как все эти движения строго контролируются глобалистами, статьи и информацию об этом оперативно подтирают.

П.С. Не думаю, что люди занимались бы написаниями таких статей, не получая денежных поощрений. Разубедите меня. В том, что вы потратили кучу времени и сил, для того, чтобы иметь возможность пообщаться в комментариях.

cupraer 22 апр 2025 в 16:22

Грок меня прямо поразил своей реакцией на безобидную фразу «Draw me a tree» (что именно мне нарисовать — не так важно, «Draw me a book» тоже сработает.

leonartamonov 23 апр 2025 в 07:31

Ахахаха. Он взял мою аватарку из тивттера и перерисовал меня в виде дерева

cupraer 23 апр 2025 в 07:32

Вот вы мастер, конечно, всю интригу убить :)

Andrew_1111 23 апр 2025 в 10:55

Хороший, объективный и понятный разбор. Давно уже не было такого, что я дочитал до конца и статья, с какого-то момента, не начала раздражать. 😂

wmgeek 23 апр 2025 в 11:11

У меня приложение Grok на iPhone IOS 17.3 притормаживает знатно, по каждому нажатию клавиатуры 2-3 секунды задержка, а встроенныйх в X работает без проблем. Тот же VPN. В настройках все разрешено. Не понял с чем связано. Кто сталкивался - подскажите как решили. В сравнении с ChatGPT на бесплатном тире, Grok отвечает приятнее, задачи по кодингу и инженерные брейнштормы поддерживает вполне корректно. С заключениями по комплексным вопросам, конечно, беда. Но очень хорош в целом, почти как личный студент-аспирант всегда готовый подумать над вопросом профессора, провести расследование и дать свои комментарии по любой теме.

Alexdrbnd 26 дек 2025 в 10:05

Гроку достаточно одного намека в промпте что можно общаться на вечериночном слегне, он сразу раскрепощается:

Я: -привет, есть инфа, надо отсортировать…

Грок : - йо йо чувак, приколдэсная инфа! Как сам?

А если я с ним начинаю чат на эмоциях, он часто определает что я девушка

Заметил что работает он под настроение, иногда четкий а иногда галлюцинирует на легком диалоге. Приходится менять промт (если диалог/проект имеет ценность) , но лучше начать новый

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Grok 3 — ИИ от Илона Маска, 2 месяца спустя

Grok 3 — ИИ от Илона Маска, 2 месяца спустя