runaway_llm7 апр в 17:14

GLM-5.1 собрала Linux-десктоп в браузере за 8 часов и взяла SOTA на SWE-Bench Pro

2 мин

10K

Искусственный интеллектМашинное обучение *

+10

Комментарии 7

AlexanderAnisimov 7 апр в 17:37

Любопытно будет глянуть на общую картину что получится на artificialanalysis.ai

Они его с какой частотой обновляют?

Dhwtj 7 апр в 18:13

Синтетика

Плохо, что с этим агентским режимом перестали улучшать обычный чат

Barnaby 7 апр в 18:27

А у кого сейчас иначе? Вроде все на чат забили.

Barnaby 7 апр в 18:27

GLM 5 ни разу не клод конечно, но пока единственный китаец который мне нормально код писал.

AraTropia 8 апр в 01:38

глм по кодинг плану странно себя ведет. В один вечер как на бенчмарках. А в другой два слова связать не может и структуру простейшего проекта забывает. Как будто для тех, у кого дешевая подписка, в моменты нагрузки, модель жесточайше квантуют...

milinsky 8 апр в 03:20

Такое поведение на всех тарифах, в том числе Max. Они попросту не справляются с нагрузкой и скорее всего квантуют на лету при пике нагрузки.

ITDiver77 8 апр в 10:24

Я взял на пробу лайт, быстро почти выжрал токены. Но работала более менее. Перешёл на про, и полетел мусор. Может так совпало конечно... Как писали на реддите, до 100к проблем нет, если больше, то шанс замусорить сессию велик, проблема точно есть и на максе

Зарегистрируйтесь на Хабре, чтобы оставить комментарий