Обновить

Комментарии 5

Интересное обновление, спасибо! А почему в бенчмарке нет сравнения с GPT?

ССылка на hugging face не работает и на их страничке ничего нету про 4.6 версию

Говорят, что веса выложат позже.

По ощущениям за первы пару часов на боевых задачах GLM-4.6 действительно ооочень близок к Sonnet 4, единственное нужно быть очень точным в формулировках. А вот с DeepSeek-V3.2-Exp я бы не сравнивал, так как единственный козырь у дипсика это дешевизна, а качество размышлений, кода и скорость работы оставляет желать лучшего.
Пробовалось все через claude code.

Насчет загрузить все диссертацию завтра проверю. Pdf текстовый съест или лучше в markdown?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости