Комментарии 8
Спасибо за тест!
Для своих задач использую разные модели для каждого этапа.
Очень полезно, спасибо!
o1 pro? Это Gemini подсказал со знаниями из 2024?) o серия уже устарела и давно депрекейтнута. Текущая sota - это gpt5.4 pro
Очень не хватает в лидерборде обычной gpt5.4 thinking, ибо прошка дорогая и медлительная
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Lexometrica Ground Truth: бенчмарк LLM по российскому праву