Комментарии 2
Очень жаль, что в бенчмарке отсутствует llama2 code 34b, так как все используемые модели маленькие, их никто на программирование не тюнил изначально (полагаю так и с остальными задачами, просто хорошей offline модели под эти задачи не найти, а для программирования есть)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
LLM Leaderboard за февраль 2024