Обновить
5
0
Igor Churin@Gscraid

Пользователь

Отправить сообщение

LIBRA: Long Input Benchmark for Russian Analysis

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели3.1K

Мы разработали бенчмарк LIBRA, который включает в себя 21 адаптированный набор данных для тщательного изучения способности LLM понимать длинный контекст. Помимо самих данных для оценки, мы опубликовали кодовую базу и лидерборд для сравнения моделей.

Читать далее

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность