Search
Write a publication
Pull to refresh
6
0
Igor Churin @Gscraid

User

Send message

LIBRA: Long Input Benchmark for Russian Analysis

Level of difficultyMedium
Reading time6 min
Views4.7K

Мы разработали бенчмарк LIBRA, который включает в себя 21 адаптированный набор данных для тщательного изучения способности LLM понимать длинный контекст. Помимо самих данных для оценки, мы опубликовали кодовую базу и лидерборд для сравнения моделей.

Читать далее

Information

Rating
Does not participate
Registered
Activity