Articles / Profile of Gscraid / Habr

Gscraid Aug 8 2024 at 09:02

LIBRA: Long Input Benchmark for Russian Analysis

Medium

6 min

8.3K

SberDevices corporate blogOpen data * Machine learning * Artificial IntelligenceNatural Language Processing *

Review

Мы разработали бенчмарк LIBRA, который включает в себя 21 адаптированный набор данных для тщательного изучения способности LLM понимать длинный контекст. Помимо самих данных для оценки, мы опубликовали кодовую базу и лидерборд для сравнения моделей.

+28