Статьи / Профиль Gscraid / Хабр

Gscraid 8 авг 2024 в 09:02

LIBRA: Long Input Benchmark for Russian Analysis

Средний

6 мин

8.3K

Блог компании SberDevicesОткрытые данные * Машинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

Мы разработали бенчмарк LIBRA, который включает в себя 21 адаптированный набор данных для тщательного изучения способности LLM понимать длинный контекст. Помимо самих данных для оценки, мы опубликовали кодовую базу и лидерборд для сравнения моделей.

+28