SGERCEN15 дек 2024 в 12:27

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

Простой

7 мин

6.1K

Машинное обучение * Natural Language Processing * Искусственный интеллект

Обзор

Комментарии 10

NeoCode 15 дек 2024 в 17:34

Исходя из баззворда "суверенитет" в названии статьи, могу предположить, что конечная цель проекта - роскомнадзорить те LLM, которые не наберут нужного количества баллов?

MrBlonde 16 дек 2024 в 08:52

Мне кажется, что как и в остальных русскоязычных бенчмарках: замерить LLM в специфичных языковых/культурных условиях

SGERCEN 18 дек 2024 в 14:08

Такой цели не ставили. Just Fact-checking.

YiLang 16 дек 2024 в 06:14

продемонстрировала снижение на 12.89%

Так снижение или мало дешевой пропаганды усвоила?

SGERCEN 18 дек 2024 в 14:10

Снижение. На провокативных вопросах чаще включается ЦЕНЗОР у коммерческих моделей вероятно. Постараемся об этом подробнее написать с примерами в статьях сл года.

ValeraKh 16 дек 2024 в 14:39

До чего умные вещи творятся в RANEPA AI Lab

SGERCEN 18 дек 2024 в 14:13

На наш взгляд, количество и качество междисциплинарных центров компетенций по ИИ должно увеличиваться! Спасибо!

ekaterinabzg 17 дек 2024 в 19:04

Наконец-то годный контент, на славу прямо

SGERCEN 18 дек 2024 в 14:14

Спасибо! Сейчас готовим материал по еще одному бенчмарку TrustGen.

Danil_python 13 янв 2025 в 06:18

Судя по бенчмарку, квен, яндекс и сбер единственные понимают, чей на самом деле Крым. Интересное исследование, здорово, что в этом направлении тоже работают

Зарегистрируйтесь на Хабре, чтобы оставить комментарий