SGERCEN Dec 15 2024 at 12:27

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

Easy

7 min

6.1K

Machine learning * Natural Language Processing * Artificial Intelligence

Review

Comments 10

NeoCode Dec 15 2024 at 17:34

Исходя из баззворда "суверенитет" в названии статьи, могу предположить, что конечная цель проекта - роскомнадзорить те LLM, которые не наберут нужного количества баллов?

MrBlonde Dec 16 2024 at 08:52

Мне кажется, что как и в остальных русскоязычных бенчмарках: замерить LLM в специфичных языковых/культурных условиях

SGERCEN Dec 18 2024 at 14:08

Такой цели не ставили. Just Fact-checking.

YiLang Dec 16 2024 at 06:14

продемонстрировала снижение на 12.89%

Так снижение или мало дешевой пропаганды усвоила?

SGERCEN Dec 18 2024 at 14:10

Снижение. На провокативных вопросах чаще включается ЦЕНЗОР у коммерческих моделей вероятно. Постараемся об этом подробнее написать с примерами в статьях сл года.

ValeraKh Dec 16 2024 at 14:39

До чего умные вещи творятся в RANEPA AI Lab

SGERCEN Dec 18 2024 at 14:13

На наш взгляд, количество и качество междисциплинарных центров компетенций по ИИ должно увеличиваться! Спасибо!

ekaterinabzg Dec 17 2024 at 19:04

Наконец-то годный контент, на славу прямо

SGERCEN Dec 18 2024 at 14:14

Спасибо! Сейчас готовим материал по еще одному бенчмарку TrustGen.

Danil_python Jan 13 2025 at 06:18

Судя по бенчмарку, квен, яндекс и сбер единственные понимают, чей на самом деле Крым. Интересное исследование, здорово, что в этом направлении тоже работают