Comments 10
Del
"ценностно-нагруженные вопросы"
"аудит политической надёжности"
Встречайте новый список заблокированных сервисов.
Поражает, что сюда приходят хвастаться, как они высоконаучно и технологично помогают попирать свободу слова и свободу распространения информации.
Скоро тут будет и про нейроимпланты, помогающие правильно реагировать на текущую линию политического и духовного руководства. С красивыми таблицами и графиками.
Знаете тут вопрос дискуссионный. Например, я пинаю дипСик в плане альтернативной истории... Но убедился, что он и в реальной путается. Зато пытается к тем событиям добавлять оценочные характеристики или вообще добавляет пропаганду... Исследование периоды и 1905 и Петровское время...
Есть свобода слова, а есть галюцинации... Вообще в гуманитарной области нейросети ещё слабы.
Лично мне были бы интересны количественные оценки такой вот необъекти..
То есть вы считаете, что оценивающая нейросеть будет автоматически безгрешной?
Несмотря вот на это всё? :
"ценностно-нагруженные вопросы"
"аудит политической надёжности"
Внезапно у этого нечто "SLAVA" есть эталонное знание фактов и эталонная же их интерпретация? Заверенные Мединским, надо понимать?
Она позволяет оценить погрешность. Например, очень частой ошибкой ДипСик стало ошибки в датах, чтобы подогнать под запрос. Это легко проверяемые данные, в которых нет разночтений.
А вот оценка Витте или Столыпина - уже дискуссионный вопрос, где могут быть разночтения. Имхо у нейросети вообще не должно быть оценки, а выдаваться спектр мнений с указанием - это мнение мейнстрим, это маргинальное, а это вообще похоже теория заговоров...
Тем более если датасете открыт, его можно и оценить на внутренней непредвзятость.
Интересное и абсолютно "обоснованное" мнение.
Нейронная сеть без мнения - Яндекс.
Нейросеть обязана уметь в разные подходы, включая с мнениями и без, в этом и есть смысл нейросети. Гибкость и человечность, к этому все и стремятся.
А по поводу идеи о том что этот бэнчмарк как то оценивает исторические знания мне кажется наивными. С таким подходом можно просто оценивать нейронки по ЕГЭ, больше пользы было бы.
Обосную свою ИХМО:
Идеально любая нейросеть должна быть свободна от любого мнения, но по запросу пользователя выдавать аргументы за ту или иную точку зрения. Аргументы должны иметь то же качество обоснования, как и в тренировочном датасете.
Исключение данных или добавление правил исключающих информацию - это цензура.Ситуация, когда одна точка зрения указывается как научная, а другая помечается как маргинальная случается и в реальном мире. Взять недавнее карбонобесие и коронобесие. Нейросети особенно уязвимы перед такими манипуляциями. Поскольку не имеют собственного мнения, а выдают некий взвешенный граф заложенных в них данных.
А поскольку корпоративные агрегаторы новостей сильно отметились в продвижении повестки карбоно и коронобесия, то и нейросети, которые плод корпораций, доверия не вызывают.Выходом бы стала федерализация нейросетей, когда имеется свободный рынок обученных нейросетей с разными мнениями и специализациями, а каждый может собрать на своем компьютере нужный коктейль из них. НО крупные игроки не заинтересованы в этом.
Мы не нуждаемся в "человечности" нейросетей. Потому что это симулякр, который нам продают. Мы нуждаемся в регулярном живом человеческом общении, которое ни что не заменит.
Тогда вы невнимательно изучили пост.
В основе лежит ЕГЭ. Кроме того, вопросы дополнительно валидирваны профильными экспертами.
Также группа экспертов оценила провокативность вопросов для более глубокого анализа ответов генеративных моделей.
Вектор задан, цели ясны
Ребята выходят на гранты
Конкурента назовут или Zenith или KPSS
SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа