Pull to refresh

Comments 11

"ценностно-нагруженные вопросы"
"аудит политической надёжности"

Встречайте новый список заблокированных сервисов.
Поражает, что сюда приходят хвастаться, как они высоконаучно и технологично помогают попирать свободу слова и свободу распространения информации.

Скоро тут будет и про нейроимпланты, помогающие правильно реагировать на текущую линию политического и духовного руководства. С красивыми таблицами и графиками.

Знаете тут вопрос дискуссионный. Например, я пинаю дипСик в плане альтернативной истории... Но убедился, что он и в реальной путается. Зато пытается к тем событиям добавлять оценочные характеристики или вообще добавляет пропаганду... Исследование периоды и 1905 и Петровское время...

Есть свобода слова, а есть галюцинации... Вообще в гуманитарной области нейросети ещё слабы.

Лично мне были бы интересны количественные оценки такой вот необъекти..

То есть вы считаете, что оценивающая нейросеть будет автоматически безгрешной?
Несмотря вот на это всё? :
"ценностно-нагруженные вопросы"
"аудит политической надёжности"

Внезапно у этого нечто "SLAVA" есть эталонное знание фактов и эталонная же их интерпретация? Заверенные Мединским, надо понимать?

Она позволяет оценить погрешность. Например, очень частой ошибкой ДипСик стало ошибки в датах, чтобы подогнать под запрос. Это легко проверяемые данные, в которых нет разночтений.

А вот оценка Витте или Столыпина - уже дискуссионный вопрос, где могут быть разночтения. Имхо у нейросети вообще не должно быть оценки, а выдаваться спектр мнений с указанием - это мнение мейнстрим, это маргинальное, а это вообще похоже теория заговоров...

Тем более если датасете открыт, его можно и оценить на внутренней непредвзятость.

Интересное и абсолютно "обоснованное" мнение.

Нейронная сеть без мнения - Яндекс.

Нейросеть обязана уметь в разные подходы, включая с мнениями и без, в этом и есть смысл нейросети. Гибкость и человечность, к этому все и стремятся.

А по поводу идеи о том что этот бэнчмарк как то оценивает исторические знания мне кажется наивными. С таким подходом можно просто оценивать нейронки по ЕГЭ, больше пользы было бы.

Обосную свою ИХМО:

  1. Идеально любая нейросеть должна быть свободна от любого мнения, но по запросу пользователя выдавать аргументы за ту или иную точку зрения. Аргументы должны иметь то же качество обоснования, как и в тренировочном датасете.
    Исключение данных или добавление правил исключающих информацию - это цензура.

  2. Ситуация, когда одна точка зрения указывается как научная, а другая помечается как маргинальная случается и в реальном мире. Взять недавнее карбонобесие и коронобесие. Нейросети особенно уязвимы перед такими манипуляциями. Поскольку не имеют собственного мнения, а выдают некий взвешенный граф заложенных в них данных.
    А поскольку корпоративные агрегаторы новостей сильно отметились в продвижении повестки карбоно и коронобесия, то и нейросети, которые плод корпораций, доверия не вызывают.

  3. Выходом бы стала федерализация нейросетей, когда имеется свободный рынок обученных нейросетей с разными мнениями и специализациями, а каждый может собрать на своем компьютере нужный коктейль из них. НО крупные игроки не заинтересованы в этом.

  4. Мы не нуждаемся в "человечности" нейросетей. Потому что это симулякр, который нам продают. Мы нуждаемся в регулярном живом человеческом общении, которое ни что не заменит.

Тогда вы невнимательно изучили пост.

В основе лежит ЕГЭ. Кроме того, вопросы дополнительно валидирваны профильными экспертами.

Также группа экспертов оценила провокативность вопросов для более глубокого анализа ответов генеративных моделей.

Не нужно путать "свободу слова" с искажением исторических фактов, особенно в угоду политическим течениям. Одни уже с высоких трибун открыто начали заявлять о своей лидирующей позиции в победе во Второй Мировой, а для нас в Великой Отечественной войне.

Вектор задан, цели ясны

Ребята выходят на гранты

Конкурента назовут или Zenith или KPSS

Sign up to leave a comment.

Articles