ИИ может менять мнение человека. Мы проверили это на моральных дилеммах / Хабр

Допустимо ли пожертвовать одним человеком, чтобы спасти нескольких? Стоит ли вмешиваться, если любой выбор приведёт к ущербу? У таких задач нет ответа в формате «правильно или неправильно». Есть личная позиция — результат ценностей, культурных норм и прошлого опыта. Эта позиция может меняться, когда рядом появляется тот, кто говорит уверенно, последовательно и убедительно. Раньше в этой роли выступал другой человек, сегодня всё чаще — языковая модель.

Мы в Лаборатории нейронаук и поведения человека Сбера проверили, способен ли ИИ влиять на моральные решения людей. Препринт исследования опубликован на arXiv.org.

Классический эксперимент Соломона Аша

Человеку трудно оставаться при своем мнении, когда большинство вокруг уверенно говорит обратное. Даже в очевидных ситуациях часть людей начинает сомневаться в собственной оценке, или хотя бы публично соглашается с группой.

В 1950-х это наглядно показал Соломон Аш в своём эксперименте «Воздействие группового давления на изменения и искажения суждений». Он давал участникам простую задачу: показывал линии разной длины и просил выбрать, какая совпадает с эталоном. Ответ был очевиден. Но из 7 из 8 участников были «сообщниками» экспериментатора. Подставные участники единогласно называли заведомо неправильный вариант.

75% «наивных испытуемых» хотя бы в одной серии эксперимента повторяли заведомо неверные ответы, которые перед ними высказали остальные члены группы, и только 25% систематически отказывались следовать групповому «безумию».

Это классический социальный конформизм: человек меняет ответ, потому что не хочет выделяться, спорить, идти против большинства. При этом внутри он часто остаётся при своём мнении, просто вслух озвучивает социально приемлемое суждение.

У Соломона Аша источником влияния была группа людей. Нам стало интересно, что изменится, если на её место поставить ИИ.

Как устроен наш эксперимент

В исследовании Лаборатории нейронаук и поведения человека Сбера участвовали 165 человек. Каждому предлагали 18 моральных дилемм из семейства «проблемы вагонетки» — ситуаций, где приходится выбирать между двумя плохими вариантами и оценивать решение героя сценария по шкале от 1 («категорически недопустимо») до 5 («абсолютно необходимо»).

Решение проблемы вагонетки зависит от того, в какой культуре сформировалась личность

Испытуемых случайным образом распределили по четырём группам.

Контрольная группа решала дилеммы без какого-либо внешнего влияния. Ответы этой группы дали исходный уровень: как люди отвечают сами по себе. Заодно он подтвердил, какой вариант для нашей выборки «нормален».

В моральных дилеммах из семейства «проблемы вагонетки» обычно выбирают между двумя логиками. Первый: выбрать вариант, при котором погибнет меньше людей. Второй: считать, что некоторые действия недопустимы сами по себе — например, нельзя толкнуть человека под вагон, даже если это спасёт пятерых. По данным кросскультурных исследований, российские респонденты чаще склоняются ко второму варианту. Наша контрольная группа показала то же самое. Поэтому ответы подставных участников и ИИ мы специально подбирали так, чтобы они шли против этой привычной позиции.
В группе «люди» участник думал, что обсуждает дилеммы на обычном онлайн-созвоне с шестью другими людьми. Все были с включенными камерами и микрофонами, ответы давали по очереди. На самом деле остальные участники были подставными: они заранее знали, что отвечать, и единодушно поддерживали один и тот же вариант. Настоящий участник отвечал ближе к концу, уже после того, как слышал позицию группы.
Группа «простой ИИ»: перед участником отвечал ИИ, коротко озвучивая решение.
*Мы использовали схему Wizard-of-Oz: модель заранее сгенерировала ответы по нашим промптам, мы записали их в виде аудио и проигрывали в нужный момент. Участники при этом были уверены, что система анализирует дилеммы прямо сейчас. То есть мы проверяли не работу конкретной модели, а восприятие человеком ответов ИИ.
Группа «объясняющий ИИ»: тот же ответ, но с обоснованием: одна-две фразы со ссылкой на этический принцип. Например: «с точки зрения минимизации вреда вариант Б сохраняет больше жизней» или «согласно принципу двойного эффекта, моральная допустимость действия зависит от намерения, а не от исхода».

Ответы подставных участников и ИИ специально подобрали так, чтобы они расходились с ответами контрольной группы и нормативно ожидаемыми вариантами. Это была не нейтральная альтернатива, а позиция, которая должна вызвать внутреннее сопротивление. Согласие с таким ответом считали проявлением конформизма.

После каждой дилеммы участник сначала называл своё решение вслух, а затем записывал его в личном бланке. Этот двойной замер — важная деталь, дальше будет ясно почему.

Что получилось

ИИ с объяснением влиял на моральные решения почти так же сильно, как давление группы. При этом, когда модель просто сообщала решение без аргументов, участники чаще оставались при своём мнении. Но когда появлялось объяснение, эффект заметно усиливался.

В группе с людьми хорошо видно различие между публичным согласием и личной позицией: в 56% случаев ответ вслух расходился с тем, что человек потом записывал в личном бланке. Вслух испытуемый подстраивался под большинство, но наедине оставался при своем мнении.

С объясняющим ИИ иначе. Устный и письменный ответы почти всегда совпадали: разрыв составил 2,6% у ИИ с объяснением и меньше 1% у ИИ с односложным ответом.

Односложный ответ ИИ почти не менял позицию — устный и письменный ответы совпадали. А когда ИИ давал объяснение, участники чаще принимали его позицию и сохраняли её в личном бланке.

Это позволяет осторожно предположить, что объясняющий ИИ способен менять позицию глубже, чем групповое давление. Человек не просто повторяет чужой ответ вслух, а начинает использовать предложенные аргументы как часть собственного рассуждения. То есть ИИ с объяснением может менять саму логику, через которую оценивают дилемму.

Почему объяснения меняют ситуацию

Аргументация меняет статус ответа — демонстрируя рассуждение, ИИ начинает выглядеть как носитель способности, которую принято связывать с людьми. Способность рассуждать запускает социальные эвристики, обычно адресованные людям. Модель показывает ход мысли, использует моральные категории, взвешивает последствия, говорит о благе, вреде, ответственности, справедливости — человек получает готовую структуру для внутреннего диалога.

После эксперимента часть участников проходила небольшое интервью. В группе с объясняющим ИИ его описывали как ориентир, который помог дать «правильный» ответ. При этом испытуемые не чувствовали, что отдали решение кому-то: один из них прямо сказал, что выбрал сам. Объяснение работает как иллюзия понимания: решение кажется собственным и продуманным, хотя рамку для него задала модель.

ИИ с коротким ответом описывали как систему, которая просто считает, сколько людей выгоднее спасти, и подозревали, что модель не дообучена. А вот ИИ с обоснованием люди описывали как рационального и «этически грамотного» агента без человеческих эмоциональных перекосов — и потому, по их ощущению, более объективного, чем человек.

Не только о вагонетках

Чтобы продемонстрировать социальный конформизм, Соломону Ашу понадобилось семь подставных участников и отрепетированный сценарий — целый спектакль ради одного человека. Объясняющему ИИ хватило пары фраз, чтобы достичь того же эффекта.

ИИ сегодня участвует в принятии реальных решений — вплоть до стратегических (мы рассказывали о проблемах участия ИИ в стратегических решениях в материале «Топ-менеджеры советуются с ИИ по стратегическим вопросам. Что может пойти не так?»). Его влияние при этом легко недооценить: кажется, что решение всё равно принимает человек. Формально так и есть. Фактически же человек может принимать решение уже внутри нарративной рамки, которую задал ИИ: какие факты считать важными, какие принципы применить, какие риски допустимы.

Это не аргумент против ИИ. Наоборот, ИИ может помогать мыслить точнее: замечать упущенные факторы, формулировать альтернативы, проверять противоречия, расширять поле возможных решений. Но для этого человек должен оставаться не пассивным получателем уверенного объяснения, а активным участником рассуждения.

Как писал один из самых влиятельных американских психологов Беррес Скиннер:

«Настоящая проблема не в том, мыслят ли машины, а в том, мыслят ли люди».

Развитие критического и системного мышления — ключевые условия ответственности за принимаемые решения. Критическое мышление помогает не принимать убедительное объяснение за истинное только потому, что оно звучит логично. Системное мышление помогает видеть всю конфигурацию последствий.

ИИ может предлагать рамку. Но человек должен уметь эту рамку заметить, проверить — и, при необходимости, выйти за её пределы.

Феномен ИИ-конформизма: как алгоритмы меняют моральные решения человека
https://arxiv.org/abs/2606.00013, апрель 2026

Авторы исследования: Яна Венерина, Дмитрий Кох, Нарэ Мелоян, Герда Прутько, Валерия Лелик, Виктория Таова, Андрей Курпатов