«Дело не в тебе, а во мне» — обнаружение и восприятие флирта на экспресс-свиданиях

Original author: Rajesh Ranganath, Dan Jurafsky, Dan McFarland
  • Translation
Об экспресс-свиданиях (speed-dates) на Хабре уже писали. Вкратце, собирается группа участников, они беседуют в парах примерно по 5 минут, затем меняются собеседниками. Каждый участник про каждого из своих партнёров отмечает, насколько сильно он ему понравился; если симпатия окажется взаимной, организаторы передают обоим контакты друг друга.

Группа исследователей из Стэнфордского университета занимается анализом человеческих диалогов, пытаясь распознать как намерения говорящего, так и восприятие речи слушателем. Несоответствие между подразумеваемым и воспринимаемым — закономерное свойство естественной речи. Для анализа использовались стенограммы с экспресс-свиданий, на которых каждая сторона оценивала «заигрывающесть» партнёра, и отмечала свою. Построенной системе автоматического распознавания флирта удалось верно определять намерения говорящего в 71.5% случаев; это превзошло точность оценок самих участников экспресс-свиданий. Как выяснилось, люди в большей степени проециируют на собеседника собственные ощущения, чем анализируют его речь.


Эксперимент


В 2005 г. студенты-добровольцы провели три сеанса экспресс-свиданий, на которых каждый участник держал включённый диктофон. Были собраны записи около 1100 четырёхминутных свиданий. Поскольку свидания проходили в естественной обстановке, записи включали сильный фоновый шум, сделавший невозможным автоматическое распознавание говоримого текста. Текст был распознан вручную, и для каждого предложения было отмечено время его начала и конца на аудиозаписи, чтобы можно было автоматически определять темп и тембр речи.

Кроме звукозаписей, каждый участник оценивал по 10-балльной шкале (1=ни разу, 10=постоянно): «Как часто собеседник вёл себя таким-то образом?» (заигрывающе, неловко, забавно, напористо и т.п.) и «Как часто вы сами вели себя таким-то образом?» В работе, опубликованной в прошлом году, исследователи анализировали лишь оценки заигрывающести. Отдельно рассматривалось выражение своего флирта участниками и участницами, и отдельно — восприятие участниками и участницами флирта своего собеседника. Таким образом было построено четыре анализатора речи, использовавшие и звукозапись беседы, и её стенограмму.

Анализаторы определяли несколько десятков численных параметров, характеризующих интонацию речи, ведение диалога, и используемую лексику. К интонационным параметрам относятся высота (основная частота, F0) речи, её громкость (RMS) и темп (слов/мин). Параметры ведения диалога были получены из стенограммы специально составленными регулярными выражениями. Подсчитывались следующие события:
  • Поддакивания: Ага; Ладно; Ну...
  • Одобрения: Ух ты; Ага, точно; Здорово
  • Вопросы
  • Переспрашивания: Подожди? В смысле?
  • Завершения фраз за собеседника
  • Смех
  • Несогласные ответы, начинающиеся с Ну,
  • Заполнения пауз: Ээ...
  • Обрывы незаконченной фразы
  • Перебивания одним говорящим другого
Используемая лексика анализировалась по принадлежности к десяти категориям, составленным специально для этого исследования:
  • Ты: твой; тебя; тебе
  • Мы: наш; нас; нам; давай
  • Я: мой; меня; мне
  • Одобрение: да; ладно; круто; отлично; согласен
  • Брань: чёрт; хрен; блин; дерьмо; нафиг
  • Предположение: думать; чувствать; полагать; понимать; представлять
  • Злость: ненавидеть; смехотворный; тупой; убить; долбаный; чёкнутый
  • Недовольство: плохой; проблема; тяжёлый; странный; скучный; грустный
  • Секс: любить; обожать; трахать; девственница
  • Еда: кушать; пить; вода; вино; кофе; бар; ужин; блюдо
Также подсчитывалось число употреблений прошедшего времени (по предположению исследователей, его использование в диалоге означает переход одного из собеседников на монолог), и число ссылок на проводимый эксперимент (свидание; анкета; бланк; исследование).

Выбранные параметры могут быть недостаточно выражены за короткое время беседы. Авторы построили статистическую модель, связывающую использованные в беседе слова с каждым из параметров, и выполнили «сглаживание» наблюдаемых значений каждого параметра, учитывая его статистически наиболее вероятное значение для использованных в беседе слов.

Результаты


Точность распознавания:
Заигрывание Восприятие заигрывания
М Ж М Ж
с явными параметрами 61.5% 70.0% 77.0% 59.5%
со сглаживанием 69.0% 71.5% 79.5% 68.0%
человеком 62.2% 56.2%
Интересно, что предложенная система одинаково точно распознаёт заигрывание молодых людей и девушек, при этом заметно лучше распознаёт реакцию девушек, чем молодых людей, на заигрывание собеседника. Другой интересный результат — что статистически значимыми для молодых людей оказались только 23 параметра, по сравнению с 31 у девушек. Таким образом, девушки оказались предсказуемее, зато богаче в выразительных средствах.

Как выяснилось, заигрывающие студенты задают больше вопросов, чаще используют ты и мы, больше смеются, используют больше слов из категории «злость», «недовольство», «секс». Их речь быстрее и выше тоном, но тише. Реакции собеседницы, свидетельствующие о заигрывании её партнёра: смех, брань, сексуальная лексика, повышенные темп и тон.

Студентки, когда заигрывают, используют более широкий диапазон высоты голоса; смеются; чаще говорят я и но; чаще переспрашивают, но не задают других вопросов; используют больше сексуальной лексики, меньше одобрений и поддакиваний; их предложения становятся длиннее и реже. Собеседник при этом чаще использует ты, задаёт больше вопросов, говорит тише и быстрее.

Кроме того, удалось выяснить, в каких случаях человек считает, что его собеседник заигрывает. Непонимание между людьми часто вызывается тем, что говорящий использует одни выразительные средства, а слушатель обращает внимание на другие. Так, хотя параметры, указывающие «он/а заигрывает» и «про него/неё решат, что он/а заигрывает», во многом совпадают, — есть важные отличия. Девушки считают, что их собеседник заигрывает, когда он реже использует одобрения и реже перебивает, — хотя статистически эти параметры не свидетельствуют о намерениях молодого человека. Кроме того, девушки преувеличивают значение задаваемых молодым человеком вопросов, и его ускоренной речи. Молодые люди, напротив, не придают достаточного значения смеху собеседницы, её переспрашиванию, и длинным предложениям.

Интересно сравнить поведение заигрывающих студентов и студенток. Общая характеристика — то, что они больше смеются, говорят быстрее, и повышают тон голоса. Есть и различия: когда заигрывают молодые люди, они задают больше вопросов, чем обычно; когда девушки — меньше, чем обычно; но девушки начинают чаще переспрашивать, а молодые люди — нет. Девушки чаще говорят я и реже мы; молодые люди — чаще мы и ты. Девушки уменьшают использование одобрений, а молодые люди — нет.

«Дело не в тебе, а во мне»


Как же так получилось, что автоматический распознаватель флирта существенно превзошёл в точности живых участников эксперимента? Чтобы проиллюстрировать суть проблемы, исследователи приводят анкеты участника №101 и участницы №127:
Я заигрываю Собеседник заигрывает
Участник №101 8 7
Участница №127 1 1
Впечатления этой пары об их свидании совершенно противоположные; но при этом, каждый оценил намерения своего партнёра практически так же, как свои собственные. Это не единичный пример: оказалось, что корреляция («я заигрываю», «я считаю, что мой собеседник заигрывает») составляет 0.73, тогда как корреляция («я заигрываю», «мой собеседник на самом деле заигрывает») — лишь 0.15. Похожие результаты получились и для других критериев оценки прошедшего свидания:
(самооценка, оценка собеседника) (самооценка, оценка собеседником себя)
Флирт 0.73 0.15
Доброжелательность 0.77 0.05
Неловкость 0.58 0.07
Напор 0.58 0.09
Хотя точность распознавания людьми намерений партнёра во всех случаях низкая, флирт распознавался лучше, чем прочие характеристики. Исследователи связывают это с тем, что в условиях экспресс-свидания участники больше сосредоточены на флирте партнёра, и меньше анализируют остальные элементы его поведения. Другое важное наблюдение — что для «притягивающих» черт поведения (флирт, доброжелательность) участники теснее связывали самооценку с оценкой собеседника, чем для «отталкивающих» (неловкость, напор).

Конечно, распознать намерения партнёра за четыре коротких минуты непросто. Но несомненно, что каждый участник оценивал не столько поведение собеседника, сколько собственные впечатления и намерения, предполагая «по умолчанию» наличие взаимности. Автоматическая система лишена подобного «слепого оптимизма», и звукозаписи четырёхминутного свидания ей достаточно, чтобы сделать более точную оценку, чем сами участники свидания, — даже при том, что в распоряжении участников были также мимимка и жесты, а системе они недоступны.

В качестве приложений данной работы видятся как обнаружение ключевых данных в массиве текста (например, эффективная индексация переписки, диалогов в социальных сетях, протоколов заседаний и собеседований), так и реализация более совершенных автоматических собеседников, в том числе для дейтинг-сайтов.
Share post

Similar posts

AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 48

    +5
    Любопытно. Очень любопытно.
      +2
      Особенно про употребляющуюся лексику было интересно.
        +1
        Вот именно. Любопытно, но ничего более.
        +6
        С такими темпами скоро любовь системой диффуров опишут :-)
          +19
          Я бы продифференцировал систему её функций, если вы понимаете о чем я.
            0
            Ну, flowcharts уже есть, как минимум.
            Гуглите «Mystery method».
              +1
              Поскорее бы.
              +4
              Нужно срочно применить эти знания на практике, срочно.
                –8
                Да всё проще. Обычно свои намерения относительно собеседника понятны за 1-5 секунд после одного сказанного ею «Привет!»… Этого времени хватит чтобы сформировать образ человека, распределить его по типам и сделать оценку возможности или невозможности дальнейших отношений… (Кстати, спрашивал и у девушек — они вообщем-то также за первую секунду знакомства оценивают, будут ли они спать с этим человеком или нет)

                Но вообще интересная информация… Возможно, дальнейший анализ этого позволил бы улучшить тренинги по успешному ведению переговоров с удаленным собеседником (телефон/скайп/..). Лучше бы они эти 4 минуты не пытались развести друг друга на секс, а старались продать что-то друг другу или создать имидж себя/своей компании как лучших для собеседника партнеров.
                  +19
                  Не верьте девушкам касательно этой их знаменитой «первой секунды». Точнее верить можно, главное не забывать, что у них эта секунда повторяется при КАЖДОЙ встрече :)
                    –1
                    Согласен. Впрочем как и у мужчин ведь. :-)

                    Одежда, макияж, запах, настроение и поведение и много мелких других факторов при каждой новой встрече будут меняться, а значит, и наше отношение к объекту. Кроме того, мы сами каждый день и одно и то же будем видеть (не)много иначе через призму собственного настроения, каких-либо переживаний и радостей. :-) Конечно, присутствует и наша память о прошлых встречах. Вообщем, оно ведь логично, что при *каждой* встрече, не совсем понял, почему вы это выделили отдельно…

                    JuliaTem, вы о чём?.. (про тренинги: есть спрос — есть предложение, в мире полно глупостей и это хорошо :-) )
                    +5
                    Lord_Daedra, глупости, которые хорошо продаются на известных тренингах :)
                      0
                      Интересно, где стояли эти самые девушки, у которых вы что-то там спрашивали?:)
                        +1
                        Не понял ваш вопрос. :-)
                          +1
                          Элементарно, Ватсон. Если девушки стоят, скажем, на Ярославке, то они, конечно, в первую секунду скажут, будут с вами спать или нет. Вопрос в том — где стояли ваши девушки?
                            –2
                            А где стоите вы? :-) Вот если бы спросили у вас, неужели вам бы потребовалось больше времени? :-)
                        +1
                        У вас с опрошенными девушками случился сбой терминов :) В первую минута девушка может решить «хочу!», зачастую осознанно это не отметив — думаю, это не только для женщин справедливо :) А уж кто на самом деле с кем будет спать, общаться, встречаться, жить и т.д. — решается уже дальнейшим общением, и первое «хочу» или отсутствие оного тут мало влияет. Имхо.
                        +4
                        Как я понимаю национальные особенности в исследовании не учитывали?
                          0
                          я тоже хотел об этом написать. Каждый раз ловлю себя на том, что все психологические исследования не учитывают особенности национального менталитета.
                            0
                            Точно так же, как и «распознаватели картинок» не учитывают марку фотоаппарата, которым было сделано фото.

                            Классифицировать можно до бесконечности.
                              0
                              ваше сравнение некорректно.
                              Пример разницы менталитетов — отношение к гомосексуальной культуре в Британии и у нас, соответственно, отношение и к разговорам об этом и внешнему виду вообще. А марка фотоаппарата не вкладывает принципиальных различий в качество картинки.
                                +1
                                «распознование картинок» и «марка фотоаппарата» — это всего лишь образы. Я надеюсь вы это поняли?

                                А теперь расскажите, как именно отношение к гомосексуализму в Британии и у нас влияет на, скажем, тестирование темперамента человека?

                                В том-то и дело — никак. Точно так же как и «марка фотоаппарата» в задаче «распознавание образа» — никак не влияет. (Я уверен, что вы сможете сами придумать задачу, при которой марка фотоаппарата будет важна).

                                Те исследования, в которых национальный фактор важен (влияет сильно и очень сильно) — там этот фактор учитываются. (А там где он нём заранее не подумали, но он оказался важным — он всплывет сам).
                                Там где не очень — не учитывается.

                                Почему вас не смущает, что исследователи не обращают внимание на погоду, которая была за окном? Уверяю вас, это тоже будет влиять на результаты. Только степень корреляции будет мала.

                                Прошу прощения за сумбур, но надеюсь мысль ясна?

                        • UFO just landed and posted this here
                            –2
                            Нелепое исследование из разряда «британские учёные доказали».
                            Начиная, собственно, с заголовка — что такое «флирт»? Кто-нибудь может дать четкое определение?
                            Заголовок для гламурных журналов, а не исследований.

                            Логично было бы выявлять сексульное желание, страх, агрессию и другие понятные эмоции, которые к тому же за 5 минут могут меняться прямо противоположно. Тогда бы исследование было более научным, и сама система несомненно интересной.

                            Сама по себе тема мне интересна. В частности, для определения эмоционального состояния клиента по голосу при звонке в call-центр. Однако, такие системы пока что в зачаточном состоянии.

                              +2
                              По-моему, эксперимент поставлен совершенно чётко и корректно. Кроме того, статья именно под этим заголовком опубликована в Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing

                              Определять «что такое флирт» авторам не нужно было: каждый участник эксперимента сам про себя отметил, флиртовал он или нет.
                              +7
                              По-моему, дейтинг-боты — это крайне перспективная бизнес-возможность.
                              Только представьте себе, как эффективно можно впарить продукт клиенту, когда у него кровь отлила от головы.
                                +1
                                А когда то было так просто… достал дубину, огрел по голове и потащил в пещеру заигрывает… не потащил в пещеру, не заигрывает.
                                  +2
                                  обнаружен дроид из Старкрафта
                                    +3
                                    Адьютант же.
                                    +2
                                    Флирт для гиков :)
                                      +10
                                      Шелдон Купер одобряет данное исследование.
                                        0
                                        Однако, у него другие мотивы ;)
                                        –5
                                        только непонятно что делает эта статья на it ресурсе Оо
                                        хотя может я излишне придираюсь
                                          +3
                                          IT — это не только формочки, это ещё и обработка естественных языков, и другие аспекты «искуственного интеллекта»
                                            –1
                                            согласен. но тогда стоило бы рассказать каким софтом пользовались, примеры алгоритмов скриптов и т.п. а так получается что пост звучит примерно так «кто-то где-то что-то как-то посчитал — получил вот такие цифры». и что? какова их ценность? какие выводы? какова их применимость хоть куда-то? описание методики было бы гораздо полезней. это хотя бы можно было применить.
                                              +4
                                              Использованные методики в статье описаны. Я только подробное описание статистической модели при переводе пропустил. Если хотите — прочитайте по ссылке, формулы в переводе не нуждаются.
                                              Готовый код вам, конечно же, никто не даст. Или вы ожидали статью в стиле «прикрути этот скрипт к своему сайту, и начни зарабатывать ПРЯМО СЕЙЧАС»?
                                                –2
                                                ну вот. то, что действительно ценно — «идите читайте по ссылкам». ну так и постить надо было только ссылки тогда
                                          0
                                          «Британские ученые определили...»
                                            +2
                                            «Анатолий Ализар запостил...»
                                            +3
                                            — Я любить обожать трахать девственница и кушать пить вода вино кофе!
                                            — круто, отлично, согласен!
                                              0
                                              Идея хороша, вот если люди, планирующие построить на этом бизнес не будут упускать детали в организации, получится востребованная услуга.
                                              Я одно время собиралась посетить подобное мероприятие, даж зарегилась на их сайте, но как-то доехать до места так и не сложилось, опять же остановили ценники. Я, конечно, не против вложить деньги в «благое» дело, но для меня это показалось многовато… поэтому, как было предложено выше, взносы можно сократить за счет ресторана/клуба/бара, принимающего гостей)
                                              А так, для интереса один раз надо сходить, удовлетворить любопытство, оценить «прелести» подобного вида знакомств. На мой взгляд, оптимально пообщаться вживую с 20 людьми и вынести для себя есть ли кто-то, заслуживающий внимания или нет. Вполне достаточно 5 минут, чтобы понять, приятен человек или нет, типа как с дубиной — «потащил» или «не потащил» в пещеру))
                                                0
                                                Видимо большая сумма — хорошая преграда для троллей, нлпишников и прочих психологов.
                                                И сколько подобные сервисы просят?
                                                  0
                                                  Когда мы этим занимались, билет стоил 1,5K, куда включался любой напиток на выбор гостя. По нашему опыту, проблема состояла не в сумме, поскольку за 1,5 тысячи получалось 15-20 свиданий, а в страхе, и как не странно, именно мужчин. Девушки шли гораздо охотнее.
                                                    +1
                                                    В прошлогоднем топике даже обсуждали причину: для девушки такое «свидание» мало чем отличается от обычного знакомства в метро / на выставке / в клубе, а для мужчины воспринимается как неспособность «утащить в пещеру» традиционными способами.
                                                      0
                                                      Мб ты прав про мужчин, тебе виднее) Но меня остановило лишь отсутствие гарантий, хотелось быть уверенной, что точно не уйдешь одна да и еще пообщаешься с приличным количеством адекватных людей, именно адекватность людей, собранных там, вызывала сомнения.
                                                      Я не испытываю сложностей в новых знакомствах, просто нет у мужчин на лбу индикатора в виде бегущей строки, говорящей, что ему это нужно и ты ему симпатична)) Я в метро один раз просто подошла и дала номер молодому человеку потому, что понравился и не скрывал симпатии, оказалось — занят… А там уже понятно, для чего люди собрались!
                                                      0
                                                      Страх?
                                                      Дело скорее в желании.
                                                      15-20 раз придумывать о чём говорить, по мне это слишком скучно и быстро потеряется интерес. Последние будут идти с мыслью «быстрей бы закончилось».

                                                      Разве что чисто для разнообразия, но тогда легко свалиться в троллинг.

                                                      Много получилось провести таких встреч? И какой был результат (знакомств, а не о деньгах)?
                                                      0
                                                      Аналогичная сумма, разделенная по возрасту: после 23 повышение ставок по взносам)))
                                                        0
                                                        Есть более интересные и востребованные предложения, если уж говорить о свиданиях

                                                  Only users with full accounts can post comments. Log in, please.