Самый успешный и самый скандальный Data Science проект: Cambridge Analytica

Автор оригинала: Александр Никс
  • Перевод
image

Александр Никс, CEO Cambridge Analytica. Расшифровка презентации 2016 года.

Леди и джентльмены, уважаемые коллеги, для меня честь поговорить с вами сегодня о влиянии больших данных и психографии на избирательный процесс и особенно о том вкладе, который мы внесли в президентскую избирательную кампанию сенатора Круза.

Легко забыть, что всего полтора года назад сенатор Круз являлся одним из менее популярных кандидатов на пост президента. Он же был наиболее критикуемым. Вдобавок к этому его имя было малоизвестно — только 40% избирателей слышали о нем по сравнению с магазином Джеба Буша в середине 80-х годов. И он вел борьбу в одной из самых конкурентных областей республиканской политики. Вдобавок, он искал способ быть услышанным среди в значительной степени гомогенной аудитории.

Тем не менее, в мае 2016 года сенатор Круз уже стал единственным серьезным противником, единственной реальной угрозой феномену Дональда Трампа. Так как он это сделал?

Кампания Круза быстро использовала три технологии, три метода, которые и привели их к успеху.

Бихевиоризм


Первой из этих технологий была поведенческая наука (бихевиоризм). Думаю, проще всего будет объяснить на примере. Представьте, у вас теперь есть собственный частный пляж. И вы хотите, чтобы другие люди перестали его использовать.

image

Вы можете поставить там такой знак, как представлен здесь слева.

Он очень содержателен, и его задача — повлиять на культурные установки. Или вы можете использовать знак справа. Это пример поведенческого общения. Его цель — прощупать почву. Оно взывает к более мощному, основному мотиву. Несомненно, страх быть съеденным акулой может стать преградой вашему желанию идти купаться на их пляж. Однако сделать это сложно, и впоследствии этого большая часть коммуникационных кампаний (PR кампаний) все еще подразделяет аудиторию по демографическим и географическим показателям.

image

Но если задуматься об этом хотя бы на секунду, такая идея начинает выглядеть нелепо. Идея того, что все женщины воспримут сообщение одинаково только из-за их пола. Или что так будет с абсолютно всеми афроамериканцами из-за их расы или с пожилыми людьми или богачами или молодыми людьми только из-за общих демографических характеристик.

Это просто не имеет никакого смысла. Конечно, демографические и географические показатели, а также экономическая ситуация будут влиять на ваше мировоззрение, но психографика так же важна или даже важнее. Это понимание ваших личностных качеств, потому что именно они управляют поведением, а поведение, очевидно, влияет на то, за кого вы отдаете ваш голос.

Так как же это возможно? В Кембридже мы внедрили подробный количественный инструментарий с целью обнаружить основные личностные качества и сформировать представление о личности. Это самая современная модель в экспериментальной технологии, которая известна как модель OCEAN.

OCEAN это акроним от таких понятий как:

  • открытость (Openness) — обозначает уровень вашей готовности к новому опыту;
  • сознательность (Conscientiousness) — указывает на то, предпочитаете ли вы порядок, привычки и планирование в жизни;
  • экстраверсия (Extraversion) — обозначает уровень вашей общительности.
  • уступчивость (Agreeableness) — значит, можете ли вы поставить нужды других людей, общества, сообщества выше себя;
  • невротизм (Neuroticism) — указывает на то, как часто вы беспокоитесь.


image

Проведя данный опрос среди сотен тысяч американцев мы смогли сформировать модель, которая способна предсказать личностные качества каждого совершеннолетнего гражданина Соединенных Штатов Америки.

Так как это влияет на маркетинг и коммуникацию в процессе выборов?

image"

На этапе праймериз (внутрипартийных выборов) вторая поправка может быть популярным вопросом среди избирателей. Если вы знаете характер людей, на которых направляете свое выступление, то можете подстраивать свой способ подачи и содержание, чтобы ваше сообщение лучше отозвалось в вашей целевой аудитории.

Итак, для очень невротической и сознательной аудитории вам понадобится сообщение, которое будет рациональным и основанным на понятии справедливости или эмоциях. В данном случае угроза ограбления и возможность оформления страхового полиса для оружия будет очень убедительной. В обратном же случае, для более закрытой и уступчивой аудитории (это те люди, которые придают большое значение традициям, привычкам, семье, чувству общности. Может быть дедушка научил своего сына стрелять из ружья, а отец в свою очередь научит этому своего сына) разговор об их ценностях сделает процесс передачи вашего сообщения гораздо более эффективным.

Data Analytics


Второй ножкой табурета является аналитика данных. Коммуникация сейчас в корне меняется. В 60-е годы (смотрите сериал Мэттью Вайнера «Mad Man») коммуникация осуществлялась сверху вниз, ее двигало творческое руководство. Тогда блестящие умы собирались вместе и сочиняли слоганы такие как «Фасоль — значит Heinz» (ориг. Beanz Meanz Heinz) или «Это — Coca-Cola» (ориг. Coca-Cola Is It!). После они продвигали эти слоганы в аудиторию в надежде, что та отзовется.

Сегодня нам не нужно догадываться, какое творческое решение сработает. Мы можем использовать сотни и тысячи индивидуальных точек данных целевой аудитории, чтобы точно понять, какой посыл привлечет какую аудиторию гораздо раньше чем начнется творческий процесс.

image

Итак, что же такое большие данные?

Большие данные это объединение наиболее большого возможного количества индивидуальных точек данных. Они синтезируются в одной базе данных, выверяются и после используются для создания представления о целевой аудитории.

В эту информацию могут входить такие данные как демографические и географические показатели, возраст, пол, этническая принадлежность, принадлежность к той или иной религии и так далее. Так же там может содержаться психографика или ваши установочные факторы. К ним относятся каждодневные привычки и предпочтения как потребителя: какая у вас машина, какие товары вы покупаете в магазинах, какие журналы читаете, к какому гольф-клубу принадлежите, в какие церкви ходите.

И, конечно, туда входит информация о вашей личности, она же поведенческая информация. О ней мы говорили ранее. Это данные о том, как вы воспринимаете мир, о том, что на самом деле движет вами.

image

Проще всего проиллюстрировать действие больших данных будет через пример из жизни. Это схема данных, которую мы составили для кампании Круза при подготовке к конкурсу (предвыборное совещание) в штате Айова. Схема выглядит пугающе, но на самом деле все очень просто.

Вот здесь вы видите график. По оси X располагается распределение уровня приверженности партии: ярые республиканцы справа, демократы слева. По оси Y отмечена вероятность того, что избиратели придут на кокус: на верхней части графика отмечены те, кто имеет наибольшую вероятность это сделать, а те, кто находится в нижней части, не имеют таковой вообще.

Эта информация уже достаточно полезна для руководителя избирательной кампании. Но если мы выделим отдельные сегменты на этой схеме, информация станет еще эффективнее.

image

В этом случае мы выделили группу, которую мы называем «Убежденные». Это те люди, которые точно будут голосовать и придут на кокус. Однако чтобы они начали поддерживать Круза, их нужно сдвинуть немного вправо от центра графика. Для этого им необходим посыл, который их убедит.

Мы можем посмотреть на эту группу, состоящую примерно из 45,000 человек, и увидеть, что основными их чертами являются низкие показатели по шкале невротизма, достаточно низкие по шкале открытости, и чуть выше по шкале сознательности.

Мы можем вычленять отдельные понятия и дальше. Мы можем посмотреть на то, какой вопрос их особенно заботит. Я выбрал право на оружие, что еще больше сузило круг анализа. И теперь мы знаем, что нам необходимо выступление о правах на оружие, которое должно быть убедительным и обязательно построенным под личностные черты тех избирателей, в которых мы заинтересованы.

image

И мы можем видеть на карте, где находятся эти люди. Если бы нам захотелось уйти и дальше в детали, мы могли бы отрегулировать данные по индивидуальному уровню, на котором у нас есть около 4 или 5 тысяч точек данных на каждого совершеннолетнего гражданина Соединенных Штатов Америки.

Таргетированная реклама


И наконец, технология адресной рекламы. Она позволяет взять всю эту офлайн информацию и сопоставить ее, чтобы она стала двигателем коммуникации.

Глобальная реклама. Глобальная реклама, идея того, что сто миллионов людей получают одно и то же письмо в рассылке, видят одинаковую телевизионную и цифровую рекламу, мертва.

Мои дети, конечно, никогда не поймут этот концепт массовой коммуникации. На сегодняшний момент коммуникация становится все более и более таргетированной. Она индивидуально подстраивается под каждого присутствующего здесь. Таким образом вы никогда не будете получать рекламные объявления на товары и услуги, которые вам не интересны. Вы будете видеть рекламу только товаров и услуг, или в случае выборов, вопросов, которые для вас больше всего важны, и она будет подстроена именно под ваше мировоззрение.

Мы можем сопоставлять оффлайн информацию с помощью куки, что становится двигателем цифровой рекламы в виде баннеров в соцсетях и тому подобным. Мы можем, естественно, использовать эту информацию, чтобы настраивать рекламу в почтовых рассылках. Например, мужу и всем остальным в семье приходит одна и та же рассылка. Однако его жена может получить слегка отличающееся письмо из рассылки, хотя оно, возможно, даже на ту же тему.

Наиболее восхитительным является тот факт, что мы можем взять эти данные и соединить их с информацией с телеприставки. Каждый раз когда вы смотрите телевизор, те программы, которые вы смотрите, записываются, и эта информация отправляется вашему провайдеру. И мы можем использовать данные о том, что вы смотрите, чтобы отбирать программы, которые смотрит большее количество людей из целевой аудитории, чтобы располагать в них рекламу.

Это не только сильно снижает цену рекламы, но и, конечно, дает лучшие показатели прибыли на инвестиции.

Итак, каковыми были результаты?

image

Тед Круз применил нашу информацию, наши поведенческие идеи не только в сфере телевидения и цифровой рекламы, но и в своих полевых операциях, в методике убеждения избирателей, в кампании по сбору средств, а также в распределении ресурсов.

И все это значило, что он начал с менее чем 5% голосов и очень медленно, но при этом уверенно, поднялся до более чем 35%. Что сделало его вторым наиболее угрожающим претендентом на пост президента в предвыборной гонке.

Конечно, сейчас кампания Круза уже закончена. Но я могу сказать вам, что один из двух кандидатов, которые остались в гонке на этих выборах, использует эти технологии. Будет очень интересно увидеть, как они повлияют на следующие семь недель. Спасибо.

P.S.


Трейлер документального фильма (есть на торрентах) про Cambridge Analytica





image
Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя онлайн-курсы SkillFactory:



Читать еще


SkillFactory
Онлайн-школа по программированию

Комментарии 8

    +1
    Видимо в будущем из-за таких технологий понятие демократии превратится в фарс
      +1

      Будущее уже наступило.
      Hacking human beings..

        0
        Или люди поймут, что критическое мышление стоит развивать.
        0
        Кембридж Аналитика рассмотрена уже достаточно давно и в деталях и по горячим следам например здесь
        www.youtube.com/watch?v=uQUkaEVe7II
        (лучший обзор из доступных)
        Есть и русскоязычные каналы с аналогичным содержанием ( но в таких вопросах здесь как то не принято ссылаться на наших)
          0
          Это схема данных, которую мы составили для кампании Круза при подготовке к конкурсу (предвыборное совещание) в штате Айова.


          Какой конкурс?
          На слайде же в заголовке написано Iowa Caucus.
            +3

            Ерунда, ничего нового с 1980-х, за исключением информационных технологий и таргетированная рекламы. Прочитал банальности. Демократии в Европе не стало с 1980-х, с миттерановской политкампании. В Америке ещё раньше.

              0
              Дада, особенно в Швейцарии.
              +1

              Ерунда какая то, вбухали кучу денег, трудилась куча яйцеголовых с шестизначными зарплатами и все закончилось пшыком, что они продвигают, обращайтесь к нам и вы гарантированно проиграете выборы?

              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

              Самое читаемое