Как стать автором
Обновить

Взлом мозгов. Сбор данных из социальных сетей

Время на прочтение7 мин
Количество просмотров21K

Взлом компьютера, телефона, электроподстанции, беспилотника или даже целого города – кого этим удивишь?

Взлом мозгов сотен миллионов людей – вот это впечатляет! США, Великобритания и граждане стран третьего мира попали под влияние компании SCL Group и ее дочерних организаций, особенно на слуху была и останется теперь навечно Кембридж Аналитика.

Этот цикл рассказывает историю SCL и ее дочерних компаний глазами бывшего директора по исследованиям – Кристофера Уайли. О том, как 24-летний либеральный канадский гей с пирсингом в носу и розовыми волосами оказался в составе британского военного подрядчика, разработал инструменты психологической войны для американских ультра-правых и рассказал об этом всему миру

Это третья часть, и посвящена она различным методикам сбора приватных данных и тому, как команда психологов и аналитиков построила невероятно точную модель американского общества. Удивительно, порой, как плотно гуманитарные науки могут смыкаться с сугубо техническими.

Часть фактов автор данной статьи ставит под сомнение, однако публикует как есть со слов Кристофера Уайли, указанных в его мемуарах. По ряду вопросов мнение автора и разоблачителя могут расходиться.

Первая и вторая части, напомню, есть на Хабре и доступны также по ссылке внизу, в блоке навигации

Часть фактов автор данной статьи ставит под сомнение, однако публикует как есть со слов Уайли, указанных в его мемуарах. По ряду вопросов мнение автора и разоблачителя могут расходиться.

Создание Cambridge Analytica

Главные злодеи действующие лица:

  • Робер Мерсер - Миллиардер, Республиканец, спонсор партии.

  • Стив Беннон - Советник Дональда Трампа, один из активнейших организаторов его предвыборной кампании.

  • Александр Никс - Директор SCL.

Александр Никс
Александр Никс

Стив Беннон совместно с Александром Никсом уговорили господина Мерсера вложить 20 миллионов долларов в новую дочернюю организацию SCL - Cambridge Analytica.

  • Мерсер получил 90% компании за инвестиции в $20 млн.

  • Беннон – управление новосозданной компанией.

  • SCL – 10% своей дочерней компании Cambridge Analytica (CA).

Но почему Мерсеру не вложил эти 20 миллионов в избирательную кампания Дональда Трампа? Почему такие сложности?

  1. CA первоначально создавалась для деятельности за рамками правового поля – прямое вмешательство в выборный процесс методами информационной войны.

  2. В законах о финансировании избирательных кампаний есть большой список ограничений и требований к прозрачности. На частную компанию CA они не распространяются.

  3. CA была зарегистрирована в США, в отличии от SCL - британской компании.

  4. Избирательная кампания всегда под микроскопом противников, частная компания – в тени.

При создании CA от вдохновляющего Мерсера и Беннона звучали следующие тезисы:

  • Мы создадим настоящий Палантир!”

Смотрели Властелин колец? Палантир - всевидящее Око Саурона. Но и еще Палантир – это на момент создания CA самый известный и эффективный программный продукт для сбора и анализа разведывательных данных. Палантир был создан коллегами Илона Маска по PayPal во главе с Питером Тиллем.
Смотрели Властелин колец? Палантир - всевидящее Око Саурона. Но и еще Палантир – это на момент создания CA самый известный и эффективный программный продукт для сбора и анализа разведывательных данных. Палантир был создан коллегами Илона Маска по PayPal во главе с Питером Тиллем.
“The Sims в реальности!”
“The Sims в реальности!”

Играли в The Sims? Симулятор жизни, где можно следить за своей виртуальной семьей и влиять на поведение каждого человечка. Эдакая песочница с возможностью быстрой перемотки вперед или загрузкой предыдущего состояния. Наши злые гении решили играть подобным образом избирателями США, моделируя общество и влияя на их решения. В целом, это позволило бы в разы поднять эффективность рыночной разведки для хедж-фондов самого Мерсера.

  • “Uber информационной войны!”

Нет тут не про индусов за рулем) Uber в свое время стал “market changer”ом, одним приложением убив всю вековую индустрию такси.

История названия

До создания компании CA Стив Беннон частенько приезжал в Лондон. Александр Никс и Кристофер Уайли презентовали ему свои разработки, рассказывали выдуманные истории о работе с Кембриджем и профессорами оттуда, и, когда Беннон попросил показать ему офис в Кембридже, они это сделали.

За пару дней арендовали фейковый офис с оборудованием, посадили туда красивых сотрудниц в максимально откровенных, но деловых нарядах, создали иллюзию работы.

В дальнейшем Беннон каждый раз прилетая в Лондон, назначал встречу именно в этом офисе и его приходилось арендовать снова и снова – вот такая “потемкинская деревня” от SCL! Ну и когда пришло время выбирать название для дочерней компании SCL, именно Беннон настоял на Cambridge Analytica – “Ведь именно там вы базируетесь!"

Таким образом, первой успешно “обработанной” целью Cambridge Analytica стал сам его создатель – Стив Бэннон. Если даже его удалось одурачить, то был ли шанс у простых избирателей?

Facebook, еще не Meta.

“Определение характеристик личности пользователя на основе взаимодействия и характеристик системы социальных сетей” – патент самого Facebook. Ведь чем больше социальная сеть знает о вас, тем легче эти данные монетизировать. Фейсбук не только проводили такие исследования самостоятельно, но и поддерживали исследования в обмен на данные.

Были ли ограничения у Facebook или хотя бы партнеров соцсети на сбор? Формально, да…

Например, по задумке Александра Когана и под руководством Кристофера Уайли, Кембридж Аналитика собирала данные с помощью множества приложений, одним из которых было “This is Your Digital Life”. По одной установке пользователем Фейсбук и нажатием на одну кнопку данное приложение получило доступ к:

  • Информации профиля пользователя

  • Лайкам пользователя

  • Его геолокации

  • Дате рождения

А также получало доступ к аналогичной информации всех его друзей! В среднем, у одного пользователя 150-300 друзей в Фейсбуке, которых он таким образом “сдавал”. “Если друг оказался вдруг…”

В зависимости от настроек приватности, у установившего приложение также утекало:

  • Новостная лента

  • Личные сообщения (!)

  • Посты

Пруфы? Сообщение Фейсбук после обличения CA прилагаю, подробности – спойлеры на последнюю часть нашего цикла.

Таким образом, Фейсбук не препятствовал сбору данных, позволял собирать их по одному клику у пользователей и раздавал данные его друзей без всякого контроля. Но что дают эти данные?

Остальное — спойлеры, наберитесь терпения.
Остальное — спойлеры, наберитесь терпения.

Это не ИРЛ(In Real Life)!

Это же в Интернете, а не реальность! Многие считают, что эти данные не связаны с реальностью, но они – результат нашей реальной жизни. Они – наша реакция на все происходящее.

Социальные сети осуществляют качественное и независимое наблюдение за цифровой “естественной средой”. И, по результатам исследования 2015 года, одни лишь ваши лайки позволяют предсказать наше поведение:

  • 10 лайков > предсказание коллеги.

  • 150 лайков > предсказание члена вашей семьи.

  • 300 лайков > предсказание вашей супруги/супруга/партнера.

В отличии от вашей семьи, партнера и коллег, с социальной сетью мы взаимодействуем постоянно, не так строго контролируем “маски” и гораздо больше откровенничаем. В результате социальная сеть может знать ваши привычки даже лучше, чем вы сами.

Первый массовый сбор

В качестве тестового бюджета CA выделила $10тыс. Цель была проста: собрать 10 тысяч профилей в Фейсбук. Как это проще всего сделать?

Заплатить каждому лоху по доллару!

Для этого CA запустила свои кампанию на площадке Amazon Mechanicalturk. Это площадка для простой подработки через интернет: решать капчи, сортировать картинки и любые другие элементарные задачи, которые легко делает человек и сложно сделать машине.

CA платила $1 за прохождение психологического теста через профиль Фейсбук, в результате чего за этот самый бакс CA получала:

  • Результаты психологического теста IPIP-NEO-120 (120 вопросов).

Знакомый тест?
Знакомый тест?
  • Все лайки пользователя и всех его друзей, что позволяло провести параллели с результатами теста и сделать надежные выводы.

  • ФИО, пол, возраст, местоположение, статусы, и, в ряде случаев, личные сообщения.

Выгодная сделка?
В дальнейшем CA использовала и тест с вопросами о девиантном поведении для выявления будущих точек влияния.

От желающих не было отбоя.
Дальше – больше: бюджет раздули до $100тыс, платформа та же, и снова бюджет выработан до нуля.

Контрольные звонки и агрегация

Никс и Беннон, вдохновленные столь эффективным сбором, решили провести контрольный тест.
Для этого были случайно выбраны автоматически сгенерированные профили нескольких жителей США. Сам Никс обзванивал этих людей, а Беннон слушал.

“Здравствуйте, мы звоним из Кембриджского университета и проводим опрос…”

А что же они видели перед звонком?

  • Женщина на фотографии.

  • ФИО.

  • Дата рождения.

  • Место работы.

  • Ее адрес и фотографии дома.

  • В 2012 году голосовала за Митта Ромни.

  • Водит ауди, фото машины.

  • Любит Кети Перри.

  • “Простушка”.

Но самым поразительным стал факт того, что она не проходила тест в Фейсбук.

Тест прошел ее друг в Фейсбуке, эти данные были объединены с открытыми данными и полученными/купленными от государственных и коммерческих бюро:

  • Ее заявки на ипотеку.

  • Доход и кредитная история.

  • Разрешение на оружие.

  • Путешествия из программы лояльности авиакомпаний.

  • Данные об ее здоровье от страховых компаний.

В процессе “опроса” по телефону она подтвердила каждую строчку.

CA воссоздали ее жизнь “in silico”, а она даже понятия не имела об этом.

Развитие

К августу 2014 года, за 2 месяца работы, CA собрала данные 87 миллионов пользователей. Список “работников Mturk” был истощен и был привлечен иной подрядчик для “проведения опросов” (сбора данных) Qualtrics.

В дальнейшем были использованы и более грязные эффективные способы сбора данных – расширения для браузера.

Расширения, которые установлены в вашем браузере, по умолчанию имеют доступ ко всем данным браузера. Включая сookies/пересылаемые данные на ВСЕХ доменах. И обнаружить какой-то злонамеренный сбор браузер не может, ведь тот же блокировщик рекламы постоянно сканирует все страницы, и браузер его активность не замечает.

На тот момент все распространяемые CA расширения успешно проходили проверки антивирусов и проверки магазинов расширений, ведь ничего однозначно вредоносного они не делали!

Эти расширения, как правило, были максимально просты:

  • Календари.

  • Калькуляторы.

  • Темы для Фейсбука.

И многое другое.
Поэтому при установке расширения задумайтесь, насколько вы ему доверяете.

В свое время Александру Никсу MI6 отказали в сотрудничестве, теперь он был готов продать разведданные кому угодно, лишь бы его заслуги признали. АНБ и ЦРУ согласились, и летом 2014 года CA начало с ними сотрудничать.

Посредником для передачи разведданных выступили Palantir – в этот момент на рынке сбора разведданных уже был другой лидер.

Интересен тот факт, что АНБ и ЦРУ официально запрещено собирать подобные данные на граждан США. Но службы могут пользоваться “добровольно представленными данными” от частных лиц и компаний, тем самым обеляя массовую слежку чужими руками.

Итог

  • К осени 2014 года была создана уникальная система слежки и сбора данных более ста миллионов граждан США.

  • Противодействие социальной сети – отсутствовало.

  • Торговля данными граждан – процветала.

  • Команда психологов и аналитиков построила невероятно точную модель американского общества.

Мерсер строил на этом прогнозы для своих хедж-фондов. А вот как именно этим воспользовались Беннон и ультраправые республиканцы?

Узнаете в следующей части этого цикла!

Автор: Forbidden World

Оригинал

Что было и что будет

1. PSYOPS

2. Новые источники и обработка данных

3. Сбор данных из соц. сетей <---- вы здесь

4. Эксплуатация: фейки и манипуляции, Брекзит и Трамп.

5. Расследование: Россия, Ассанж, Facebook.

Теги:
Хабы:
Всего голосов 38: ↑32 и ↓6+30
Комментарии2

Публикации

Истории

Работа

Ближайшие события

22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
2 – 18 декабря
Yandex DataLens Festival 2024
МоскваОнлайн
11 – 13 декабря
Международная конференция по AI/ML «AI Journey»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань