Pull to refresh

Предвыборная гонка глазами поисковых роботов

Reading time 2 min
Views 12K


Мы ежедневно выполняем срез документов, расположенных на главных страницах миллиона самых посещаемых сайтов мира. Сегодня рассмотрим, как количество упоминаний кандидатов в президенты РФ коррелирует с происходящими оффлайн событиями.

Ссылка на график, шкала — линейная

Цифра соответствует количеству найденных упоминаний в тексте из корпуса html-документов получаемого краулером ежедневно, что позволяет нам выводить индекс для каждого кандидата. Обычно мы строим подобные индексы по брендам для маркетологов/pr-специалистов, но выборы — событие историческое.

Признаться, подошли мы к этому вопросу с некоторой халатностью, Собчак добавили каким-то чудом перед тем, как она объявила о своем желании выдвинуть кандидатуру, Грудинина уже когда стало понятно, что без него банкет не состоится. С другой стороны, у нас не было цели сделать доскональный анализ технологий кандидатов, хотели посмотреть как ведут себя топы.

На графике в начале темы мы можем наблюдать динамику упоминаний кандидатов. Шкала линейная, Путин улетел, сильнее всего к его индексу приближалась Собчак (когда объявила о своем выдвижении) и Навальный (когда ему ЦИК отказал в регистрации). Здесь шкала логарифмическая.

Рассмотрим детали


Путин




  1. Прямая линия с президентом
  2. Встреча Путина и Трампа
  3. День рождения Путина
  4. Отмена встречи с Трампом
  5. Выдвижение кандидатуры на пост президента
  6. Большая пресс-конференция Владимира Путина
  7. Обращение к федеральному собранию



Навальный




  1. Организовал митинг
  2. Навальный продал «Лайфу» видео про «отдых Навального во Франции». Заработал 10 тысяч рублей для своей президентской кампании. Meduza. Параллельно запустилась сеть сайтов по продаже атрибутики к выборам с символикой Навального. Именно эта сеть так задрала фон.
  3. Протестные акции сторонников Алексея Навального
  4. ЦИК отказал в регистрации
  5. Протестные акции сторонников Алексея Навального
  6. Сайт Навального внесли в черный список



Собчак, Жириновский




  1. МОСКВА, 4 сентября. /ТАСС/. Лидер ЛДПР Владимир Жириновский признался, что ему были неприятны публикации в российских СМИ, где утверждалось, что одним из кандидатов на предстоящих выборах в марте 2018 года будет женщина.
  2. Рождение Собчак, как кандидата в президенты. Хочется отметить, что фон упоминаний как влетел с уровня Жириновского, так полностью и не откатился.
  3. Собчак облила Жириновского водой во время дебатов



Грудинин, Жириновский




С Грудининым одни скандалы, ничего интересного (Жириновский для масштаба)


Общий вид




График будет обновляться ежедневно, система продолжает собирать данные, посмотрим, как события будут развиваться в последнюю неделю до голосования.

Интересные наблюдения


  1. У Жириновского самый сильный инфоповод за историю наблюдений — скандал с Собчак, количество упоминаний самое низкое.
  2. Грудинин скандалами запутал всех, но бьется в одной куче с остальными.
  3. Так, как о Собчак написали в тот день, когда она объявила о своем желании — не писали больше никогда (пока).
  4. Навальный падает.
  5. Информационная волна от выступления Путина с посланием Совету Федерации сравнима с первой встречей с Трампом.



P.S. Если кто-нибудь захочет провести собственное исследование, например, посчитать что-нибудь о кандидатах в новостных заголовках — пишите в личку, поделимся датасетами.
Tags:
Hubs:
+18
Comments 26
Comments Comments 26

Articles