Pull to refresh

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено

Data Mining *R *Open data *Data visualization

В первой части статьи о выборах 2016 года шла речь о результатах в 225 избирательных округах. В этот раз рассмотрим данные о результатах голосования по участковым избирательным комиссиям (УИК), которых насчитывалось чуть менее 100 тысяч. Этот уровень детализации позволяет увидеть неожиданные явления и удивительные закономерности в результатах голосования.




Данные


Мы будем рассматривать только результаты выборов по партийным спискам — пропорциональная составляющая голосования. Сведения о результатах голосования для каждого УИКа предоставляются Центризбиркомом в несколько разрозненном виде. В агрегированном виде данные собраны и распространяются Сергеем Шпилькиным (ссылка).


Общее число участков на этих выборах составило 96871. В этих данных для каждого УИКа приводятся данные о числе избирателей, проголосовавших за партии, участвовавших в выборах. Вместо числа избирателей переходим к процентному представлению результатов партий с точностью до 0.01 %. Сумма результатов в каждом УИКе по всем партиям, с учетом процента испорченных бюллетеней, должна быть равна в точности 100.00 %. Для округления процентных результатов используем метод наибольшего остатка — наиболее известный подход. ЦИК использует другой метод округления процентных результатов, сведения о котором я не нашел. И по крайней мере этот метод не совпадает ни с одним из алгоритмов представленных в библиотеке sfsmisc. Поэтому, в некоторых случаях, используемые процентные результаты могут отличаться от данных ЦИК на 0.01 %, но это не играет принципиальной роли. Результаты явки тоже выражены в процентах с точностью до 0.01 % (использовалось обычное округление).


Пятно


Отображаем полученные данные на диаграммах рассеяния, в которых точками являются — УИКи.
На графике ниже показаны результаты явки и партии "Единая Россия" по всем УИКам.




На этой диаграмме обращает на себя внимание черная точка в районе явки с 65 процентами и результатом "Единой России" примерно в 60 процентов. Эта точка означает высокую концентрацию УИКов с очень близкими результатами по этим двум осям графика.


Для двух диаграмм с осями "Явка — КПРФ", "Явка — ЛДПР" по-прежнему наблюдаем черную точку с той же явкой.






И даже для непарламентских партий, например, для "Коммунистов России" это точка продолжает сиять.




Впрочем, и для остальных партий это явление можно также наблюдать. Дальше — больше, посмотрим что это за участки. Зададим диапазон более точно — явка в пределах от 64.26 % до 64.33 %, результат "Единой России" от 62 % до 62.5 %. В указанные границы попадает 60 УИКов. И, какое неожиданное совпадение, все они из Саратовской области!


Этот феномен был обнаружен еще до утверждение результатов выборов. К сожалению, представители ЦИК, в том числе и его председатель, поспешили заявить, что ничего удивительного в этом явлении нет. Поэтому проверка по этому случаю не проводилась.


Линейные зависимости


На графики с осями "КПРФ — ЛДПР" прослеживаются прямые вида y = x и y = 2*x.




Более отчетливо линейные зависимости с целыми коэффициентами видны, например, для пары "Коммунисты России — Яблоко".




Нельзя сказать, что это вклад какого-либо определенного региона (точек на этих прямых слишком много). Но почувствовать некоторую разницу можно на примере Москвы и Московской области.






Или вот график для пары "Коммунисты России — Справедливая Россия" в квадрате 10 % на 10 % с сериями y = x, y = 2x, y = 3x и x = 2*y



По какой причине выделяются эти линейные зависимости с целыми коэффициентами?
Мне не приходит на ум какого-либо логичного объяснения этим закономерностям в результатах голосования.


Бимодальность


Это характеристика результатов голосования в Госдуму хорошо известна и по предыдущим выборам. Высокая явка избирателей на участке, как правило, свидетельствует о высоком результате "Единой России". Особенно отчетливо это проявляется в районе точки (100 %, 100%). Такое уникальное сочетание гражданской ответственности и единомыслия избирателей на этих участках не перестает обращать на себя внимание.


Ниже два графика сглаженной плотности точек для партий "Единая Россия" и "ЛДПР"





"Красивые" цифры явки


На выборах 2011 года число УИКов с явкой в 60, 70, 80, процентов резко возрастало по сравнению с остальными участками (и явкой меньше 100 %). На выборах 2016 года таких резких перекосов не наблюдается, за исключением явки в 50%. На графике ниже бин равен 0.1%, результат 100% явки — 2813 участка, исключен для наглядности представления остальных данных.



Как поработать с графиками самостоятельно


Все графики построены в R с использованием библиотек shiny и ggplot2. Это пример страницы приложения.



Если у вас установлен R, то, загрузив библиотеки shiny и pacman, вы можете запустить приложение командой:


shiny::runGitHub("e-chankov/elections_2016_uik")

Или же просто взять R-скрипты с GitHub.


UPD: Добавлю, что согласен с мнением AllexIn — какие-либо графики и расчет нужны для того, чтобы обратить внимание на неожиданные результаты. Но они не позволяют утверждать, что были факты фальсификации результатов. Рассмотрением подозрительных случаев должны заниматься представители ЦИК и выкладывать результаты проверок. Не могу представить, что может сделать ЦИК для оперативного анализа ситуаций с бимодальностью или линейными зависимостями. Тогда как, полагаю, рассмотрение феномена в Саратовской области являлось обозримой задачей. В ЦИКе сразу высказали мнение, что ничего удивительного в этом явлении нет. Это разочаровывает.


UPD2: Наличие линий на графиках имеет естественное происхождение. Примеры и подробности в комментарии skyramp и моем ответе ниже.


UPD3: Как справедливо заметил ikashnitsky, публикация получилась без каких-либо ссылок. Это было сделано без злого умысла. Здесь alexkuku представил краткий обзор и ссылки по анализу результатов выборов в 2011 году. В блоге Сергея Шпилькина можно найти много разнообразных графиков и подробностей об итогах голосования как за 2016 год, так и за предыдущие годы.

Tags:
Hubs:
Total votes 89: ↑85 and ↓4 +81
Views 25K
Comments Comments 119