Search
Write a publication
Pull to refresh
14
0
Send message

Мы не вполне поняли, откуда Вы берете данные про шахматные турниры, если скинете ссылку, с удовольствием почитаем.

В нашем анализе мы нигде и не предполагаем, что какая-либо величина распределена по Гауссу; когда мы проверяем, есть ли аномальные пики на круглых и целых числах, приходим к выводам, что их нет (значит ли это по Вашей логике, что эти выборы сфальсифицированны?).

Кстати, в Kobak, Shpilkin, Pshenichnikov, 2016 на рис. 4 хорошо видно, что "пила Чурова" появляется только в 2004-м году. Вы считаете, что выборы до этого фальсифицировали? Или что и наличие, и отсутствие "пилы" может быть при корректном подсчете голосов и явки?

И мы, конечно, не надеемся, что статья на Habr'е (тем более от анонимных новорегов) сможет хоть как-то повлиять на московские выборы. Просто делимся наблюдениями.

Для того чтобы сравнивать очное голосование и ДЭГ нужно иметь уверенность, что у них совпадает распределение по социологическим признакам.

А оно, скорее всего, не совпадает, Вы правы. Но мы не утверждаем, что то, что результаты очного голосования и ДЭГ отличаются, является свидетельством фальсификаций. Они и должны отличаться. Странно выглядит то, что данные разделяются на два кластера: есть очень много кандидатов от партии X, результат которых очно и дистанционно отличатся примерно в одинаковое количество раз и несильно (что совершенно нормально), и есть мало кандидатов, сильно выбивающихся из этой закономерности, которые гораздо популярнее по ДЭГ. При этом в результатах очного голосования такой группки сверхпопулярных нет, популярность кандидатов распределена унимодально. Этого, естественно, недостаточно для обвинения в фальсификациях, но мы и не говорим о том, что они были, только на основании этого. Но это обращает на себя внимание — обычно естественные данные распределены не так.

С чего там взяться нормальному распределению?

Как я понял, Вы обвиняете нас в том, что мы предполагаем, что кривая количества голосов от времени должна выглядеть как гауссиана. Это было бы самое глупое, что только можно было бы сделать с нашей стороны. Естественно, эта кривая может быть более-менее произвольной. Но она всегда будет по крайней мере непрерывной, потому что чтобы это было не так, должен существовать единственный фактор, который совершенно одновременно подействует на очень большое количество избирателей. Посмотрите на рис. 14: чтобы такое появилось в естественных данных, одновременно (не "после обеда", а совершенно одновременно) должно увеличиться количество избирателей, голосующих за определенный набор кандидатов из "системной оппозиции", но не за кандидатов от УмГ, и этот фактор, увеличивающий количество избирателей, которые голосуют так, должен действовать равномерно на протяжении всего вечера пятницы и всю субботу и резко прекратиться в ночь с субботы на воскресенье. Вы говорите, почту проверяют. Т.е. на самом деле модель, которую Вы предлагаете, выглядит так: "избиратели, голосующие за данный набор кандидатов от "системной оппозиции" и от УмГ с 11:00 до 16:00 пятницы и в воскресенье проверяют почту одинаково часто, но позже 16:00 в пятницу и в субботу любители системной оппозиции проверяют почту ровно в два раза чаще. Не в среднем за весь этот промежуток, а в любое время этого промежутка". Кроме того, у нас есть огромный пик количества голосов в воскресенье, длящийся минуту или меньше. Если бы это была e-mail рассылка или что-то вроде того, пик был бы точно более растянутым во времени: люди увидели бы письмо неодновременно, кто-то проголосовал бы сразу, кто-то чуть позже и т.п. Кроме того, очевидно, что никакая рассылка не увеличит количество голосов в минуту в 25 раз! Никаких естественных объяснений такого пика правда нет.

Сторонний софт не может накручивать. <...>

У нас не хватает данных и специальных знаний, чтобы сказать, как были сделаны фальсификации, но хватает, чтобы сказать, что они были.

Сделаем! Не обещаю, что быстро, но однажды будет.

Information

Rating
Does not participate
Registered
Activity