Pull to refresh

Comments 103

UFO just landed and posted this here

Объяснение явно не в плоскости математики/статистики. Тут вообще не исследование, а натягивание совы на глобус.

Не могу найти старый пост который это объясняет, но он где-то был. Такие пики в «круглых» значениях возникают для рациональных дробей когда и числитель и знаменатель — случайны.

К примеру, точку 79% можно получить только как число вида 79x/100x, а точку 80% — как число вида 4x/5x. Поэтому попаданий во вторую точку всегда будет больше чем в первую.

Вы правы, но только при условии того, что подавляющее большинство уиков будет с крайне малой численностью, т.е. такой на которой ещё не работает статистика.
Но если это так, то вообще имеет смысл говорить о некорректности методики проведения измерений (выборов) как таковых, а не на подтасовках в ходе измерений.
(Ну не может быть тайного независимого голосования, когда весь участок, включая комиссию и наблюдателей состоит из 10-15 человек)

Не вижу причин по которым это должно перестать работать на больших числах.

Ну вот попробуйте просто график построить.
n = 1000000
counts = (np.random.rand(n) * 1000 + 1000).astype(int)
visits = ((np.random.rand(n) * 0.3 + 0.6) * counts).astype(int)
fracs = visits / counts
plt.hist(fracs, bins=1000);

Результат:
image
Пиков на круглых значениях по сути нет.
Для сравнения вместо 1000 ставим 20:
image
Все дело в bins=1000. Заметьте: на графике 1а тоже нет никаких аномалий! Но автору это оказалось мало, он начал уменьшать интервал… Попробуйте пойти по его стопам и повысить bins :-)
А зачем ещё уменьшать? Давайте сравнивать с последним более-менее разумным графиком из этого блока в посте — где шаг 0.1% (как ниже написали, меньше смысла брать уже нет). У меня же шаг ещё несколько меньше.
Я и другие пользователи пробовали строить графики с псевдослучайным числом избирателей и проголосовавших, и никаких пиков, сравнимых с графиком с выборов, там нету. Код и графики: telegra.ph/Proverka-gipotezy-o-estestvennom-poyavlenii-pikov-na-kruglyh-znacheniyah-yavki-04-01 (ссылка на веб-прокси).
Так я вроде абсолютно это и написал. Или вы как раз подтверждаете?
Я дополняю, так как там есть ссылки на код, которым можно строить графики, а также графики, построенные с разными параметрами.
Да, тогда полностью поддерживаю :)

Собственно, вот вам пики на абсолютно случайной явке, но реальных размерах участков. Вообще, мне интересно — а кто решил, что размеры участков случайны? Более того — кто-нибудь подумал, что участки состоят из целого числа домов, большинство из которых — типовой застройки?..
Уже не раз писали, что этот эффект не из-за какой-то «неслучайности» размеров участков, а просто из-за их малого размера — отфильтруйте ваш uik_size, чтобы остались только > 500 например и посмотрите на результат этого же самого кода.

Потеряно 7.5% данных, но я по-прежнему вижу пики.
Ну тут два комментария — во-первых у вас бин таки стал в 3 раза меньше, во-вторых пиков на круглых числах тут нет (в смысле, значения получаются такими же, как и на «некруглых»).

Более того — кто-нибудь подумал, что участки состоят из целого числа домов, большинство из которых — типовой застройки?..

В домах много квартир, в которых живёт близкое количество человек — да это же прямо стандартный случай для применения закона больших чисел :) Да просто посмотрите на остатки от вашего uik_size при делении на любое небольшое число — они равномерно распределены.
Я не пойму, почему вы ставите размер УИК > 500, если в реальности он в диапазоне 3 — 7746 ???
Если ставить такое условие то 32711 УИКов вы в своей генерации не учитываете. А это 1/3 от общего количества.
На малых размерах в любом случае будет присутствовать ярко выраженная дискретность, хотя 500 это возможно перебор, согласен. Всё равно, ниже я выложил графики-сравнения реальной и сгенерированной явок, с учётом всех участков, даже маленьких — результат не меняется.
Потому что делали график без маленьких УИК и пики на круглых числах на нем сохраняются.
К первому комментарию: мм. вообще-то, я не говорил ничего про целые числа. Я говорил про пики, как таковые, вызванные структурой данных УИК. То есть, любая случайная либо псевдослучайная («выборы») выборка на этом множестве будет иметь пики. Отличия моего графика от вашего (с одинаковыми бинами, кстати) это показывает:
image
Позиционирование этих пиков в реальных данных на целых числах процентов это никак не объясняет, я ещё подумаю, какой эксперимент на эту тему построить. Возможно, стоит нарастить выборку, сгенерировав по несколько чисел на участок.
Ко второму:
Вообще-то, нет. Стандартным случаем для закона больших чисел это было бы, если бы все участки состояли только из домов типовой застройки с примерно равным количеством жильцов. Для понимания: вот Q-Q график сравнения количества избирателей на участке (после фильтрации <500) с нормальным распределением:
Иными словами, есть хвосты, отличающиеся от нормального распределения.
Ну, и напоследок — возвращаясь к реальным результатам, вы предполагаете, что все избиратели принимают решение о голосовании независимо друг от друга. Это, опять-таки, не так — вероятность, что все члены семьи примут одинаковое решение, больше, чем вероятность обратного. Следовательно, в выборке будет много семей.
Вообще-то, нет. Стандартным случаем для закона больших чисел это было бы, если бы все участки состояли только из домов типовой застройки с примерно равным количеством жильцов.

Ну так я на это и отвечал:
Более того — кто-нибудь подумал, что участки состоят из целого числа домов, большинство из которых — типовой застройки?

Если бы это было верно для всех участков (т.е. каждый участок состоял из домов типовой застройки и был примерно одного размера), то было бы близко к нормальному. То, что на самом деле размеры участков от этого далеки (что видно и без qq-plot) просто говорит о том, что такое предположение неверно. Ну и это было просто отступление, нигде в анализе это не предполагается и не используется.

Но что должно выполняться — так это то, что нет предпочтительных остатков при делении на (достаточно малые) числа. И это как раз отлично выполняется.
Позиционирование этих пиков в реальных данных на целых числах процентов это никак не объясняет, я ещё подумаю, какой эксперимент на эту тему построить.

Ну так вся рассматриваемая здесь (есть ещё и другие) аномалия и состоит в том, что слишком много участков с ровно круглым числом процентов, относительно соседних значений. Так-то пики ясное дело, что в любом случае будут (если пиком считать просто бин, в котором больше значение, чем в соседних), хоть как равномерно ни генерируй.
> участки состоят из целого числа домов, большинство из которых — типовой застройки?..

И в каждой квартире типового дома живет одинаковое число людей, и они также синхронно рождаются, умирают и переезжают?

Ваша картинка на график с выборов ничем не похожа. Суть не только в том, что есть пики, а еще и в их расположении на определенных круглых числах.

Приведение всех данных к общему знаменателю устраняет такой эффект?

Нет, значения же от этого не изменятся. А вот округление (или, что то же самое, укрупнение шага) должно помочь. К примеру, на первом графике (1а), который с интервалом 1%, никаких аномалий не видно.
Третий по величине пик должен попадать на не рациональный 2/3(66,(6)%). Но у нас вместо него пики на 13/20(65%) и 7/10(70%). Маловероятно.
Автор статьи так аккуратно обошел кратность трем.
В районе значения 66% просто знаменатели достаточно большие, пик от этого сгладился. Но посмотрите на график с интервалом в 0,01% (1в) — там самый крупный пик именно в той точке которую вы указали.
Автору нужно было просто вспомнить идею 2011 года, добавив к каждому числу рандомное float-значение в районе 0.5 с кучей знаков после запятой, сразу уходят проблемы целочисленного деления. Эта ошибка сводит на нет всю статью, в которой, впрочем, и так ничего стоящего нет.
Это только для маленьких знаменателей. На участках порядка 1500-2000 избирателей, и на таких цифрах целые отношения маленьких чисел теряются в шуме.
45% (3) и 70% (57) показывают, что это не так.
Вы видимо не прочитали легенду для столбцов в таблице. Приведу еще раз:
PROCENTX – процент явки
KOLVO – общее кол-во УИК ровно с данным процентом без каких-либо округлений
X2 – количество УИК в которых кол-во зарег. избирателей кратно 2
X5 – количество УИК в которых кол-во зарег. избирателей кратно 5
X10 – количество УИК в которых кол-во зарег. избирателей кратно 10

45 3 3 3 3
Означает, что всего есть 3 УИК у которых явка ровно 45%. При этом из них 3 — кратны 2, 3 кратны 5, 3 — кратны 10. Т.е. упрощенно — у всех 3х УИК с явкой 45% кол-во зарегистрированных избирателей заканчивается на 0 (поэтому все они одновременно кратны 2, 5 и 10). Тоже самое и для 70 57 57 57 57.

Еще для примера:
80 122 62 122 62
Означает что всего есть 122 УИК ровно с явкой 80%, 62 кратно 2, 122 кратно 5, 62 кратно 10, т.е. кол-во зарег.избирателей во всех 122 УИКах заканчивается либо на 5 либо на 0.

25 2 2 0 0 — здесь ровно с 25% два УИК и оба они кратны только 2м.

И всё-таки, хотелось бы услышать от вас, какова математическая природа пиков на круглых значениях?
Я добавил в конец статьи раздел «Заключение», там есть пояснения по этому поводу.

UFO just landed and posted this here
> Означает, что всего есть 3 УИК у которых явка ровно 45%.

Потому что ровно 45% будет только для соотношения 9/20. То есть для участков где число избирателей кратно 20. Вы рассматриваете только эти участки с круглыми числами и естественно число на них будет кратно 2, 5 и 10. Но на графике с выборов в бин 45% попадают участки с явкой от 44.95% до 45.05%. Например, участок с соотношением 451/1003 = 0,4497. А участок с соотношением 452/1003 = 0,4506 попадает в соседний бин. Вы такие участки выкинули из рассмотрения.

Первое впечатление (простите, напишу сразу, до разбора сути) — Вы как будто забыли методы анализа из далёкого 2011 года. С дробями научились бороться уже тогда, добавлением случайного числа порядка 0.5 вроде random(0.1, 0.9), которое большим числом знаков после запятой просто убирает проблему дробей.
Ну и второе - шаг в 0.01% смотрится странно
Ну и второе — шаг в 0.01% смотрится странно, учитывая, что обычно участок размером 1-2тыс избирателей, и ниже 0.1% брать ошибочно, т.к. число избирателей — целое число (чуть подробнее о сути по ссылке про 62.22% в Саратове), и уменьшением шага на порядок ниже целочисленного избирателя просто убирает все эффекты «рисований», сглаживая их в 10 раз.
Возьмите шаг 0.0001%, и вообще сгладите всё до шума. Схема неустойчива к постоянному уменьшению шага, т.к. надо либо помнить о том, что характерный step 0.1% (~1 человек), либо считать «от обратного», как по ссылке, перебирая процент, а не людей.
Возьмите шаг 0.0001%, и вообще сгладите всё до шума. Схема неустойчива к постоянному уменьшению шага, т.к. надо либо помнить о том, что характерный step 0.1% (~1 человек), либо считать «от обратного», как по ссылке, перебирая процент, а не людей.
Факты говорят об обратном, я проверял шаги до 0.000001% включительно, после 0.001% картина на графике существенно не меняется, все пики которые есть на График_1г с шагом 0.001% (включая мелкие) остаются. К тому же, вы наверно не заметили, но все графики в статье как вы выражаетесь «перебирают» процент явки. В визуализации 1 — мы сортируем результат по возрастанию процента, а в визуализации 2 — по возрастанию кол-ва УИК, но группировка всегда идет по проценту явки с заданным шагом.

С дробями научились бороться уже тогда, добавлением случайного числа порядка 0.5 вроде random(0.1, 0.9), которое большим числом знаков после запятой просто убирает проблему дробей.
Я не вижу ни какой «проблемы» с дробями, а тем боле необходимости добавлять «мусор» в исходные данные. В данной статье показано то, как выглядят реальные данные при уменьшении шага и то, что пики — это вполне естественные вещи на графике, а так же, есть подсказка для понимания откуда берутся пики на круглых значения.

Вот еще одна подсказка:

Если включить «математическое», а не «конспиралогическое» мышление, то всё довольно просто.

Посмотрите на График_1д, и задайтесь вопросом, почему в окрестности с круглым значением 80% есть «пустая воронка»? Я вам подскажу, что такие воронки есть и на других «круглых» значениях. Посмотрите на График_2г и задайтесь вопросом, откуда могут появиться такие ступеньки?

Вспомните из школьного курса математики, что такое дробь и освежите знания в теории вероятности, посмотрите на данные по распределению кратности из раздела данной статьи «Ключ к решению загадки круглых цифр», тогда все станет на свои места. Если вам лень этим заниматься — то извините, ничем помочь не могу, в заголовке статьи написано «Решаем загадку», а не «Подсматриваем ответ в конце учебника». Я думаю, что многим на хабре эта математическая «загадка» будет интересна.
Вы вообще какую-то чушь пишите, простите. Проблема дробей решается простым рандомным добавлением мелкого числа. Всё. Добавляйте и смотрите на пики.
Загадку про дроби решили в декабре 2011 года, я вот о чём хочу сказать. И ещё с 2011 года все делают графики с рандомной добавкой, чтобы не тратить время и силы на дроби и видеть реальные пики. «Мусор» не искажает вид кривых, зато полностью убирает проблему дробей.
Вы вообще какую-то чушь пишите, простите. Проблема дробей решается простым рандомным добавлением мелкого числа. Всё. Добавляйте и смотрите на пики.
Простите, а может это вы пишите чушь? :)
В статье всего лишь показаны графики и реальные данные иллюстрирующие естественность появления пиков на «круглых» значениях. Вы здесь что-то хотите возразить?

Я не знаю что там было в декабре 2011, но если у вас есть какие-то предложения по другим способам визуализации и исследованию графика, давайте ссылку на метод, посмотрим, и если есть смысл, можно будет поэкспериментировать.
Если бы статья и правда иллюстрировала естественность появления пиков — у вас бы не спросили о их происхождении в первом же комментарии. Я вот, к примеру, из статьи сделал вывод что вы нашли в этих пиках какой-то заговор и решили поделиться этой находкой.
Серьезно? :))
Если вы почитаете исходную статью, на которую писался ответ и мои комментарии в ней, то увидите, что всё ровно наоборот (почитайте, там реально интересная дискуссия). Данная статья как раз-таки и была написана, что бы показать, что «странность» и «аномалии» найденные в пиках вполне естественны и не связаны с «любовью фальсификаторов к круглым значениям», как там многие утверждали. Собственно именно по этому в своей статье я и решил уменьшить шаг с 0.1% (как в исходной статье) до 0.01% и ниже, чтобы показать, что пики это нормальное явление для обсуждаемого графика.

Но, своим выводом о данной статье, вы меня прям поразили :) Здесь я старался излагать только факты и без каких-либо интерпретаций, чтобы не разводить полит.срач, (как в исходной статье), а вести дискуссию с точки зрения математики.

Похоже, надо добавить раздел «Заключение» с пояснениями.
«странность» и «аномалии» найденные в пиках вполне естественны и не связаны с «любовью фальсификаторов к круглым значениям», как там многие утверждали

Нет, неестественны. Пока Вы не убрали пики случайной добавкой и не убедились, что пики на процентах (на 79%, например) исчезли, Вы ничего не можете с уверенностью сказать.
Можете нормально сформулировать, что именно вы хотите показать графиками 2а, 2б? Непонятен вывод из них. Можно же привести кучу способов изобразить эти данные, где не то что аномалий, самих результатов особо не видно будет — и что?
Хотелось бы поблагодарить вас за попытку анализа. К сожалению, статья у меня вызвала больше вопросов, чем ответов, которые хотелось бы задать.

> Видно, что на точке X=100 значение очень высокое,… В качестве подтверждения, давайте посмотрим на первые 10 регионов по кол-ву УИК со 100% явкой.

Вопрос 1. Здесь нужно пояснение, я не понял, что подтверждает приведенный ниже список городов. Было бы хорошо не оставлять недосказанности и либо закончить мысль, либо убрать это утверждение. На зарубежных участках да, явка 100% не вызывает удивления, так как там могли включать в списки только тех, кто пришел, и число изб. в списках потому совпало с пришедшими.

Вопрос 2. Оранжевая линия и пики на ней на графике 1б вызывают интерес, но не очень понятно, о чем они говорят. Может быть, стоит взять несколько крупнейших пиков (а также их окрестность) и просто проанализировать участки, которые в них входят?

Вопрос 3. Я не понял, в чем смысл графиков 2а-2г, вы на них переставили бины так, что все пики вжаты в правый край, а не-пики, низкие места — слева. Для чего это? Что это должно показать? Что обозначает белая ломаная на них?

Вопрос 4. По графикам 2в и 2г, где видна интересная белая ломаная — было бы хорошо, если бы вы прояснили свою мысль, а не оставляли загадку:

> А вот это уже интересно, те, кто разбирается в математике уже наверно начинают понимать в чем фишка.

Я, к сожалению, ничего не понял.

И, наконец, есть вопросы к разделу «Ключ к решению загадки круглых чисел». Начнем с того, что в x2 попадет не менее половины всех УИК, так как половина чисел — четные.

> Это красивая закономерность, которую я обнаружил в «круглых цифрах».
> Суть в том, что начиная с точки 40% и далее с шагом 5% количество УИК всегда кратно 2, 5 или 10.

Я даже могу объяснить, почему. Потому что ровно 95% может получиться только при соотношении 19/20 = 19*n / 20*n, где n — целое, а это значит, что число избирателей в списках должно быть кратно 20. И, следовательно, все УИК с процентом явки 95% попадут в колонки x2, x5, x10.

Однако, это нельзя считать «объяснением» пиков. Так как на графике с бином 0.1% в пик на 80% попадают УИК с явкой от 79.95% до 80.05%. В этот диапазон, например, попадут отношения 801/1001, 802/1002, 802/1003, 803/1004 и так далее, которые не «круглые». Вы выкинули их и оставили только участки с «круглым» числом избирателей.

Аналогично, для цифр вроде ровно 90% знаменатель будет кратен 10, для цифры 80% кратен 5 итд.

Приведенная вами таблица не доказывает и не опровергает наличия пиков. Так как вы выбрали для нее исключительно УИК с круглым числом избирателей, а в пики входят и участки с не-круглым числом. Для сравнения, я и другие пользователи пытались построить график для случайно выбранных количеств избирателей и проголосовавших, и никаких заметных пиков там нету. Графики и исходный код я собрал в статье: telegra.ph/Proverka-gipotezy-o-estestvennom-poyavlenii-pikov-na-kruglyh-znacheniyah-yavki-04-01 (если не открывается, открыть через веб-прокси).

Вопрос 5. Не могли бы вы, пожалуйста, перестроить таблицу с учетом этого факта? Иначе вы рассматриваете не все участки в стране, а выбираете из них только участки с круглым (кратным 5-10-20) числом избирателей и по таким участкам делаете выводы об общей картине.

Также, на исходном графике видны пики в областях не очень круглых чисел вроде 81%, 92%, 93%, 94%, 96%, 97%, 98%, 99%. Для них вы отобрали только участки с числом избирателей, кратных 50 или 100. Вы выкинули из рассмотрения участки, где, например, 1001, 1002, 1003, 1004, 1005, 1006, 1007, 1008 и 1009 избирателей.

Или у вас есть данные, которые говорят, что таких участков с «круглым» числом избирателей было значительно больше «некруглых» и «некруглые» можно не принимать в расчет?

> по графикам График_1в, График_1г мы видим — что наличие пиков на обсуждаемом графике — вполне естественно, а причина их появления кроется в дроби количество_избирателей_пришедших_на_выборы / количество_избирателей_зарегистрированных_на_участке

Я это проверял, и на псевдослучайных числах (случайное число избирателей и число пришедших, код и графики в статье выше) таких заметных пиков нет, и пики не тяготеют к круглым значениям. Более того, если убрать из рассмотрения маленькие участки, меньше 500 человек, из результатов выборов, пики на круглых числах остаются. Попробуйте построить графики без УИК до 500 человек.

В заключение, приведу свое объяснение «пиков». Преположим, что УИК делятся на 2 группы: а) УИК, где считают честно, либо присутствуют наблюдатели, следящие за подсчетом и б) УИК, где результат фальсифицируется. Предположим, что участки из группы б) координируются местными властями города или региона. Предположим, что власти спускают на эти участки «желаемую» цифру явки, в разных районах,
городах и регионах разную. Члены УИК, переведя процент в число человек, видят некруглое, выглядящее случайным, число, и вписывают его в протокол. Однако при статистическом анализе такие цифры дают пики на графике.

Если у вас сложности с комментированием, можете написать в личку — обязуюсь опубликовать ваш ответ без изменений.
Вопрос 1. Здесь нужно пояснение, я не понял, что подтверждает приведенный ниже список городов.
Для меня подтверждением является, как вы правильно заметили, первое место в списке для заграничных УИКов, а так же наличие в списке регионов с традиционными общинами и высокой плотностью воинских частей. Но я соглашусь, формулировка «подтверждает» довольно субъективна, поэтому я внес изменения, что бы «подтверждает / не подтверждает» оставить на выбор читателю.

Вопрос 2. Оранжевая линия и пики на ней на графике 1б вызывают интерес, но не очень понятно, о чем они говорят. Может быть, стоит взять несколько крупнейших пиков (а также их окрестность) и просто проанализировать участки, которые в них входят?
Выбирайте какой вам пик больше нравится :) я выложу список УИКов, которые в него попадают.

Вопрос 3. Я не понял, в чем смысл графиков 2а-2г
Вопрос 4. По графикам 2в и 2г, где видна интересная белая ломаная — было бы хорошо, если бы вы прояснили свою мысль, а не оставляли загадку:
На эти вопросы я ответил в своем комментарии ниже (и дополнительно добавил этот комментарий в саму статью).

И, наконец, есть вопросы к разделу «Ключ к решению загадки круглых чисел».
Приведенная вами таблица не доказывает и не опровергает наличия пиков. Так как вы выбрали для нее исключительно УИК с круглым числом избирателей, а в пики входят и участки с не-круглым числом
Верно, сама по себе таблица иллюстрирует лишь то, что все целые проценты явки содержат в себе только УИКи с кол-вом зарег. избирателей кратных 2,5,10. Как вы сами подтвердили на примерах — так и должно быть. Теперь осталось только рассчитать вероятность появления «круглого» процента и «не круглого». Для этого в разделе «ключ», как раз и присутствует таблица распределения по кратности 2,3,4,5,6,7,8,9,10 для кол-ва избирателей зарег. в УИК и для кол-ва избирателей пришедших на выборы.

Однако, это нельзя считать «объяснением» пиков. Так как на графике с бином 0.1% в пик на 80% попадают УИК с явкой от 79.95% до 80.05%. В этот диапазон, например, попадут отношения 801/1001, 802/1002, 802/1003, 803/1004 и так далее, которые не «круглые». Вы выкинули их и оставили только участки с «круглым» числом избирателей.
Вопрос 5. Не могли бы вы, пожалуйста, перестроить таблицу с учетом этого факта? Иначе вы рассматриваете не все участки в стране, а выбираете из них только участки с круглым (кратным 5-10-20) числом избирателей и по таким участкам делаете выводы об общей картине.
Ну… я бы не стал так категорично говорить «выкинул» :) я привел распределение кратности для всех целых чисел процентов, ни больше ни меньше. Если вам интересны дополнительные данные, опишите как должна выглядеть таблица, если это будет не сильно сложно, то можно будет построить. Но, я могу вам и без таблицы сказать, что по графикам 1бвг, можно проанализировать все «составляющие» пиков. Например: пик на 80% на График_1б (шаг 0.1%) = 231 УИК, тот же пик 80% на на График_1в = 122 УИК (шаг 0.01%), если посмотреть в таблице по кратности целых процентов, то мы там увидим, что всего ровно с 80% имеется 122 УИК, т.е. дальнейшее уменьшение шага (График_1г) не изменит этот пик. Получается, что График_1б вобрал в себя дополнительно из интервала 79,95… 80.04 количество УИК 231-122=109, т.е. 122 УИК попадает ровно на 80% и 109 УИК попадают в интервал 0.1%.

Могу привести увеличение графика, что бы были видны все точки интервала 79,95… 80.04 и было понятно откуда появляются дополнительные 109 УИК:


А вот еще одно увеличение, чтобы увидеть точки на интервале 1% с шагом 0.01%:


Я это проверял, и на псевдослучайных числах (случайное число избирателей и число пришедших, код и графики в статье выше) таких заметных пиков нет, и пики не тяготеют к круглым значениям. Более того, если убрать из рассмотрения маленькие участки, меньше 500 человек, из результатов выборов, пики на круглых числах остаются. Попробуйте построить графики без УИК до 500 человек.
Дело не только в размере участка, но и в размере шага выборки. Об этом выше так же написал mayorovp.

В заключение, приведу свое объяснение «пиков».
Я понял вашу мысль, но она основывается на неком допущении, что власти «глупые». Что мешает властям спускать на эти участки «желаемую» цифру явки сразу в нужном количестве человек с заранее рассчитанным «случайным» распределением, чтобы не палиться на круглых значениях?

Если вы подозреваете наличие фальсификации в выборах, то должны доказать, что пиков на графике быть не должно, иначе это просто голословное утверждение и не более того. Версий можно придумать бесконечно много, но данная статья задумывалась для обсуждения именно математики, а не теорий заговоров, поэтому нужны математические доказательства «аномальности» пиков, без этого, что-то серьезно утверждать нельзя.

Я со своей стороны показал, что наличие пиков ровно на «круглых» значениях — обусловлено более высокой вероятностью появления таких значений по сравнению с «не круглыми». Кроме того, в пояснении к статье и графиках 2абвг показано, что само по себе понятие «пика» имеет реальный смысл «аномальности», только если есть доказательство, что таких «пик» на данной визуализации быть не должно, иначе можно создать сколько угодно визуализаций с «пиками» и считать их «аномальными».
наличие в списке регионов с традиционными общинами и высокой плотностью воинских частей.

Почему вы решили, что в перечисленных городах и регионах много воинских частей и традиционных общин? У вас есть какие-то данные по расположению «традиционных общин» и воинских частей?

Ну… я бы не стал так категорично говорить «выкинул» :) я привел распределение кратности для всех целых чисел процентов, ни больше ни меньше.

Ну смотрите. Ровно 85% может быть только на участках с числом изб. кратным 20. При равномерном распределении численности это будет 1/20 об общего числа участков. Вы рассмотрели 1/20 всех участков, а 19/20 выкинули из рассмотрения. Для явки «ровно 27%» вообще вы взяли 1/100 участков, а 99/100 выкинули из рассмотрения.

У вас, например, явка ровно 85% нашлась на 36 участках. Но в России 90 000 УИК. На гистограмме в бине 85% нашлось 255 участков. Вы взяли малую часть от общего количества. Как вы можете на основании 36 участков из 255 делать какие-то выводы? Это 14% от всех участков в бине и 14% высоты пика.

Выбирайте какой вам пик больше нравится :) я выложу список УИКов, которые в него попадают.


Мне нравится высокий пик на 85% при бине 0.1%, который виден и на оранжевой линии, и на гистограмме. То есть участки с явкой в диапазоне [84.95%; 85.05%) которых там около 255. Давайте на них посмотрим поближе. Может, там есть еще какие-то закономерности?

Получается, что График_1б вобрал в себя дополнительно из интервала 79,95… 80.04 количество УИК 231-122=109, т.е. 122 УИК попадает ровно на 80% и 109 УИК попадают в интервал 0.1%.


Ну а для пика на 85% получается 36 участков с ровно 85%, и 255 всего. Для пика на 94% всего 195 участков, но ровно 94% всего лишь на 13 участках.

Но это отдельный интересный вопрос, а почему так много участков с ровно 80%. Может быть, стоит исследовать распределение численности избирателей, нет ли такого, например, что на очень многих участках оно кратно 5 или 10? Это тоже ведь вызывает вопросы, как такое могло получиться.

Я понял вашу мысль, но она основывается на неком допущении, что власти «глупые». Что мешает властям спускать на эти участки «желаемую» цифру явки сразу в нужном количестве человек с заранее рассчитанным «случайным» распределением, чтобы не палиться на круглых значениях?


Например, примем гипотезу, что координируют это местные власти, а не центральные. Центральные не координируют действия, а лишь обеспечивают плохо контролируемые снаружи механизмы (например, систему откреплений), не проводят строгой проверки, а местные уже решают, какую цифру спустить в УИК в их городе или районе. Математиков они не нанимают, так как раньше это всегда им сходило с рук и не зачем заморачиваться. Плюс, надо где-то найти лояльных власти математиков, уговорить их поучаствовать в незаконном деянии и сохранить все это в тайне.

В качестве подтверждения, что такое возможно, привожу пост по результатам выборах в Думу в 2016:

kireev.livejournal.com/1300008.html
kireev.livejournal.com/1302969.html

В Саратовской области вообще на 62 участках нарисовали одинаковые результаты. ЦИК их принял. Прочитайте пост, посмотрите офиц. данные, сделайте выводы. Поищите — наказан ли кто-то за это? Жулики видят такие случаи и делают выводы — с нормальным распределением можно не заморчиваться, а просто дать всем одну цифру, и так сойдет. Понятно, что где-то могут быть более хитрые жулики, которые раскидывают разные проценты по участкам, но это все равно выявляется потом на графике в виде пиков.

Точно так же в Чечне рисуют 95% явки, а когда приезжают наблюдатели, у них выходит от 30 до 70%.

Плюс, если следовать аргументу «они же не хотят палиться», то чиновники, например, не должны официально записывать на свое имя дома и имущество, которое по стоимости превышает их доходы — но такие факты вскрываются. А воры не должны лезть в магазин с камерами — но они лезут.

Если вы подозреваете наличие фальсификации в выборах, то должны доказать, что пиков на графике быть не должно, иначе это просто голословное утверждение и не более того.


При разных псевдослучайных распределениях пиков нет. Это не строгое доказательство, но это подтверждает мою мысль. А почему они должны быть?

поэтому нужны математические доказательства «аномальности» пиков, без этого, что-то серьезно утверждать нельзя.


Строго говоря, в теории вообще на всех участках в стране может получиться ровно 50%. Но вероятность этого ничтожно мала. Так же и с пиками — они могут получиться, но с ничтожно малой вероятностью. Как вы предлагаете доказать возможность или невозможность пиков? Строго доказать это невозможно. Можно только взять случайное распределение и посчитать, какая вероятность возникновения пиков на круглых цифрах — но критики скажут, что итоги голосования не случайные числа.

Я со своей стороны показал, что наличие пиков ровно на «круглых» значениях — обусловлено более высокой вероятностью появления таких значений по сравнению с «не круглыми».


Вы этого не показали. Вы взяли малую часть участков с круглым значением числа избирателей и пытаетесь по ней сделать выводы о явке на всех участках. Для пика на 94% всего 195 участков, но ровно 94% всего лишь на 13 участках. Этот пример опровергает вашу теорию.
Почему вы решили, что в перечисленных городах и регионах много воинских частей и традиционных общин? У вас есть какие-то данные по расположению «традиционных общин» и воинских частей?
Это мое субъективное мнение, но основывается оно на том, что в списке довольно много северных и морских регионов, на севере живут местные малочисленные народы, рядом с морем соответственно морские воинские части, на юге тоже знаю есть множество в/ч, вот примерно на таких данных я и основываюсь, ну и смысла особого тут обсуждать субъективные мнения я не вижу :)

Ну смотрите. Ровно 85% может быть только на участках с числом изб. кратным 20. При равномерном распределении численности это будет 1/20 об общего числа участков. Вы рассмотрели 1/20 всех участков, а 19/20 выкинули из рассмотрения. Для явки «ровно 27%» вообще вы взяли 1/100 участков, а 99/100 выкинули из рассмотрения.
Честно говоря, здесь я вообще не понимаю о чем вы пишите. Я не рассматривал ни каких 1/20 ни выкидывал 19/20, таблица отображает те УИКи в которых явка — это целое число. Явки 27% о которой вы говорите, в таблице вообще нет, т.к. в БД нет ни одного УИКа ровно с такой явкой. Поясните свою мысль.

У вас, например, явка ровно 85% нашлась на 36 участках. Но в России 90 000 УИК. На гистограмме в бине 85% нашлось 255 участков. Вы взяли малую часть от общего количества. Как вы можете на основании 36 участков из 255 делать какие-то выводы? Это 14% от всех участков в бине и 14% высоты пика.
Тут вы уже путаете понятия. В БД всего 36 УИК с явкой ровно 85%, это вы можете увидеть на График_1г (с шагом 0.001%) и в таблице. Грубо говоря именно об этих 36 УИКах речь и идет в статье, когда говорится, что вероятность появления целого числа выше чем дробного. Далее, когда мы переходим на График_1в (с шагом 0.01%) в 85% уже объединяются те дроби, которые на цело не делятся, но значения близки к 85% — в результате на графике уже значение не 36, а 50 УИК, далее мы еще больше увеличиваем шаг и на График_1б (с шагом 0.1%) уже видим значение 254 УИК, и наконец на График_1а (с шагом 1%) видим 1403 УИК и пиков уже нет. Вы о каких 14% говорите? Почему не 36/36=100% для График_1г, не 36/50=72% для График_1в, не 36/1403=2.5% для График_1а, а именно 14% для График_1б? Чем те графики хуже и почему по ним нельзя рассуждать о круглых значениях? :) Я вам еще раз поясняю, в статье речь идет именно о том, почему такие пики как 36 УИК на 85% (без каких-либо округлений) гораздо выше чем окружающие ее пики (тоже без каких-либо округлений). Сами по себе эти пики уже включают в себя «разумный выбор» и потом при увеличении шага уже из этих базовых пик и окружающих их мелких значений складываются более высокие пики.
Вот увеличенный график для 85%, обратите внимание на величину соседних пик:


Мне нравится высокий пик на 85% при бине 0.1%,

254 записи
ПРОЦЕНТ ЯВКА ВСЕГО_ЗАРЕГ REGION NAME ADDRESS
85 102 120 adygei УИК №48 385400, Республика Адыгея, Кошехабльский район, поселок Комсомольский, улица Широкая, 23, фельдшерско-акушерский пункт
84,97854 198 233 altai_rep УИК №158 649490, Республика Алтай, Усть-Коксинский район, с.Тюгурюк, ул.Центральная, д.3, Здание Тюгурюкского сельского клуба
85,016286 522 614 altai_terr УИК №1554 658022, Алтайский край, Тальменский район, село Кашкарагаиха, улица Советская, 1А, здание Кашкарагаихинского Дома культуры
85,020242 210 247 altai_terr УИК №1555 658006, Алтайский край, Тальменский район, село Наумово, улица Октябрьская, 2А, здание Наумовского клуба
84,971098 147 173 altai_terr УИК №756 659476, Алтайский край, Ельцовский район, село Верх-Неня, улица Леухина, 1, здание администрации сельского Совета
85,02994 142 167 altai_terr УИК №888 659037, Алтайский край, Калманский район, поселок Новый, улица Боровая, дом 6, филиал МБУК «Калманский культурно-информационный центр» поселка Новый
84,959349 209 246 altai_terr УИК №926 658733, Алтайский край, Каменский район, поселок Филипповский, улица Сибирская, дом 4 Б, здание Администрации Филипповского сельсовета
85 68 80 altai_terr УИК №944 658993, Алтайский край, Ключевский район, село Красный Яр, улица Западная, 3, Сельский клуб
85,023041 369 434 bashkortostan УИК №1179 452989, Республика Башкортостан, Балтачевский район, Штандинский сельсовет, деревня Штанды, улица Центральная, 8, администрация сельского поселения
84,993849 691 813 bashkortostan УИК №1183 452000, Республика Башкортостан, Белебеевский район, город Белебей, улица Советская, дом 11, Филиал ФГБОУ ВО Самарский государственный технический унивеситет в г.Белебее РБ
85,004284 1984 2334 bashkortostan УИК №1191 452000, Республика Башкортостан, Белебеевский район, город Белебей, улица имени Морозова, дом 2, МБОУ Башкирская гимназия — интернат города Белебея
84,986225 1851 2178 bashkortostan УИК №1197 452000, Республика Башкортостан, Белебеевский район, город Белебей, улица имени Марса Гизитдиновича Амирова, дом 13, МАУК Центральная межпоселенческая библиотека муниципального района Белебеевский район
84,974358 1657 1950 bashkortostan УИК №1199 452000, Республика Башкортостан, Белебеевский район, город Белебей, улица имени Владимира Ильича Ленина, дом 9, МАОУ ДО Детская школа искусств №1 г.Белебея
84,958353 1734 2041 bashkortostan УИК №1201 452000, Республика Башкортостан, Белебеевский район, город Белебей, улица Тукаева, дом 77, МАОУ СОШ № 8
84,950773 604 711 bashkortostan УИК №1496 453441, Республика Башкортостан, Благовещенский район, Николаевский сельсовет, село Николаевка, улица Нижняя, дом 91, здание МОБУ основная общеобразовательная школа села Николаевка
84,96732 1560 1836 bashkortostan УИК №1519 453447, Республика Башкортостан, Благовещенский район, Ильино-Полянский сельсовет, село Ильина Поляна, улица Советская, дом 9 А, здание Сельского дома культуры села Ильино-Поляна
84,981684 232 273 bashkortostan УИК №1621 452969, Республика Башкортостан, Бураевский район, Тепляковский сельсовет, село Тепляки, улица Мелиораторов, 1, здание общественного центра с.Тепляки
85 34 40 bashkortostan УИК №1647 453583, Республика Башкортостан, Бурзянский район, Кипчакский сельсовет, деревня Малый Кипчак, улица Молодежная, дом 5, здание МОБУ начальная общеобразовательная школа д. Малый Кипчак
84,982935 498 586 bashkortostan УИК №1906 452185, Республика Башкортостан, Ермекеевский район, Тарказинский сельсовет, село Тарказы, Молодежная, 26, общеобразовательная школа
85,028248 602 708 bashkortostan УИК №2048 424129, Республика Башкортостан, Иглинский район, Чуваш-Кубовский сельсовет, село Старокубово, улица Школьная, дом 10, здание школы
85,03937 432 508 bashkortostan УИК №2188 452860, Республика Башкортостан, Калтасинский район, село Калтасы, улица Кооперативная, дом 1, здание Калтасинской средней школы № 2
85,03937 108 127 bashkortostan УИК №2213 452865, Республика Башкортостан, Калтасинский район, деревня Кугарчино, улица Нагорная, дом 7, здание сельского клуба
85,042735 995 1170 bashkortostan УИК №2245 452373, Республика Башкортостан, Караидельский район, Магинский сельсовет, село Магинск, улица Октябрьская, дом 22, Здание сельского Дома клуба
85 833 980 bashkortostan УИК №2501 453366, Республика Башкортостан, Куюргазинский район, Ермолаевское сельское поселение, село Айсуак, улица Совхозная, 3, СДК с.Айсуак
85,042735 199 234 bashkortostan УИК №2858 453142, Республика Башкортостан, Стерлитамакский район, Аючевский сельсовет, деревня Новая Васильевка, улица Центральная,, дом 27, здание СДК
84,987893 351 413 bashkortostan УИК №3060 450024, Башкортостан, Уфимский район, Жуковское сельское поселение, деревня Сергеевка, улица Центральная, 31 А, здание магазина
85,021224 1402 1649 bashkortostan УИК №3124 453742, Республика Башкортостан, Учалинский район, Уральский сельсовет, село Уральск, улица Гагарина, дом 12, помещение СДК с.Уральск — филиал МБУ «Районный Дом культуры» МР Учалинский район РБ
84,955752 672 791 bashkortostan УИК №3202 453800, Республика Башкортостан, Хайбуллинский район, Акъярский сельсовет, село Акъяр, улица Подгорная, 69, здание Дома детского творчества
84,974789 2528 2975 bashkortostan УИК №34 450039, Республика Башкортостан, город Уфа, улица Ферина, дом 19/1, здание ООО ЖЭУ — 65
85,030269 1545 1817 bashkortostan УИК №347 450065, Республика Башкортостан, город Уфа, улица Вологодская, дом 76/2, здание жилищно-эксплуатационного участка №48 ООО «Объединение жилищного хозяйства Орджоникидзевского района города Уфы»
85 2006 2360 bashkortostan УИК №43 450043, Республика Башкортостан, город Уфа, улица Георгия Мушникова, дом 5/2, здание Башкирской гимназии № 140 имени Зайнаб Биишевой
84,964845 1571 1849 bashkortostan УИК №475 452680, Республика Башкортостан, город Нефтекамск, улица Парковая, дом 18, здание Дома физкультуры
84,983221 1013 1192 bashkortostan УИК №52 450030, Республика Башкортостан, город Уфа, улица Петрозаводская, дом 10в, здание общежития ПАО «ОДК-УМПО»
85 1853 2180 bashkortostan УИК №576 453260, Республика Башкортостан, город Салават, улица Уфимская, дом 72, здание МБОУ «Лицей №8», корпус №1
85 1972 2320 bashkortostan УИК №580 453266, Республика Башкортостан, город Салават, бульвар Космонавтов, дом 41а, здание ГБПОУ РБ «Салаватский музыкальный колледж
84,976525 181 213 bashkortostan УИК №760 453625, Республика Башкортостан, Абзелиловский район, Амангильдинский сельсовет, деревня Абдулгазино, улица Ленина, 54, здание Абдулгазинской начальной школы
84,977578 379 446 bashkortostan УИК №790 453618, Республика Башкортостан, Абзелиловский район, Краснобашкирский сельсовет, деревня Озерное, улица Школьная, 32, здание Озерновской неполной средней школы
84,962406 113 133 bashkortostan УИК №835 452130, Республика Башкортостан, Альшеевский район, Аксеновский сельсовет, село Кайраклы, улица Центральная, 18, здание НОШ с.Кайраклы — филиал МБОУ СОШ с.Аксеново
84,990253 436 513 belgorod УИК №707 309903, Белгородская область, Красногвардейский район, село Валуйчик, улица Черняховского, дом 6, здание Валуйчанского сельского Дома культуры
84,97854 198 233 bryansk УИК №1055 243322, Брянская область, Унечский район, Красновичское сельское поселение, деревня Добрик, улица Центральная, дом 61, Добрикский сельский клуб
85,026041 653 768 bryansk УИК №342 242650, Брянская область, Дятьковский муниципальный район, Ивотское городское поселение, деревня Сельцо, улица Ленина, дом 6, Дом культуры
84,989316 1591 1872 bryansk УИК №56 Брянская область, город Брянск, Бежицкий район, улица Федюнинского, дом 1, МБОУ ДОД „Детская школа искусств №1“
85 136 160 bryansk УИК №599 242400, Брянская область, Комаричский муниципальный район, Литижское сельское поселение, Дерюгино деревня, улица Центральная, дом 8, контора
85 85 100 bryansk УИК №729 243567, Брянская область, Погарский муниципальный район, Витемлянское сельское поселение, д.Исаевка, улица Первомайская, дом 42, магазин филиала Погарского РПС „Коопунивермаг“
85,012919 329 387 bryansk УИК №832 242461, Брянская область, Севский муниципальный район, Подлесно-Новосельское сельское поселение, село Подывотье, улица Молодежная, дом 32, Подывотский дом культуры
84,995251 895 1053 bryansk УИК №951 243500, Брянская область, Суражский муниципальный район, город Сураж, улица Красноармейская, дом 6, МДОУ детский сад „Солнышко“
85,031847 534 628 buriat УИК №146
85,043478 489 575 buriat УИК №43 671543, Республика Бурятия, муниципальный район „Баунтовский эвенкийский район“, село Романовка, СДК, улица Первомайская, 2, „сельский Дом культуры“
85 51 60 buriat УИК №618 671197, Республика Бурятия, Селенгинский район, сельское поселение Иройское, улус Удунга, улица Улан-Удунга, 13, здание фельдшерско-акушерского пункта
84,962406 113 133 chechen УИК №45 366340, Чеченская Республика, Веденский район, с. Беной, ул. Б-Г. Митаева, д. 14, здание школы
85 34 40 chelyabinsk УИК №1056 Челябинская область, Красноармейский район, Русско-Теченское сельское поселение, деревня Шуранкуль, улица Комсомольская, 23
85 153 180 chelyabinsk УИК №1311 456040, Челябинская область, Усть-Катавский городской округ, село Минка, улица Долгая, 34, помещение МОУ „ООШ с. Минка“
85 119 140 chelyabinsk УИК №1784 457658, Челябинская область, Нагайбакский район, Фершампенуазское сельское поселение, деревня Слюда, улица Новая, дом 10, (здание сельского клуба)
85,032362 1051 1236 chelyabinsk УИК №338 457100, Челябинская область, город Троицк, улица Гастелло, дом 60, здание Дома детского творчества
85,038503 773 909 chuvash УИК №1503
84,97854 198 233 chuvash УИК №2316 429077, Чувашская Республика, Ядринский район, деревня Кудаши, Первомайская, 1, здание Кудашского аункта выдачи книг
85,023696 897 1055 chuvash УИК №404 429220, Чувашская Республика — Чувашия, Вурнарский район, Вурнарское городское поселение, п.Вурнары, Ленина, 160А, Здание ООО»Сельхозэнерго"
84,987694 1036 1219 chuvash УИК №801 429140, Чувашская Республика, Комсомольский район, Комсомольское сельское поселение с.Комсомольское, Заводская, 50, здание МБОУ «Комсомольская СОШ №1»
84,988452 1104 1299 crimea УИК №17 298542, Республика Крым, городской округ Алушта, поселок городского типа Партенит, улица Победы, 1, здание МОУ «Партенитская школа»
85,038503 773 909 crimea УИК №398 298000, Республика Крым, городской округ Судак, город Судак, улица Приморская, 46, Государственное унитарное предприятие Республики Крым «Пансионат „Крымская весна“, конференц-зал
85,012087 1055 1241 crimea УИК №400 298000, Республика Крым, городской округ Судак, город Судак, улица Ленина, 81, Акционерное Общество „Пансионат “Звездный», холл
84,959816 1480 1742 crimea УИК №845 297053, Республика Крым, Красногвардейский район, село Ленинское, улица Ленина, 18, административное здание АО «Крымская фруктовая кампания»
84,965831 373 439 dagestan УИК №1336 368661, Республика Дагестан, Табасаранский район, сельсовет Марагинский, село Марага,, здание школы №2
85,026737 159 187 dagestan УИК №1442 368421, Республика Дагестан, Тляратинский район, сельсовет Хидибский, селение Хидиб,, здание сельской администрации
85,03937 216 254 dagestan УИК №278 368250, Республика Дагестан, Гергебильский район, село Чалда,, здание спортзала
84,965034 972 1144 dagestan УИК №377
84,950859 1383 1628 dagestan УИК №496
84,986595 1902 2238 ingush УИК №92 386125, Республика Ингушетия, Назрановский район, сельское поселение Али-Юрт, улица Ахриева, 47, здание школы
85,026737 159 187 ivanovo УИК №679 155033, Ивановская область, Тейковский муниципальный район, Морозовское сельское поселение, деревня Сокатово, улица Зеленая, 1/2, Здание администрации Морозовского сельского поселения
84,969325 277 326 kaliningrad УИК №179
85,046728 182 214 kaluga УИК №2308 249266, Калужская область, Сухиничский район, д. Алнеры, -, 5, зданиие администрации сельского поселения «Деревня Алнеры»
84,955752 96 113 kaluga УИК №2327 249264, Калужская область, Сухиничский район, д. Глазово, -, 48а, зданиие МКОУ «Глазовская основная общеобразовательная школа»
85,032894 517 608 kaluga УИК №2617 249800, Калужская область, Ферзиковский район, с.Ферзиково, -, 46, Администрация сельского поселения «Село Ферзиково»
85 952 1120 karachaev-cherkess УИК №113 369164, Карачаево-Черкесская Республика, Зеленчукский муниципальный район, Кардоникское сельское поселение, станица Кардоникская, Ленина, д.76, спортзал МКОУ «ООШ № 3 ст.Кардоникской»
84,982174 1907 2244 kemerovo УИК №214 650093, Кемеровская область, город Кемерово, Ленина проспект, дом 55А, Главное управление МЧС России по Кемеровской области
85,001781 2386 2807 kemerovo УИК №220 650070, Кемеровская область, город Кемерово, улица Котовского, дом 8, Средняя общеобразовательная школа №95
85,016556 2054 2416 kemerovo УИК №266 650003, Кемеровская область, город Кемерово, Ленинградский проспект, дом 34, литера В, Школа № 94
84,979591 1041 1225 kemerovo УИК №292 650060, Кемеровская область, город Кемерово, Строителей бульвар, дом 24, литера В, Школа №12
84,995808 2028 2386 kemerovo УИК №331 650099, Кемеровская область, город Кемерово, улица Орджоникидзе, дом 9, МБОУ «Гимназия №1»
85 799 940 kemerovo УИК №40 652470, Кемеровская область, Анжеро-Судженский городской округ, улица имени 137 Отд.Стр.Бригады, дом 7, детский сад №17
85,028901 1471 1730 kemerovo УИК №527 652870, Кемеровская область, Междуреченский городской округ, город Междуреченск, улица Пушкина, дом 22, Школа №25
84,989959 1693 1992 kemerovo УИК №611 654038, Кемеровская область, город Новокузнецк, улица Тореза, дом 11, МБОУ «Средняя общеобразовательная школа №93
84,990706 1829 2152 kemerovo УИК №618 654038, Кемеровская область, город Новокузнецк, улица Тореза, дом 22в, Культурный центр ОАО „ЗСМК“
84,977139 1301 1531 kemerovo УИК №974 652062, Кемеровская область, город Юрга, проспект Победы, дом 32А, здание детского сада №42 „Огонек“
84,995663 980 1153 khabarovsk УИК №549 681076, Хабаровский край, Комсомольский район, поселок Снежный, улица Торговая, 16, Дом культуры
85,018726 227 267 khantu-mansy УИК №56 628112, Ханты-Мансийский автономный округ — Югра, Октябрьский район, поселок Комсомольский, улица Партсъезда, 16, помещение МКОУ „Комсомольская ООШ“
85,046728 91 107 kirov УИК №712 613260, Кировская область, Нагорский район, поселок Крутой Лог, Советская, 2, здание МКОУ ООШ п.Крутой Лог
84,960422 322 379 komi УИК №625 Республика Коми, Прилузский район, село Лойма, улица Центральная, дом 20, здание администрации СП „Лойма“
85,008896 1911 2248 krasnodar УИК №101
85,040983 1660 1952 krasnodar УИК №225
85,038693 989 1163 krasnodar УИК №2819 352016, Краснодарский край, Кущевский район, хутор Глебовка, улица Братская, 33, здание МУК „КДЦ Глебовского сельского поселения“
85,046728 1274 1498 krasnodar УИК №3108 352570, Краснодарский край, Мостовский район, поселок городского типа Мостовской, улица Буденного, 177, здание ГУСО КК „Мостовский центр социальной помощи семье и детям “Источник»
85,02994 1136 1336 krasnodar УИК №409
85,030502 1812 2131 krasnodar УИК №435
85,004009 2120 2494 krasnodar УИК №456
85 136 160 krasnodar УИК №4835 352378, Краснодарский край, Тбилисский район, хутор Зиссермановский, улица Верхняя, 2, здание сельского клуба хутора Зиссермановский — филиала МБУК «Марьинский культурно-досуговый центр»
84,975369 345 406 krasnodar УИК №5330 352812, Краснодарский край, Туапсинский район, Шепсинское сельское поселение, поселок пансионата «Гизель-Дере», улица Центральная, 1, здание МБОУ ООШ № 23
85,007974 533 627 krasnodar УИК №5334 352822, Краснодарский край, Туапсинский район, Шепсинское сельское поселение, село Кроянское, улица Шаумяна, 4, магазин
85,007727 1100 1294 krasnodar УИК №5605 352330, Краснодарский край, Усть-Лабинский район, город Усть-Лабинск, улица Ободовского, 153-А, здание МБОУ СОШ № 36
84,966052 876 1031 krasnodar УИК №655
84,962406 113 133 krasnoyarsk УИК №2094 662330, Красноярский край, Шарыповский район, д.Росинка, Центральная, 12, здание сельского клуба
85,046728 91 107 krasnoyarsk УИК №2147 662240, Красноярский край, Ужурский район, п. Сухореченск, Садовая, 1, Здание конторы отделения №3
85,046728 91 107 kursk УИК №528 307634, Курская область, Конышевский район, Платавский сельсовет, деревня Гряды,, здание Грядского сельского клуба филиала МКУ «Платавский сельский Дом культуры»
84,965034 243 286 kursk УИК №818 306007, Курская область, Поныровский район, Первомайский сельсовет, деревня Прилепы, дом 10, помещение МКУК «Первомайский сельский Дом культуры»
85 340 400 kursk УИК №968 306120, Курская область, Солнцевский район, Старолещинский сельсовет, деревня Большая Козьмодемьяновка, улица Молодежная, дом 4, здание МКОУ «Старолещинская ООШ»
85,031847 267 314 lipetsk УИК №1105
84,95702 593 698 lipetsk УИК №123
85 221 260 lipetsk УИК №333
85,014836 573 674 lipetsk УИК №620
85,022026 386 454 mordov УИК №119 431740, Республика Мордовия, Большеберезниковский район, село Русские Найманы, улица Центральная, дом 34, здание Русско-Найманской ООШ
85,012285 1384 1628 mordov УИК №412 431524, Республика Мордовия, Лямбирский муниципальный район, Атемарское сельское поселение, село Атемар, улица Центральная, дом 73, здание МБУ «КДЦ Атемарского сельского поселения»
84,986876 1619 1905 moscow_city УИК №1900 117452, город Москва, Чонгарский бульвар, дом 17, ГБОУ города Москвы «Школа №2016»
84,99534 912 1073 moscow_reg УИК №1848 142400, Московская область, Ногинский район, город Ногинск, улица Комсомольская, 3, (МБОУ СОШ №14)
85,032188 1585 1864 moscow_reg УИК №3074 142840, Московская область, городской округ Ступино, посёлок Михнево, улица Библиотечная, дом 19, средняя школа
84,981684 464 546 n_osset-alania УИК №133 363753, Республика Северная Осетия — Алания, Моздокский район, поселок Моздок 2, ул. Центральная, 2, МБОУ «ООШ поселка Советского»
85,029469 2164 2545 n_osset-alania УИК №325 362035, Республика Северная Осетия — Алания, город Владикавказ, Северо-Западный внутригородской район, проспект Коста, дом 283В, здание МБУК ЦГБ
84,98969 2061 2425 n_osset-alania УИК №338 362047, Республика Северная Осетия — Алания, город Владикавказ, Северо-Западный внутригородской район, улица Морских Пехотинцев, дом 9А, здание МБДОУ детский сад №91
85,003885 2188 2574 n_osset-alania УИК №342 362045, Республика Северная Осетия — Алания, город Владикавказ, Северо-Западный внутригородской район, улица Дзусова, дом 36, здание МБОУ СОШ №46
84,975369 345 406 n_osset-alania УИК №72 363506, Республика Северная Осетия — Алания, Ирафский муниципальный район, Советское сельское поселение, Беза Нигкоева, 1, АМС с.Советское
84,962406 113 133 nnov УИК №1311 607815, Нижегородская область, Лукояновский район, Тольско-Майданский сельсовет, с. Мерлиновка, ул.Ленина, д.96, Дом культуры
85,031185 409 481 nnov УИК №1323 607833, Нижегородская область, Лукояновский район, Шандровский сельсовет, с. Шандрово, ул.Центральная, д.3, Шандровский филиал МБОУ Ульяновская средняя общеобразовательная школа
85,006353 1338 1574 nnov УИК №1479 606125, Нижегородская область, Павловский район, город Горбатов, ул. Советская, д. 4А, здание средней школы
84,971751 752 885 nnov УИК №1812 607564, Нижегородская область, Сеченовский район, Верхнеталызинский сельсовет, с. Верхнее Талызино, ул. Советская, дом 13а, здание школы
84,968102 2131 2508 nnov УИК №1824 607580, Нижегородская область, Сеченовский район, Сеченовский сельсовет, с. Сеченово, пл. Советская, дом 3, здание Дома культуры
84,96732 130 153 nnov УИК №1889 606191, Нижегородская область, Сосновский район, Виткуловский сельсовет, деревня Волчиха, ул. Ленина, д. 1А, здание сельского Дома культуры
85 34 40 novosibirsk УИК №527 632945, Новосибирская область, Краснозерский район, Аксенихинский сельсовет, поселок Ганино, улица Ганинская, 25, помещение Ганинского сельского клуба МКУК «Аксенихинский КДЦ»
85,016835 505 594 novosibirsk УИК №933 633650, Новосибирская область, Сузунский район, Мышланский сельсовет, село Мышланка, улица Советская, 45, здание Мышланского Дома культуры
84,982935 249 293 omsk УИК №1537 646400, Новотроицкое сельское поселение, Саргатский муниципальный район, Омская область, д.Десподзиновка, Центральная, 26, Сельский клуб
85,026737 159 187 omsk УИК №1567
84,988962 385 453 orel УИК №715 303945, Орловская область, Хотынецкий район, село Ильинское, улица Школьная, 17, здание сельского Дома культуры
84,978274 1369 1611 orel УИК №722 303930, Орловская область, поселок Хотынец, улица Пушкина, 25, здание районного Дома культуры
85 255 300 orenburg УИК №1504 462133, Оренбургская область, Саракташский район, село Старый Сокулак, улица Заречная, 3, здание основной общеобразовательной школы
85,03937 108 127 orenburg УИК №1564 461661, Оренбургская область, Северный район, деревня Шабрино, улица Бадановка, дом 20, здание ФАП
85,018726 454 534 orenburg УИК №175 461704, Оренбургская область, Асекеевский район, село Новосултангулово, улица Центральная, 78/10, здание сельского Дома культуры
85,016286 261 307 penza УИК №1084 442900, Пензенская область, Тамалинский район, Ульяновский сельсовет, село Обвал, Иванова улица, дом 43-б, здание СДК с. Обвал
85,026737 159 187 penza УИК №405 442183, Пензенская область, Вадинский район, Рахмановский сельсовет, село Ключи, улица Пролетарка, дом 14, Здание администрации
85 595 700 penza УИК №598 442840, Пензенская область, Колышлейский район, Трескинский сельсовет, село Трескино, улица Мира, дом 23, здание филиала МОУ СОШ с.Трескино
85 238 280 penza УИК №650 442550, Пензенская область, Лопатинский район, Лопатинский сельсовет, поселок Владимирский, Советская, 1А
85,017421 488 574 penza УИК №677 442745, Пензенская область, Лунинский район, Большевьясский сельсовет, село Лесной Вьяс, улица Большая дорога, дом 69, Здание обособленного подразделения «Лесновьясский КДЦ» МУК «МЦ РДК Лунинского района Пензенской области»
84,977005 1663 1957 primorsk УИК №337 692760, Приморский край, Артёмовский городской округ, город Артём, улица Кирова, дом 138 (1 этаж), здание школы № 18
84,989429 402 473 pskov УИК №291 182854, Псковская область, Бежаницкий район, село Кудеверь, Школьная, 4-а, помещение Администрации с/п «Бежаницкое»
84,955752 96 113 pskov УИК №489 182036, Псковская область, Куньинский район, деревня Долговица, -, 12, здание фельдшерско-акушерского пункта
84,992101 1076 1266 rostov УИК №1537 346466, Ростовская область, Октябрьский район, Кривянское сельское поселение, станица Кривянская, улица Кооперативная, 109, «здание МУК „Кривянский сельский ДК №1“
85,016286 2088 2456 rostov УИК №1693 344068, Ростовская область, город Ростов-на-Дону, Ворошиловский район, проспект Михаила Нагибина, дом 33, здание школы №90
84,973885 2115 2489 rostov УИК №1889 344065, Ростовская область, город Ростов-на-Дону, Первомайский район, улица Киргизская, 41, здание МБОУ „Школа № 84“
84,986301 1551 1825 rostov УИК №2337 347091, Ростовская область, Тацинский район, Жирновское сельское поселение, поселок Жирнов, улица Театральная, дом 7, здание МБУК „Жирновский ДК“
85,022026 579 681 rostov УИК №2439 346000, Ростовская область, Чертковский район, Чертковское сельское поселение, поселок Чертково, улица Фрунзе, дом 23, здание районного ДК
85 102 120 rostov УИК №372 346173, Ростовская область, Верхнедонской район, Верхняковское сельское поселение, хутор Поздняковский, улица Лесная, дом 31, здание школы
85,035971 591 695 rostov УИК №402 346182, Ростовская область, Верхнедонской район, Шумилинское сельское поселение, станица Шумилинская, улица Ленина, дом 6, здание дома культуры
84,984678 1664 1958 rostov УИК №596 347660, Ростовская область, Егорлыкский район, Егорлыкское сельское поселение, станица Егорлыкская, улица Ленина, 62, здание ЦВР
85,023737 1970 2317 rostov УИК №859 347830, Ростовская область, Каменский район, Старостаничное сельское поселение, хутор Старая Станица, улица Театральная, 45, здание ДК
85,019455 437 514 ryazan УИК №181 391200, Рязанская область, Кораблинский район, город Кораблино, улица Заводская, дом 6, помещение ООО ДПМК „Кораблинская
84,990253 436 513 ryazan УИК №591 Рязанская область, Скопинский район, село Вердерево, улица Центральная, дом 98А, здание дома культуры
84,959349 209 246 ryazan УИК №791 391503, Рязанская область, Шиловский район, село Боровое, улица Весенняя, дом 3, квартира 2, здание сельской администрации
84,974093 328 386 ryazan УИК №820 391501, Рязанская область, Шиловский район, село Тимошкино, улица Хлопоталовка, дом 88, здание дома культуры
85,007496 567 667 saratov УИК №1001 412802, Саратовская область, город Красноармейск, 5 микрорайон, дом 48, здание Детского сада № 16
85,026737 159 187 saratov УИК №1168 413063, Саратовская область, Марксовский район, село Фурмановка, улица Заречная, дом 6А, здание дома культуры с. Фурмановка
85,009861 431 507 saratov УИК №1232 413361, Саратовская область, город Новоузенск, площадь Льва Толстого, дом 3, здание автовокзала
85 187 220 saratov УИК №1474 412286, Саратовская область, Романовский район, поселок Алексеевский, -, -, здание сельского Дома культуры
85,049019 694 816 saratov УИК №154 410005, Саратовская область, город Саратов, Кировский район, улица имени Зарубина В.С., дом 158/162, здание МУК “Централизованная библиотечная система города Саратова»
85 1156 1360 saratov УИК №1585 410511, Саратовская область, Саратовский район, село Александровка, улица Привокзальная, дом 3 В, здание школы
84,980744 662 779 saratov УИК №1636 413222, Саратовская область, Советский район, село Александровка, улица Юбилейная, дом 3, здание Дома культуры
85,048231 529 622 saratov УИК №1707 413412, Саратовская область, Федоровский район, село Романовка, улица Советская, дом 51, здание администрации МО
85,006353 2007 2361 stavropol УИК №102 355000, Ставропольский край, город Ставрополь, улица Михаила Морозова, дом 95 (МБОУ лицей № 14)
85 1292 1520 stavropol УИК №11 355500, Ставропольский край, город Ставрополь, улица Голенева, дом 46, МБОУ СОШ № 4 города Ставрополя
85 1870 2200 stavropol УИК №123 355000, Ставропольский край, город Ставрополь, улица 50 лет ВЛКСМ, дом 49 (МБОУ СОШ с углубленным изучением отдельных предметов № 29)
84,997242 1541 1813 stavropol УИК №1267 356232, Ставропольский край, Шпаковский район, Темнолесский сельсовет, станица Темнолесская, Центральная улица, 129, МКУК «Темнолесский культурный центр»
84,971567 2092 2462 stavropol УИК №1294 355000, Ставропольский край, город Ставрополь, улица Доваторцев, дом 86/1, 86/2 (помещение администрации Промышленного района города Ставрополя)
84,989604 2044 2405 stavropol УИК №137 355000, Ставропольский край, город Ставрополь, улица 50 лет ВЛКСМ, дом 49 (МБОУ СОШ № 29 с углубленным изучением отдельных предметов)
85,03937 756 889 stavropol УИК №249 356405, Ставропольский край, Благодарненский район, аул Эдельбай, улица Манкаева, 70, здание МКОУ «СОШ № 14»
84,983261 1777 2091 stavropol УИК №26 355000, Ставропольский край, город Ставрополь, улица Мира, дом 262, МБОУ СОШ № 1 города Ставрополя
84,99774 1881 2213 stavropol УИК №31 355000, Ставропольский край, город Ставрополь, улица Серова, дом 272, МБОУ гимназия № 30 города Ставрополя
85,002094 2029 2387 stavropol УИК №336 357838, Российская Федерация, Ставропольский край, Георгиевский район, станица Лысогорская, улица Школьная, 114, здание МБОУ СОШ № 15 имени Александра Захаровича Потапова станицы Лысогорской
84,96732 1950 2295 stavropol УИК №382 357600, Ставропольский край, город-курорт Ессентуки, улица Вокзальная, 45-А, МБОУ СОШ №1
84,955141 1231 1449 stavropol УИК №47 355000, Ставропольский край, город Ставрополь, улица Магистральная, дом 16/1, помещение для работы с населением Совета микрорайона № 32
84,986098 917 1079 stavropol УИК №499 356630, Российская Федерация, Ставропольский край, Ипатовский городской округ, город Ипатово, улица Заречная, 37 (завод Алеврит), завод Алеврит
85,008103 1049 1234 stavropol УИК №532 357300, Ставропольский край, Кировский район, город Новопавловск, промзона, -, здание МБОУ «Новопавловская СОШ №33»
85 1105 1300 stavropol УИК №54 355000, Ставропольский край, город Ставрополь, улица Дзержинского, 137, здание муниципального автономного общеобразовательного учреждения лицей № 5 города Ставрополя
85,006045 703 827 stavropol УИК №549 357300, Ставропольский край, Кировский район, поселок Фазанный, улица Рабочая, 4, здание МКОУ «СОШ №18 поселка Фазанный»
85,041938 1825 2146 stavropol УИК №59 355008, Ставропольский край, город Ставрополь, проспект Карла Маркса, 7, здание частного образовательного учреждения высшего образования «Институт Дружбы народов Кавказа»
85,029163 1312 1543 stavropol УИК №619 357014, Ставропольский край, Кочубеевский район, Заветненский сельсовет, село Заветное, улица Баркова, дом 17, Здание СПК колхоз имени Ленина
85,006693 1270 1494 stavropol УИК №63 355006, Ставропольский край, город Ставрополь, улица Фрунзе, 2, здание муниципального бюджетного общеобразовательного учреждения гимназия № 12 имени Белоконя Владимира Эдуардовича города Ставрополя
85,012386 2059 2422 stavropol УИК №75 355001, Ставропольский край, город Ставрополь, улица Октябрьская, 101, здание киноклуба «Пионер» муниципального бюджетного учреждения культуры Центра досуга и кино «Октябрь» города Ставрополя
84,986351 934 1099 stavropol УИК №807 357108, Ставропольский край, город Невинномысск, бульвар Мира, дом 9, здание МБОУ лицей № 6
84,950859 1383 1628 stavropol УИК №810 357108, Ставропольский край, город Невинномысск, бульвар Мира, дом 24, здание ГБПОУ «Невинномысский энергетический техникум»
85,014137 902 1061 stavropol УИК №815 357118, Ставропольский край, город Невинномысск, улица Северная, дом 9А, здание МБОУ СОШ № 12
85,003274 1298 1527 stavropol УИК №819 357118, Ставропольский край, город Невинномысск, улица Северная, дом 14А, здание МБОУ СОШ № 15
85,017421 1952 2296 stavropol УИК №82 355001, Ставропольский край, город Ставрополь, улица Октябрьская, 164А, здание государственного бюджетного профессионального образовательного учреждения «Ставропольский государственный политехнический колледж»
84,995251 1790 2106 stavropol УИК №830 357100, Ставропольский край, город Невинномысск, улица Гагарина, дом 53Б, здание МБОУ СОШ № 18
84,951816 1146 1349 stavropol УИК №832 357100, Ставропольский край, город Невинномысск, улица Кооперативная, дом 98, здание МБОУ СОШ № 5
84,974958 1018 1198 stavropol УИК №833 357115, Ставропольский край, город Невинномысск, улица Калинина, дом 159А, здание МБОУ СОШ № 20
84,997301 1575 1853 stavropol УИК №843 357106, Ставропольский край, город Невинномысск, улица Апанасенко, дом 82А, здание МБОУ СОШ № 16
84,958382 1429 1682 stavropol УИК №848 357101, Ставропольский край, город Невинномысск, улица Матросова, дом 165, здание ГКУСО «Невинномысский социально-реабилитационный центр для несовершеннолетних „Гавань“
85,007649 1667 1961 stavropol УИК №849 357101, Ставропольский край, город Невинномысск, улица Шевченко, дом 2, здание МБОУ СОШ № 2
84,987593 2055 2418 stavropol УИК №94 355000, Ставропольский край, город Ставрополь, улица Ленина, дом 419 (ОАО «СевКавНИПИГаз»)
84,980673 1539 1811 stavropol УИК №96 355000, Ставропольский край, город Ставрополь, улица Ленина, дом 456 (МУП «ВОДОКАНАЛ»)
84,980842 1109 1305 stavropol УИК №98 355000, Ставропольский край, город Ставрополь, улица Мира, дом 458 (МБОУ лицей №16)
85 102 120 sverdlovsk УИК №1056 623013, Свердловская область, Шалинский район, деревня Коптело — Шамары, улица Кропанцева, 30, здание сельского клуба
84,96732 130 153 sverdlovsk УИК №325 624378, Свердловская область, Верхотурский район, село Меркушино, улица Центральная, 10, Здание управы
84,958506 819 964 tambov УИК №136 393370, Тамбовская область, Кирсановский район, Голыщинский сельсовет, село Голынщина, д. 79а, здание Голынщинского МБУК „Районный Дом культуры“
84,953703 367 432 tambov УИК №331 393950, Тамбовская область, Моршанский район, Вановский сельсовет, село Ваново, ул. Советская, д. 10, здание Вановского филиала МБОУ Алгасовская СОШ
85,01529 278 327 tambov УИК №422 393006, Тамбовская область, Никифоровский район, д. Вырубово, ул. Молодежная, д. 11а, здание Вырубовского филиала МБОУ „Никифоровская средняя общеобразовательная школа № 1“
84,955752 192 226 tambov УИК №425 393027, Тамбовская область, Никифоровский район, с. Богородицкое, ул. Центральная, д. 1, здание Богородицкого филиала МБУК „Межпоселенческая центральная библиотека“
84,972677 933 1098 tambov УИК №554 393250, Тамбовская область, город Рассказово, ул. Красноармейская, д. 14, здание МБОУ СОШ №3
84,987893 351 413 tambov УИК №892 393491, Тамбовская область, Уваровский район, Подгорненский сельсовет, с. Верхнее Чуево, ул. Советская, д. 28, здание Верхнечуевского филиала МБОУ Моисеево-Алабушкой СОШ
84,952606 717 844 tatarstan УИК №1098 423234, Республика Татарстан (Татарстан), Бугульминский район, город Бугульма, улица Красноармейская, 39, здание средней школы №9
84,973166 950 1118 tatarstan УИК №1102 423234, Республика Татарстан (Татарстан), Бугульминский район, город Бугульма, улица Гафиатуллина, 20, литера А, здание школы №3
84,971644 899 1058 tatarstan УИК №1114 423236, Республика Татарстан (Татарстан), Бугульминский район, город Бугульма, улица Мусы Джалиля, 37, здание гимназии №7
84,991776 2067 2432 tatarstan УИК №1396 423602, Республика Татарстан (Татарстан), Елабужский район, город Елабуга, проспект Мира, 59, здание средней общеобразовательной школы №8
85 1071 1260 tatarstan УИК №1790 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Широкая, 15, здание средней школы №1
85,015673 1356 1595 tatarstan УИК №1792 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Агадуллина, 2, здание учебного центра УКК»НА"
85,02538 1675 1970 tatarstan УИК №1800 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Ленинградская, 40, здание средней школы №6
84,985835 1800 2118 tatarstan УИК №1801 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Кутузова, 2, здание средней школы №11
85,035276 2290 2693 tatarstan УИК №1802 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Кутузова, 14, здание ГАПОУ «ЛМХПК»
85,040322 2109 2480 tatarstan УИК №1803 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Крупской, 2, литера А, здание средней школы №10
85,019043 2009 2363 tatarstan УИК №1806 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Кошевого, 28, здание ГАПОУ «ЛПК»
85,024894 2220 2611 tatarstan УИК №1807 423250, Республика Татарстан (Татарстан), Лениногорский район, город Лениногорск, улица Степная, 2, литера А, здание средней школы №12
84,989339 1993 2345 tatarstan УИК №2016 423820, Республика Татарстан (Татарстан), город Набережные Челны, Комсомольский район, улица Александра Грина, 8/2, здание школы №9
84,983878 1845 2171 tatarstan УИК №2017 423820, Республика Татарстан (Татарстан), город Набережные Челны, Комсомольский район, улица Александра Грина, 8/2, здание школы №9
84,972462 2160 2542 tatarstan УИК №2036 423803, Республика Татарстан (Татарстан), город Набережные Челны, Комсомольский район, улица Комарова, 29, здание школы №7
84,969008 1645 1936 tatarstan УИК №2046 423806, Республика Татарстан (Татарстан), город Набережные Челны, Комсомольский район, переулок Садовый, 4, здание Таткиновидеопроката, «Татаркино»
85,008445 2013 2368 tatarstan УИК №2096 423819, Республика Татарстан (Татарстан), город Набережные Челны, Центральный район, бульвар Строителей, 9, здание пролицея №78
84,977578 1516 1784 tatarstan УИК №2111 423823, Республика Татарстан (Татарстан), город Набережные Челны, Центральный район, проспект Чулман, 88, здание ДЮЦ №14
84,97854 1782 2097 tatarstan УИК №2734 422980, Республика Татарстан (Татарстан), Чистопольский район, город Чистополь, улица Льва Толстого, 144, здание лицея №1
85,037748 1239 1457 tatarstan УИК №2740 422980, Республика Татарстан (Татарстан), Чистопольский район, город Чистополь, улица Студенческая, 1, учебный корпус сельскохозяйственного техникума
85,026041 653 768 tatarstan УИК №2826 423800, Республика Татарстан (Татарстан), город Набережные Челны, Комсомольский район, улица Гостева, 29, здание Городского культурного центра «Эврика»
85 323 380 tatarstan УИК №540 423303, Республика Татарстан (Татарстан), Азнакаевский район, село Агерзе, улица Ахметовой, 14, литера А, здание дома культуры
85,043837 1649 1939 tatarstan УИК №794 423450, Республика Татарстан (Татарстан), Альметьевский район, город Альметьевск, улица Белоглазова, 131, литера А, здание подросткового клуба «Луч»
84,958071 1621 1908 tula УИК №2830 301205, Тульская о
комент был обрезан хабром
Продолжение
85,043837 1649 1939 tatarstan УИК №794 423450, Республика Татарстан (Татарстан), Альметьевский район, город Альметьевск, улица Белоглазова, 131, литера А, здание подросткового клуба «Луч»
84,958071 1621 1908 tula УИК №2830 301205, Тульская область, Щекинский район, г. Советск, ул. Энергетиков, д. 17а, здание школы № 2
84,954128 463 545 tula УИК №806
84,989122 1172 1379 tyumen УИК №1131 627750, Тюменская область, город Ишим, ул. Непомнящего, д. 98, здание школы № 4
85,005512 1542 1814 tyumen УИК №2124 625027, Тюменская область, город Тюмень, ул. 50 лет Октября, д. 41, МАОУ гимназия № 12
84,96732 260 306 ulyanovsk УИК №1308 433104, Ульяновская область, Вешкаймский район, поселок Залесный, улица Советская, дом 14, административное здание поселок Залесный, кабинет администратора
84,974093 164 193 ulyanovsk УИК №1423 433012, Ульяновская область, Инзенский район, село Палатово, улица Центральная, дом 97, Палатовский СДК
85,02538 335 394 ulyanovsk УИК №1439 433011, Ульяновская область, Инзенский район, село Аргаш, улица Кузнецова, дом 65, административное здание МУ администрация МО Труслейское сельское поселение
85,015608 817 961 ulyanovsk УИК №1902 433810, Ульяновская область, Николаевский район, рабочий поселок Николаевка, площадь Ленина, дом 7, здание МУК «Николаевский МКДЦ»
85,03937 108 127 ulyanovsk УИК №2726 433240, Ульяновская область, Сурский район, рабочий посёлок Сурское, улица Ленина, дом 35, Здание бывшей администрации городского поселения
85 204 240 vladimir УИК №333 601293, Владимирская область, Суздальский район, муниципальное образование Селецкое, село Красное, улица Центральная, дом 58, здание МКУК «Селецкий КДЦ»
85,02994 426 501 volgograd УИК №1626 403774, Волгоградская область, Жирновский район, село Алешники, Центральная, 3А, здание МУК «Алешниковский центр культуры, досуга и спорта»
85,049019 347 408 volgograd УИК №1628 403776, Волгоградская область, Жирновский район, село Новинка, Молодёжная, 6, здание администрации Новинского сельского поселения, помещение Новинской сельской библиотеки
85 119 140 volgograd УИК №1636 403773, Волгоградская область, Жирновский район, село Меловатка, Центральная, 35, здание администрации Меловатского сельского поселения
85 85 100 volgograd УИК №2519 403317, Волгоградская область, Михайловский район, хутор Веселый, улица Садовая, дом 12, Веселовский сельский клуб — филиал МКУ «МЦК»
84,974093 1148 1351 voronezh УИК №112 396250, Воронежская область, Аннинский район, Архангельское сельское поселение, село Архангельское, улица Мира, дом 10а, (здание администрации Архангельского сельского поселения)
84,9944 1518 1786 voronezh УИК №1248 394030, город Воронеж, улица Кольцовская, дом 35, корпус А, помещение торгового Центра Галереи Чижова
85,013812 1231 1448 voronezh УИК №1902 396350, Воронежская область, Каширский район, село Каширское, улица Мира, дом 1, здание Центрального Дома культуры
84,952606 717 844 voronezh УИК №2070 397940, Воронежская область, Лискинский район, городское поселение Давыдовка, улица Ленина, дом 32 А, здание Давыдовской школы искусств
84,99257 572 673 voronezh УИК №2343 396318, Воронежская область, Новоусманский район, село Хреновое, улица Молодежная, дом16А, здание администрации Хреновского сельского поселения
85 476 560 voronezh УИК №2912 397680, Воронежская область, Петропавловский район, Новобогородицкое сельское поселение, село Новобогородицкое, улица Ленина, дом 41, помещение Новобогородицкого дома культуры
84,962406 226 266 voronezh УИК №342
85 85 100 voronezh УИК №3719 397138, Воронежская область, Терновский район, Новокирсановское сельское поселение, село Ржавец, улица Проезжая, дом 5, здание медицинского пункта
85,049019 1041 1224 yakut УИК №649 678011, Республика Саха (Якутия), Хангаласский район, село Октемцы, улица Емельяна Андреева, дом 1, Муниципальное учреждение Центр культуры «Бар5арыы» имени А.С.Даниловой
84,955089 1135 1336 yakut УИК №780 677013, Республика Саха (Якутия), город Якутск, улица Кулаковского, дом 48, КФЕН СВФУ
85,019305 1101 1295 yamal-nenetsk УИК №1015 629007, Ямало-Ненецкий автономный округ, город Салехард, ул. Республики, д. 31, здание Средней общеобразовательной школы № 1
84,966216 503 592 zabkray УИК №2218 673850, Забайкальский край, муниципальный район «Могойтуйский район», Сельское поселение «Кусоча», село Кусоча, Кусочинская, 18, здание МОУ «Кусочинская средняя общеобразовательная школа»


Но это отдельный интересный вопрос, а почему так много участков с ровно 80%. Может быть, стоит исследовать распределение численности избирателей, нет ли такого, например, что на очень многих участках оно кратно 5 или 10?
Данные по кратности 2,3,4,5,6,7,8,9,10 по всем уиакам есть в разделе «ключ».

Строго говоря, в теории вообще на всех участках в стране может получиться ровно 50%. Но вероятность этого ничтожно мала. Так же и с пиками — они могут получиться, но с ничтожно малой вероятностью. Как вы предлагаете доказать возможность или невозможность пиков? Строго доказать это невозможно. Можно только взять случайное распределение и посчитать, какая вероятность возникновения пиков на круглых цифрах — но критики скажут, что итоги голосования не случайные числа.
В том-то и дело, что мне не требуется доказывать «невозможность» пиков, это должны делать те, кто считает, что пики — это «аномалия». Как раз с моей точки зрения, это доказать по графикам не возможно, т.к. «разумный выбор» не обязан подчиняться нормальному распределению (тут нужны только юридические доказательства), но меня удивляют люди, которые все-равно упорно выдают «пики» — за доказательство, хотя доказать, что это «анамалия» не могут. Собственно для них этот пост и посвящался, а особенно графики_2абвг — в которых много пиков и даже треугольных ступенек, но при этом эти пики и ступеньки ничего не доказывают.

Я со своей стороны показал, что наличие пиков ровно на «круглых» значениях — обусловлено более высокой вероятностью появления таких значений по сравнению с «не круглыми».
Вы этого не показали. Вы взяли малую часть участков с круглым значением числа избирателей и пытаетесь по ней сделать выводы о явке на всех участках. Для пика на 94% всего 195 участков, но ровно 94% всего лишь на 13 участках. Этот пример опровергает вашу теорию.
На сколько я понимаю, мы просто с вами под «круглыми» значениями понимаем разные вещи. Я имею ввиду — ровно круглые значения и ничего более, вы же к ним относите некое расплывчатое понятие в которое включается разное кол-во соседних точек в зависимости от шага выборки, и значение (в нашем случае кол-во УИКов) изменяется для каждого нового выбранного шага. Поэтому вы считаете, что я чего-то не показал, в то время, когда я показал всё, что хотел показать :)

Просто, посмотрите на свою логику со стороны и вы поймете в чем проблема:
На бине 1% — нет пиков, это вас не устраивает (слишком обобщено),
На бине (0.001%) — тоже не устраивает, (слишком детально),
На бине (0.1%) — вы видите «хорошие» пики и утверждаете, что они «аномальны».

Смысл, в том, что выбрав понравившийся бин — можно получить любое кол-во пиков.

Для меня пики это не аномалия, это те базовые классы-параметры на которые делится обобщенный «разумный выбор» и чем меньше шаг выборки тем детальнее мы погружаемся в анализ.
Просто, посмотрите на свою логику со стороны и вы поймете в чем проблема:
На бине 1% — нет пиков, это вас не устраивает (слишком обобщено),
На бине (0.001%) — тоже не устраивает, (слишком детально),
На бине (0.1%) — вы видите «хорошие» пики и утверждаете, что они «аномальны».

Где интересно вы такую логику увидели? Если мы возьмём сгенерированные случайные данные, то на них на 1% и 0.1% не будет никаких пиков — а на графиках уиков на 0.1% есть. Вот и принцип выбора размера бина.
Если мы возьмём сгенерированные случайные данные, то на них на 1% и 0.1% не будет никаких пиков — а на графиках уиков на 0.1% есть. Вот и принцип выбора размера бина.
Я присоединяюсь к вопросу, заданному ниже. На каком основании вы утверждаете, что сгенерированные вами случайные данные — отражают тот «разумный выбор», который был заложен в реальном голосовании? Может существуют другие способы генерации данных на которых будут пики на 0.1%, не задумывались? Или вы реально считает — что ваш способ это единственный вариант генерации и то, что на нем в 0.1% нет пик — является доказательством фальсификации на реальных выборах? :)
UFO just landed and posted this here
Я думаю такой модели, которая может симулировать реальный «разумный выбор» всей страны создать невозможно :)

Но, я могу построить модель, которая будет использовать реальные данные по голосованию и мы посмотрим, что получится. В разделе «ключ» изначально были представлены таблицы с данными по кратности, я их выложил с самого начала, так как по моим прикидкам вероятности, которые они описывают, как раз и являются «ключом» к решению проблемы. Но формулы и расчеты это одно, а практика это другое… давайте проверим.

Вот визуализация, основанная на таблице кратности размеров УИК:

Шаг выборки (1%)


Шаг выборки (0.1%)


Шаг выборки (0.01%)


Шаг выборки (0.001%)


Таблицы из раздела «ключ»:

Общее разбиение по кратности количества зарегистрированных избирателей x2-10 для всех УИК:
KOLVO X2 X3 X4 X5 X6 X7 X8 X9 X10
97699 49413 32753 24724 20283 16649 13923 12464 10917 10411

KOLVO – общее кол-во УИК в которых проводились выборы
X2-10 – количество УИК в которых кол-во зарег. избирателей кратно 2-10

И общее разбиение по кратности пришедших на выборы избирателей x2-10 для всех УИК:

KOLVO X2 X3 X4 X5 X6 X7 X8 X9 X10
97699 49268 32712 24634 20608 16492 14085 12192 10938 10752

KOLVO – общее кол-во УИК в которых проводились выборы
X2-10 – количество УИК в которых кол-во пришедших избирателей кратно 2-10

Как работает модель:

0. По таблице рассчитывается вероятность появления числа кратного X2-X10
VerX2 = X2 / KOLVO
VerX3 = X3 / KOLVO


1. Запускается цикл по кол-ву УИКов = 97699
2. Для каждого УИКа случайно генерируется его размер из реального диапазона 3 — 7746 чел
3. В соответствии с вероятностью выбирается кратность УИКа, и от случайного размера УИКа — вычитается остаток от деления на кратное число. Если ни одна из вероятностей не сработала, то размер УИКа остается без изменения (случайным).
4. Случайно выбирается кол-во человек пришедших на выборы в УИК из диапазона 0… размер УИКа.
5. В соответствии с вероятностью выбирается кратность человек пришедших в УИК и от этого числа — вычитается остаток от деления на кратное число. Если ни одна из вероятностей не сработала, то кол-во человек остается без изменения (случайным).
6. Считается явка и в массиве результата соответствующему явке увеличивается кол-во УИК на +1.
7. По массиву результата строится график

Вот код на c++
	
	int k_uchastok = 97699;
	int arr[] = {49413 ,32753 ,24724 ,20283 ,16649 ,13923 ,12464 ,10917 ,10411};
	std::vector<int> all_kratnost(arr, arr + sizeof(arr) / sizeof(int));

	std::vector<double> ver_kratnost(all_kratnost.size());
	for (int i = 0; i < all_kratnost.size(); i++)
	{
		ver_kratnost[i] = (double)all_kratnost[i] / (double)k_uchastok;
	}


	int arr2[] = {49268, 32712, 24634, 20608, 16492, 14085, 12192, 10938, 10752};
	std::vector<int> all_kratnost2(arr2, arr2 + sizeof(arr2) / sizeof(int));

	std::vector<double> ver_kratnost2(all_kratnost2.size());
	for (int i = 0; i < all_kratnost2.size(); i++)
	{
		ver_kratnost2[i] = (double)all_kratnost2[i] / (double)k_uchastok;
	}



	for (int i = 0; i < k_uchastok; i++)
	{
		// Случайное значение от 0 до 1
		double ver_value = (double)rand() / RAND_MAX ;

		uik_size = 3 + rand()%7743;

		int k;
		for (k = 0; k < all_kratnost.size(); k++)
		{
			if (ver_value < ver_kratnost[k])
			{
				// кратно 2+k
				int ostatok = uik_size % (k+2);
				if (uik_size > (ostatok+3))
				{
					uik_size -= ostatok;
				}

				uik_yavka = uik_size - rand()%uik_size;


				// Случайное значение от 0 до 1
				double ver_value2 = (double)rand() / RAND_MAX ;
				for (int k2 = 0; k2 < all_kratnost2.size(); k2++)
				{
					if (ver_value2 < ver_kratnost2[k2])
					{
						// кратно 2+k2
						int ostatok = uik_yavka % (k2+2);
						if (uik_yavka > ostatok)
						{
							uik_yavka -= ostatok;
						}

						break;
					}
					else
					{
						ver_value2 -= ver_kratnost2[k2];
					}
				}


				procentx = (double)uik_yavka / uik_size;
				procentx = RoundTo(procentx * 100.0, round_digits);

				result_map[procentx] += 1;

				break;
			}
			else
			{
				ver_value -= ver_kratnost[k];
			}
		}

		// ни одна вероятность не сработала
		if (k == all_kratnost.size())
        {
			uik_yavka = uik_size - rand()%uik_size;

			procentx = (double)uik_yavka / uik_size;
			procentx = RoundTo(procentx * 100.0, round_digits);

			result_map[procentx] += 1;
		}
	}



	std::map<double, int>::iterator it;
	for (it = result_map.begin(); it != result_map.end(); ++it)
	{
		m_BarSeries_Bottom->AddXY(it->first, it->second);
	}



Как видно из графиков на шаге 1%, пиков нет. На шаге 0.1% — есть, в том числе и на круглых значениях (90,85,80,75,70,65,60,50...). Сгенерировав график десяток раз можно подобрать конфигурацию пиков на свой вкус :) Такая длинная последовательность «круглых» чисел появляется не всегда, обычно есть пропуски или склеивания, но за примерно 10 генераций ее можно увидеть если искать по всему графику и учитывать все пики, а не только 5 самых высоких.

Замечания:
Естественно — это очень упрощенная модель выборов. Я бы сказал это модель выборов где в реальных УИКах все люди выбирают между пойти/не пойти на выборы подбрасывая монетку (поэтому пика 50% обычно выше других, хотя это не обязательно (например на графике с 0.1% я выбрал вариант где самая высокая пика не 50%)). Но как мы видим, само физическое распределение размера УИКов по кратности и кол-ва пришедших избирателей — уже является причиной появления пиков на «случайном выборе», а когда добавляется «разумный выбор» эти пики уже могут усиливаться или ослабляться в зависимости от распределения «разумного выбора».

Заключение:
Считаю, что показанная выше модель пиков вполне объясняет их возможность «естественного» происхождения и на реальном графике выборов (в силу того, что использует вероятности взятые из реальных данных). Пики — это не «аномалия», это скажем так, базовые классы, которые отображают некую обобщенную тенденцию выбора.
Ну, ваш метод, по крайней мере как он описан, некорректен. Например, сравните долю уиков с количеством зарегистрированных избирателей, кратным некоторому n (которое по вашей же таблице получается почти равно 1/n, как и должно быть) в реальных данных и в ваших сгенерированных (после шага 3). Они разные.
Да, естественно они будут разными, так как мы не используем реальные данные, а используем «вероятности», которые были взяты из реальных данных, поэтому при нескольких запусках симуляции мы всегда будем получать разные значения, но это ни чем не хуже чем ваш метод просто на чистом рандоме, здесь же используется более «реалистичный» рандом, приближенный в плотную к распределению в реальных данных. Я изначально писал в комментарии, что это грубая симуляция — но даже она позволяет увидеть, что круглые значения можно получить случайно (просто из-за физического распределения кратности УИКов), без сговора, в этом как раз весь смысл.
Да вот именно, что она не «приближенная к реальным данным». Своим шагом №3 вы наоборот ухудшаете соответствие реальности, искусственно привнося «круглые» числа.
Ну это уже становится просто смешно :)
Вы наверно просто не понимаете как работает шаг 2,3.

Поясняю:
На шаге 2 — мы случайно генерируем размер УИКа (3 — 7746 чел), допустим получили 5999.

На шаге 3 — мы случайно определяем в какой диапазон должен попасть наш уик на основании вероятности вычисленной для кратности 2-10 реальных размеров УИКов.

Если случайность сработала на кратности 2, то размер УИКа = 5998
Если случайность сработала на кратности 3, то размер УИКа =
5997
Если случайность сработала на кратности 4, то размер УИКа =
5996

Если случайность не сработала ни на одной кратности 2-10, то размер остается 5999.

Так как вероятности срабатывания нашей случайности рассчитаны по распределению размеров реальных УИКов, то благодаря этому мы приближаемся к реальным выборам, так как размеры наших УИКов — становятся приближены к реальным.

Еще более реальная модель:
Я уже не знаю как вам это можно более доходчивее объяснить, поэтому просто сделаю симуляцию по реальным размерам УИКов. Т.е. мы не будем генерировать размеры УИКа случайно, а возьмем реально каждый УИК в БД с его реальным размером и сгенерируем для него абсолютно случайную явку от 0 до размера УИКа.

Т.е. в симуляции мы полностью воспроизводим выборы в РФ на всех реально существующих в ней УИКах, но «разумный выбор» заменяем монеткой «пойти/не пойти».

Вот что получилось для горячо любимого вами шага 0.1%
(Пики на ровно «круглых» значениях с кратностью 5 выделены желтой линией.). Привожу для примера 5 генераций.

1


2


3


4


5


Выводы:

1. Мы видим — что пики это абсолютно нормальное явление на шаге 0.1%.

2. Мы видим что пики на ровно «круглых» значениях с кратностью 5 — стабильно существуют на графике обычно в диапазоне (9 — 16 шт). Подсвечиваются все пики в которых ровно круглое значение выше чем ближайшие справа и слева.

Думаю, что на этом в дискуссии можно ставить точку. Хотя, если вы заявите, что злые, глупые власти сговорились с ф-цией rand() я не сильно удивлюсь :)

Отвечу только на первую часть (про вашу хитрую генерацию размеров уиков), т.к. именно с ней я не согласен. Вы правда не понимаете, что таким вычитанием остатка получаете, например, больше чисел, делящихся на 3, чем должно быть? Всё-таки посчитайте, сколько их получается, и потом пишите.
Соглашусь лишь с тем, что для X2-X10 генерируется примерно такое же кол-во УИК как в БД + те числа на которых не сработала вероятность X2-X10 и мы оставили их случайное значение без изменения, могут так же попасть в диапазон X2-X10 и тогда кол-во УИК с кратностью X2-X10 будет больше чем в реальной БД. В идеале, для тех чисел которые не попали в X2-X10 надо не оставлять случайное значение (как в моем алгоритме), а генерировать новое пока оно не будет кратно X11 или более, но это долго.

То, что графики выше, построенные полностью по реальным размерам УИКов очень похожи на
созданные по сгенерированным данным на основе вероятности кратности размеров УИКов, говорит о том, что погрешность в алгоритме генерации по вероятностям не сильно влияет на наличие пиков. Они присутствует примерно в одинаковом количестве и там и тут — это факт, который сложно отрицать и который подтверждает, что пики — это вполне «естественное» явление.

При этом, конечно, «естественность» пиков — не может являться доказательством честности выборов.

Естественность пиков просто подтверждает тот факт, что утверждения типа «пики на круглых значениях — это 'маловероятная' аномалия, доказывающая 'нечестность' выборов» — ошибка.
Так, ну хоть где-то к согласию пришли — а именно, что ваш метод генерации размеров уик некорректный:
… и тогда кол-во УИК с кратностью X2-X10 будет больше чем в реальной БД. В идеале, для тех чисел которые не попали в X2-X10 надо не оставлять случайное значение (как в моем алгоритме), а генерировать новое пока оно не будет кратно X11 или более, но это долго. ...

Особенно порадовало обоснование «но это долго» :) А вам не приходило в голову просто выбросить шаг 3 и посчитать долю сгенерированных значений, которые делятся на n=2, 3, ..., 10? По удивительнейшему совпадению получится такая же ситуация (доля 1/n) как и в реальных размерах участков! Или действительно взять просто ровно те размеры, которые есть в реальных данных, и ничего не генерировать (про это сейчас напишу отдельный коммент, чтобы не смешивать разные проблемы).
Так, ну хоть где-то к согласию пришли — а именно, что ваш метод генерации размеров уик некорректный:
Правильная формулировка — он с погрешностью, которая ни сколько не выше чем у вашего полностью рандомного метода, а даже ниже, что следует из похожести с графиками созданных по реальным размерам УИКов.

Или действительно взять просто ровно те размеры, которые есть в реальных данных, и ничего не генерировать
Так ведь так и было сделано.
Правильная формулировка — он с погрешностью, которая ни сколько не выше чем у вашего полностью рандомного метода, а даже ниже, что следует из похожести с графиками созданных по реальным размерам УИКов.

Нет, не следует. Вы так и не посчитали, сколько с вашим хитрым методом генерации получается кратных чему-нибудь чисел? Подсказка: заметно больше, чем в реальных данных.
Не знаю, что значит ваше «заметно», но на графиках принципиальной разницы не видно.
Так вы посчитали, или ещё нет? А то таблицу кратности для реальных размеров уиков привели:
KOLVO X2 X3 X4 X5 X6 X7 X8 X9 X10
97699 49413 32753 24724 20283 16649 13923 12464 10917 10411

а для своих сгенерированных — нет.
Удовлетворю ваше и свое любопытство:
kratnost[2]=81515
kratnost[3]=54230
kratnost[4]=48583
kratnost[5]=19588
kratnost[6]=38051
kratnost[7]=13863
kratnost[8]=24277
kratnost[9]=18057
kratnost[10]=16360

Отличие от данных распределения из БД примерно в 1.6 раза, что как я уже говорил на графике принципиальных отличий не проявляет. Видимо данное распределение каким-то образом уравновешивается.
То есть вы попытались сгенерировать размеры, которые по количеству кратных чисел соответствуют реальным, а в итоге ошиблись раза в два. Как же вас не удивило, что почти все значения получились кратными двум? :)

Повторюсь, просто случайная генерация без модификаций (без вашего шага 3) даёт именно нужное распределение, как в реальных данных.

А на графиках (если я правильно понял, о каких графиках речь) разницы видно не будет, хоть просто случайно генерируй, хоть так, хоть ещё как-то похоже.
То есть вы попытались сгенерировать размеры, которые по количеству кратных чисел соответствуют реальным
Да именно так, и получившиеся при генерации распределение размера УИКа в 1.6 раза отличается, но видимо из-за того, что в те же 1.6 раза отличается и получившиеся при генерации распределение для явки, это практически не заметно.

Вот сгенерированный график по распределению, а это график по реальным размерам из БД
но видимо из-за того, что в те же 1.6 раза отличается и получившиеся при генерации распределение для явки, это практически не заметно

Нет, я же написал в чём дело — просто эти графики к таким вариациям распределения нечувствительны. Ну и хорошо, что наконец-то согласились с тем, что просто равномерная случайная генерация размеров и явок даёт более правильные результаты (конечно, использование настоящих размеров участков ещё более правильно).
Ну и хорошо, что наконец-то согласились с тем, что просто равномерная случайная генерация размеров и явок даёт более правильные результаты
:) Нет, я с эти не соглашался, я подтвердил, что при генерации случайных размеров УИКов по приведенному алгоритму есть погрешность, которая на приведенных графиках не заметна. Но в том алгоритме уже нет смысла, так как благодаря ему пришла мысль о генерации по реальным размерам УИКов и теперь все графики строятся по ним.

Если бы, алгоритм работал без погрешности и формировал точное распределение из таблицы (ключ) — это было бы ближе к реальным данным чем «равномерная случайная генерация». Но, для этого пришлось бы значительно замедлить его работу (куча итераций rand() пока не появится правильное число X11 или выше для каждого УИКа не попавшего в X2-10), чего я делать не стал в виду использования более точных реальных данных. Но может еще как-нибудь к этому ради интереса вернусь.
Нет, я с эти не соглашался

Очень странно. Казалось бы, из утверждений «ваш метод даёт отличие в количестве кратных участков до 2 раз (в среднем 1.6)» и «случайная равномерная генерация размеров даёт намного меньшее отличие в количестве кратных участков», и больше эти методы не отличаются, напрямую логически следует, что «равномерная случайная генерация размеров даёт более правильные результаты». В логике сомневаться думаю не будем, а приведённые два утверждения здесь уже были подтверждены.
Всё верно «равномерная случайная генерация размеров даёт более правильные результаты», по сравнению с алгоритмом имеющем погрешность, но если погрешность убрать (ценой замедления), то алгоритм будет давать более правильные результаты, чем «случайная равномерная генерация размеров». В этом и смысл моего понятия «ключ», который не пригодился, так как в реальном времени исполнения можно использовать настоящие размеры УИКов из БД.
Что там будет если «убрать погрешность» я и не писал — речь шла ровно о предложенном вами алгоритме, который таки намного хуже просто равномерного выбора.
Итак, что касается реальных размеров участков. Я взял эти самые размеры (далее cnt_total) и реальные явки из выложенной базы (real_visits), а также для сравнения сгенерировал случайные данные этих самых явок (cnt_visit = (np.random.rand(len(cnt_total)) * cnt_total).astype(int)). Построил два графика одинаковым образом — для реальных и сгенерированных данных:

cnt_visit = (np.random.rand(len(cnt_total)) * cnt_total).astype(int)
ratios = cnt_visit / cnt_total  # и real_visits / cnt_total
ratios_round = (ratios * 1000).round().astype(int)
bin_counts = np.bincount(ratios_round, minlength=1001)

plt.plot(np.linspace(0, 100, 1001), bin_counts, '.-', lw=1);
plt.xlim(68, 98)

Для сгенерированных данных получается всё ровно:

(я не подбирал случайную выборку, чтобы так получилось — попробуйте сами). Для реальных же — вот так:

Как видно, пики крайне сильные, причём именно на круглых значениях — 70, 75, 80, 85, 90, 95, и ещё ровно на целых значениях 92-98 (отмечены на графиках).

Что тут ещё можно обсуждать?
Для сгенерированных данных получается всё ровно
Для начала вопрос первый, как вы думаете, почему мой график по реальным данным отличается от вашего? Покажите свой график в масштабе как у меня и сделайте кликабельным, чтоб можно было открыть на весь экран (у меня все такие, а почему вы делаете такие маленькие непонятно :)

Не понятен алгоритм генерации явки по реальным данным на вашем графике. Поясните как он работает (я не увидел ни одной константы).
Вот эти графики в pdf: generated real (хабр не даёт векторные форматы загружать), зумьте сколько угодно :) Но ничего нового там не видно, правда!

Вот без обрезки по оси х (это же вы имели в виду «в том же масштабе»?): generated real. Обрезал просто для удобства, всё равно интересует только часть с процентами >= 70 — зачем лишнее.

Генерация — я же вставил формулу:
cnt_visit = (np.random.rand(len(cnt_total)) * cnt_total).astype(int)

Генерируется случайное число от 0 до 1, умножается на размер участка, приводится к целому. Да, тут забыл правильноеокругление (нужно перед astype добавить round()), но сейчас перепроверил — ничего не меняется при этом.

Про константы
я не увидел ни одной константы

не понял, о чём это?
Ну вот, уже более менее узнаю очертания наличие пиков на 50% и по бокам.

Но, давайте все-таки сделаем наши графики пригодные для сравнения друг с другом.

Пожалуйста, уберите из вывода точки 0 и 100, тогда наши масштабы будут одинаковы. Если я правильно понял — то пунктирной линией помечены круглые числа. Тогда вопрос, они что у вас реально только с правой стороны от 50% встречаются? Пометьте пожалуйста для объективности все. Ибо вы должны понимать, что при голосованием монеткой, положение и размер пик будет отличаться от голосования «разумным выбором».

И последняя просьба, на моих графиках есть вспомогательные лини через каждые 5%, можете на своем тоже добавить, иначе не возможно определить даже примерные координаты пиков (так на глаз видно пики на 10,15, 25, 35, 45, 50, 55, 60, 70, 75, 80 ).
Если я правильно понял — то пунктирной линией помечены круглые числа. Тогда вопрос, они что у вас реально только с правой стороны от 50% встречаются?

Я же вроде написал — для сравнения и попыток объяснения представляет интерес участок от ~70%, т.к. именно на нём пики на круглых значениях в реальных данных намного сильнее, чем на сгенерированных. На меньших значениях отличия существенно менее выражены.

И последняя просьба, на моих графиках есть вспомогательные лини через каждые 5%, можете на своем тоже добавить, иначе не возможно определить даже примерные координаты пиков

Вот с доп.линиями: generated real.

Пожалуйста, уберите из вывода точки 0 и 100, тогда наши масштабы будут одинаковы.

От убирания двух точек масштаб не изменится. Вообще, советую поступить наоборот — постройте график, взяв интересующий нас диапазон (например, как у меня от 68 до 98), и сравните. Я так и не понял, для чего вы собираетесь использовать остальную часть диапазона (от 0 до 68), раз там таких явных отличий нет и соответственно объяснять происхождение пиков не требуется.
Я так и не понял, для чего вы собираетесь использовать остальную часть диапазона (от 0 до 68), раз там таких явных отличий нет и соответственно объяснять происхождение пиков не требуется
А вы не задумывались над тем фактом, почему на реальном графике основные данные начинаются с 40%, а не с 0% как на сгенерированном? Меня вот наоборот удивляет, почему на «случайном выборе» монетки вы ищите пики, только в тех местах, где они были на «разумном выборе». Можеет, вы считаете, что между «случайным выбором» и «разумным выбором» особой разницы нет? Я к тому, что на «случайном выборе» монетки, примерно так же часто появляются достаточно длинные последовательности круглых чисел 15,20,25,30 как и 70,75,80,85… — что показывает, естественость появления таких последовательностей по всему диапазону выбора. Напомню, что на реальном графике этот диапазон гораздо уже чем у монетки и там остается гораздо меньше круглых чисел для выбора.

Я на своих графиках отобразил распределение пик по круглым значениям кратным 5 по всему диапазону 0-100 и показал, что их наличие на всем протяжении графика — «естественно». На вашем первоначальном графике тоже есть пики на 70,75,80,85, потом на втором графике пик на 70 и 85 практически не видно, но пика на 75 стала заметно выше. Т.е. вы перегенирировали график — и положение / размер пик изменился. Я вам писал ранее, что достаточно хорошую последовательность высоких пик можно получить просто заново перегинирировывая графики около 10 раз, попробуйте.

На наших с вами графиках точка 50% практически всегда самая высокая, она характеризует свойства нашего голосования «монетки» и притягивает к себе самое большое кол-во выбора. Наличие других высоких пик, показывает, что конкретно данная рандомная генерация (с конкретного номера начала последовательности в rand()) была более любвиобильна к выбору значений около этих конкретных пик, а новая любит больше другие пики. И такое любвиобилие (наличие высоких пик на круглых значениях — абсолютно не редкость) и заподозрить в этом происки злой власти — глупо.

Когда вы анализируете «выбор монетки» и реальный график «разумного выбора» и при этом утверждаете, что пиков нет, процетирую
Для сгенерированных данных получается всё ровно:
Вы откровенно лукавите, так как пики есть, просто вы не обращаете на них внимания, считая, что они не достаточно высоки как на реальных данных.

Как я вам уже писал выше, любвиобилие монетки к пике 50% и другим пикам на круглых значениях (даже на вашем первом графике с четкими пиками 70,75,80) обусловленно ее "«разумным выбором»".
Точно так же, любвиобилие на реальном графике к значениям 70,75,80,85 может быть обусловленно усилением пик на 70,75,80,85 благодаря «разумному выбору» избирателей, который перераспределился из диапазона 0-40%, на котором у монетки есть свои любимые высокие пики, а в реальных данных, там значений практически нет, но есть более высокие пики в другом диапазоне.

Как я уже писал ранее, ожидать что пики на графике монетки и на реальном графике будут одинаковы по размерам глупо, в силу разной природы выбора. Но вот, утверждать что наличие пик на круглых значениях при выборе монетки — высоковероятно, можно (если перегенирировать график монетки они появляются постоянно обычно в количестве 9-16, если смотреть по всему графику).

Я обосновал — почему с моей точки зрения, пики на круглых значениях — могут иметь естественную природу (для монетки со «случайным выбором» — это «естественно», не вижу причин запрещающих возникновению таких же пик с усилением при «разумном выборе»).

Обоснуйте теперь вы — почему с вашей точки зрения — это аномалия, или вы так не считаете?

Ну, а читатели пусть уже выбирают, чья точка зрения им ближе.
На вашем первоначальном графике тоже есть пики на 70,75,80,85

А теперь сравните их размер :) Неужели вы правда не видите, что на сгенерированных графиках на круглых значениях нет пиков выше, чем на «некруглых»?

Я на своих графиках отобразил распределение пик по круглым значениям кратным 5 по всему диапазону 0-100 и показал, что их наличие на всем протяжении графика — «естественно».

То же самое — у вас там, кроме 50%, пики на круглых значениях никак не выделяются — они такой же высоты, как и на некруглых.

На наших с вами графиках точка 50% практически всегда самая высокая, она характеризует свойства нашего голосования «монетки» и притягивает к себе самое большое кол-во выбора.

Повеселила эта формулировка :) Уже сто раз обсуждали — это чисто из-за дискретности для малых размеров участков. Давайте ограничимся участками с большим количеством избирателей, например > 500. При этом на сгенерированных данных пики вообще станут намного меньше, пропадёт даже особенно высокий пик на 50%:

Сравним с реальными данными для тех же участков с >500:

Здесь пики всё так же остались на круглых значениях. С этим согласны?
А теперь сравните их размер :) Неужели вы правда не видите, что на сгенерированных графиках на круглых значениях нет пиков выше, чем на «некруглых»?
Да как же вы никак не поймете, дело не в том, что они ниже — главное что они существуют и они сравнимы по высоте (обратите внимание, что на вашем первом графике эти три пики 70,75,80 выше всех пик начиная с 67% и до 100% кроме двух рядышком на 83 которые чуть-чуть выше). Напрямую, сравнивать реальные выборы и «голосование монеткой» безумие, но вы продолжаете это делать. Я уже об этом писал.

на круглых значениях нет пиков выше, чем на «некруглых»
Ну, и как вы после этих слов людям в глаза будете смотреть, учитывая мое замечание выше… Правда? Нет ни одной пики ниже пики на круглом значении на промежутке от 67% до 100%??? Видимо да, для вас их нет, потому что вы не хотите их видеть.
Повеселила эта формулировка :) Уже сто раз обсуждали — это чисто из-за дискретности для малых размеров участков. Давайте ограничимся участками с большим количеством избирателей, например > 500.
Мне кажется у вас явно с логикой проблемы… я вам уже писал, что в реальных данных на УИКи с размером меньше 500 приходится 32711 штук, и это 1/3 от общего количества! Вы вроде бы скачали БД и можете генерировать как и я голосование монеткой по реальным УИКам, зачем их выкидывать из рассмотрения??? Чтобы показать что пики при этом исчезают и ложиться спать спокойно? :) Да, на вашем виртуальном голосовании без 1/3 УИКов, они исчезают, а на реальных выборах они есть и ваше виртуальное голосование становится бессмысленным.

Я думаю, что с такими сравнениями как у вас — и наш спор тоже становится бессмысленным. Пусть читатель решает сам.

на круглых значениях нет пиков выше, чем на «некруглых»

Ну, и как вы после этих слов людям в глаза будете смотреть, учитывая мое замечание выше… Правда?

Не очень понял, что не так. Единственная неточность в моём высказывании — я смотрел только на участок > 68%, что уже обосновывал выше. На нём действительно нет пиков на круглых значениях, которые выше, чем на некруглых — например, на ~83%, как вы отметили, и ещё несколько «некруглых» пиков почти такой же высоты, хоть и чуть ниже.
Нет ни одной пики ниже пики на круглом значении на промежутке от 67% до 100%???

Конечно есть, и что? Пики бывают вообще очень маленькими, как на некруглых, так и на круглых значениях — см. например 85 и 90% на том графике. Я сравниваю максимальные значения.

Теперь, как я считаю, главный комментарий вам:
Да как же вы никак не поймете, дело не в том, что они ниже — главное что они существуют и они сравнимы по высоте

Нет, это не так! Рассматриваемая в вашем посте аномалия состоит в том, что на реальных данных на круглых значениях пики намного выше, чем на некруглых. Если бы они были сравнимого размера, ничего необычного в этом бы не было, так и должно быть: круглые и некруглые значения равноправны. Пока вами так и не было показано, как объяснить то, что наблюдается.

Мне кажется у вас явно с логикой проблемы… я вам уже писал, что в реальных данных на УИКи с размером меньше 500 приходится 32711 штук, и это 1/3 от общего количества!

Вот здесь вообще не понял, в чём проблема. Почему я не могу взять понравившееся мне подмножество данных, соответствующим образом скорректировав и генерацию случайных данных для сравнения?

Тем более в данном случае выбор подмножества вполне обоснован: на малых размерах участков высокие пики на значениях типа 50% будут возникать при любом распределении, поэтому они нам никакой пользы для выводов не дают. На больших размерах же, как было показано, случайно заметные пики вообще не возникают — а в реальных данных они остаются такими же высокими.
Не очень понял, что не так.
Не так то, что вы видите, только то, что хотите видеть, не обращая внимания на «мелкие» пустяки, которые могут испортить картину :)

Давайте пройдемся по фактам, что бы вы поняли о чем я говорю.

1. Мы используем симуляцию выборов монеткой (в которой нет разумного выбора).

2. Пики на круглых значениях существуют по всему графику с высокой вероятностью, это видно и на ваших и на моих графиках.

3. Высота «круглых» пиков на 0.1% — сравнима с высотой «не круглых» пиков, на вашем графике это (70,75,80) на моем есть и более крупные пики (если вы сделаете десяток генераций, вы это тоже увидите).

4. Данная статья объясняет, что высокие пики на «ровно круглых значениях» при шаге 0.001% — естественны. При увеличении до 0.01% это тоже заметно, но при округлении до шага 0.1% в округленное «круглое» значение, попадает много не круглых значений из окрестности, и влияние «ровно круглой» составляющей уже не так заметно, большее значение уже имеет «разумный выбор».

5. Я предполагаю, что пики на «ровно круглых» значениях стабильно присутствующие на графике «случайного выбора» монетки с шагом 0.1%, могут быть усилены «разумным выбором» на реальном графике голосования. Поэтому ваше игнорирование наличия таковых пиков (при их реальном присутствии на графиках) с моей точки зрения является желанием не замечать факты. Да, предположение — это всего лишь предположение, но основывается оно на «естественности» пиков «ровно на круглых» значениях (это уже хотя бы что-то имеющее вес).

6. Теперь про ваше предположение.
Вы очень вольно относитесь к понятию «случайный» и «разумный» выбор. Напрямую сравнивая реальное голосование с монеткой ожидаете в конкретном месте увидеть высокие пики, а когда видите сопоставимые по размеру (те же 70,75,80), считаете что их нет. А между тем если увеличить масштаб на интервале 67-100, то эти пики вполне себе сопоставимы по размерам (на темном фоне участок из реального графика в том же интервале 67-100):
Сравнивать напрямую графики по размеру пик на реальном графике и монетки смысла нет, но некоторые тенденции к похожести (при желании) увидеть можно.

Так вот, ваше предположение, что отсутствие пик «соответствующего» размера на графике монетки, как-то компрометирует пики на реальном графике — ни на чем не основано. Но вы почему-то, его считаете чуть ли не аксиомой или я не прав? Если так, то обоснуйте.

Вот здесь вообще не понял, в чём проблема. Почему я не могу взять понравившееся мне подмножество данных, соответствующим образом скорректировав и генерацию случайных данных для сравнения?
Взять вы можете, но это не будет отражать свойства реального голосования на обсуждаемом графике (я про пики). Почему вы считаете, что моя цитата
На наших с вами графиках точка 50% практически всегда самая высокая, она характеризует свойства нашего голосования «монетки» и притягивает к себе самое большое кол-во выбора.
Почему вы решили, что понятие «характеризует свойства нашего голосования «монетки»...» не включает в себя свойства распределения УИКов по размеру? Включает. Поэтому убрав 1/3 УИКов вы изменили «свойства нашего голосования «монетки»» и ваше виртуальное голосование, потеряло смысл (не соответствует реальному).
Самое главное, и мне кажется критичное в вашем непонимании утверждение, с которым нельзя согласиться — это:
Напрямую сравнивая реальное голосование с монеткой ожидаете в конкретном месте увидеть высокие пики, а когда видите сопоставимые по размеру (те же 70,75,80), считаете что их нет. А между тем если увеличить масштаб на интервале 67-100, то эти пики вполне себе сопоставимы по размерам (на темном фоне участок из реального графика в том же интервале 67-100):

Вы так и не поняли, что с чем сравнивается. А сравниваются не пики на двух этих графиках между собой!

Возьмём сгенерированный график. На нём «пики» на круглых значениях имеют такую же высоту, что и на некруглых.

Возьмём реальный график. На нём пики на круглых значениях намного выше всех пиков на некруглых.

И вот именно в этом аномалия. Остальные ваши утверждения объяснению этого эффекта не помогают. Пока я видел только одну модель, как произошли эти пики на круглых значениях, и эта модель включает в себя искусственное дописывание результатов до некоторой цели (круглого значения), поставленной комиссии.

Поэтому убрав 1/3 УИКов вы изменили «свойства нашего голосования «монетки»» и ваше виртуальное голосование, потеряло смысл (не соответствует реальному).

Что ж вам так это слово «монетки» понравилось? :) Давайте подробно распишу, а вы скажите какой шаг не нравится:
— из каких-нибудь причин я решил ограничить выборку и рассматриваю только участки с размером > 500 (а мог например взять те, которые простые, или делящиеся на 5, или ещё что — для разных целей разное полезно)
— по ним смотрю результаты, распределение явки, ещё что-нибудь
— вижу, что есть явные пики на круглых значениях — хм, странно
— хочу проверить, может быть они могли получиться естественным образом, просто из-за неявной дискретности где-нибудь
— для этого генерирую случайным образом количество пришедших на рассматриваемые участки и смотрю на результат
— результат явно не сходится (не имеет пиков) с реальным

Соответственно, отсюда можно утверждать, что эти пики — неслучайны. Заметьте, что здесь я не использую участки с < 500 и никаких выводов про них не делаю — поэтому вообще не важно, что там происходит.
Вы так и не поняли, что с чем сравнивается. А сравниваются не пики на двух этих графиках между собой!
Возьмём сгенерированный график. На нём «пики» на круглых значениях имеют такую же высоту, что и на некруглых.
Возьмём реальный график. На нём пики на круглых значениях намного выше всех пиков на некруглых.
Теперь вы меня не понимаете. Я привел ваш и реальный график друг под другом для того, что бы показать, что если рассматривать участки 67-100 в подходящем масштабе, то относительная высота пиков сопоставима. На вашем графике пика 70 почти самая высокая и на реальном графике — она тоже почти самая высокая. Рядом с пикой 70 на вашем графике есть ряд пик постепенно уменьшающих высоту и на реальном графике тоже самое и расстояние относительно начала снижения пик и там и там примерно 1/3. Пика 75 — тоже и там и там выглядит по высоте относительно рядом стоящих пик одинаково длинной. Рядом есть ступенька из кучи маленьких пик и там и там, но на реальном графике их высота относительно пики 75 1/3, а на вашем 2/3. На пики 80 — тоже похожая ситуация и там и там есть ступенька на 2/3. Да есть высокие пики на 83%, которых нет на реальном графике и более низкие в других местах (назовем их помехи), но в целом картина пик сопоставима по высоте (в конкретном данном случае). Т.е. если учесть, что «разумный выбор» может отличаться от «случайного» и понизить помехи и повысить пики, то в результате мы получим график с пиками на круглых значениях. Я не утверждаю, что так оно и есть, но то, что вы не обращаете внимание на факт сопоставимости относительных высот (на картинке выше) — это странно. Если следовать только вашей логике и смотреть на схожесть без учета «помех», то получается, что вы приравниваете «случайный выбор» голосования монеткой к «разумному выбору» — это не верно.

И вот именно в этом аномалия.
Я уже писал, что ваше предположение, что это аномалия ни на чем не основано, хотя нет, оно основано на том, что «случайный выбор» можно приравнять к «разумному выбору», но это не верно.

Заметьте, что здесь я не использую участки с < 500 и никаких выводов про них не делаю — поэтому вообще не важно, что там происходит.
Вот, с таким дополнением всё корректно.

Соответственно, отсюда можно утверждать, что эти пики — неслучайны.
Правильнее так: можно утверждать, что для вашей методики генерации пики не появляются. Но это не доказывает, что они аномальны.

В целом, можно констатировать, что в рамках статьи «естественную» природу пик ровно на круглых значениях удалось объяснить только для шагов выборки 0.001% ,0.01% дальше при округлении до 0.1% гораздо большее значение имеет «разумный выбор».

То, что вам не удается воспроизвести пики, тоже не доказывает, что их природа «аномальна».

Т.е. с помощью математики на шаге 0.1% не удалось ни показать «естественность» пиков ни доказать их «аномальность». Всё остается на уровне «предположений».
Хорошо, давайте для простоты ограничимся рассмотрением только участков с > 500 человек, как вы наконец согласились
Вот, с таким дополнением всё корректно.

Соответственно все выводы в этом комментарии относятся только к таким большим участкам, которых 2/3 штук.

Смотрим на график сгенерированных данных:
image
и реальных:
image
напоминаю, оба графика ровно по этим участкам. Если вы считаете, что высота пиков на круглых числах тут сопоставима или ещё что — пожалуйста. Считать численные показатели их высоты лениво, но по-моему очевидно, что на втором графике пики высокие, и ровно на круглых числах, а на первом всё ровно.

«разумный выбор» может отличаться от «случайного» и понизить помехи и повысить пики

Пока не предложено ни одного способа, как это может (или хотя бы в принципе могло) произойти. Предложите — будет предметный разговор.

Пока имеется только одна модель, которая как раз позволяет «повысить пики» на круглых числах, и как я уже писал она включает мухлёж.

Т.е. с помощью математики на шаге 0.1% не удалось ни показать «естественность» пиков ни доказать их «аномальность». Всё остается на уровне «предположений».

Как уже писали, ни в какой науке (кроме собственно математики, без приложения к реальному миру) нельзя строго доказать утверждения вообще. Поэтому это ваше предложение и так очевидно.

На этом, если вы (или кто-то другой, конечно) не предложите чего-то нового, это обсуждение прекращаю.
Да, давайте прекращать, статья задумывалась как математическое решение загадки пиков, смысла обсуждать в ней «конспиралогические теории», которые никто не может доказать математически — не вижу. Мне к рассуждениям, которые уже полностью раскрыты в комментариях выше добавить больше нечего и ходить по кругу смысла нет.
Уже который раз у меня такое впечатление, что вы комментарий, на который отвечаете, особо не читаете (не только мои).
На каком основании вы утверждаете, что сгенерированные вами случайные данные — отражают тот «разумный выбор», который был заложен в реальном голосовании?

Вообще не понял и не увидел, где я это утверждаю?

Написано же, что я в том комментарии обосновал конкретную вещь:
… Вот и принцип выбора размера бина.
Написано же, что я в том комментарии обосновал конкретную вещь:
… Вот и принцип выбора размера бина.
:) Вы меня удивляете
«Вот и принцип выбора размера бина...» выбора для какой цели? Поясните пожалуйста. Я так понял для того, что бы сравнить с графиком голосования и заявить, что на сгенерированом графике на 0.1% — нет пиков, а на реальном графике — есть, и типа это анамалия. Еще раз процетирую ваше утверждение:
Если мы возьмём сгенерированные случайные данные, то на них на 1% и 0.1% не будет никаких пиков — а на графиках уиков на 0.1% есть. Вот и принцип выбора размера бина.

Смотрите, какое дело: для бинов в 100%, 1% и 0.001% графики сгенерированного и реального распределений выглядят качественно одинаково, поэтому здесь обсуждать нечего. Для бина в 0.1% они качественно отличаются друг от друга, причина неясна, поэтому как минимум это стоит проверить, проанализировать и попытаться объяснить.
Для бина в 0.1% они качественно отличаются друг от друга
Вы согласны со мной, что они качественно могут отличаться друг от друга по простой причине — не соответствия вашей модели генерации реальным данным?

И еще раз повторяю свой вопрос:
На каком основании вы утверждаете, что сгенерированные вами случайные данные — отражают реальную модель голосования, чтобы основываясь на ней искать аномалии в реальных данных?
Вы согласны со мной, что они качественно могут отличаться друг от друга по простой причине — не соответствия вашей модели генерации реальным данным?

Конечно, могут. Может быть например так, что по всей стране люди договорились, что хотят круглое значение явки на своём участке — и поэтому сагитировали ровно 80% избирателей, и стояли смотрели чтобы никого лишнего не пришло (чтобы не стало например 80.3%).
Я выше привел модель, которая позволяет получить круглые значения и без сговора. Но думаю, вас даже это не переубедит :/
Покажите, где? Видимо я пропустил — увидел только обоснование пиков на графиках с маленьким бином, и на совсем других графиках (которые №2 в посте). Как раз наличие такой модели и могло бы переубедить, причём не только меня, а и многих других людей.
Тут упрощенная симуляция голосования по реальным данным о размерах и кратности УИКов (даже без учета «разумного выбора» удалось воспроизвести длинную последовательность пиков (90,85,80,75,70,65,60,50...) на шаге 0.1%).
У меня есть гипотеза, почему лучше всего пики видны на 0,1%.

Если мы предположим сценарий фальсификаций, когда сверху спускается цифра в процентах (например, 85%), и члены УИК переводят ее в целое число избирателей, то понятно, что если на участке число изб-й не кратно 20, то получится явка не ровно 85%, а немного другое число. Например, на участке с 1001 избирателем может получиться либо 850/1001 = 84,915%, либо 851/1001 = 85,015%. Если мы предполагаем, что такие фальсификации имелись, то лучше всего они будут видны на графике, построенном с учетом отклонений от целого процента явки. Как мы видим, для участка с порядка 1000 избирателей отклонение от целого числа получается примерно в пределах (-0,1%; +0,1%). А для участка с 2000 — будет примерно (-0,05%; +0,05%). Потому нам лучше всего строить график с бином 0,1… 0,2%, чтобы увидеть подтверждение или опровержение гипотезы о таком сценарии фальсификации.
Хоть и с опозданием, но отвечаю на ваш комментарий. Спасибо за предоставленную выборку из 254 участков.

Это мое субъективное мнение, но основывается оно на том,...

Вы в других комментариях пишете про то, что все должно быть доказано строго математически, но утверждение про расположение воинских частей и «традиционных общин» никак обосновывать не хотите. Это неправильно. Лучше либо убрать это утверждение, либо привести какие-то подтверждения, например, найти данные по расположению воинских частей.

Честно говоря, здесь я вообще не понимаю о чем вы пишите. Я не рассматривал ни каких 1/20 ни выкидывал 19/20, таблица отображает те УИКи в которых явка — это целое число. Явки 27% о которой вы говорите, в таблице вообще нет, т.к. в БД нет ни одного УИКа ровно с такой явкой. Поясните свою мысль.


Давайте еще раз. В исходной статье был приведен график распределения явки по участкам с бином 0,1%. На нем были пики на круглых числах явки, в том числе 85% (а также на 91, 92, 93 итд), которые многие (я в том числе) считают признаком наличия фальсификаций. Не единственным, а находящимся в ряду других признаков (другие признаки — видеозаписи с вбросами, различия явки в некоторых регионах на участках с наблюдателями и без, новости на сайте ЦИК, поведение ЦИК в случае с аномалией в Саратове 2016).

На мой взгляд, нет естественных причин, которые бы объясняли высокую вероятность появления пиков именно на этих круглых числах.

Поведение ЦИК, признавшего результаты выборов в 2016 году в Саратове, указывает на его незаинтересованность расследовать случаи фальсификаций и причину появления аномальных процентов. То есть на одобрение фальсификаций с его стороны.

Вы под заголовком «Ключ к решению загадки круглых чисел» приводите таблицу, где указано, что среди участков с явкой **ровно** 85% 100% участков имеют число избирателей, которое делится на 2, 5 и 10.

Это не является никаким «ключом», так как ровно 85% может быть только на участках с числом избирателей, кратным 20. Следовательно, на 100% этих участков число избирателей будет делиться на 2, 5 и 10. Для любых значений явки и числа избирателей (кратных 20).

Например, на участках с числом избирателей вроде 1001, 1002, 1003… 1019 человек не может получиться явка ровно 85%. Если мы посмотрим на любезно предоставленные вами данные, по участкам с явкой [84,95%; 85,05%) то мы увидим, что на большинстве из них явка не составляет ровно 85%. То есть пик на 85% не образован только участками, с числом избирателей, кратным 20. И таблица в статье под заголовком «Ключ к решению...» никаким образом ключом не является и никак не объясняет наличие пика на исходном графике с бином 0,1%. Она вообще ничего не объясняет.

У меня сложилось ощущение, что вы не заинтересованы в том, чтобы разобраться и найти или исключить причины, объясняющие появление пиков на графике, а просто хотите запутать читателя, произвольно пересортировывая столбцы на графиках или оставляя недосказанности, которые якобы должны что-то объяснить. Зачем так делать?

Я не рассматривал ни каких 1/20 ни выкидывал 19/20, таблица отображает те УИКи в которых явка — это целое число.


Какой смысл рассматривать только участки, где явка является целым числом? В исходном графике вопросы вызывают пики с явкой в диапазонах вроде [84,95%; 85,05%), а не с целой явкой. Что вы хотели этим показать? Что число, кратное 20, делится на 2, 5 и 10? Для этого не требуется брать данные с выборов.

Тут вы уже путаете понятия. В БД всего 36 УИК с явкой ровно 85%, это вы можете увидеть на График_1г (с шагом 0.001%) и в таблице. Грубо говоря именно об этих 36 УИКах речь и идет в статье, когда говорится, что вероятность появления целого числа выше чем дробного.


Вопросы вызывали не пики с явкой ровно 85%, а то, что количество участков с явкой в диапазоне [84,95%; 85,05%) аномально выше, чем в соседних диапазонах вроде [85,15%; 85,25%) или [85,25%; 85,35%). Ваше утверждение про участки с явкой ровно 85% не имеет к этому никакого отношения, хотя тоже интересно.

Я вам еще раз поясняю, в статье речь идет именно о том, почему такие пики как 36 УИК на 85% (без каких-либо округлений) гораздо выше чем окружающие ее пики (тоже без каких-либо округлений)


Это отдельный вопрос, который тоже интересен, но который ваша статья тоже никак не объясняет. Под заголовком «Ключ к разгадке...» никакой разгадки нет, а лишь констатируется факт, что кратное 20 число делится на 2, 5 и 10. Там нет объяснений, откуда берется пик на 85% при бине 0,001%, 0,01%, 0,1% и тд.

Это отдельный вопрос, не связанный с исходным графиком с бином 0,1%. Откуда берется пик ровно на 85%, мне непонятно. 85% это дробь 17/20, но если мы возьмем соседние с ней дроби — 16/19 (84,21%) или 18/21 (85,714%), то участков с ровно такой явкой гораздо меньше. Вы видите какое-то разумное объяснение, почему дробь 17/20 получилась на гораздо большем числе участков, чем 16/19 или 18/21? Я вижу — фальсификации.

Почему не 36/36=100% для График_1г, не 36/50=72% для График_1в, не 36/1403=2.5% для График_1а, а именно 14% для График_1б? Чем те графики хуже и почему по ним нельзя рассуждать о круглых значениях?


Потому что ваша статья — ответ на статью про аномалии на графике с бином 0,1%. Почему нужен такой бин?

Если мы предположим сценарий фальсификаций, когда сверху спускается цифра в процентах (например, 85%), и члены УИК переводят ее в целое число избирателей, то понятно, что если на участке число изб-й не кратно 20, то получится явка не ровно 85%, а немного другое число. Например, на участке с 1001 избирателем может получиться либо 850/1001 = 84,915%, либо 851/1001 = 85,015%. Если мы предполагаем, что такие фальсификации имелись, то лучше всего они будут видны на графике, построенном с учетом отклонений от целого процента явки. Как мы видим, для участка с порядка 1000 избирателей отклонение от целого числа получается примерно в пределах (-0,1%; +0,1%). А для участка с 2000 — будет примерно (-0,05%; +0,05%). Потому нам лучше всего строить график с бином 0,1… 0,2%, чтобы увидеть подтверждение или опровержение гипотезы о таком сценарии фальсификации.

Также, если предполагать, что координация фальсификаций велась не из Москвы, а на местных уровнях, то имело бы смысл построить такие гистограммы не по всей стране, а по отдельным регионам или крупным городам и искать пики там — если фальсификации шли независимо в разных регионах, то аномальные пики в них будут на разных числах.

Хотя я, благодаря вам, вижу теперь и другие аномалии — например, гораздо большее число участков с явкой ровно 17/20, чем 16/19 или 18/21.

Как раз с моей точки зрения, это доказать по графикам не возможно, т.к. «разумный выбор» не обязан подчиняться нормальному распределению (тут нужны только юридические доказательства), но меня удивляют люди, которые все-равно упорно выдают «пики» — за доказательство, хотя доказать, что это «анамалия» не могут.


Пики на графике — это один из признаков, который вместе с другими признаками фальсификаций складывается в цельную картину. Математически доказать отстутвие пиков нельзя, но вы можете попробовать оценить вероятность их появления с помощью теории вероятностей, если вам так хочется.

На сколько я понимаю, мы просто с вами под «круглыми» значениями понимаем разные вещи. Я имею ввиду — ровно круглые значения и ничего более, вы же к ним относите некое расплывчатое понятие в которое включается разное кол-во соседних точек в зависимости от шага выборки, и значение (в нашем случае кол-во УИКов) изменяется для каждого нового выбранного шага. Поэтому вы считаете, что я чего-то не показал, в то время, когда я показал всё, что хотел показать :)


Совершенно верно. И выше я объяснил, почему мне интереснее график с бином 0,1 — 0,2% — этот размер бина определяется из гипотезы о методе фальсификаций и типичных размеров участков (1000-2000 чел). Также, ваша статья ответ на статью с графиком с бином 0,1%.

Ваш же выбор «круглых» чисел — непонятно, чем обоснован и что вы хотели показать.

Смысл, в том, что выбрав понравившийся бин — можно получить любое кол-во пиков.


Я объяснил, почему бин 0,1… 0,2% предпочтителен. Ну и даже на выших графиках — нет объяснения, почему есть пик ровно на 17/20, но нет на ровно 16/19.

chersanya
Sabubu
Можете нормально сформулировать, что именно вы хотите показать графиками 2а, 2б? Непонятен вывод из них. Можно же привести кучу способов изобразить эти данные, где не то что аномалий, самих результатов особо не видно будет — и что?
Вся статья задумывалась как некая загадка, которую можно решить если использовать логику и минимум математических знаний. Само решение, благодаря подсказкам в виде графиков и данных «ключа», на мой взгляд, казалось настолько очевидным, что большинству читателей потребуется минимум усилий, чтобы понять о чем речь. Но, теперь ясно, что это не так, и как говорится телепатов нет, и эта «загадочность» больше путает, чем помогает понять смысл статьи.

Вот дополнительные пояснения (я буду нумеровать тезисы, чтобы можно было на них ссылаться в случае несогласия):

Графики 2абвг строились для визуализации моей мысли о том, что три точки стоящие рядом друг с другом по порядку на графиках 1абвг — между собой никак не связаны.

Т.е. например 79,80,81 — включают в себя совершенно разные по параметрам УИКи (размер, гео-расположение, разумность избирателей) и никакой прямой связи между этими точками нет, т.е. допустим пика на 80 относительно 79 и 81 пикой является только в силу того, что на числовой прямой эти числа стоят рядом и дополнительной смысловой нагрузки не несет. Т.е. нет никакой «обязательности» в том, чтобы изменения значения процента явки между этими точками было всегда ниже некого субъективного порога, выше которого это изменение можно назвать «пикой». Упрощенно – наличие пик на графиках 1бвг, вызывает у некоторых читателей субъективное чувство «не естественности», т.к. они видят, что в других местах график выглядит более гладко, это происходит из-за некоего подсознательного ожидания нормального распределения функции на графике. Но такое ожидание является заблуждением. Для иллюстрации этого заблуждения и были показаны графики 2абвг. Суть этих графиков в том, что отображают они ровно одни и те же данные, что на графиках 1абвг, но кол-во субъективных «аномалий» сильно отличается.

Графики 2абвг отсортированы не по возрастанию процента явки, как 1абвг, а по возрастанию кол-ва УИКов. Естественно, пики по количеству УИКов пропали, они идут по возрастанию, но теперь появилась ломаная кривая (белого цвета), на которой мы и будем искать «пики». Т.е. мы пытаемся найти «аномалии» на другой визуализации одних и тех же данных.

Давайте посмотрим на График_2а (шаг 1%):
В зависимости от субъективного выбора и наших ожиданий на графике, мы можем, как обнаружить здесь «аномалии», так и считать что их нет.
Их нет, если посмотреть по линии 56% или 68% и т.п… то все колебания (нижние, верхние пики рядом с этими линиями) особо не выделяются.
Они есть, если мы будем использовать логику «аномалий» из графика 1абвг, где «аномальность» формулировалась вопросом «Как может быть так, чтобы явка X% была на большом кол-ве УИК, а (X-1)% и (X+1)% на маленьком?», то здесь «аномальность» формулируется вопросом «Почему в точке X – с N кол-вом УИКов высокий процент явки, а в точках (X+1) и (X-1) (в которых N+1 и N-1 не сильно отличаются от N) процент явки гораздо ниже?»

И в наличии и в отсутствии аномалий есть некая логика, давайте посмотрим, куда она нас заведет дальше.

График_2б (шаг 0.1%):
Здесь, если мы считали, что на График_2а – нет аномалий, мы в этом дополнительно убеждаемся. Это показано на примере линии с 80%, если на график_1б 80% — это одинокая пика, то здесь рядом с линией 80% есть еще множество значений близких к 80% (отмечены желтыми кружками).

А вот если мы придерживаемся понятия «аномальности» для графиков 1бвг, то здесь у нас вообще всё в пиках и одна сплошная «аномальность» никаких «гладких» мест на линии белого цвета практически нет.

Таким образом, в зависимости от способа визуализации и выбранного критерия «аномальности», мы можем придти к двум совершенно противоположным выводам.

График_2в (шаг 0.01%):
На этом масштабе интересен тот факт, что по оси X уже выводится достаточно много точек, чтобы увидеть, как изменяется процент явки для УИКов с одинаковым количеством зарегистрированных избирателей. Внутри каждой уже достаточно широкой ступеньки располагается некое распределение явки и это распределение уже можно сравнивать между разными ступеньками. В комментарии к графику я дал намек на то, что любители математики должны явно заметить вид периодической функции и некую «аномалию» из-за того, что в ней меняется ширина периода (согласен, так себе был намек :).

График_2г (шаг 0.001%):
Ну… а здесь я просто откровенно прикололся, показав, что «аномалии» можно буквально создавать из воздуха. На графике – реальные данные, и если проверить значения каждой точки – все честно, при этом мы видим явно «искусственные» ступеньки, которые должны безапелляционно «доказывать», что выборы «нарисованы».
На самом деле секрет прост. На нашем графике сортировка идет по количеству УИКов, и на одной ступеньке (фиолетовый цвет) мы видим множество УИКов, каждому из которых соответствует свой процент явки (на белой линии), так вот, все ступеньки идут по возрастанию, а что происходит внутри ступенек? А внутри ступенек мы можем делать, все что угодно. На предыдущем графике мы внутри ступенек отсортировали УИКи по возрастанию у них процента явки… и получилась, такая изогнутая плавно возрастающая линия. А здесь сортировка внутри ступенек вообще была отключена и они выводились на график в той последовательности, в которой хранятся в БД (бинарное дерево или что-то вроде того), что привило к рисованию таких вот ступенек процента явки (на белой линии).

Ну и собственно мой первый тезис:

Тезис 1:
От выбранного способа визуализации зависит количество некой субъективной «аномальности» на графике. Причем, всё зависит от того, что мы понимаем под «аномальностью». Пики на графике 1бвг – субъективно некоторыми людьми считаются «аномальностью» лишь из-за «геометрической» близости точек с высоким и низким значением (без какого-либо доказательства, что таких пиков на графике быть не должно), замечу еще раз, что кроме «геометрической» близости между этими точками никакой связи нет. Грубо говоря, мы можем сортировать их всё новым, и новым способом находя всё новые и новые «геометрические» аномалии, которые не несут в себе никакой смысловой нагрузки. Вот когда появится доказательство, что пиков на какой-то визуализации быть не должно, а они там есть – вот тогда, такая визуализация имеет смысл.

Теперь пояснения по графикам 1абвг:

Здесь мы разбираем тот вариант, когда за «доказательство» на запрет появления пиков выдается «не знание способа, как эти пики могут появиться естественным путем». Т.е. для некоторых людей, появление пиков на круглых значениях – очень маловероятное событие и кроме как вмешательством «конспиралогических» факторов необъяснимое.

График_1а (шаг 1%):
Это базовый график, на котором нет «аномалий».

График_1б (шаг 0.1%):
Это график, в котором автор исходной статьи обнаружил и показал «аномальные» пики на круглых значениях. И да, действительно, если на этой визуализации следовать логике «геометрической» близости точек и ожидать нормального распределения, то пики – это анамалия.

График_1в (шаг 0.01%):
Здесь мы уменьшаем шаг и уже видим гораздо больше пиков, причем они разбросаны по всему графику. О чем это говорит? Что мы обнаружили еще больше аномалий? Или может для данного графика пики просто сами по себе являются нормальным явлением?

График_1г (шаг 0.001%):
Ну, тут ответ на вопрос выше очевиден – весь график состоит из пик, значит либо весь график – аномалия, либо пики – это нормальное (естественное) явление для данной визуализации, и значит бездоказательно считать, что пики на графике График_1б «аномалия» — это ошибка. Ибо утверждать, что пики маловероятны мы уже не можем.

Тезис 2:
На графиках 1абвг – просто утверждение, что пики «маловероятны» — не является доказательством «аномальности» пиков, так как на График_1а их нет, а на всех последующих График_бвг с уменьшением шага их становится всё больше и больше.

Ну и собственно разгадка пиков на круглых значениях:

По графикам График_1в, График_1г мы видим — что наличие пиков на обсуждаемом графике — вполне естественно, а причина их появления кроется в дроби:

количество_избирателей_пришедших_на_выборы / количество_избирателей_зарегистрированных_на_участке

Значение которой имеет более высокую вероятность оказаться «круглым» чем другие, это подтверждается данными из раздела «Ключ к решению загадки круглых чисел».

Визуально, подсказка на это дается в графике График_1д, где видно пустую воронку вокруг значения 80%.

Входные данные для задачи:

1. По таблице мы видим, что в точки для всех «круглых» значений процента явки – попадают только УИКи в которых кол-во зарег. избирателей кратно 2,5 или 10.

2. Далее приведены таблицы с данными по кратности 2,3,4,5,6,7,8,9,10 для всех УИКов
по кол-ву пришедших на выборы избирателей (числитель)
и
по кол-ву зарег. избирателей (знаменатель)

Ну а дальше, можно посчитать вероятности по появлению интересующих значений, но это я уже оставляю на откуп читателям статьи. Если кому-то нужно, могу привести больше данных по кратности.

Еще просто для справки:
Минимальный размер (кол-во зарег.избирателей) УИКа = 3 чел
Максимальный = 7746 чел

P.S.
Sabubu
Ваши вопросы понятны, на часть из них я ответил в данном комменте, на оставшиеся отвечу позже.
Как хорошо вы объясняете. А можете тогда объяснить наличие на 60 участках одинаковых результатов и пик на этом графике?

kireev.livejournal.com/1300008.html

Вся статья задумывалась как некая загадка,

Загадка — это откуда взялись пики, а остальное лучше писать прямо.

строились для визуализации моей мысли о том, что три точки стоящие рядом друг с другом по порядку на графиках 1абвг — между собой никак не связаны.

Естественно, если вы на графике пересортируете столбцы, то они окажутся никак не связаны. Вы с таким же успехом могли столбцы случайно перемешать.

Ну… а здесь я просто откровенно прикололся, показав, что «аномалии» можно буквально создавать из воздуха.

Вы пересортировали столбцы определенным образом (как выяснилось, зависящим от структуры БД), и график отобразил эту структуру. Гистограмма распределения явки не содержит такой зависимости. Вас просят предложить объяснение пикам, а не показывать другие пики на других графиках.

Суть этих графиков в том, что отображают они ровно одни и те же данные, что на графиках 1абвг, но кол-во субъективных «аномалий» сильно отличается.

Суть аномалий была в том, что пики располагались не случайно, а на определенных точках по оси X. Если их пересортировать по этой оси, то естественно, аномалия исчезает — все пики оказываются справа и перемешиваются с «горбом» гистограммы.

а причина их появления кроется в дроби:
количество_избирателей_пришедших_на_выборы / количество_избирателей_зарегистрированных_на_участке
Значение которой имеет более высокую вероятность оказаться «круглым» чем другие

Это проявляется при кол-ве избирателей порядка 20. Если оно увеличивается до 1000-2000 — пики исчезают, что проверено в моей статье: telegra.ph/Proverka-gipotezy-o-estestvennom-poyavlenii-pikov-na-kruglyh-znacheniyah-yavki-04-01

И это объяснило бы пики на простых дробях вроде 1/2, 1/3, 2/3, но не на числах вроде 94% (47/50).

Еще просто для справки:
Минимальный размер (кол-во зарег.избирателей) УИКа = 3 чел
Максимальный = 7746 чел

Строили график и без участков менее 500 человек — та же картина. Ссылка habr.com/post/352424/#comment_10735492

Участок с 7700 чел — это ненормально, обычно в населенных областях делают 2000/уч., больше может появиться из-за прикреплений или чрезвычайных обстоятельств. Что это за участки такие, интересно. Какое-нибудь предприятие непрерывного цикла?

Ваши рассуждения про «кратность» числа избирателей никак не учитывают участки с соотношениями вроде 1101/2001. С какой стати вы думаете, что таких «круглых» участков большинство?

Ну и напоследок, общее разбиение по кратности количества зарегистрированных избирателей x2-10 для всех УИК:

Ну эта таблица показывает, что число избирателей и проголосовавших распределены равномерно. То есть в x2 примерно половина участков, в x3 — примерно треть и т.д. Участков с x20 или x100 должно быть совсем немного и они не должны вносить решающий вклад в пики. Я приводил выше несколько примеров:

— для пика на 85% получается 36 участков с ровно 85%, но 255 участков всего
— для пика на 94% всего 195 участков, но ровно 94% всего лишь на 13 участках

Из моих примеров видно, что эти два пика образованы не за счет участков с «круглым» числом избирателей.

Раз уж вы взялись за цифры — может вам попробовать сделать табличку вида:

Процент | знаменатель дроби для этого процента | число «круглых» уч., где ровно такой процент и число изб. делится на знам-ль | число некруглых, попадающих в бин 0.1%
80 | 5 | x | y
81 | 81 | z | q
85 | 20 | v | w

Она должна показать, что вклад «круглых» участков не значителен.
а причина их появления кроется в дроби:
количество_избирателей_пришедших_на_выборы / количество_избирателей_зарегистрированных_на_участке
Значение которой имеет более высокую вероятность оказаться «круглым» чем другие


А почему тогда для дроби 17/20 (85%) эта вероятность намного выше, чем для 16/19 или 18/21? Если взять равномерно распределенные случайные числа в определенном диапазоне, то чисел, делящихся на 19, больше, чем делящихся на 20. Для дроби 16/19 вероятность не должна быть ниже, чем для 17/20.
А почему тогда для дроби 17/20 (85%) эта вероятность намного выше, чем для 16/19 или 18/21? Если взять равномерно распределенные случайные числа в определенном диапазоне, то чисел, делящихся на 19, больше, чем делящихся на 20. Для дроби 16/19 вероятность не должна быть ниже, чем для 17/20.
Вы снова смешиваете всё в кучу не понимая в чем суть. Просто, приведу цитату из статьи в разделе «Заключение», который был уже давно добавлен в статью, что бы читатели понимали о чем она.

Откуда могут появиться «естественные» пики на круглых значениях?
— Это уже был мой вопрос самому себе, для решения которого я просил автора исходной статьи выложить файл БД для возможности анализа.

Собственно эта статья на него и отвечает — по графикам График_1в, График_1г мы видим — что наличие пиков на обсуждаемом графике — вполне естественно, а причина их появления кроется в дроби
количество_избирателей_пришедших_на_выборы / количество_избирателей_зарегистрированных_на_участке

Значение которой имеет более высокую вероятность оказаться «круглым» чем другие, это подтверждается данными из раздела «Ключ к решению загадки круглых чисел». Но надо иметь в виду, что под «круглыми» значениями здесь понимаются «ровно круглые» значения без какого либо округления, т.е. иллюстрируемые пики на График_1г и График_1в. На График_1б — значения уже сильно округлены и к «ровно круглым» значениям, добавляются значения из ближайших окрестностей, поэтому «естественность» пик на «ровно круглых» значениях оказывает уже гораздо меньше влияния чем «разумный выбор». Поэтому появление высоких пик на круглых значениях в реальном голосовании, показанная нами «естественность» не объясняет. Но, то что они существуют и могут быть усилены «разумным выбором» вполне вероятно.


Персонально для вас поясняю, что дробь 16/19 как и 17/20 (при шаге 0.001%) имеет пику и на графике с реального голосования и на графике голосования монеткой. Причина — в более высокой вероятности получения значения 84,211%, 85% чем других в интервале соответствующему шагу (а уже сама высота пики зависит от природы выбора). Но в отличии от «не круглых значений», ровно круглые не требуют округления и привязки к шагу выборки ( 84,211 округлено с 84,2105263157895). В статье этот факт показан на График_1д для 80% (видите воронку вокруг значения? похожие есть и на пиках 84,211%, 85%). В статье речь идет ровно о круглых значениях без округления — показывая естественность пик именно на них. То, что «естественные» пики могут быть и не на круглых значениях в статье видно на любом графике с шагом 0.001% где не круглых пик, как ни странно, гораздо больше.

Последний раз — статья показывает, что пики на ровно круглых значениях — естественны, всё. Если вы начинаете округлять — то это уже не ровно круглые значения. Кроме того, на шаге 0.001% по графику голосования монеткой и реальным размерам УИКов видно — что ситуация, где множество «круглых» пик оказывается по высоте выше ближних окружающих «не круглых» пик — очень частая.

Основная суть:
В статье на которую писался ответ, приведены графики с шагом 1%, 0.1%. В данной рассматриваются графики с шагом 1%, 0.1%, 0.01%, 0.001%. Там автор считает — что «круглые» высокие пики на 0.1% — аномальны, без каких-либо доказательств. В данной статье показано, что «ровно круглые» высокие пики на 0.001% — абсолютно нормальное явление.

На шаге 0.1% где уже складываются/округляются множество значений из окрестностей пик — гораздо большее значение имеет «природа» голосования, которая определяет сколько человек придет/не придет на выборы. Для случайного определения монеткой — пики на круглых значениях существуют, но по высоте они не так выражены как на 0.001%. Если убрать из рассмотрения все УИКи с размером меньшем 500 чел (1/3 от общего числа). То, пики на круглых значения тоже существуют, но их высота еще менее выражена по сравнению более высокими «не круглыми» пиками. При этом, на реальном графике без этих УИКов, высота «круглых» пик остается более высокой. На этом основании, некоторые считают, что они аномальны. Но это их личная точка зрения, доказать которую они никак не могут, сколько бы я это доказательство не просил, при этом основание у этого мнения одно — «разумный» и «случайный» выбор это одно и тоже, что конечно не верно.

Обычно свое «не знание естественного способа воспроизведения пик», такие люди выдают за доказательство, что такого способа не существует — это глупо. Аномальность пик — тоже глупость без предоставления доказательств. Не надо перекидывать стрелки и просить показать «естественный способ появления пик», так как пока не доказано обратного, по умолчанию пики всегда будут «естественными» (презумпция невиновности), я в статье лишь подчеркнул их естественность на 0.001% шаге.

В данной статье не утверждается, что фальсификаций на голосовании не было / было (это можно доказывать только юридически), в данной статье говорится о том, что без математических доказательств «круглые» пики на графике называть «аномальными» — не верно. Речь в статье идет именно о математических доказательствах аномальности, но его никто привести не может. В статье же приведены графики, показывающие, что на 0.001% высокие «круглые» пики при голосовании монеткой — это естественно в силу математического смысла дроби. Это не доказывает их «естественность» на 0.1% в реальном голосовании, но дает гипотезу «усиления пик из-за разумной природы голосования», что имеет такое же право на существование как и гипотеза «фальсификации».

Основная мысль статьи — пики на круглых значениях называть «аномальными» без каких-либо доказательств не верно. Если есть юридические доказательства — то надо идти в соответствующие органы (в этой статье смысла обсуждать их нет), если есть математические — предоставьте, но просто так называть пики «аномальными» считая, что «разумный» и «случайный» выбор одно и тоже… глупо.
Так, данную статью я примерно понял. В такой вещи, как Выборы (да и не только в них), действительно неправильно заранее ожидать како-го распределения без объяснения причин такого ожидания. Учитывая относительную простоту постановки вопроса статья реально перегружена материалом и в нём сложно увидеть ответ на поставленный вопрос. А если прям точно, то в статье вообще очень сложно что-либо понять из-за дикой перегруженности. Думаю, что именно по этому многие в комментариях пишут, что так и не увидели в статье того, чего ожидали.
У меня же другой вопрос возникает: «А с чего вдруг все решили искать 'естественные закономерности' в таком сложном явлении без адекватной социально-математической модели?»
Существует, например, задача о моделировании распространения вируса в популяции и постановка у неё вообще детская. Но, при этом, она описывается целой системой интегро-дифференциальных уравнений (два или три, точно не помню). Очевидно же, что выборы куда сложнее.
Так где модель?
Вы меня сподвигли написать статью с анализом данных, не имеющих в себе проблемы целочисленного деления или же проблемы уменьшения шага
habr.com/post/358790
Sign up to leave a comment.

Articles