Pull to refresh

Comments 37

При всём уважении к работе, которую вы проделали, трудно было что ли расшифровать, что такое СКО? И вообще, все эти процентные доли, что это такое, как понять эти числа?

Средне Квадратичное Отклонение, не?

в процентах? это что-то новенькое

Насколько я помню, у него размерность такая же, как у измеряемой величины. Т.е. если у вас скажем явка в процентах, то и ее среднеквадратичное отклонение — тоже будет в процентах. Может это и необычно — но ничего неправильного я прям не вижу.

А вывод конечный можно пожалуйста озвучить? А то не очень понятно что все эти цветные кружочки означают

Все довольно просто, если я правильно понял - сравниваете первую и последнюю таблицу. Например, около 25% от общей суммы голосов* аномальны, похоже что вкинута была треть голосов*, от реально проголосовавших людей. Чтобы добиться таких результатов, вероятно, вбрасывали на каждом третьем УИК***. Любые выводы в лоб вызовут негативную реакцию, поэтому проще дать каждому возможность сделать их самостоятельно.

* (528,4-391,5)/528,4;

** (528,4-391,5)/391,5, где 528,4 - число избирателей (в тысячах) по данным сводной таблицы, а 391,5 - число избирателей (в тысячах) с исключением статистических аномалий.

*** (377-265)/377, где 377 - число УИК по данным сводной таблицы, а 265 - число УИК с исключением УИК со статистическими аномалиями

Скорее так. 32.9% доля победителя на 265 УИК, 45.6% его доля на 377 УИК. 103875 голосов за победителя на 377 УИК.

103875*32.9/45.6=74945 реальных голосов, 28930 предполагаемая аномалия.

Спасибо за пояснение! Я так и знал, что там что-то такое.

Конечный вывод может озвучить только суд, а мы можем наблюдать статистические аномалии ))

Суд ответит, что статистический анализ не является основанием для назначения переподсчёта голосов. Нам в 2017 году (Очаково-Матвеевское, муниципальные выборы) сказали именно это. Хотя анализ однозначно показывал и участки, и способ фальсификаций.

Вопрос философский )), нужно ли всеобщее избирательное право или как "Отцы основатели США  предполагали, что в силу малограмотности населения страны симпатии избирателей могут приобрести популисты и экстремисты различного рода. Косвенные выборы президента и сената были введены, так как многие отцы-основатели считали, что при прямых выборах, когда органы управления будут избираться непосредственно народом, большинство голосов будет принадлежать не просвещённому населению, а массам, что в конце концов повредит демократии, президент по-прежнему избирается коллегией выборщиков"

Проще говоря, чем больше была явка на избирательном участке - тем больше было голосов за ЕР. Но!, при нормальном распределении и за другие партии должно быть больше голосов (пропорционально), а этого не наблюдается. Таким образом статистика явно показывает, что была не явка большая, а чистые вбросы за одну партию.

А вы можете визуально кластеры выделить - общим фоном или границей?

Да планирую дополнять пост.

Для начала, случайный вектор нужно рассматривать другой (доля доля партии от полного списка избирателей, доля явки, максимальный темп явки в час).

Посчитать, нарисовать нормализованные случайные вектора (наблюдение- матожидание)/СКО.

Поискать кластеры не визуально, а математически.

Знающие математику - да увидят! Остальным хоть кол на голове теши - будут как бараны на новые ворота смотреть и блеять: - "Что это такое?"

ФОМ - 29%, ВЦИОМ - 29.5%, Левада-Центр - 28%. Таковы реальные рейтинги Единой России

Могу дать пояснения по г.Сергиев Посад как местный житель.

УИК №2725 г. стадион "Луч" и совсем рядом с ним УИК №4042 школа 21. Школа долгое время была переполнена, 2 - 3 смены. Сергей Пахомов на новую школу деньги выбил, и строительство курировал как мог. Новую Школу построили и открыли недавно, в прошлом учебном году.

УИК №2742 и УИК №2743 это школа № 8, а так же УИК №2749 г. в школе искусств № 3 , Это бывший военный городок и прилегающий к нему поселок где проживают действующий и уволенный в запас офицерский состав ВС РФ.

Вообще по г. Сергиев Посад статистика может не работать совсем. Город хорошо знают Президент с Министром Обороны, так исторически сложилось, Патриарх имеет тут свои виды. Долгосрочную стратегию развития города, например, Патриарх курирует лично.

>> Вообще по г. Сергиев Посад статистика может не работать совсем.

Вообще, все что Вы написали как раз объясняется тем, что по итоговой таблице у ПЖИВ сохраняется бОльшая доля голосов - на 14,5% больше, чем в Королёвской и на 8,4%, чем в Пушкинской.

Никто не отрицает существования психоневрологических интернатов № 20, но тем не менее - при 157 УИКах в Сергиевом Посаде, есть 68 с вполне статистически адекватными результатами, которые показывают, что на оставшихся 89 пришлось прибегнуть к определенным махинациям. Увязывая первый абзац с этим - эти самые определенные махинации "проще" проводить там, где у едра есть "хороший" уровень поддержки, т.к. это значит, что и наблюдателей меньше, и проще "объяснить" итоговый результат, что мы и видим на примере Вашего комментария.

Опять же, к этому вопросу можно подойти и с другой стороны - а где же тогда УИКи с аномалиями наоборот? Где при этой же явке в ~80%, побеждает не ПЖИВ, а КПРФ с результатом в ~70%?

УИК 2725, 2742 и 2743 отметились аномальным числом надомников, 4042, 2742 и 2743 аномальной явкой в промежуток 18:00-20:00 19.09.

 2742 и 2743 аномальной явкой в промежуток 18:00-20:00 19.09

Это нормально, народ с дач из Шарапова приехал. Видимо коменданту гарнизона сообщили что явка недостаточная и он скорее всего обратился с просьбой к командирам подразделений как к действующим так и уволенным в запас. Взаимовыручка у офицерского состава это не пустой звук, это хорошо работает, попросили помочь, подъедут и помогут.

Это маловероятно. Действующих попросили проголосовать ещё в пятницу, отставным всё равно. Четверть трехдневных голосов за два часа, наиболее вероятно, что после окончания голосования неиспользованные бюллетени вместо того чтобы погасить, "проголосовали".

Действующих попросили проголосовать ещё в пятницу,

Тогда должен быть четкий резкий пик начиная примерно с 18:30 до закрытия в пятницу 17.

 отставным всё равно.

Именно они и принимают решения, именно к ним и обращаются за помощью. Это очень влиятельная группа определяющая у кого как карьера военного сложиться, много военных династий, огромные связи в МО.

Четверть трехдневных голосов за два часа

Это примерно 500 человек, 250 семей. В городке много больше 10000 жителей, из них 20 процентов имеют дачи по дороге в Шарапово как минимум. 250 семей это всего 4 пятиэтажки. Это мало, очень мало. Там пара кварталов только девятиэтажных домов. И несколько кварталов пятиэтажек, и это не считая домов в самом Птицеграде.

Тут надо сравнивать с соседними избирательными участками располагающимися в городке, если грубо сравнить общую численность избирателей зарегистрированных по трем участкам и общую численность жителей, то как бы избирателей не хватает, должен быть как минимум еще один участок.

На 2742 почти три дня голосовали в темпе 8-31 человек в час, а с 18 до 20 часов 19 сентября вдруг активизировались 650 человек в темпе 325 человек в час, на 2743 голосовали в темпе 8-21 чел/час с 18-20 часов в темпе 237 чел/час рывок на 474 человека. На 2749 осталось не истребованными всего 3 бюллетеня. Дачная мобилизация военных пенсионеров, смешно. На 4042 нет столько военных пенсионеров, темп голосов 16-38 чел/час три дня, за два последних часа 284 чел/час и всего 18 погашенных бюллетений. Тоже смешно.

Дачная мобилизация военных пенсионеров, смешно.

Ну кому смешно, а я раньше по этой дороге больше 5 лет попутками добирался, для меня норм. Военные пенсионеры вместе с женами и внуками на дачи ездят, жены тоже голосуют. И мобилизации такие были не однократно, и по больше были.

Я не утверждал, что взбросов не было. Я говорил что в определенный период вполне могла быть аномалия, поскольку для этого есть условия. Именно на этих участках эти условия были.

Может быть только одна причина вбрасывать. Это низкая явка. Не важно кто победит, это не существенно и при большой явке, так бывало на выборах раньше, поворчат и забудут, это проблемы политиков. Но если будет провал по явке, то это будут большие и тяжелые последствия с многочисленными кадровыми перестановками, низкая явка это проблема военных. В МО таких ошибок не простят никогда, и последствия будут жесткие. Люди испортят репутацию, потеряют связи, дети и, наверно уже, внуки поломают карьеру, потеряют хорошее служебное жилье.

В общем если вброс и был, то причину следует искать совсем в другой политике, ЕР с КПРФ тут рядом не стояли.

>> Это примерно 500 человек

Зайти, дать переписать паспортные данные, расписаться (берем самое узкое место) - минимум 30 секунд, просто если бежать. 650 * 0,5 = 325 минут. 625 / 60 = 5 часов и 25 минут. Может хватит тут заливать и конспирологические теории рисовать?

Вам в помощь не хватает только сидящего на зарплате пропагандиста @AirLibra, чтобы он заявил, что сам был наблюдателем и "убедился, что выборы прошли честно", а заодно назвал всех активных наблюдателей мудаками провокаторами.

Интересно, как сказалось на результатах то, что по сути, целенаправленно искались вбросы в пользу именно ЕР и изъятия именно у КПРФ? В науке не зря существует метод «двойного слепого тестирования»…
По моему опыту неформального общения с членами избирательных комиссий — никто не заморачивается на «выкидываем только КПРФ» — если выбрасывают лишние бюллетни, то делают это не глядя на голоса.

>>  изъятия именно у КПРФ

Не увидел речи об "изъятии" в статье. Выглядит все как раз так, что вся рисованная явка отдается непосредственно ПЖИВ, за счет чего голоса за КПРФ просто размываются в итоговой явке. Насколько я вижу, в итоговой таблице исключены и голоса за КПРФ (в принципе все голоса) на аномальных участках.

Datascience к делу не пришьешь. К сожалению.

Datascience к делу не пришьешь. К сожалению.

И это очень странно. Анализы ДНК прекрасно пришиваются к делам, а там вероятность ошибки зачастую выше, чем вероятность случайного появления некоторых аномальных распределений на выборах. Например, когда в 2011-м несколько избирательных комиссий "случайно" засчитывали голоса, поданные за другие партии, ЕР. Если посчитать, то вероятность одновременного появления этих "случайных" исходов получалась где-то в районе 1e-30.

Здравствуйте! Спасибо за статью! Тоже сейчас занимаюсь анализом результатов выборов. Запустил веб приложение для построения графиков. Заинтересовало в статье деление на три кластера: гладкое, административное голосование и фальсификации. Вы такую градацию вводили на основе визуальной оценки графика?

Да, делил визуально. Т.к. достоверных данных где были фальсификации нет, обучающей выборки нет, остается только догадываться. Кластеризация К-means на 3 кластера дает похожее разделение.

А есть ли какая-то связь с данными по голосованию в московскую областную думу? Грубо говоря, если что-то вбрасывали, то и туда, и туда? Или может наоборот, в ГД заморочились, а в областную - и так сойдет?

Результаты похожи, например, по королёвской ТИК в ГД за ЕР 21515 голосов, в МосОбл 20454, при том, что за МосОбл можно голосовать только с подмосковной пропиской, за ГД с любой.

490 голосов в час — а физически могут 490 человек подойти, отметиться, расписаться, проголосовать?
Тем более это 25.9% от списка в час, небольшой участок, там физически не сидит 25 оформителей, ведь так?
А суслик то вот он, «камеру вырубаем» сказали.
Sign up to leave a comment.

Articles