Открытые данные электоральной статистики России

    Некоммерческая организация ГОЛОС занимающаяся мониторингом выборов в России буквально вот только что открыла сайт электоральной статистики в нашей стране — stat.golos.org

    Всего в их базе 36 834 записи о выборах на всех уровнях власти — от федерального до местного самоуправления, по всем регионам и начиная с 2003 года.

    Огромный объем работы наконец-то доступный онлайн. Данные по весьма чувствительной теме под названием «выборы». Причем данные официальные, наконец-то, извлеченные из сайта Центризбиркома и представленные в форме пригодной для повторного использования как открытые данные.

    И у каждого из выборов есть ссылка на CSV файл с описанием. Который можно выгрузить, загрузить в Excel, загрузить в любимую базу данных, построить инфографику, сделать свой региональный проект, сделать проект по собственному муниципалитету и многое другое.

    Скриншот главной страницы:
    image


    Конечно, там не все пока ещё идеально. На мой взгляд нехватает:
    1. Сейчас по отдельным выборам можно скачать в CSV данные, но нет возможности скачать весь список выборов в машиночитаемой форме. Лучше всего в CSV формате доступном ссылкой на главной странице.
    Это может быть полезно если, к примеру, кто-то захочет проанализировать выборы в своем регионе — тем самым можно будет написать сравнительно простое приложение которое бы охватывало не один файл выборов, а несколько сразу.
    2. Нехватает обратной связи с посетителями сайта вроде кнопки а ля reformal.ru
    3. Нехватает описание структуры CSV файлов или же XML файлов.

    Гораздо важнее что такие проекты появляются. Что открытые данные идут в умы людей. И то что некоммерческие организации начинают опережать органы власти в прозрачности собственной деятельности.

    А я сейчас думаю как эти данные можно было бы использовать для общего блага и пользы. Если у Вас есть какие-либо идеи, предложения или желания приложить силы — предлагаю думать вместе.

    Комментарии 13

      0
      А CSV откуда брались?
        0
        Они распарсили страницы сайта Центризбиркома и превратили их в CSV
        0
        Интерфейс, действительно, не слишком удобный. Для своих нужд придется грабить награбленное парсить спарсенное.
        Был бы благодарен, если бы кто-нибудь подсказал возможную визуализацию данных — есть идейка подтянуть python за счет написания какого-нибудь такого сервиса с использованием плюшек гугла типа карт и GAE.
        • НЛО прилетело и опубликовало эту надпись здесь
            0
            Да, было бы полезно!
              +1
              не в этой стране и не в это время
                –1
                Ждем 2015 года, когда голосования станут по картам.
            0
            В первую очередь надо посмотреть временные графики предпочтений граждан конкретных политических партий. Причем в абсолютных числах, а не в процентах по разным регионам или даже по конкретным участкам.

            Более чем уверен что можно будет найти «незакономерные» всплески у всеми-нами-очень-любимой-партии.

            Еще надо найти как там в Чечне получилось что проголосовавших 101% был ;-)

            Как бы мне все это в Матлаб зафигачить. В Экзеле я не мастак к сожалению.
              +3
              Всплески уже посмотрели тут :)
                +1
                Потрясающая статья (только выкинуть бред по сравнению аномалий зависимостей с сверхтекучестью гелия), было бы неплохо добавить эту ссылку в статью.

                Помимо исследования, там в начале классная цитата :)
                Так, вице-президент Центра политической конъюнктуры Виталий Иванов говорит: «Не надо математикам со своими моделями лезть в политику, анализировать выборы, придумывать какие-то свои версии. Это просто смешно, когда математик рассуждает о выборах. Давайте еще биолога спросим! Или узнаем, что по поводу результатов выборов думает физик-ядерщик! У них, наверное, тоже найдутся идеи, как высчитать, какой на самом деле должен быть результат. Я считаю, всерьез обсуждать здесь нечего!» www.polit.ru/news/2009/10/19/mathematics.html
              +1
              Интересно, что говорить) Я смотрел только процент за ЕдРо относительно числа зарегистрированных избирателей.

              Например, выбору в Думу РФ 2007 года. Зарубежные участки. Их два вида: с небольшим процентом (10-20) за ПЖиВ и с около 90% за ту же партию. Хорошая местами явка, да? Но это фигн. На выборах в парламент Чеченской республики 2005 года 19 участков (21966 человек) показали явку 100% и 100% голосов ушло всё той же любимой партии.

              Статистика по участкам в этом смысле очень полезна — ведь по региону есть 60% и непонятно, может и правда столько.
                +1
                некоторые посты из ЖЖ на тему статистики по результатам прошлых выборов

                Анамнез выборов в Сочи
                Чтобы понять, чего можно ожидать от Сочи на нынешних выборах, сделал небольшой анализ данных голосований по Сочи на прошлых выборах — думских декабря 2007 года, президентских марта 2008 г. и мэрских июня 2008 г. Статистика небольшая, но кое-что видно.


                Фальсификации. Проверка на Гауссиан
                Любое множество данных, если оно возникло стихийным, естественным образом, подчиняется общим статистическим закономерностям, в частности «нормальному распределению», «гауссиану». Если же оно создано искусственно, то оно из этих закономерностей выламывается.
                Обнаружить это в век доступных статистических программ и быстродействующих компьютеров несложно.
                Ниже приведены результаты проверки на «нормальность распределения» трёх множеств по 153 Окружным избирательным комиссиям на выборах в Думу 2 декабря 2007 года: 1. Явка; 2. Абсолютный % голосов за ЕдРо; 3. Относительный % голосов за Едро.


                Выборы в Московскую городскую Думу 2009 года: подробные данные 1, подробные данные 2, комментарии

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                Самое читаемое