Совет по открытым данным: вести с полей

    image
    Источник фото: сайт Открытого Правительства

    23 декабря мне впервые посчастливилось побывать на заседании Совета по открытым данным. Участвовала я от лица АНО “Информационная культура”, своим участием добавив общественный сектор к представителям госсектора и бизнеса.

    Состав декабрьского заседания совета был, на первый взгляд, внушительным: собрались представители Минфина, Казначейства, Росстата, Минэкономразвития, Открытого Правительства, НИУ ВШЭ, Аналитического Центра “Форум”, Аналитического центра при Правительстве и Яндекса – как видно из списка, некоммерческого сектора очень не хватает. Повестка состояла из шести объемных пунктов, но это не помешало заседанию начаться на полчаса позже, что, впрочем, не вызвало удивления присутствовавших и не сопровождалось какими-либо комментариями организаторов.

    1. Исключение дублирования статистических показателей в отчетности Росстата

    Первым пунктом повестки был доклад Росстата о том, как исключить дублирование показателей в различных отчётах и как публиковать первичную статистическую информацию в формате открытых данных. Доклад вызывает множество вопросов, начиная с способа подачи материала, который заключался в дословном прочитывании текста из раздаточных материалов. Из содержательного запомнились два пункта:

    Первый тезис заключался в том, что «дублирование показателей создает неоправданную нагрузку на бизнес и бюджеты всех уровней», что подразумевает многократную подготовку и сдачу одних и тех же показателей. Удивил комментарий министра Открытого Правительства Михаила Абызова, который прямо сказал, что сотни тысяч чиновников на рабочих местах только и делают, что находят цифры по форме из excel-таблиц, которые внезапно понадобились их руководителям. Что касается Росстата, то, на мой взгляд, намного интереснее тот факт, что нагрузку на бюджеты создает и само ведомство, когда продает региональным и муниципальным госорганам собранные данные. То есть работа Росстата оплачена не только нашими налогами, но и результаты этой работы продаются внутри государства, и на это идут региональные и муниципальные средства. Но вариант снижения нагрузки на бюджеты за счет отмены продажи данных не был озвучен.

    image
    Контракт на закупку показателей статистической отчетности Администрацией губернатора Пермского края у территориального органа ФСГС. Источник: проект Госзатраты

    Второй тезис — это работа Росстата с большими данными. Из озвученного текста у меня не сложилось впечатление, что представители Росстата правильно понимают и эту область и терминологию, т.к. по их мнению большие данные – это что-то отдельно-стоящее от всех остальных данных и, естественно, требующее дополнительного финансирования. Например, Росстат предлагает «создание единого межведомственного координационного центра по использованию Больших данных в официальной статистике», «обеспечение Росстатом единого методологического контроля (надзора) за использованием Больших данных в официальной статистике», «разработку и принятие комплекса законодательных и НПА, обеспечивающих возможность и устанавливающих порядок использования Больших данных в официальной статистике». Подозреваю, что «Большие данные» у Росстата уже есть, правда, они об этом не догадываются.

    Хотя по Росстату, судя по моему опыту, основная проблема сегодня заключается в том, что данные не предоставляются в формате открытых данных. Муниципальную статистику в виде датасетов скачать нельзя, массивы, выгружаемые на федеральный портал, сильно раздроблены (за счет чего увеличивается их количество, которое так важно для рейтингов), а статистические сборники, состоящие в основном из таблиц, публикуются в формате doc и сверстаны для печати, а не для работы с данными.

    2. Обсуждение порталов Казначейства

    После Росстата «докладывалось» Казначейство. Их доклад можно назвать образцовым выступлением госоргана – красочная презентация с необходимыми поясняющими фразами, грамотная речь, понятное и интересное содержание. Были представлены ресурсы bus.gov.ru и budget.gov.ru, а также приказы, на основании которых госорганы, государственные и муниципальные учреждения должны публиковать данные о себе. Интересно, что минут 20 на заседании шло обсуждение того, нужно ли менять один из приказов Минфина России и добавлять в перечень обязательных данных координаты фактического расположения учреждения или все же пользоваться API Яндекса/Google для генерации координат. Благодаря аргументации руководителя Департамента ИТ Минфина России Елены Черняковой, сотни тысяч муниципальных учреждений не будут задаваться вопросом, какие у них координаты и где их найти. Впрочем, это не было удивительным, т.к. интересные и адекватные выступления и ответы на вопросы Е. Черняковой – это то, чего я жду на каждом мероприятии.

    image
    Портал bus.gov.ru для размещения данных о государственных учреждениях

    Хотя также, как и с Росстатом, в процессе работы с рассматриваемыми порталами Казначейства, мы выявили куда существенные проблемы чем те, которые обсуждались на совете:

    • На портале bus.gov.ru неправильно преобразуется в структурированный формат финансовая отчетность: отображаемые на сайте данные не соответствуют тому, что указано в прикрепленных оригиналах;
    • На портале bus.gov.ru отсутствует документированное API, и блокировка IP-адреса осуществляется при просмотре данных всего 50 учреждений, то есть бесполезно выкладывать и обсуждать новые данные, если даже то, что есть, скачать/использовать практически невозможно;
    • На портале budget.gov.ru в конструкторах данных много багов, например, теряется выбор пунктов при переносе фильтра в раздел «Показатели» или показываются удвоенные суммы доходов/расходов, если отметить пункт «выбрать все» в фильтре «Уровень бюджета»;
    • Важно уточнить, проводится ли каким-то образом верификация данных, вводимых представителями госучреждений на портале bus.gov.ru: о том, как представители госзаказчиков формируют данные по госконтрактам, мы знаем уже давно, а ошибки в финансовой отчетности выявили недавно, но «исправляет» их Казначейство уже несколько месяцев.

    Интересно, что при обсуждении геолокации учреждений, Михаил Абызов поднял вопрос о том, можно ли заставить учреждения (школы) публиковать все данные по ЕГЭ, — теперь мы знаем, кто из государственных служащих поддерживает открытость образовательных данных и с кем стоит коммуницировать «Российским школам».

    В этом пункте повестки Елена Чернякова из Минфина России раскрыла тайну многочисленных ошибок в данных ЕГРЮЛ, о работе над которым Татьяна Нестеренко рассказывала на Московском финансовом форуме в сентябре (на исправление данных в ЕГРЮЛ у Минфина России ушло полгода, 600 млн рублей и 200 000 человекочасов). Проблема в том, что подача данных в ЕГРЮЛ носит заявительный характер, поэтому, например, фактический адрес, указанный индивидуальным предпринимателем, проверить практически невозможно. Поэтому, когда Минфин России занялся обновлением своих информационных систем, 80% государственных и муниципальных учреждений пошли править свои данные в ЕГРЮЛ.

    3. Предложения Аналитического центра при Правительстве по публикации данных госкорпораций и публичных акционерных обществ

    Третьим пунктом Аналитический центр при Правительстве РФ представил доклад «О совершенствовании работы государственных корпораций и публичных акционерных обществ с открытыми данными». Основная идея заключалась в том, чтобы обязать указанные организации публиковать в машиночитаемых форматах ту информацию, которую они уже обязаны раскрывать (общие сведения об организации, вакансии, сведения об охране окружающей среды и т.д.). На это один из участников заседания справедливо заметил, что тогда мы получим миллион датасетов в разных форматах на разных сайтах, и намного логичнее опубликовать открытую часть ЕГРЮЛ и другие данные, которые собирает у тех же учреждений Росстат или Росприродназдор. Замечание про ЕГРЮЛ было одним из самых ценных комментариев на совете, поскольку мы давно об этом говорим ФНС, но, к сожалению, в проекте протокола этого комментария нет.

    4. Саммит по открытым данным и конкурс Открытого Правительства

    Четвертым пунктом было обсуждение саммита, перенесенного на февраль, и конкурса по открытым данным. Вряд ли что-то можно рассказывать об этом пункте до подведения итогов конкурса, но к статистике по прошлому конкурсу это не относится. Было озвучено, что большое количество проектов, поданных на прошлый конкурс (или 50 проектов, или 50%), продолжают развиваться. Хотелось бы посмотреть на этот список, потому что обычно через год после проведения конкурса или хакатона практически все проекты становятся недоступными или заброшенными.

    5. О работе федеральных органов исполнительной власти по открытым данным в 2016 году

    Пятым пунктом было перенесенное на февраль подведение итогов работы органов государственной власти по раскрытию информации в форме открытых данных. Примечательно, что в материалах к заседанию в качестве лидеров среди ФОИВ указаны далеко не финансовые госорганы (Казначейство, Минфин России, ФНС), чья работа в области открытости не вызывает сомнений, а, на первый взгляд, выбранные случайным образом. Возможно, этот список составлен на основе рейтинга, подготовленного недавно Открытым Правительством и ВЦИОМ.

    image
    «Безусловно открытые ведомства» по результатам рейтинга Открытого Правительства и ВЦИОМ

    image
    «Аутсайдеры» рейтинга Проектного центра «Инфометр»

    В отличие от прозрачного, понятного и основанного на законодательстве рейтинга Инфометра, рейтинг ВЦИОМа и ОП вызывает много вопросов. Во-первых, за основу в нем принимается количество датасетов, при этом Росстат, целью деятельности которого является сбор данных, оценивается наравне с остальными ведомствами. Во-вторых, значительной составляющей итоговой оценки является «востребованность» наборов, которая определяется как количество скачиваний с федерального портала data.gov.ru. Специально перед советом просмотрела ТОП-7 федеральных ведомств по количеству датасетов на этом портале. Общее количество скачиваний за все время существования портала у «лидирующих» ведомств составляет примерно 100-150 раз (это суммарное количество скачиваний всех датасетов одного ведомства), то есть вместо того, чтобы судить о невостребованности наборов, нужно судить о невостребованности данного портала. В-третьих, этот рейтинг оценивает только данные, размещенные на федеральном портале, не принимая во внимание активность ведомств на своих сайтах, за счет чего госорганы вынуждены дублировать свои данные и на федеральном портале (причем иногда вручную).

    image
    статистика количества скачиваний с портала data.gov.ru датасетов Ростуризма (154), Росавтодора (70) и Минпромторга России (61). По количеству датасетов среди ФОИВ они на 3, 2 и 4 месте.

    Подводя итоги...

    Шестой пункт о схеме взаимодействия Минкомсвязи России с Советом по открытым данным зачитан не был и не обсуждался (а у меня терпение во время чтения материалов закончилось раньше).

    В целом, совет вызывает двойственное впечатление: что-то было адекватно и интересно: например, доклад Казначейства и некоторые комментарии; также порадовало участие в мероприятии компетентных людей. Что-то, с другой стороны, было слишком формальное и напоминающее «обязаловку», в чем-то проглядывало непонимание ни работы с данными, ни специфики открытых или больших данных. Непосредственно обсуждению докладов уделяется очень мало времени – какие-то незапланированные в повестке комментарии вставить сложно, и, конечно, обсуждение открытых данных в закрытом режиме выглядит довольно странным. Посмотрим, что будет дальше.
    • +13
    • 3,4k
    • 7

    «Информационная культура»

    65,50

    Открытое государство и открытые данные

    Поделиться публикацией
    Комментарии 7
      0
      Всё конечно замечательно.
      Но когда касаешься работы с данными Казначейства — такое чувство, что делают это студенты 1-2 курса. Видимо нормальные после 3 уезжают в другие Казначейства. В кабинетах всё прекрасно и картинки супер, а в жизни — ж… а
        0

        С какими данными Казначейства вы работаете?

          0
          Штрафы за автомобиль (25000 авто)
            0
            Посмотрю их, спасибо. Уточнила, потому что мы, например, в основном работаем с госконтрактами, а эти данные формируются госзаказчиками и в их плохом качестве виновато не только Казначейство, но и представители госзаказчиков :(
              0
              В том то и дело, что как у Райкина — к пуговицам претензий нет? а костюмчик не сидит. Нет участия людей. Вот делал для GPS интеграцию с EGNOS (https://www.egnos-portal.eu/) — так прямо забота. И письма и скайп — да чем помочь, да что непонятно. У нас же 100500 бумажек с водой, и всё сделано так что бы только красивые презентации показывать на комиссиях.
                0
                То есть общаться с Казначейством вы пробовали? Т.к. на встречах Минфина с разработчиками представители ФК жаловались, что у них нет обратной связи, которую они очень хотят. Может вы напишите на почту и мы попробуем вас связать с теми, кто на встрече был от них? А вдруг поможет… :)
                  +1
                  Да я бы написал — только куда? На деревню дедушке Василию Макарычу? Только телефон и знаю один 8 800 200 23 16, но там не говорят про Казначейство. Если есть заботливые/заинтересованные люди — пусть напишут на info@fleet-web.com — я тут же отвечу и обеспечу и связь обратную и всё, что нужно. И пиво конечно.

      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

      Самое читаемое