Бегтин Иван Викторович @ibegtin
Пользователь
Information
- Rating
- Does not participate
- Location
- Москва и Московская обл., Россия
- Date of birth
- Registered
- Activity
Specialization
Chief Technology Officer (CTO), Data Engineering
Lead
Python
Database
High-loaded systems
MongoDB
Git
А не хотите податься к нам на конкурс Apps4Russia? Мы как раз будем рассматривать все приложения на открытых данных.
Относительно «Blind Data» — были уже находки когда в мы сопоставляли списки образовательных учреждений на сайтах ФОИВ (пример — МВД) и данные из других систем, и они никак не бились. Или данные об отделениях полиции с сайта 112.ru и с портала госзакупок. Не бьются и пустых пятен там в избытке. Есть и другие примеры, но публиковать нет пока готовности.
Их не так уж мало, плюс многие есть в больших системах раскрытия типа ФИАС, сайта закупок и тд
Про закупки госкорпораций вопрос уже поднимается — есть хороший шанс что будут открывать.
По поводу данных — есть сайты Федерального Казначейства, там вообще ничего не надо парсить, достаточно разобраться в их данных. Есть ресурсы ФНС — там хуже с качеством данных, но они также публикуют открытые данные по ряду направлений.
Если Вы хотите их использовать — Вы можете делать это прямо сейчас.
government.ru и остальные ресурсы нужны тем кому они нужны. Вам не нужны — ок.
Если Вы не хотите участвовать в создании открытых данных, можете подождать июля 2013 года когда должны быть раскрыты данные большинства ФОИВов.
Те кто ждать не хочет — создает базы данных.
Если Вы думаете что в других странах чиновники сами пришли к раскрытию данных — то это совсем не так. На их решение более всего повлияли проекты такие как ScraperWiki позволяющие активистам собирать данные самостоятельно.
В любом случае я не хочу Вас переубеждать — хотите лениться, ленитесь.
Парсить сайт — это совсем не огромная задача, я лично их перепарсил несколько сотен и многие есть кто над этим работают. Ваш интерес в данных понятен, я пишу о том что он может быть удовлетворен разными способами, а не только открытыми данными что раскрывают сами чиновники.
в свободном доступе.