All streams
Search
Write a publication
Pull to refresh
130
0
Бегтин Иван Викторович @ibegtin

Пользователь

Send message
Павел, спасибо, важное дело.

А не хотите податься к нам на конкурс Apps4Russia? Мы как раз будем рассматривать все приложения на открытых данных.

Использование данных в том что на их основе создаются алгоритмы нужные для других задач. Это отличается от использования данных в лоб, но использованием является.

Относительно «Blind Data» — были уже находки когда в мы сопоставляли списки образовательных учреждений на сайтах ФОИВ (пример — МВД) и данные из других систем, и они никак не бились. Или данные об отделениях полиции с сайта 112.ru и с портала госзакупок. Не бьются и пустых пятен там в избытке. Есть и другие примеры, но публиковать нет пока готовности.
Открывается точно, может быть, действительно, хабраэффект.
Это не совсем так поскольку — да, приказы есть, вот только чаще всего это приказы со справочниками на конкретную дату, а не целиком и переводить их в базу из текста приказа не проще чем собирать описанным мной способом.
Я бы дополнил этот список организационной структурой администрации муниципалитета, новостной информацией, статистикой, демографической информцией, данными ЗАГС и тд. А вообще — это хороший список для работы над открытым муниципалитетом. Правда он потребует сильного большей автоматизации их деятельности чем у них есть сейчас.
Спасибо, согласен что все массивы важные.
Это возможно уже сейчас из документов, но действительно не возможно как открытые данные. Согласен — это важно.
Данные эти есть, хотя и неудобны и разрознены — на сайт ФНС и сайте Казначейства. Минфин обещается раскрывать их на budget.gov.ru
Мы довольно много классификаторов и ссылок на системы раскрытия собрали у нас в хабе — hub.opengovdata.ru/dataset?q=&sort=relevance+asc&groups=classifiers
Их не так уж мало, плюс многие есть в больших системах раскрытия типа ФИАС, сайта закупок и тд
А что не так с форматами госзакупок? Данные есть в дампах XML — их можно преобразовывать во все что угодно. И по результатам торгов, если можно, хотелось бы подробнее.

Про закупки госкорпораций вопрос уже поднимается — есть хороший шанс что будут открывать.
Это важные данные и, на самом деле, все зависит от того насколько четко и подробно описать то что нужно и привлечь саму отрасль. Направить запрос на раскрытие данные в Совет вполне возможно и шансы на раскрытие не нулевые.
Есть вероятность что эти данные будут на budget.gov.ru — во всяком случае речь об этом заходила. С самими сайтами муниципалитетов сильно сложнее, формально они не государственная власть, заставить их публиковать данные удобным образом сложно. Нужен закон. Но усилия в эту сторону предпринимаются уже сейчас.
Налог может быть и федеральный, да только он распределяется между тремя бюджетами — федеральным, субъектовым и местным. Отсюда и борьба, например, между Московской областью и Москвой чтобы граждане платили этот налог не по месту работы, а по месту прописки.

По поводу данных — есть сайты Федерального Казначейства, там вообще ничего не надо парсить, достаточно разобраться в их данных. Есть ресурсы ФНС — там хуже с качеством данных, но они также публикуют открытые данные по ряду направлений.

Если Вы хотите их использовать — Вы можете делать это прямо сейчас.

government.ru и остальные ресурсы нужны тем кому они нужны. Вам не нужны — ок.
Разумеется лучше чтобы машиночитаемые данные давали сами госорганы — в этом направлении работа идет давно — уже около 5 ФОИВов начали их раскрывать.

Если Вы не хотите участвовать в создании открытых данных, можете подождать июля 2013 года когда должны быть раскрыты данные большинства ФОИВов.

Те кто ждать не хочет — создает базы данных.

Если Вы думаете что в других странах чиновники сами пришли к раскрытию данных — то это совсем не так. На их решение более всего повлияли проекты такие как ScraperWiki позволяющие активистам собирать данные самостоятельно.

В любом случае я не хочу Вас переубеждать — хотите лениться, ленитесь.
У ЦБ довольно много API открытых, такой сервис сделать несложно — если найдется желающий.
Есть идей много. По government.ru мы их пока не систематизировали, по kremlin.ru — есть github.com/infoculture/openkremlin/blob/master/docs/kremlin_ru_opendata.xls посмотрите по аналогии
Вы действительно все смешали. Куда идут именно Ваши налоги определить не так просто как может показаться, потому как налоги есть как те что Вы платите сами, так и те что Вы платите опосредовано через акцизы. Учитывая структуру нашей экономики быстро выяснится что большая часть налогов идет от нефти и газа, а подоходный налог идет в бюджеты, в основном, регионов.

Парсить сайт — это совсем не огромная задача, я лично их перепарсил несколько сотен и многие есть кто над этим работают. Ваш интерес в данных понятен, я пишу о том что он может быть удовлетворен разными способами, а не только открытыми данными что раскрывают сами чиновники.

Смысл в том что данные даже если не являются достоверными есть способы проверки их достоверности и скрыть, к примеру, убийство куда сложнее чем хулиганство. Достоверность проверяют, в том числе, сравнением пропорции в статистике между хулигантствами и убийствами с другими странами. Это так очень огрубленно я описываю методики которыми пользуются професссиональные исследователи. Кроме того если даже данные искаженные в случае если они недоступны, то их невозможно перепроверить. Именно по этой причине мы добиваемся открытости данных по муниципальной криминальной статистике и есть надежда что данные появятся.
Давайте обсудим:) OpenPolice.ru — это ко мне, а crimestat.ru — это к прокуратуре, мы с ними уже общаемся.
На одном только data.gov более 6 000 датасетов, в Socrata 22 000 датасетов, у французов 353 000 датасетов на data.gouv.fr
в свободном доступе.

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Date of birth
Registered
Activity

Specialization

Chief Technology Officer (CTO), Data Engineering
Lead
Python
Database
High-loaded systems
MongoDB
Git