ibegtin Apr 12 2011 at 15:40

Информационное общество и повторное использование информации

2 min

1.6K

Open data*

+40

Comments 15

bezumkin Apr 12 2011 at 17:19

Только начал читать, а топик закончился.

ibegtin Apr 12 2011 at 17:20

На хабре он первый из многих по теме открытых данных. Я непрерывно пишу на эту тему в своем личном блоге, там больше текстов и тем.

bezumkin Apr 12 2011 at 17:26

Спасибо за информацию, конечно, но как по мне, так или более развернутый топик, или топик ссылка на блог.
А то смысл можно уложить в 3 предложения:
«Информацию можно использовать повторно, это клево. У них ее широко повторно используют, а у нас пока нет. Надо стараться.»

legato_di Apr 12 2011 at 17:41

Как я понял, есть различные гос. субъекты (муниципалитеты, города, области, регионы). У каждого субъекта есть какая-то статистика, часть в цифровом виде. Суть открытых данных – это предоставление API с веб-порталов этих субъектов с целью их последующей агрегации и использования для построения различных графиков, выявлений тенденций и пр.

Я правильно понял?
Это хорошо, но смысл? Есть расхожее выражение «есть правда, ложь и статистика». Как осуществлять контроль достоверности информации?

ibegtin Apr 12 2011 at 18:35

Это не совсем так, открытые данные — это не только API и совсем необязательно статистика.

В основном, открытые данные в мире — это большие массивы доступные для выгрузки. Например, данные по госконтрактам в Великобритании, или дампы Википедии — это тоже открытые данные. Их можно скачать, проанализировать и представить в форме отличной от той в которой её представляют те кто их публиковал.

Соответственно для разных данных и нужны разные правила проверки достоверности. Если это статистика, то здесь неважно — открытые данные или это графики непригодные для автоматизированной обработки, в любом случае проверять их мы можем только сопоставляя с другими данными и источниками. В этом смысле машиночитаемая статистика даже удобнее для проверки.

А вот в случаях данных, к примеру, со списками конгрессменов или актуальными законопроектами, открытые данные являются лишь более удобной формой представления той информации что и так публикуется. Но за счет этой более удобной формы мы можем представлять эту информацию на других платформах, интегрировать с другими массивами информации и так далее.

legato_di Apr 12 2011 at 18:48

Понятно, спасибо.

И раз уже такое дело. В ближайшем будущем предстоит создание сайта и далее постепенная автоматизация процессов в одном муниципалитете. Там по большей части инфа типа: кто в муниципалитете, кто в муниципальном собрании, какие постановления утвердили, какие рассматриваются, какие мероприятия (досуг) и где планируются, какие прошли и пр.

Как к такой информации можно приложить описанный вами принцип? Про API понятно, но кому «сбагривать» эту информацию? Кому это может быть полезно?

ibegtin Apr 12 2011 at 18:57

Это может быть полезно, в первую очередь местным разработчикам, и во вторую остальным гражданам.
В зависимости от того какие это данные они могут быть по разному представлены. Например, раскрывая список мероприятий в виде виде календарных данных будет возможность гражданам добавлять их в календари типа Google Docs.

Раскрывая данные по местным депутатам и законам, можно вплоть до того что делать приложения для айфонов и андроидов.

Но самое полезное было бы даже не придумывать самостоятельно, а предоставить данные и провести конкурс на их общественно-полезное использование. Пусть десятки и сотни других людей думают как на их основе сделать нечто нужное. Это срабатывает во многих странах и регионах, может принести пользу и у нас.

legato_di Apr 12 2011 at 19:18

Спасибо за ответы. При проектировании обязательно учту возможность открытия информации.

owniumo Apr 13 2011 at 07:44

Читал об этом в Think Quarterly.

gislab Apr 13 2011 at 11:05

нас мало, но мы в тельняшках! :)

rPman Apr 13 2011 at 15:12

Слишком абстрактно. Если я правильно понял то…

Замечательный пример публичных данных, которые должны собираться (стекаются из кучи мест, должны быть доступны в одном, и опять таки всем):
* база данных адресов, история изменений (к сожалению этого в КЛАДРе мало, но он — замечательный пример)
* база данных организаций (сейчас за доступ к этим данным, как я понимаю, придется покупать у государства за 100к рубликов, особенно если нужны регулярные обновления)
* патенты, товарные знаки,…
* информация о лицензировании, сертификации,…

Сейчас, чтобы достать эту информацию и что либо в ней найти, нужно 'сожрать очень много соли'… где то так. Речь в статье ведется об этом?

ibegtin Apr 13 2011 at 15:15

Речь идёт об этих и многих других данных, а также о том как они должны публиковаться чтобы ими было удобно пользоваться.
Дело не в том что одно место куда всё собирается, а в том что данные размещаются в форматах вроде XML, CSV, DBF и так далее, с возможностью их автоматической обработки.

ComodoHacker Apr 13 2011 at 17:36

Примеры таких данных есть. Уже упомянутый КЛАДР, информация о законопроектах в Думе, данные по судебной практике, данные на сайте Росстата. Есть и примеры их повторного использования. Несправедливо не упомянуть о них в топике.

Что касается всяческих удобств — форматов, API, отслеживания изменений, контроля достоверности и пр. — да, можно и нужно улучшать, полностью поддерживаю.

n3o Apr 14 2011 at 11:32

Вчера на конференции «Государство в ХХI веке» активно рассказывали про сайт data-gov.ru который афишируется авторами, как «сделанный по европейским стандартам» портал.

В данный момент ресурс не работает, оценить качество и наполнение не удалось. Насколько я понимаю — он также как и все остальные разработки исходит от частного лица.

Жаль, что нет ничего «единого» и государственного, как в других странах.

ibegtin Apr 14 2011 at 12:52

Домен data-gov.ru мы резервировали, но пока не активировали. Сайт находится по адресу www.datagov.ru

Я тоже надеюсь на «единое» и государственное, а пока делаем своими силами.