Комментарии 27
Заходите в чатик OpenDataRussiaChat поделиться своей болью. Может и подскажут чего, и помогут контакт наладить.
То, что я писал выше — про Россию. Но фундаментальное деление на «хорошие» и «плохие» данные — не по национальному или государственному признаку (хотя, безусловно, корреляция есть).
Хорошие данные — там, где те, кто их публикует, их действительно используют сами, и где их собственное благополучие от этих данных зависит (не обязательно в смысле «работы под страхом увольнения», например). Такие данные почти никогда не бывают идеальными, просто потому что «идеальные данные» — это вообще очень сложно и дорого.
Плохие данные — там, где единственный или почти единственный сценарий использования этих данных теми, кто их публикует — показуха или обязаловка, которая делается только потому, что их к этому принуждает закон. И вот с этим почти ничего поделать нельзя, потому что этот процесс не имеет надежной обратной связи и является «несходящимся». Можно жаловаться на ошибки, грозить, бомбардировать письмами. Сегодня — исправят (потому что механизм жалоб отслеживается), а завтра всё опять сломается, потому что система генерации таких данных, как правило, безграмотно построена.
Во втором случае, конечно, тоже можно выжать какие-то крупицы полезной информации но стоит ли это вообще усилий — вопрос всегда открытый, потому что собрать те же самые данные самостоятельно может оказаться эффективнее, чем тратить время на общение с теми, кто в повышении качества совершенно не заинтересован.
Возвращаясь к исходному вопросу, в России данные второго рода, созданные в порядке обязаловки, встречаются если не везде, то почти везде. Европа — понятие широкое, я работал только с французскими и норвежскими, норвежские были очень практические, французские были разные. В США все, вероятно, также сильно зависит от конкретных штатов и графств, но то, что мне встречалось, было или достаточно качественным, или основная доля ошибок носила характер устаревших данных, не учитывающих свежие изменения, но не характер мусора и бреда. Что логично, потому что кто создает данные, тот их и использует, но на обновление деньги есть не всегда.
Да ну, это довольно очевидный вывод для любого, кто имел дело с бюрократией и не болеет идеей "всё люди — добрые и хорошие".
Для тех, кто использует данные, они — инструмент. Если инструмент совсем плох, работать им почти невозможно. Так что надо быть совсем уж жутким имитатором деятельности, чтобы иметь дело с таким инструментом. А если данные — не инструмент, а продукт (как в случае российской обязаловки), наплевать на посторонних, которые может и никогда этим продуктом не воспользуются — куда легче, нужно меньше наглости.
Почему эти данные — не инструмент для российских гос.организаций? Потому что их регламенты и методы работы — из прошлого века, и в изменении этого никто не заинтересован. Это видно по всем этим ЕИРЦ, Госуслугам, госархивам — даже когда они обязаны делать что-то в электронном виде, все эти процессы оказываются просто электронной копией бумажного процесса.
Вот и выходит, что тот или иной слой открытых данных — это геокодированный через Яндекс лист Excel, который обновляется из бумажной учётной книги, которая и является, на самом деле, инструментом для банды тёток, вечно пьющих чай и работающих три дня в неделю.
Удручает только что в очередной раз не были освещены люди которые этим занимались непосредственно с технической стороны. Сколько их, сколько им платят пока они пытаются сдвинуть загибающееся от бюрократии государство в сторону технического прогресса.
Елена Балашова: «Активисты подняли вопрос о том, чтобы данные нашего ГИС-портала были открыты для OpenStreetMap»