Не секрет что больше данных — это не означает что данные станут лучше. Чаще это происходит иначе и примеров когда данные публикуются в ужасающем виде немало.
Например, данные Рособоронзаказа о которых я писал ранее ( habrahabr.ru/company/infoculture/blog/201260 ) и где можно увидеть.
Точно также данные публикует и МВД России — это вот такой массив — mvd.ru/opendata/od1
А есть много других данных когда CSV файлы создаются на базе непригодных для анализа Excel файлов, или когда данные публикуют без описания схем, или когда публикуют невалидные XML файлы и многое другое.
Чтобы собрать все такие случаи коллеги из Open Knowledge Foundation начали собирать все примеры.
Например, данные Рособоронзаказа о которых я писал ранее ( habrahabr.ru/company/infoculture/blog/201260 ) и где можно увидеть.
Точно также данные публикует и МВД России — это вот такой массив — mvd.ru/opendata/od1
А есть много других данных когда CSV файлы создаются на базе непригодных для анализа Excel файлов, или когда данные публикуют без описания схем, или когда публикуют невалидные XML файлы и многое другое.
Чтобы собрать все такие случаи коллеги из Open Knowledge Foundation начали собирать все примеры.