Pull to refresh
  • by relevance
  • by date
  • by rating

Creative Commons и базы данных: большой ликбез

Creative Commons *Database Administration *Open data *Research and forecasts in IT Copyright
Translation
Tutorial
Давно хотел перевести, но сейчас как раз подходящее время в связи со сменой лицензии у OpenStreetMap.

Главная потенциальная ценность данных для всего общества в целом — это то, что большее количество данных потенциально способствует расширяющемуся научному сотрудничеству и воспроизводимости, более эффективным рынкам, увеличивающейся правительственной и корпоративной прозрачности и, в целом, ускорению нахождения и понимания решений глобальных и социальных потребностей.

Большая часть потенциальной ценности данных, в частности их ценность для всего общества, реализовывается за счёт использования без организационных преград. Как это происходит (юридически)? Многие сайты дают узкое разрешение на использование данных с помощью условий предоставления услуг. Активно обмен специальными данными происходит среди исследователей. И всё чаще открытые данные освобождаются посредством распространения на публичных условиях (например, лицензий CC или передачи в общественное достояние CC0) для преодоления ограничений авторского права, которые в противном случае способны ограничить распространение или повторное использование данных.

Многие организации, учреждения и правительства используют инструменты CC для данных.

Лицензии CC используются для баз данных следующими организациями (подробнее):
Australia Federal Government, Australia Queensland State Government, ChEMBL, DBpedia, Finnish Libraries, Freebase, Geocommons, Google, Greece Government, Italian Government, MusicBrainz, Mydosis Portal, New Zealand Government, Open Directory Project (dmoz), OpenStreetMap, Powerhouse Museum, Spain (Basque) Government — Open Data Euskadi, Stack Overflow, Uniprot, United Kingdom Government.
Читать дальше →
Total votes 18: ↑16 and ↓2 +14
Views 5K
Comments 5

Версия 4.0 — черновик лицензии Creative Commons готов для общественного обсуждения

Creative Commons *Open data *Copyright
Translation
image


Мы рады разместить для общественного обсуждения первый дискуссионный черновик версии 4.0. Этот черновик является результатом расширенного (и беспрецедентного) периода сбора потребностей с участием партнёрской сети CC, сообщества и заинтересованных сторон. Спасибо всем из вас, кто потратил своё драгоценное время и энергию в стратегических дискуссиях и подготовке совещаний в поддержку этого черновика. Мы создали этот первый черновик (v4.0d1), помня о главных целях разработки, сформулированных на Глобальном Cаммите 2011:
  • Разработать набор версии 4.0, направленный на неотложные задачи важных потребителей, в том числе в тех странах, в которых не существует локализованных версий лицензий CC и может никогда не быть по всевозможным причинам;
  • Максимизировать совместимость, сокращая разнообразие лицензий и продвигая стандартизацию там, где это возможно; и
  • Долговечность и простота использования.
image
Подробнее.

Australian Broadcasting Corporation выпускает архивные кадры новостей по CC BY-SA

Кадр из "Артур Чарльз Кларк предсказывает Интернет"; предоставлено Australian Broadcasting Corporation (ABC); CC BY-SA.

CC Австралия объявила о том, что Australian Broadcasting Corporation, крупнейший общественный вещатель и новостная служба Австралии, использовала Викисклад, чтобы выпустить по CC BY-SA набор исторически значимых сюжетов телевизионных новостей.
Читать дальше →
Total votes 16: ↑13 and ↓3 +10
Views 1.1K
Comments 1

Запущен портал открытых данных правительства Москвы

Open data *
Московское правительство запустило портал открытых данных. На нем размещаются наборы данных в машиночитаемом виде (в формате CSV) для последующего использования и обработки всеми желающими.

Читать дальше →
Total votes 45: ↑42 and ↓3 +39
Views 14K
Comments 46

Конкурс мобильных приложений для города Moscow App Contest’13

Google Developers corporate blog Development for Android *Open data *
Приглашаем Android-разработчиков к участию в конкурсе городских мобильных приложений на базе Единой мобильной платформы (ЕМП) г. Москвы.

Конкурс на лучшее приложение, решающее городские задачи и делающее будни жителей мегаполиса проще и приятнее, проводится с 17 июля по 20 сентября 2013 года совместно с Департаментом информационных технологий города Москвы.

Читать дальше, если ты Android-разработчик
Total votes 24: ↑21 and ↓3 +18
Views 6.1K
Comments 4

Мобильные приложения на службе у городских властей

Sport programming *
Многие считают, что мобильное приложение — это что-то среднее между социалочкой с геолокейшеном и кнопочкой для постинга фоток еды и котиков. Конечно же, есть и профессиональный софт, но его в разы меньше по сравнению с развлекательным контентом. Но, тем не менее, мобильное приложение — это очень мощный инструмент, который может помогать в разных жизненных ситуациях. В этой статье мне бы хотелось рассказать о том, как мобильные технологии могут решать многочисленные проблемы жителей конкретных городов и регионов.

В начале хотел бы упомянуть об инициативе Open Government Data, суть которой заключается в том, чтобы правительства и локальные советы выкладывали свои данные в открытом доступе, чтоб их мог использовать любой желающий. Это необходимо для обеспечения прозрачности деятельности правительств и значительным образом увеличивает информированность граждан. На сайте datacatalogs.org можно найти список каталогов открытых данных по всему миру. По запросу Russia выдается пять результатов:

  • budget.gov.ru. Russia open budget / open spending portal
  • data.mos.ru. Moscow city administration open data portal, Russia.
  • data.openpolice.ru. Data portal for Open Police project, Russia
  • OpenGovData Russia. Catalog OpenGovData.ru is a public data catalog published by the Russian Government
  • DataGov.ru. CKAN community site, Russia

А вот по запросу Ukraine, к сожалению, 0.
Читать дальше →
Total votes 11: ↑11 and ↓0 +11
Views 8.1K
Comments 2

Ложные корреляции по открытым данным Пермского края

Functional Programming *Open data *
Sandbox
6-7 ноября 2014 года в Перми будет проведен конкурс «Открытый регион. Хакатон» по разработке приложений и сервисов на основе открытых данных Пермского края.

На сайте opendata.permkrai.ru опубликовано примерно 1400 статистических показателей по различным областям жизнедеятельности края. Что можно сделать с этими данными? Первая мысль, которая пришла мне в голову, — создать аналог сайта Spurious Correlations (ложные корреляции).

TL; DR:
Исходники: github.com/yakov-bakhmatov/odpr
Приложение: odpr.bakhmatov.ru
Итак, приступим
Total votes 20: ↑20 and ↓0 +20
Views 9.3K
Comments 12

33 млн судебных решений различных судов РФ стали открытыми данными

Open source *Open data *
image

Судебные решения арбитражных судов (14 810 402 документов), судов общей юрисдикции (9 147 074 документов) и мировых судов (9 398 347 документов) РФ. Всего документов: 33 355 823. Все решения заархивированы и разложены по папкам с названиями судов, объем архива в сжатом виде — 150Gb.
Вот и магнет-ссылка. fc9ab4d0f50184ee5b9f40feca77533a219fd4f4
Подробности
Total votes 4: ↑2 and ↓2 0
Views 4.6K
Comments 6

Прямая трансляция конференции Make Web, Not War из Монреаля — 5 февраля, пятница, в 17:00 (Москва)

Microsoft corporate blog Website development *JavaScript *HTML *
Make Web, Not War: Live from Montreal

Всем привет! Сегодня в Монреале (Канада) наши коллеги проводят конференцию "Make Web, Not War: Live from Montreal", посвященную современным веб-стандартам, открытым решениями и открытым данным.

Начало трансляции в 17:00 по Москве. Запасайтесь попкорном и присоединяйтесь к погружению в веб-технологии.

Программа конференции
Total votes 12: ↑11 and ↓1 +10
Views 2.9K
Comments 0

Финальный хакатон конкурса «BudgetApps»

«Информационная культура» corporate blog Hackathon

"


22 и 23 июля, в пятницу и субботу, в хакспейсе «Сталь» в Москве состоится хакатон в рамках конкурса для веб-разработчиков, журналистов и специалистов по инфографике «BudgetApps-2016». Для тех, кто планирует участвовать в конкурсе, это последний шанс обсудить свои проекты с экспертами и менторами.


Участники хакатона смогут разработать мобильные приложении, веб-сервисы или медиапроекты, инфографику на основе открытых государственных данных, получить рекомендации экспертов по воплощению своих идей и улучшить уже действующие проекты.


Хакатон — финальная стадия подготовки к конкурсу «BudgetApps-2016». Конкурс уже второй год подряд организует АНО «Инфокультура» при поддержке Министерства финансов РФ. Призовой фонд конкурса — 500 тысяч рублей. Его цель — поддержать коммерческие и общественные инициативы в сфере использования открытых государственных данных.


Читать дальше →
Total votes 2: ↑2 and ↓0 +2
Views 1.6K
Comments 0

Артём Геллер будет ментором финального хакатона «BudgetApps»

«Информационная культура» corporate blog Big Data *


Артём Геллер, разработчик сайта Kremlin.ru, сайтов Правительства РФ и Совета Федерации РФ, генеральный директор студии lab.AG выступит в качестве ментора проектов финального хакатона конкурса BudgetApps.

Помимо Геллера в качестве менторов выступят: Иван Бегтин, эксперт по открытым государственным данным, директор АНО «Информационная культура», аналитик Ольга Пархимович, руководитель портала «ГосЗатраты» (реализуется при поддержке КГИ), Максим Осовский, преподаватель РАНХиГС, эксперт по визуализации данных и др.

Читать дальше →
Total votes 14: ↑5 and ↓9 -4
Views 1.3K
Comments 8

Соревнование по программированию на открытых данных: Budget Sprint

«Информационная культура» corporate blog Sport programming *


Команда «Инфокультуры» в эту субботу, 13 августа, тестирует новый формат хакатона — в стиле спортивного программирования. Ждём людей, которые уверенно программируют и ловят фан от решения задач на скорость. Если вы хорошо кодите на Python, давайте соревноваться.

У нас есть 20 задач, примеры которых можно посмотреть на GitHub, предлагаем их решить в течение дня (с 10.00 до 20.00), посмотрим, кто быстрее и лучше.

Возможно, кому-то будет лень идти по ссылке, поэтому часть задач выведем сюда:

1. Визуализация расходов на закрытие Олимпиады в Сочи с помощью движка TheOpenBudget (но не просто так, а за 1 час)
2. Дашборд о состоянии финансов России за 1,5 часа.
3. База данных налоговой муниципальной статистики (за 1,5 часа, а?)
Читать дальше →
Total votes 17: ↑10 and ↓7 +3
Views 3.1K
Comments 2

Почему данные могут быть открытыми и бесплатными

Research and forecasts in IT
Цифровая экономика способствует появлению множества новых вещей, событий, технологий и моделей, которые ранее были просто немыслимы или требовали исключительных затрат.



Среди таких новшеств цифровизации, на фоне общего тренда управления потоками данных, проявился феномен «открытых данных». С ним стоит отдельно разобраться, чтобы понять все его преимущества и недостатки для дальнейшего эффективного практического применения.
Читать дальше →
Total votes 8: ↑4 and ↓4 0
Views 2.4K
Comments 3

Трансфер открытых данных

Research and forecasts in IT
Реальным и важнейшим мотивом публикации данных в свободном режиме является необходимость поиска новых решений, новых методов, моделей и технологий – новых знаний в обозначенной предметной области.



Свободное и открытое распространение данных (открытая публикация) – это частный случай системы транзакционного целевого обмена информацией между двумя субъектами при которой первый передает информацию второму в соответствии с договорённостью (контрактом).
Читать дальше →
Total votes 11: ↑9 and ↓2 +7
Views 4.1K
Comments 2

Содержание, метаданные и контекст открытых данных

Research and forecasts in IT
Результат публикации данных в свободном и бесплатном доступе напрямую зависит от их состава и качества. Чем более полными и корректными окажутся публичные данные, тем выше будет эффективность их использования и тем больше пользователей предпочтет поработать с ними.


В отношении любых передаваемых данных, особенно публичных, необходимо всегда оценивать три их ключевых аспекта: состав (содержание), описание (метаданные) и окружение (контекст).
Читать дальше →
Total votes 7: ↑7 and ↓0 +7
Views 11K
Comments 0

Показатели качества публичных данных

Research and forecasts in IT
Проблема качества данных представляет собой достаточно серьезную тему и не только в связи с их обработкой и анализом. На данных в современном цифровом мире построено множество процессов, в том числе и связанных с безопасностью. Поэтому от того, насколько качественные данные используются в государственных и коммерческих организациях зависит эффективность и результат их работы.

Рассмотрим несколько показателей, которые могли бы составить интегрированную оценку качества публичных (открытых) данных.
Читать дальше →
Total votes 16: ↑16 and ↓0 +16
Views 12K
Comments 0

Управление публичными данными: подготовка и поставка

Research and forecasts in IT
Передача данных, особенно на постоянной основе и периодически актуализируемых ставит перед поставщиками много технических, технологических, методических, управленческих и юридических вопросов. И если правовые аспекты как-то зарегулированы, технические обусловлены имеющимися ресурсами (материально-технической базой), то управленческие (экономические, маркетинговые) и в большей степени методические приводят к весьма сложным проблемам, которые приходится решать самостоятельно и не всегда успешно.

Читать дальше →
Total votes 10: ↑9 and ↓1 +8
Views 3.4K
Comments 2

Управление публичными данными: получение и использование

Research and forecasts in IT
Неоднократное использование данных из одного источника даже при незначительных изменениях их содержания, структуры и формата обуславливает необходимость решения различных инструментарных, информационных, инжиниринговых, управленческих и правовых задач.

Одинарное применение набора данных может реализовываться в «ручном» режиме. Но уже повторное и последующие обновления данных на основе тех же актуализированных наборов вынуждает рассматривать проблему автоматизации хотя бы частично. Ещё более высокий уровень задач решается в рамках системы, которая задействует множество публичных наборов данных периодически актуализируемых и от разных поставщиков.

Читать дальше →
Total votes 12: ↑12 and ↓0 +12
Views 2.9K
Comments 0

Перспективы развития публичных данных

Research and forecasts in IT
Когда защищенные цифровые данные начинают открываться и становятся доступны широкому кругу экспертов, информационное пространство обогащается и разогревается. При этом оно усилиями многих аналитиков, исследователей и экспертов структурируется по тематикам и группам, упорядочивается и выстраивается по линиям приоритетных трендов, оптимизируется и вырабатывает новые подходы, технологии и модели решения проблем.

Несомненно, что при этом количество альтернативных вариантов растет, а выбор наиболее эффективного из них усложняется.

Остановимся на некоторых интересных вопросах перспективного развития публичных данных.


Читать дальше →
Total votes 11: ↑11 and ↓0 +11
Views 2.9K
Comments 0

Открытые данные со стороны разработчика

Open data *
Sandbox
В процессе работы над мобильным приложением использующим открытые данные пришлось близко познакомиться с содержанием ряда порталов, в результате возникли предложения, как усовершенствовать «внутренний мир порталов открытых данных» в интересах разработчика.
Если Вам это интересно и у Вас уже есть опыт работы в этой области, то можете сравнить свои выводы с написанным ниже.
Читать дальше →
Total votes 10: ↑9 and ↓1 +8
Views 3.5K
Comments 2

Добыча данных в R

Data Mining *API *R *Open data *Data visualization
Этот пост — перевод трех частей серии Data acquisition in R из моего англоязычного блога. Исходная серия задумана в четырех частях, три из которых легли в основу данного поста: Использование подготовленных наборов данных; Доступ к популярным статистическим БД; Демографические данные; Демографические данные. В еще не написанной заключительной части речь пойдет об использовании пространственных данных.




R заточен под воспроизводимость результатов. Существует множество прекрасных решений, обеспечивающих сопоставимость версий системы и пакетов, помогающих применять принципы literate programming… Я же хочу показать, как можно легко и эффективно находить/скачивать/добывать данные, используя собственно R и документируя каждый шаг, что обеспечивает полную воспроизводимость всего процесса. Разумеется, я не ставлю перед собой задачи перечислить все возможные источники данных и фокусирую внимание в основном на демографических данных. Если ваши интересы лежат вне сферы статистики населения, стоит посмотреть в сторону великолепного проекта Open Data Task View.


Для иллюстрации использования каждого из источников информации я привожу пример визуализации полученных данных. Каждый пример кода задуман как самостоятельная единица — копируйте и воспроизводите. Разумеется, сперва необходимо установить требуемые пакеты. Весь код целиком лежит тут.

Читать дальше →
Total votes 21: ↑21 and ↓0 +21
Views 14K
Comments 7
1