Данная БД скорее должна использоваться как оперативная, а уже срезы, аналитика и история могут перекочёвывать в более традиционные хранилища. Вы же не делаете запросы по всем своим террабайтам данных? А если делаете то у вас скорее кластер, что для Вольта, по идее, родная среда…
Для сохранения данных на диск используется концепция снапшотов, отражающих срез данных, актуальных на момент создания снапшота
То есть возможно вы потеряете данные, но не больше, чем накопилось за время между снапшотами + снапшоты позволят оставшимся после отключения света данным быть целостными.
А по-настоящему большие БД влазят в память благодаря партицированию.
Суть архитектуры VoltDB в комбинации хранения всех данных в памяти с концепцией распределённой организации и разбиения БД по разделам (партицирование)
Здесь нет картообмена.
На данный момент все данные поступают под лицензией CC-BY-SA и трактуются креативной деятельностью пользователя. В OSM запрещается вносить данные из источников с закрытыми лицензиями. Более подробно можно ознакомиться c OSM лицензией.
Я и не говорил, что ездить нельзя. Просто теперь можно нормально ездить в том числе используя CloudMade.
А касательно второго пункта, не всегда нужно смотреть на то, где можно заработать — чистые карты это очень интересная задача, но всему своё время.
Кто-то, бесспорно, занимается маппингом ради удовольствия пребывания на свежем воздухе и несения полезного в свет, а вот другим нужно показать хоть капельку профита. Таким профитом может быть сервис геокодинга (поиск по адресу), навигация, карты для «твоего» GPS в удобном для тебя стиле и только с нужными маршрутами…
Показав человеку, что все его действия уже через час/день/неделю появятся на удобном сервисе, которым он хотел бы пользоваться, пусть и изредка, его можно привлечь как очень активного участника.
У меня описанный вариант треккинга вызывает симпатию, т.к. я долгое время работал с прокси, через прокси и с учетом прокси, локальный дебаг под ВПН и т.д.
Такой код позволяет НЕ задерживать загрузку страницы, если прокси/настройки сети не разрешают доступ для Google Analytics в данный момент.
Накапливаю в память, как и говорил, с последующим дампом по окончании процедуры препроцессинга.
Как это ни странно, но архив один (да-да, бывает такое в наше время), и разделять его не желательно из-за зависимости данных, как я и писал. Парсинг SAX'ом. После успешного дампа, на готовых данных поднимаются инстансы веб-серверов.
Какой этот? Я описываю только импорт и препроцессинг — да они занимают более 5ти часов.
То есть возможно вы потеряете данные, но не больше, чем накопилось за время между снапшотами + снапшоты позволят оставшимся после отключения света данным быть целостными.
А по-настоящему большие БД влазят в память благодаря партицированию.
На данный момент все данные поступают под лицензией CC-BY-SA и трактуются креативной деятельностью пользователя. В OSM запрещается вносить данные из источников с закрытыми лицензиями. Более подробно можно ознакомиться c OSM лицензией.
А касательно второго пункта, не всегда нужно смотреть на то, где можно заработать — чистые карты это очень интересная задача, но всему своё время.
Неужели вбивали руками с нуля?
Я надеюсь, что через пару-тройку месяцев он покажет себя еще лучше — задумки там есть хорошие.
Кто-то, бесспорно, занимается маппингом ради удовольствия пребывания на свежем воздухе и несения полезного в свет, а вот другим нужно показать хоть капельку профита. Таким профитом может быть сервис геокодинга (поиск по адресу), навигация, карты для «твоего» GPS в удобном для тебя стиле и только с нужными маршрутами…
Показав человеку, что все его действия уже через час/день/неделю появятся на удобном сервисе, которым он хотел бы пользоваться, пусть и изредка, его можно привлечь как очень активного участника.
Редакторов много есть: есть с WEB-мордой, есть без неё (например JOSM).
Правда не совсем понял что такое:
Можешь привести пример возможных конфликтов?
Такой код позволяет НЕ задерживать загрузку страницы, если прокси/настройки сети не разрешают доступ для Google Analytics в данный момент.
Касательно сохранять данные: здесь
Касательно не всё в памяти: здесь
Как это ни странно, но архив один (да-да, бывает такое в наше время), и разделять его не желательно из-за зависимости данных, как я и писал. Парсинг SAX'ом. После успешного дампа, на готовых данных поднимаются инстансы веб-серверов.
Какой этот? Я описываю только импорт и препроцессинг — да они занимают более 5ти часов.
Про 15 Гигов boolean переменных здесь уже обсуждалось.