Как стать автором
Обновить

Комментарии 37

MyDataSpace – это сервис публикации данных. Любой может опубликовать данные и любой же может получить доступ к ним через веб-интерфейс или API.

Допустим, «любой может опубликовать данные». У меня сразу возникают вопросы, на которые в статье не дано ответов:
  • На каких условиях (за деньги/бесплатно)?
  • Если за деньги, то сколько это стоит и чем это лучше покупки своего/своих VPS?
  • Если бесплатно, то какие гарантии сохранности данных?
Бесплатно. О монетизации ещё не думал. Задумка — GitHub для данных.
Соответственно второй вопрос: «какие гарантии сохранности данных?»
Ну и сразу вытекает третий, более технический и ближе к тематике «хабра» — «как будете от меня защищаться, если я начну Вам свои зашифрованные бакапы выкладывать?»)
Сохранности с технической точки зрения (репликация, бекапы) или какие гарантии того что завтра сервис не перестанет существовать?

Скорость заливки достаточно низкая, размер поля ограничен) Пока такого не было, но думаю будет что-то типа модерации.
Сохранности с технической точки зрения (репликация, бекапы) или какие гарантии того что завтра сервис не перестанет существовать?
Хотя бы с технической — мы же на «хабре» :)
Допустим, кто-то на самом деле хочет поделиться какими-то своими данными. Если он отдаёт эти данные стороннему сервису для распространения, и не уверен в его надёжности, то он будет вынужден хранить эти данные и у себя. А если он и так хранит эти данные у себя, то почему бы и не отдавать их всем желающим самостоятельно? (Лично я вижу две причины: во-первых, отдав данные внешнему сервису, можно переложить часть проблем, например ограничения трафика, ширины канала, защиты от DDOS и прочих атак на этот сервис, а во-вторых, если этот внешний сервис «раскручен», то пользователи эти данные с большей вероятностью будут искать там, а не на малоизвестном сайте этого человека).

Пока такого не было, но думаю будет что-то типа модерации.
Как это защитит от стеганографии? ;)

PS. Если что, я не пытаюсь «очернить» идею. Идея — хорошая. Но вопросы по реализации есть.
Сейчас данные которые есть, загружены мной, по-этому бекапа базы вполне хватает)
Сервис распределенный, хостится в Public Cloud OVH и Scaleway. Репликация MySQL и бекапы.

Ваше видение причин использования сервиса совпадает с моим:) Содержать свой сервер который не приностит денег (хотя бы в перспективе), сомнительная идея.

Не вижу ничего плохого в стеганографии :-) Пусть хранится)
Меня вот тоже волнует сохранность: с экономико-социально-политической точки зрения :) Где гарантия, что:

1. сервис будет существовать достаточно долго? Это про то, кто оплачивает банкет. Ресурсы и время не бесплатны в нашем мире. А ещё и вообще про желание его поддерживать.

2. сервис не перестанет предоставлять данные по желанию администрации? Но вопрос, скорее, риторический :)

3. сервис не прикроют (не заблокируют) из-за того, что кто-то залил противоправный контент? (пока не будем определять юрисдикцию)

4. не захлебнётся со временем от наплыва пользователей? Перекликается с п.1.
1) На данный момент нельзя сказать как долго будет существовать сервис. Пока он интересен, об будет работать. Но в любом случае данные не пропадут. В случае остановки работы бекапы данных и исходный код проекта будут доступны.
3) Противоправный контент будет удален
4) Наплыв пользователей, это то, чего хотелось бы добиться)
1. Это радует :)

3. Весь вопрос в том, как быстро? Не окажется ли слишком поздно? Это, наверное, к вопросу о модераторах и подобных им людях. А также о технологиях автоматической фильтрации/обнаружения.

4. Не пожалели бы ;)
3) Противоправный контент будет удален

А адалт разрешен? :)
Если это законно)

Приветствую, коллега. Делаю "в гараже" похожий проект. Удивительно насколько совпадают решения)


Каким образом реализовано версионирование? Есть совместное редактирование CRDT или CoachDB/PouchDB?

Версионирование простое, ручное) т.е. пользователь вручную создает новую версию и заливает данные.
Нет, совместного редактирования нет.
А где-то можно посмотреть на ваш проект?

В течение месяца опубликую.

Не планируется свою реализацию выложить на github?
Возможно. Раскпутка Open Source проекта не проще чем проприетарного. А мативации меньше. Не охото чтоб он лежал никому ненужный с 5 лайками.

Если подтянуть UI, то можно собрать достаточную аудиторию для привлечения финансирования на Product Hunt и т.п.

… Надежный доступ к данных…
Последнее слово исправьте )
Присоединяюсь к предыдущим ораторам по вопросу контроля содержания данных. В случае, если данных будет много, ваши ресурсы могут в итоге полностью уйти на выявление и удаление «противоправного контента». В идеальном интернете ничего такого не надо, а в реальном, на базе ваше проекта начнут клепать приложения с телефонами борделей Москвы и прочее такое. И пока вы будете в очередной раз чистить базу, вас уже торжественно внесут в зал славы имени Роскомнадзора…
Я это всё к тому, что заранее продумать подобные вопросы не менее важно, чем запилить движок базы. Потому что речь не про фабричную линию по выпуску галош, а про нечто, что будет напрямую соприкасаться с большим количеством людей.
Думаю, что тут нужна масштабируемая система контроля к доступу «на запись». Приглашения, рекомендации, совет модераторов, или что-то подобное, что позволит существовать системе в случае внезапного роста популярности.
P.S. Ещё интересная мысль в голову пришла. Вы думали, как защититься от ситуации, когда плодами вашего (и единомышленников) труда по структурированию информации начнут пользоваться наши госструктуры, на халяву получая готовый продукт, за который им будут немалые деньги из бюджета платить?
Думаю, что тут нужна масштабируемая система контроля к доступу «на запись».

Будем решать проблемы по мере их поступления :)

Вы думали, как защититься от ситуации, когда плодами вашего (и единомышленников) труда по структурированию информации начнут пользоваться наши госструктуры, на халяву получая готовый продукт, за который им будут немалые деньги из бюджета платить?

Для каждого набора данных можно указать лицензию (Public Domain, Creative Commons,… или свою). Если лицензия позволяет пользоваться, пусть пользуются, на то они и открытые данные.
Да это же круто! Спасибо огромное, успехов!
удалите 3 основных бага которые раздражают:
— периодически меняется язык, сделайте привязку к одному источнику временных настроек
— при нажатии поиск сверху выпадающую ерунду никак не закрыт и приходится перезагружать страницу
— сделайте простой приход в 1-2 клика для перехода из личного кабинета в публичный кабинет

и, в идеале, дополнительные доки всех фишечек, а то я у меня лыжи все не едут :(
Спасибо, исправим в ближайшее время.
а так идея хорошая, буду пользоваться, когда выйдет из тестирования)
А что с производительностью?
Сервис хорошо масштабирувется. Если будет высокая нагрузка, просто добавим ресурсов.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Не смог импортировать простенькую таблицу из Excel, я что-то не так делаю?
Importing Data
image
image

Причем таблица просматривается нормально, до момента самого импорта.
Похоже на баг с кодировкий. А могли бы вы прилать ссылку на файл?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории