С конца нулевых в ИТ-кругах ведутся разговоры о так называемых социально ориентированных облачных хранилищах, призванных усилить контроль пользователей над своими данными. Мы в Beeline Cloud решили взглянуть на «альтернативные модели управления данными» — например, как выглядит профсоюз владельцев данных и для чего он нужен — и обсудить, почему такие форматы (пока еще) не получили широкого распространения.

Пользователям — пользовательские данные!
Еще в 2009 году отец Всемирной паутины Тим Бернерс-Ли представил концепцию «социально ориентированного облачного хранилища». Идея новой архитектуры заключалась в том, чтобы предоставить пользователям возможность держать персональные данные в собственных хранилищах, а не на серверах сторонних компаний. Приложения должны были получать доступ к этим хранилищам с помощью открытых протоколов, снижая риски монополизации данных. Позже идея получила развитие и была реализована в виде децентрализованной сети — Solid. Проект предполагал запуск единой среды управления данными, где пользователи могли бы самостоятельно решать, какую информацию, кому и на каких условиях предоставлять.
Очевидно, что вопросы конфиденциальности данных интересовали не только Бернерса-Ли. В том же 2009 году команда браузера Opera представила проект Unite. Это расширение, которое превращало пользовательский компьютер в персональный веб-сервер. С его помощью можно было предоставлять доступ к файлам и папкам друзьям и знакомым напрямую, минуя сторонние сервисы. Однако проекту так и не удалось обрести широкую аудиторию и закрепиться на рынке — его свернули в 2012 году.
Похожая судьба постигла и Solid — он не стал массовым, хотя, в отличие от проекта Opera, к технологии продолжают проявлять интерес различные исследовательские институты, некоммерческие и государственные организации. Например, в Бельгии на основе Solid развивают цифровое решение, которое должно заменить бумажные академические справки. С его помощью студенты могут делиться своими данными об образовании и сроках обучения с потенциальными работодателями, кадровыми агентствами, а также социальными организациями с целью получения льгот и привилегий.
В городе-графстве Большой Манчестер технология Solid легла в основу медицинской платформы, пользователи которой сами решают, кому предоставлять доступ к их информации о здоровье. Ее называют «цифровым трубопроводом», который необходим для запуска единого хранилища медицинских данных для всех жителей региона.
При этом развиваются и другие модели, призванные сформировать прозрачные структуры управления данными. Далее расскажем о некоторых из них.
Кооперативы, профсоюзы и общины
Кооперативы данных. Это — добровольное объединение интернет-пользователей, которое создается для совместного управления или монетизации их данных. Решения в таких организациях принимаются демократическим путем по схеме «один участник — один голос». Примером реализации такой модели может служить швейцарский кооператив MIDATA. Это — платформа для управления медицинскими данными, которую в 2015 году запустил профессор кафедры биологии Швейцарской высшей технологической школы Эрнст Хафен совместно с коллегами. Пользователи — например, пациенты клиник — могут по желанию делиться анонимизированной мед. информацией, которая затем применяется в научных исследованиях.
Структура управления данного кооператива включает четыре органа: общее собрание, административный совет, управление аудита и комитет по этике. Общее собрание является высшим органом — именно оно путем голосования назначает представителей других структур и может вносить изменения в правила и устав кооператива. Административный совет отвечает за операционную деятельность, независимый ревизионный орган контролирует соблюдение законодательства, а комитет по этике оценивает проекты, запрашивающие доступ к данным.
Помимо медицины, подобные кооперативы существуют в сферах лесного и сельского хозяйства. Так, в 2017 году в Нидерландах появилась платформа JoinData, объединяющая фермеров. Участники видят, какие компании получают доступ к их данным — будь то производители кормов или поставщики сельскохозяйственной техники — и могут при необходимости отзывать разрешения. При этом организации, использующие данные фермеров, платят комиссию за доступ к базе, финансируя работу платформы.
Общины данных. В отличие от кооперативов, которые формируются и управляются пользователями, так называемые «общины данных» обычно создают крупные организации — исследовательские институты, банки, государственные структуры и не только. По сути, это открытые хранилища для широкой общественности, которые обеспечивают совместный доступ к экономическим, научным, социальным и другим данным.
Примером реализации такой модели может служить платформа Environmental Data Commons, которую финансирует Национальный научный фонд США. Здесь собраны различные наборы информации для научных исследований. Например, данные о погоде, атмосфере и солнечной активности, поступающие с геостационарного спутника GOES-R или метеорологических радиолокационных станций NEXRAD. Доступ к данным открыт для всех желающих, однако предоставляется по мере возможностей, поскольку необходимую облачную инфраструктуру поддерживает специализированный консорциум на общественных началах.
Еще один пример общины данных — проект Data Commons, запущенный Google в 2018 году. Там собраны данные по экономике, демографии, образовании, здравоохранении, экологии и не только. По сути, компания агрегировала публичную информацию из множества источников — государственных организаций и НКО — очистила, нормализовала и структурировала ее, чтобы упростить дальнейшую работу. Платформа предоставляет доступ широкому кругу пользователей: студентам, аналитикам, журналистам, некоммерческим организациям, государственным структурам и даже бизнесу.
Последнее время такие «общины» востребованы среди разработчиков систем ИИ, для которых они становятся важным источником данных для обучения моделей — особенно учитывая, что платформа Data Commons позволяет формировать кастомные «общины». В них открытые данные можно дополнить собственными и использовать в решении специфических задач. Причем пользователи имеют полный контроль над такими персонализированными корпусами — можно предоставить доступ выборочно или открыть их для широкой публики.
Разумеется, Google не единственная компания, развивающая подобные инициативы. С 2023 года Microsoft совместно с американской исследовательской лабораторией The GovLab разрабатывают фреймворк, который позволит создавать «общины данных» внутри компаний, университетов, библиотек или исследовательских центров. Проект предлагает методические рекомендации, ресурсы и даже чек-листы, которые можно использовать при разработке таких систем. Основная цель — упростить запуск общин данных, пригодных для разработки социально значимых решений, в том числе на базе генеративных систем ИИ.
Профсоюзы данных. Они представляют собой структуру, участники которой стремятся извлечь максимальную выгоду от передачи ПД третьей стороне. Так, если какая-либо компания желает получить доступ к данным, она должна согласовать условия с профсоюзом. По сути, структура во многом имитирует традиционные профсоюзы, когда сотрудники коллективно договариваются с работодателями об условиях труда и повышении заработной платы.

Существует несколько подходов к организации таких объединений. Один из них — по географическому принципу: профсоюзы могут формироваться на уровне страны, региона, города или даже отдельного района. Альтернативный подход — запуск профсоюзов на основе политик работы с данными. В этом случае пользователи могут выбирать объединение в зависимости от его правил, чтобы передавать ПД на условиях, которые в наибольшей степени соответствуют их моральным ценностям и представлениям о приватности. Уже существуют проекты, которые реализуют идею профсоюзов данных — и, как правило, это Web3-приложения, построенные на основе блокчейн-технологий.
Что мешает развитию кооперативов
В январе 2025 года некоммерческие исследовательские организации, которые занимаются продвижением децентрализованных систем, провели серию интервью с участниками кооперативов данных, а также экономистами, профессорами, предпринимателями. Многие респонденты высказали точку зрения, что модели управления данными, подобные кооперативам и профсоюзам, все еще находятся на ранних этапах развития.
Одна из проблем, которая тормозит развитие кооперативов, — это отсутствие стандартизации. Дело в том, что участники кооперативов и профсоюзов могут предоставлять данные, которые различаются по структуре, формату и качеству. В результате организациям приходится тратить ресурсы на очистку, нормализацию и согласование данных. Другая проблема — масштабируемость инфраструктуры. С увеличением числа участников растут и объемы собираемых данных, что ведет к необходимости расширять инфраструктуру — в частности, наращивать мощность серверов для обработки и хранения данных. Однако демократическая модель управления кооперативами тормозит принятие решений о финансировании.
Наконец, нерешенные вопросы есть и с точки зрения законодательства. Во многих странах до сих пор отсутствуют четкие юридические определения кооперативов и профсоюзов данных. Эксперты считают, что решить эту проблему можно только комплексно: необходимо сформировать понятные правовые рамки, разработать надежные системы управления данными — включая стандарты их сбора, хранения и защиты от утечек. Только после этого можно будет говорить о массовом распространении социально ориентированных моделей управления данными и связанных с ними фреймворков.
Beeline Cloud — безопасный облачный провайдер. Разрабатываем облачные решения, чтобы вы предоставляли клиентам лучшие сервисы.
Что еще почитать в нашем блоге на Хабре:
