Обновить

В Минцифры утвердили правила работы по обезличиванию персональных данных для госсистемы «озера данных»

Время на прочтение2 мин
Охват и читатели3.4K
Всего голосов 5: ↑5 и ↓0+9
Комментарии11

Комментарии 11

Интересно, эти методы обезличивания будут комбинироваться, потому что при единоличном использовании они почти бесполезны:

  • метод введения идентификаторов — замена части сведений идентификаторами с созданием «таблицы соответствия исходным данным»;

Если злоумышленник получит доступ к таблицк соответствия, данные легко восстановить. Требуется защита таблицы соответствия. Если идентификаторы генерируются по простому алгоритму, их можно подобрать. Учитывая кучу баз с утечками, эти данные можно использовать для сопоставления.

  • изменение состава или семантики данных, в том числе путем удаления части сведений;

Тут нужно очень глубоко прорабатывать комбинации - сложно определить, какие поля безопасно удалять . Например, оставшиеся данные (например, возраст + город) могут идентифицировать человека. Можно восстановить кросс-анализом с существующими утечками, использование уникальных комбинаций оставшихся признаков.

  • метод декомпозиции — разбиение массива персональных данных на несколько частей и раздельное их хранение;

Разделение данных требует дополнительной инфраструктуры (у нас есть что-то кроме Ростелекома для таких масштабов?) на уровне даже юр. лиц. Отсюда зранить это будет очень догоро (может быть всё таки обойдёмся без "озера" :) Ну и если будут инсайдеры, то по общим ключам (это же надо для использования как-то смотреть) можно будет всё восстановить.

  • метод перестановки отдельных записей, групп записей в массиве персональных данных;

Перестановка не меняет сами данные, только их порядок и зная алгоритм перестановки всё легко восстанавливается. Можно аналищировать паттерны, т.к. структура не меняется.

  • метод преобразования — агрегация данных через их обобщение — например, по качественным значениям.

Комбинация обобщенных признаков (пол + город + диапазон зарплаты) может быть уникальной. И зачем такое делать, если, как я понял из статьи, эти данные требуются детальные.

Утечка из озера.... В этом даже что-то есть.

Из Байкала вытекает одна единственная река, Ангара. Из Ладоги тоже одна - Нева, и та и другая с очень мощным течением.... про что это я? про гидрологию конечно)

Ещё издалека течёт река Волга :)

Эта наоборот, не из а в озеро течёт, Каспийское море, это, формально, бессточное озеро ))

«озера данных»

Они так стебутся? У слова "озеро" в контексте разговоров о российской власти есть довольно широко известная ассоциация.

Data Lake - это устоявшийся термин в мире больших данных

Спасибо за пояснение, не знал.

"Хочу всё знать!"

Представители Минцифры говорят, что обезличенная информация пригодится для обучения ИИ, изучения ситуации в различных областях — от социальной сферы до экологической и безопасности граждан.

Государство сможет принимать «более эффективные решения» благодаря обезличенным данным, резюмируют в Минцифры.

Анекдот №369728

Однажды в телевизоре появился бледный как смерть Министр Финансов и заявил:

- Финансовый кризис нас не затронет. Потому что. Я вам точно говорю.

Население, знающее толк в заявлениях официальных лиц, выматерилось негромко и отправилось закупать соль, спички и сахар.

На следующий день в телевизоре появился смущенный донельзя Министр Торговли и сказал:

- Запасы хлеба и товаров первой необходимости позволяют нам с гордостью утверждать, что голод и товарный дефицит нам не грозит. Вот вам цифры.

- Ох! – сказало население и докупило еще муку и крупы.

Министр Сельского Хозяйства для убедительности сплясал на трибуне и сказал радостно:

- Невиданный урожай! Надежды на экспорт! Возрождаемся! Закрома трещат!

- Во даже как! – ужаснулось население и побежало конвертировать сбережения в иностранную валюту.

- Цены на недвижимость упадут! Каждому студенту по пентхаузу! В ближайшем будущем! – не поморщившись, выпалил Министр Строительства.

- Да что ж такое, а? – взвыло население и побежало покупать керосин, керосиновые лампы, дрова и уголь.

- Современная армия на контрактной основе. Уже завтра. И гранаты новой системы. В мире таких еще нет. – солидно сказал Министр Обороны. – Ну а чего нам? Денег же – тьма тьмущая. Резервы, запасы и вообще профицит.

- Мама!... -пискнуло население и начало копать землянки.

- Все о-фи-ген-но! Вы понимаете?! О-ФИ-ГЕН-НО!!! – внушал Президент. – Мы уже сегодня могли бы построить коммунизм. Единственное что нас останавливает – нам всем станет нефиг делать. Потому можете спать спокойно! Стабильнее не бывает! Пенсионеры покупают икру ведрами! Предвижу качественный скачок, рывок и прыжок. А количественный – вообще бег! Семимильными шагами к достатку и процветанию. Карибы становятся ближе. Отсель грозить мы будем миру. По сто тридцать центнеров роз с каждой клумбы. Надои будем вообще сокращать. Коровы не могут таскать вымя. Население возмущено дешевизной. Южная Америка просится в состав нас на правах совхоза. Ура!

- Да что ж вы там такое готовите, звери?! – закричало население и на всякий случай переоделось во все чистое ...

Да какие уж тут «более эффективные решения», до сих пор носишь справки из одного окошка в другое. Текущие данные не могут применить хоть сколько то с пользой, а грабастуют ещё больше.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости