
Комментарии 11
Интересно, эти методы обезличивания будут комбинироваться, потому что при единоличном использовании они почти бесполезны:
метод введения идентификаторов — замена части сведений идентификаторами с созданием «таблицы соответствия исходным данным»;
Если злоумышленник получит доступ к таблицк соответствия, данные легко восстановить. Требуется защита таблицы соответствия. Если идентификаторы генерируются по простому алгоритму, их можно подобрать. Учитывая кучу баз с утечками, эти данные можно использовать для сопоставления.
изменение состава или семантики данных, в том числе путем удаления части сведений;
Тут нужно очень глубоко прорабатывать комбинации - сложно определить, какие поля безопасно удалять . Например, оставшиеся данные (например, возраст + город) могут идентифицировать человека. Можно восстановить кросс-анализом с существующими утечками, использование уникальных комбинаций оставшихся признаков.
метод декомпозиции — разбиение массива персональных данных на несколько частей и раздельное их хранение;
Разделение данных требует дополнительной инфраструктуры (у нас есть что-то кроме Ростелекома для таких масштабов?) на уровне даже юр. лиц. Отсюда зранить это будет очень догоро (может быть всё таки обойдёмся без "озера" :) Ну и если будут инсайдеры, то по общим ключам (это же надо для использования как-то смотреть) можно будет всё восстановить.
метод перестановки отдельных записей, групп записей в массиве персональных данных;
Перестановка не меняет сами данные, только их порядок и зная алгоритм перестановки всё легко восстанавливается. Можно аналищировать паттерны, т.к. структура не меняется.
метод преобразования — агрегация данных через их обобщение — например, по качественным значениям.
Комбинация обобщенных признаков (пол + город + диапазон зарплаты) может быть уникальной. И зачем такое делать, если, как я понял из статьи, эти данные требуются детальные.
Утечка из озера.... В этом даже что-то есть.
«озера данных»
Они так стебутся? У слова "озеро" в контексте разговоров о российской власти есть довольно широко известная ассоциация.
"Хочу всё знать!"
Представители Минцифры говорят, что обезличенная информация пригодится для обучения ИИ, изучения ситуации в различных областях — от социальной сферы до экологической и безопасности граждан.
Государство сможет принимать «более эффективные решения» благодаря обезличенным данным, резюмируют в Минцифры.
Анекдот №369728
Однажды в телевизоре появился бледный как смерть Министр Финансов и заявил:
- Финансовый кризис нас не затронет. Потому что. Я вам точно говорю.
Население, знающее толк в заявлениях официальных лиц, выматерилось негромко и отправилось закупать соль, спички и сахар.
На следующий день в телевизоре появился смущенный донельзя Министр Торговли и сказал:
- Запасы хлеба и товаров первой необходимости позволяют нам с гордостью утверждать, что голод и товарный дефицит нам не грозит. Вот вам цифры.
- Ох! – сказало население и докупило еще муку и крупы.
Министр Сельского Хозяйства для убедительности сплясал на трибуне и сказал радостно:
- Невиданный урожай! Надежды на экспорт! Возрождаемся! Закрома трещат!
- Во даже как! – ужаснулось население и побежало конвертировать сбережения в иностранную валюту.
- Цены на недвижимость упадут! Каждому студенту по пентхаузу! В ближайшем будущем! – не поморщившись, выпалил Министр Строительства.
- Да что ж такое, а? – взвыло население и побежало покупать керосин, керосиновые лампы, дрова и уголь.
- Современная армия на контрактной основе. Уже завтра. И гранаты новой системы. В мире таких еще нет. – солидно сказал Министр Обороны. – Ну а чего нам? Денег же – тьма тьмущая. Резервы, запасы и вообще профицит.
- Мама!... -пискнуло население и начало копать землянки.
- Все о-фи-ген-но! Вы понимаете?! О-ФИ-ГЕН-НО!!! – внушал Президент. – Мы уже сегодня могли бы построить коммунизм. Единственное что нас останавливает – нам всем станет нефиг делать. Потому можете спать спокойно! Стабильнее не бывает! Пенсионеры покупают икру ведрами! Предвижу качественный скачок, рывок и прыжок. А количественный – вообще бег! Семимильными шагами к достатку и процветанию. Карибы становятся ближе. Отсель грозить мы будем миру. По сто тридцать центнеров роз с каждой клумбы. Надои будем вообще сокращать. Коровы не могут таскать вымя. Население возмущено дешевизной. Южная Америка просится в состав нас на правах совхоза. Ура!
- Да что ж вы там такое готовите, звери?! – закричало население и на всякий случай переоделось во все чистое ...
Да какие уж тут «более эффективные решения», до сих пор носишь справки из одного окошка в другое. Текущие данные не могут применить хоть сколько то с пользой, а грабастуют ещё больше.
В Минцифры утвердили правила работы по обезличиванию персональных данных для госсистемы «озера данных»