Комментарии 7
А нельзя просто менять данные местами?
Были:
Первов Первый Первович, паспорт ААА, телефон ХХХ
Второв Второй Вторвович, паспорт БББ, телефон УУУ
Третьев Третий Третьевич, паспорт ВВВ, телефон ЗЗЗ
Стали:
Первов Первый Первович, паспорт ВВВ, телефон УУУ
Второв Второй Вторвович, паспорт ААА, телефон ЗЗЗ
Третьев Третий Третьевич, паспорт БББ, телефон ХХХ
Или по нынешним долбанутым законам сам по себе номер паспорта и номер телефона (без привязки к чему-либо реальному) - это уже ПД?
Можно :)
Существуют великие и ужасные методические рекомендации Роскомнадзора от 2013 года, которые отвечают на вопрос о том, что является деперсонализацией, а что нет. Но только для госорганов.
Так вот, в них явно упоминается метод перемешивания — да, можно просто менять данные местами, и они станут обезличенными. А дальше начинается интересное: рекомендации не актуализируются, а судебная практика идет вперед. И из неё мы узнаём, что имейл персданными не является, телефон — иногда да, иногда нет, а паспорт — всегда да, хотя казалось бы, те же 10 цифр. Так что можно, но не совсем.
Вчера Минцифра анонсировала закон об обезличивании (может и раньше, мне на глаза только что попалось) — надеюсь, что там появится хоть что-то конкретное и учитывающее реальность вокруг, где и так данные каждого из нас поутекали из десятка разных мест.
Ну не знаю.. Продавать такое как продукт...
Фио перемашать , ака Третьев Первый Вторвович.
Емейлы, телефоны - ну тут понятно простейший генератор. Адреса - есть кладр, или можно также перемешать (города, улицы, дома), если физическое существование не важно. Сохранить в отдельные таблицы, дергать по мере надобности, в нужном кол-ве, при раскатке тест баз, чтоб каждый раз не генерировать.
Попробовал заняться маскированием телефонов, так наткнулся на проблему уникальности - как бы замаскировать телефоны таким образом, чтобы одинаковые телефоны в разных местах системы замаскировались одинаковым образом, но при этом, чтобы разные телефоны не превратились в одинаковые.
что-то типа
a = str(1234567890)
b = a[5:]
c = a[:5]+b[::-1]
недостаточно?
Мы такую задачу пока не решали.
Но если будем решать, поможет кэш маскирований — там видно, какие результирующие значения мы уже использовали. Достаточно добавить проверку: если новое значение телефона не фигурирует в кэше, можно оставить номер, все хорошо. А если уже встречалось нужно будет сформировать номер заново.
Как мы обезличиваем ПДн, сохраняя их смысл и качество. Чтобы тестовый стенд был полезным, будто там данные с прода