Комментарии 3
На сегодняшний день появились компании, которые вместо анонимизации данных предлагают «синтетические» (или «сгенерированные» на основе оригинальных) данные, которые статистически и математически не отличаются от оригинальных. Этот новый подход использует, в частности, генеративные нейронные сети.
0
Можете ли поделиться ссылкой на сравнительный обзор или просто списк таких компаний? В том числе интересует методика отпеределия покзателя «статистически и математически не отличаются от оригинальных».
0
Присоединюсь к просьбе. Было бы интересно почитать.
И вот первый вопрос который приходит в голову — насколько устойчивее такие наборы данных к описанным проблемам?
Кажется, что и повторная генерация таких наборов данных и слишком узкие выборки все равно оставляют вероятность раскрытия исходных данных.
И вот первый вопрос который приходит в голову — насколько устойчивее такие наборы данных к описанным проблемам?
Кажется, что и повторная генерация таких наборов данных и слишком узкие выборки все равно оставляют вероятность раскрытия исходных данных.
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Дифференциальная приватность — анализ данных с сохранением конфиденциальности (введение в серию)