Привет, Хабр! Ловите новую подборку от beeline cloud — собрали практические истории по работе с персональными данными. Здесь и основные ошибки хранения ПДн, и советы, которые помогут навести порядок, и примеры защиты личных данных пациентов в виде кейса компании, которая проводит дистанционные медицинские осмотры.
Основные ошибки хранения персональных данных: как их избежать
Привет! Меня зовут Костя Степанов, и вместе с моей командой мы создаем IT-продукты для обработки и повышения качества клиентских данных. Расскажу, что можно сделать, чтобы защитить персональные данные клиентов. Будет полезно тем, кто работает с большими массивами таких данных: розничному бизнесу, аналитикам, тестировщикам, дата-инженерам и специалистам по информационной безопасности.
Наши проекты по управлению клиентскими данными обычно начинаются с аудита. Вместе с заказчиками разбираем, какие персональные данные вообще есть в организации, где они хранятся и в каких бизнес-процессах используются.
Приведу примеры самых частых ошибок по сбору и хранению данных.
Слишком много систем для хранения персональных данных, нет «единой версии правды»
Частая картина: клиентские данные хранятся в самых разных системах. Например, в B2C и B2B CRM. Но такие приложения не предназначены для хранения большого объема клиентских данных и имеют ограниченную функциональность для работы с ними. В итоге бизнес не понимает, сколько у него в реальности клиентов, и не видит полный продуктовый профиль каждого из них.
Для работы с большим объемом клиентских данных лучше всего подходят системы класса CDI (Customer Data Integration, или клиентский MDM). Такая система выявляет дублирующиеся записи по сложным алгоритмам: правил слияния дубликатов может быть больше сотни. CDI улучшает качество данных, приводит в порядок адреса, формирует эталонную запись клиента. По сути, она выступает той самой «единой версией правды» в отношении клиентских данных, к которой обращаются за информацией все другие системы. Они, кстати, тоже в выигрыше: увеличивается их производительность, так как не нужно проводить нетипичную для них обработку данных. Из MDM через обратные потоки другие системы оперативно получают все изменения, которые происходят в карточке клиента.
Не так давно мы внедрили CDI в одном из банков. После этого банк разделил клиентскую базу на клиентов и лидов (проспектов — тех, кто оставил заявку, но договор в итоге не подписал). После этого вся база уменьшилась на 60%.
Появляются многочисленные копии данных
Хранение данных клиентов в CDI позволяет развести по разным системам персональную информацию и транзакции. По этой причине, кстати, службы информационной безопасности всё чаще выступают за появление в корпоративной архитектуре именно CDI, так как становится понятно, где именно лежат данные и как их защищать от атак и утечек.
И еще один аспект. Когда мы говорим о том, что клиентские данные хранятся в разных системах, речь идет не только о боевых средах, но и о тестовых контурах. В крупных компаниях могут быть десятки копий клиентских данных, которые используются для тестирования высоконагруженных систем или для моделей машинного обучения. Доступ к тестам, как правило, имеют еще и подрядчики, и это серьезно повышает риск утечек.
Плохое качество клиентских данных
Плохое качество клиентских данных — это тот самый мусор, неактуальные сведения, нестандартизированные адреса и номера телефонов, клиентские записи-дубли, которые я уже упоминал.
Если в данных нет порядка, операторы тратят время и звонят по неактуальным номерам или беспокоят клиента, действие договора с которым уже закончилось. Иногда и вовсе случаются казусы — например, СМС приходит в то время, когда у клиента во Владивостоке ночь, то есть компания не учитывает его актуальный часовой пояс. Или еще хуже: в почтовой рассылке человека называют другим именем или обращаются к нему «Дорогой Светлана!». Интернет уже даже полон мемов — вот, например, один из самых знаменитых:
Защита личных данных пациентов. Как работать с конфиденциальными медданными
Меня зовут Александр Горловой, я исполняющий обязанности директора по продукту компании MedPoint24. Основной профиль компании — проведение дистанционных медицинских осмотров сотрудников: например, водителей, шахтеров, пилотов.
Каждый раз, когда человек выходит на работу в смену, он проходит несколько этапов осмотра. Первый этап — сбор анамнеза, то есть самочувствие и наличие жалоб. Второй этап — тонометрия, измерение артериального давления и частоты сердечных сокращений. Третий этап, который стал обязательным из-за COVID-19, — термометрия, то есть измерение температуры. Заключительный этап — проверка на количество паров этанола, или алкотестирование.
Для работы с персоналом заказчик может делать отчеты по обязательным данным из электронного документа под названием «Медицинский журнал», а также по дополнительным — например, собирать профиль здоровья компании. Медицинский работник использует онлайн-кабинет, чтобы вынести решение по состоянию сотрудника. В этом помогает, например, цветовая разметка отклонений в параметрах и предиктивный анализ процедуры на основании истории осмотров.
Система MedPoint24 помогает медику принять решение, можно ли допустить человека к работе. Большая часть информации, которую собирает наше ПО, конфиденциальная, поэтому мы не можем просто записать и хранить ее, как любую другую. В статье я расскажу о специфике работы с персональными и медицинскими данными, а также об особенностях их обработки, защиты и хранения.
Собираем данные с помощью оборудования для осмотра
Для анализа данных их нужно предварительно собрать. При онлайн-осмотре сотрудники компании-заказчика используют медицинский комплекс, в котором есть тонометр, пирометр, алкотестер, датчики окружающей среды, управляющее устройство и набор защитных мер. Полученные данные в зашифрованном виде и обезличенно попадают на платформу и анализируются. Доступ к расшифрованным данным есть только у медицинского работника.
Например, водитель автобуса приходит на работу. Он должен пройти медицинское обследование для того, чтобы получить допуск в рейс. Тогда работодатель будет уверен, что человек может перевозить людей безопасно, то есть с ним ничего не произойдет. Или, если осмотр покажет какие-то отклонения от стандартных показателей, руководитель примет меры для улучшения показателей сотрудника. Например, даст ему дополнительные часы отдыха.
Водитель с утра приходит в медицинский кабинет автобусного парка, где установлено наше оборудование. Он спокойно готовится к осмотру, может предварительно отдохнуть в течение пяти минут. Затем садится за программно-аппаратный комплекс.
Водителю нужно авторизоваться в системе, чтобы начать осмотр. Для этого предусмотрено несколько вариантов: с помощью табельных номеров, карты контроля и управления доступом, по сотовому телефону и дополнительно по смарт-карте для водителей, использующих тахограф.
После авторизации человек попадает в личный кабинет, где может выбрать тип осмотра:
базовый — до или после смены в зависимости от должности;
линейный, или внутрисменный, — для проверки состояния в течение дня;
профилактический — на случай, если человек чувствует себя плохо.
Затем процедура осмотра завершается, водитель вводит код из СМС и подтверждает данные. В среднем осмотр занимает полторы минуты.
В каком виде к нам поступают данные?
После осмотра обезличенные данные передаются по зашифрованному каналу на нашу платформу для обработки. Шифрование также встроено в ПО комплекса и в дополнительный туннель на аппаратном уровне. Тем самым мы стремимся минимизировать возможность утечки персональных данных.
Каждый осмотр получает уникальный идентификатор, который затем позволяет расшифровать пакет данных и привязать информацию к конкретному человеку. Затем расшифрованные данные попадают к врачу, который принимает финальное решение. Иногда это бывает сложно, поскольку есть визуально похожие люди, а медицинский персонал проводит чуть больше двух миллионов осмотров в месяц. Мы уменьшаем влияние человеческого фактора с помощью ассистента медицинского работника.
Дальше я подробнее расскажу о том, как мы используем цифрового ассистента медицинского работника, как защищаем данные от взлома и как мы пришли к своему варианту защиты.
Если вы практикующий ИТ-эксперт, накопили достаточно опыта и хотите им поделиться — приходите в наш проект вАЙТИ. За вклад в медиа каждый автор получает вознаграждение.