Pull to refresh
4
0
Alexander Medvedev @Medale

Data analytics and data science for audit activity

Send message
Привет!
Глобальная цель для нас — это выявление любых уязвимостей и рисков в процессах банка. Например, если мы находим две одинаковые фотографии клиентов в двух анкетах, то это может означать, что кто-то из сотрудников повторно использовал ранее сделанную фотографию, что нарушает установленные в банке процессы (фотография каждый раз должна делаться заново). Далее необходимо провести анализ выявленной аномалии и узнать причины. Причинами в приведённом примере могу быть отсутствующие автоматические проверки в ИТ системе, в которую загружаются фотографии. Таким образом мы от аналитически выявленной аномалии перешли к реальной уязвимости в ИТ системе.
Привет!

Во-первых, у нас на каждую задачу есть ограничение по времени из-за специфики аудита ~40 рабочих дней (начиная с даты, когда мы получаем данные, до формирования заключения).
Во-вторых, у нас нет этапа прода, т.е. мы делаем модель/алгоритм проверяем выявленные уязвимости, разбираем причины и двигаемся дальше (формирование замечания и прочее без нашего участия осуществляется аудиторами). В случае действительно эффективных наработок мы к ним возвращаемся, рефакторим и документируем их для более комфортного переиспользования.

Теперь по пунктам:
  • По нормализации: в рамках описанных тестов не делали нормализации. Изображения с отклонениями по яркости и контрасту частично выявлялись при поисках исключений по гистограммам. Используемая в данной статье сеть FaceNet просто вернет пустой список лиц, если изображение не подойдет для анализа, т.е. покажет, что на фото нет лиц, и тогда мы будем эти фото разбирать вручную.
  • Про предобработку с крупными областями – попробуем применить, спасибо за идею!
  • Про угадывание оптимального масштаба – не думали в эту сторону, т.к. автоматический перебор нейронной сетью нас вполне устроил по скорости обработки (1000 изображений за 6 мин). Фотографии, где лицо занимает аномально много пространства, нас так же интересуют, т.к. они могут стать аномалией (может послужить основанием для рекомендаций по улучшению бизнес-процесса).


Information

Rating
Does not participate
Works in
Registered
Activity