SmartEngines 30 мая 2024 в 08:15

Подделка из бумаги: разбираемся, почему участились мошенничества с документами и как устроены антифрод-системы с ИИ

Простой

9 мин

1.1K

Блог компании Smart EnginesМатематика*Машинное обучение*Статистика в IT

Привет, Хабр!

На связи Smart Engines, AI-разработчик систем распознавания и проверки подлинности документов. По состоянию на сегодняшний день наш софт способен проверять не только удостоверяющие личность документы вроде паспорта или водительского удостоверения, но и документы государственного образца – судебные приказы, нотариальные доверенности и всевозможные свидетельства.

Мы совместно с командой юристов INTELLECT решили провести масштабное исследование и разобрались, как изменилась статистика преступлений с использованием поддельных документов за последние годы, какие существуют подделки и как работают самые современные антифрод-системы.

Общая статистика преступлений с использованием поддельных документов за 2019-2022 гг.

В основу анализа легла информация из следующих источников:

• Статистические анализы МВД России «Состояние преступности в России» за 2019-2022 гг.
• Статистические отчеты Судебного департамента при Верховном Суде РФ
• «Результаты рассмотрения уголовных дел» за 2019-2022 гг.
• Официальная база судебных актов ГАС «Правосудие» (bsr.sudrf.ru)
• Неофициальная база судебных актов Sudact (sudact.ru)
• Российский федеральный портал открытых данных
• Банк судебной практики СПС «ГАРАНТ»
• Публикации официальных СМИ.

За четыре года – в период с 2019 года по 2022 год – по статье 324.-327.2 УК РФ (незаконное приобретение и сбыт поддельных документов) было возбуждено в общей сложности более 17 тыс. уголовных дел.

Важное уточнение: данных за 2023 год в отчете нет, поскольку банк данных приговоров судов за 2023 год пока еще не выгружен в официальные источники в полном объеме.

Для ответа на вопрос, как менялось количество преступлений, связанных с подделкой или сбытом документов, следует сравнить три показателя:

а) статистика выявленных и расследуемых преступлений по ст. 327 УК РФ (МВД РФ) — отражает количество уголовных дел, находящихся в производстве следственных органов и не учитывает дела, переданные в суд. Из указанной статистики возьмем лишь показатель новых дел за каждый год, так как старые и нераскрытые дела, указанные в ней и переходящие из года в год, не дают представления о годовой динамике.

б) статистика судебных дел по ст. 324-327.2 УК РФ (Судебный Департамент при ВС РФ) — отражает количество уголовных дел в судах по указанным статьям УК РФ. К сожалению, статистика не содержит разбивки показателей по отдельным составам, что делает ее бесполезной для определения точного количества дел (т. к. она включает в себя подделку госзнаков, VIN, акцизных марок). Между тем, эта статистика может быть использована для отслеживания общего тренда.

в) статистика судебных дел по ст. 327 УК РФ (ГАС «Правосудие») - содержит необходимую информацию, однако данные за 2023 год фрагментарны и, в какой степени это возможно, восполнены за счет иных источников. Кроме того, в силу особенностей состава статьи, в нее также включены преступления, связанных с подделкой водительских удостоверений, санитарных карт, полисов и т.д.

Детальная статистика преступлений за 2022 год

Количество уголовных дел, в которых в 2022 году фигурируют поддельные документы (ст. 327 УК РФ) – 3987. Из них:

3585 - количество уголовных дел по ч. 2 ст. 327 УК РФ (подделка удостоверений личности
206 - количество уголовных дел по ч. 1 ст. 327 УК РФ (подделка документов за исключением ДУЛ)
59 - количество уголовных дел по ч. 3 ст. 327 УК РФ (приобретение, хранение и сбыт поддельных документов)

Что подделывают?

В 2022 году почти все поддельные документы – это удостоверяющие документы: общегражданские паспорта РФ и паспорта стран СНГ, водительские удостоверения, миграционные карты, разрешения на работу и др. На них приходится 93,4% от общего числа поддельных документов. А вот на официальные документы – доверенности, судебные приказы, награды или госзнаки – всего 5,2%.

Водительские удостоверения среди подделок являются безоговорочным лидером – 55% от общего объема. Показатель свидетельствует о том, что подпольное производство подобного типа документов буквально поставлено на поток и россиянам зачастую не составляет особого труда купить водительское удостоверение – «нужного специалиста» можно легко найти в сети Интернет.

Внутренние паспорта – как граждан РФ, так и стран СНГ – сохраняют место в тройке лидеров и составляют 16%. Внутренние паспорта используются в большинстве случаев при оформлении потребительского кредита, покупки билета на самолет или поезд. Хотя встречаются случаи, когда поддельные удостоверения личности используются для вступления в наследство или для проникновения в закрытые административно-территориальные образования (ЗАТО). Большая часть случаев (дошедших до суда) приходится на подделку собственными силами. В частности, переклейку фотографий. При этом в отчете не учитываются случаи подделки изображений документов в фоторедакторах, которые до суда не доходят.

Иностранные удостоверения личности часто изготавливаются на подпольных фабриках, куда иностранцев (в большинстве случаев – граждан Кыргызстана и Узбекистана) завлекают рекламой в Интернете и обещаниями удалить все их данные после того, как услуга будет оказана. В большинстве случаев подделывают миграционные карты или фальсифицируют отметки о въезде и виде на жительство в оригинальном национальном паспорте.

Внутренние финансовые документы: это могут быть бухгалтерские отчеты, налоговые декларации, выписки по банковским счетам, свидетельства о регистрации предприятий и другие документы. Подобные бумаги могут фальсифицироваться в том числе для того, чтобы получать от государства финансовую поддержку на открытие своего дела.

На поддельные нотариальные доверенности и судебные приказы приходится 1% и 2% соответственно. Несмотря на то, что количество уголовных дел, связанных с подделкой этих типов документов, крайне невелико, в действительности именно они несут высокий риск и максимальный ущерб.

Во-первых, это связано с огромным объемом подделок. Так, в одном деле, где фигурирует подделка судебных приказов, может идти речь об обороте десятков, сотен и даже тысяч фальшивок. Фактически это напоминает ситуацию с водительскими удостоверениями и паспортами стран СНГ, где за незаконным изготовлением документов стоят не отдельные люди, а хорошо организованные группы.

Во-вторых, поддельные судебные приказы и нотариальные доверенности используются для незаконных операций с недвижимостью или организации мошеннических схем - в частности, для взыскания с людей несуществующих задолженностей.

Виды подделок документов

Все поддельные документы условно можно разделить на два класса – физические и цифровые.

Подспорьем для мошенников при изготовлении подделок являются утечки данных, число которых все время растет:

168 утечек персональных данных зафиксировал Роскомнадзор в 2023
300 млн уникальных записей россиян утекло за 2023
500 млн уникальных записей россиян уже утекло за 2024

Как ловят мошенников в разных каналах?

Главный элемент защиты от мошенника при оказании финансовой услуги — это предварительная идентификация и аутентификация клиента. Современные финансовые организации оказывают услуги тремя способами: традиционно через отделения, полу-дистанционно с помощью выездных сотрудников и дистанционно. Рассмотрим каждый из данных пунктов подробнее с точки зрения используемых методов антифрода и необходимости применения систем на базе ИИ.

Очный формат

Если оказание услуг происходит в отделении финансовой организации, то для идентификации подделок задействуются следующие методы:

использование сервисов и баз недействительных документов;
физическая проверка подлинности предъявляемых документов (в частности, с помощью специализированных устройств, таких как специальные цифровые увеличители), их целостности (не рваный) и валидности (срок действия);
сверка лица клиента и его фотографии в документе;
двойное подтверждение (дополнительно выполняется проверка старшим специалистом) при совершении значимых операций.

Хотя проверка документа на валидность и подлинность присутствует, ее результат может быть недостоверным вследствие человеческого фактора (невнимательность и халатность сотрудников), элемента сговора сотрудника с мошенником или отсутствие полноты информации о способе проверки документов. Системы антифрода на базе ИИ, оперирующие поверх мультиспектральных данных, лишены указанных недостатков.

Полу-дистанционный формат

Другая распространенная практика — выездной сотрудник передает клиенту банковскую карту или забирает у него заявление на открытие счета. В этом случае методы борьбы с мошенниками построены на базе расширенной идентификации личности, а также удостоверения факта оказания услуги именно клиенту, чей документ предъявляется.

В частности, фотографируют клиента с его паспортом или любым иным удостоверением личности и сам процесс оказания услуги. Кроме того, проверяется подлинность документов в соответствии с инструкциями банка или базами данных, а также сверяются фотография в документе и селфи клиента.

Сами по себе «полевые условия» не позволяют внимательно отнестись к процессу идентификации и аутентификации. К тому же сотрудникам приходится часто торопиться, чтобы успеть посетить как можно больше клиентов. Это также играет на руку мошенникам. В данном случае роль ИИ в том, чтобы упорядочить и упростить процесс идентификации и аутентификации клиента за счет технологий распознавания и проверки подлинности фотографий и видеоданных.

Дистанционный формат

Если касаться дистанционного оказания услуг, то все в целом проходит так же, как в полу-дистанционном режиме. Однако есть нюансы. Объектом проверки в данных случаях выступают изображения (отсканированная или сфотографированная версия удостоверения личности) или видеопоследовательность документа (когда паспорт показывают в камеру).

Важно отметить, что процесс выявления вмешательств в изображение или видеопоток достаточно сложен. Даже экспертам требуется много времени для выполнения подобной проверки. В условиях, когда дистанционных заявок становится очень много, время на принятие решения резко сокращается. Учитывая, что ИИ может осуществлять проверку документов «на лету», для дистанционного формата оказания услуг он незаменим.

Чем антифрод-системы отличаются от систем распознавания документов?

При беглом взгляде может показаться, что антифрод-система по своей природе аналогична традиционной системе распознавания образов. Отчасти это так, поскольку и там и там используются схожие семейства алгоритмов ИИ. Однако в действительности между обеими системами достаточно различий.

Большее число операций. В отличие от систем распознавания текста документов система антифрода более сложная и комплексная на всех уровнях, начиная с анализа входного изображения. Системе распознавания достаточно найти документ, а система антифрода должна не только обнаружить документ, но и отыскать аномалии как внутри, так и снаружи документа. На уровне анализа шаблона — распознать тип документа и при этом проверить ключевые особенности этого типа. На уровне распознавания буквы — вместе с идентификацией символа необходимо также проверить шрифт и способ нанесения. Это делает системы антифрода более комплексными и сложными в разработке, чем системы «простого» распознавания.

Анализ обширного объема данных. На входе антифрод-системы рассматривают комплексированные данные, содержащие наборы изображений (зарегистрированных в различных спектральных диапазонах), результаты распознавания (информация о найденном документе и его атрибутах), ответы от отдельных модулей анализа и понимания документа. Оперируя таким обширным набором данных разной природы, антифрод-система должна принять решение о наличии признаков фальсификации.

Комплексный вывод. На выходе антифрод-система возвращает коллекцию выявленных признаков фальсификаций, о каждом из которых известен не просто бинарный ответ: был ли в результате выявлен каждый признак или нет. Антифрод-системы на базе ИИ возвращают пару значений: «достаточно ли данных для выявления признака» и вероятность выявления признака на анализируемых данных. В некоторых случаях антифрод-системы, помимо коллекции признаков, возвращают также уверенность в подлинности рассматриваемого документа.

Находит то, что может не заметить человек. За счет активного применения методов машинного обучения системы антифрода на базе ИИ, в отличие от большинства традиционных систем распознавания, выявляют и детектируют на входных данных сложно интерпретируемые человеком элементы (например, аномалии в распределении шумов на изображении). Это позволяет эффективно находить даже те случаи фрода, которые опытные сотрудники с трудом определяют.

Требования к качеству работы. У систем распознавания и антифрода разные требования к качеству работы. Так, когда рассматривается система распознавания текста, вполне достаточным является показатель правильности распознавания (accuracy) — сколько букв или слов система правильно распознала. Чем выше показатель правильности, тем меньше «ручной» работы придется делать после применения системы распознавания. Когда речь заходит об антифрод-системах, одним показателем тут не обойтись. Антифрод-системы обрабатывают как подлинные документы, так и подделки, поэтому качество работы таких систем измеряют путем вычисления двух показателей:

ошибка первого рода («ложноположительное» заключение, обозначается α ) — когда антифрод-система неверно «признала» подлинный документ за подделку;
ошибка второго рода («ложноотрицательное» заключение, обозначается β) — когда антифрод-система неверно «пропустила» подделку.

По своей природе, будучи «дополнительным щитом» против мошенника, антифрод-системы не должны сильно «препятствовать» прохождению подлинных документов. А это значит, что количество ошибок первого рода, то есть количество «ложноположительных срабатываний» (ситуация, когда антифрод-система признает подлинный документ за подделку), должно быть минимальным. Современные антифрод-системы на базе искусственного интеллекта могут обеспечивать значение ошибки первого рода на уровне не выше 0,1%. Это означает, что антифрод-система ложноположительно ошибается на подлинных документах не чаще одного раза на 1000 подлинных документов.

Почему так важно редко ошибаться на подлинных документах? Для понимания этого давайте гипотетически рассмотрим антифрод-систему, которая одинаково ошибается как на подлинных документах, так и на подделках с вероятностью, скажем, 1% (то есть α = β = 0,01). Пусть также в нашем гипотетическом примере поддельные документы встречаются не очень часто, с вероятностью p = 1% = 0,01 (то есть на сто предъявленных документов всего один поддельный), что в некотором приближении соответствует практике. Зададимся вопросом: какова вероятность того, что документ поддельный, если такая гипотетическая система распознала его как поддельный? Совсем не 99%, как может показаться. Чтобы получить правильный ответ, следует обратиться к теории вероятности, а именно к формуле Байеса:

$P_{ 0.01 }(подделка|распозналась\ подделка)=\frac{0.99\cdot 0.01}{0.01 \cdot 0.99+0.99\cdot 0.01}=0.5$

То есть всего 50% вероятность того, что перед нами действительно подделка, если гипотетическая система с рассмотренными выше параметрами «сработала».

Однако если в том же примере ошибка будет 0,1%, то вероятность выявления подделки резко возрастает:

$P_{ 0.001 }(подделка|распозналась\ подделка)=\frac{0.999\cdot 0.01}{0.01 \cdot 0.999+0.99\cdot 0.001}\approx0.91$

Таким образом, требования по качеству работы к антифрод-системам принципиально отличаются от традиционных распознающих систем.

Хабы: