
«Успешные люди вырываются вперёд, используя то время, которые остальные используют впустую», — говорил (так пишут в интернете) изобретатель конвейера Генри Форд. Как микросервисы и графовая платформа помогают экономить время в новом кредитном конвейере ВТБ, читайте под катом.
Почему конвейер
Процесс формирования предложений по кредитам и одобрения заявок клиентов включает несколько стадий. Банку нужно проанализировать потребности клиента, кредитную историю, риски, оценить, нужен ли клиенту продукт, справится ли он с кредитной нагрузкой, какую сумму и какие условия можно ему предложить.
За каждую стадию отвечает определённый модуль, вместе они образуют кредитный конвейер.
Модули выполняют:
оценку кредитной истории (основные источники: БКИ, внутренние данные банка);
оценку благонадёжности;
оценку платёжеспособности (зарплатные зачисления, транзакционные и иные внутренние данные);
определение уровня риска (вероятности дефолта);
расчёт лимита кредитования;
определение ценовых условий;
выбор продукта для клиента с использованием моделей склонности (в случае формирования предодобренных предложений).
Основной кирпичик в построении архитектуры кредитного конвейера — статистические модели, использующие для оценки всю доступную информацию. На первом этапе запуска конвейера ВТБ внедрил модели оценки кредитного риска клиента и модели склонности к кредитному продукту.
Уникальность кредитного конвейера ВТБ в том, что модели обрабатываются с помощью обращения к централизованной платформе исполнения моделей.
Платформа исполнения моделей
В кредитном конвейере ВТБ мы реализовали платформу исполнения моделей на микросервисах, она позволяет предоставлять различным потребителям модель-как-сервис (MaaS) с использованием различных фреймворков обработки данных как в режиме онлайн с малым временем ответа и высокой нагрузкой, так и в пакетном режиме для обработки практически любых объёмов данных.
Описывающие бизнес-процесс модели обращаются к единой платформе, в ней осуществляются необходимые расчёты и предоставляются результаты для дальнейшего использования в процессе.
С кредитным конвейером платформа связана через набор интеграционных адаптеров, что даёт возможность гибко настраивать процессы конвейера и взаимодействовать с ней на различных этапах обработки заявки.
В процессе работы платформы все данные о работе системы сохраняются, что позволяет их использовать в дальнейшем для мониторинга работы и обучения моделей.
Вскоре мы дополним её централизованной системой управления моделями, которая позволит вести полный независимый реестр используемых в банке моделей, их версий, оперативно поставлять обновлённые модели и даже автоматически переобучать их без участия человека.
Платформа исполнения дополняется новыми специализированными компонентами — графовой платформой и геоплатформой.
Графовая платформа
Графовая платформа служит для выявления и предупреждения мошенничества. Она состоит из графовой СУБД и удобного интерфейса для работы пользователей. СУБД интегрирована с хранилищем данных на базе Hadoop и служит для построения связей (рёбер) между различными вершинами. Интерфейс используется для дополнительного анализа построенных пользователями графов.
Выявление потенциального кредитного мошенничества может производиться как в режиме реального времени, так и в рамках offline-мониторинга (выявление и расследование реализованных случаев кредитного мошенничества, анализ концентраций уровня риска на предмет возможного кредитного мошенничества и т. д.).
Выявление, расследование и противодействие кредитному мошенничеству осуществляется с применением методов графовой аналитики, анализа связей и установления противоречий. Результаты расследования признаков кредитного мошенничества могут влиять на маршрутизацию кредитной заявки и уровень принятия кредитного решения.
Геоплатформа
Удобным инструментом для анализа потребностей и интересов клиента в процессах банка выступает геоплатформа. Она представляет собой совокупность геослоёв различных обезличенных данных, на основе анализа которых с применением методов автоматического машинного обучения (Auto ML) можно прогнозировать спрос, потоки клиентов и другие факторы для принятия решений. Продукты геоплатформы служат для оценки и прогноза потока покупателей и для размещения таргетированной рекламы.
Собранные в единую геосетку данные позволяют использовать методы Аuto ML, что ускоряет процесс вывода продуктов на рынок. Геоплатформа вмещает 170 слоёв обезличенных данных из банковской сферы, телекома и digital-сервисов. Такой модуль позволяет учитывать в моделях оценки клиентов широчайший спектр географических особенностей — от уровня региона и ситуационной конфигурации расположения офисов до локаций проживания и работы отдельного клиента.
Модель оценки дохода
При выдаче кредита одной из главных задач является определение платёжеспособности клиента. В современных банках эта задача чаще всего решается вручную, в то время как в кредитном конвейере на помощь снова приходят статистические модели. Модели оценки дохода позволяют оценить потенциальный доход клиента по всей доступной по нему информации:
социально-демографический профиль;
информация о ранее поданных заявках на кредитные и некредитные продукты;
транзакционная активность;
информация по депозитам и счетам;
платёжная дисциплина по ранее выданным кредитам и т. д.
Использование этой модели в процессе кредитования позволяет формировать полноценные предодобренные предложения и определять оптимальную кредитную нагрузку, как если бы клиент обратился в банк сам, без запроса дополнительной информации на момент оценки.
Технологический стек под капотом
Для реализации расчётного кредитного конвейера мы использовали микросервисную архитектуру с оркестрацией посредством bpm-движка Camunda. Camunda представляет собой набор библиотек, которые позволяют выполнять описанные процессы. Такой подход позволил разработать гибкую и масштабируемую архитектуру и помимо этого имел следующие плюсы:
возможность восстановления процесса ровно с того места, где произошел сбой, причём это доступно из коробки;
наличие GUI, позволяющего увидеть, что происходит с процессом;
возможность написания юнит-тестов не только на логику и интеграцию, но и на сам процесс.
Микросервисы, осуществляющие этапы работы конвейера, реализованы как java-компоненты с использованием каркаса Spring и конфигурируются при помощи Spring Boot. Компоненты имеют собственные источники данных, построенные на базе СУБД PostgreSQL. Поскольку конвейер должен принимать решение за несколько минут, доступ к БД осуществляется посредством Spring ORM с оптимизацией для быстрых и высоконагруженных запросов. Взаимодействие между компонентами системы асинхронное и реализовано посредством Apache Kafka.
Кроме этого, микросервисы интегрируются с внешними системами, используя различные технологии и протоколы, такие как REST API, IBM MQ, Apache Kafka.
Для чего всё это нужно
На данный момент кредитный конвейер уже формирует предодобренные предложения по кредитам наличными и кредитным картам, это начальный этап его внедрения.
Технологическая основа конвейера в перспективе позволит формировать предодобренные кредитные предложения для 30 млн клиентов менее чем за 4 дня. Входящие заявки клиентов будут переведены на новую платформу до конца 2021 года.
В 2022 году он позволит нам принимать 95 % решений о выдаче кредитов розничным клиентам за 1–3 минуты. Что касается остальных 5 % заявок, они приходятся на те случаи, когда к проверке заявки необходимо подключать андеррайтера. Полностью исключать сотрудников банка из процесса андеррайтинга мы не планируем, поскольку их участие крайне важно для выявления новых схем мошенничества.
Кроме того, с 20 до 5 % снизится доля клиентов, которые для получения кредита предоставляют подтверждающую доход и занятость справку.
Новый конвейер позволит оперативно подключать новые источники информации о клиентах, что сделает точнее оценку рисков и позволит предложить лояльным клиентам более низкую ставку.