Комментарии 11
Заказчики то в погонах? Отступление то надуманное, не факт что кто то кого то спасать будет а не топить :-)
Ну там же объяснено, что фактор связности используется дальше другими банковскими моделями. Как именно он используется - это уже вопрос той модели, которая этот фактор использует, тут просто художественно описано, какой в связности может быть смысл.
Погоны могут из ИФНС получить свод за 5 минут, и не нужно просить банки а тем более платить за это, банкам скорее это нужно для соблюдения 115-фз
Интересная и похоже большая работа по развитию аналитических эвристик. Интересно, тянет ли на кандидатскую? Но это про саму статью, как изучение анализа данных.
А вот с т.з. "связности" компаний .. вызывает недоумение:
Скажем некая крупная оптовая контора .. имеет явно связанный бизнес, скажем СТО, по ремонту машин парка оформленное на "самозанятый", ибо там родственник, скажем двоюродный племянник. Племяннику надо прикупить оборудование, он идет к оптовику, тот приходит к Вам за кредитом.. связаны? Вряд ли, если судить по статье.. ;)
.. ещё 100500 таких "аффилиатов", где один и тот же вид закупок проходит через 1-3 родственные структуры.. ;)
На кандидатскую никак не тянет. Ниже aborouhin предложил идеи поинтереснее.
А Ваш п.1 хоть и показывает "связность" но только эпизодичную (и то, точность будет невелика, может просто родственник обратился к родственникам?), а заинтересованным лицам скорее другая связанность нужна - регулярная, именно она может показать дробление бизнеса, например.
Любопытно. Делал такое в полуручном режиме для выявления разных банкротных схематозов. Но я не банк, так что больших массивов данных для анализа нет, так что больше на экспертный опыт приходилось полагаться.
Мне кажется, зря отфильтровали физ. лиц - не ИП. Как раз вероятность, что одни и те же компании регулярно платят одним и тем же физлицам, крайне невелика, и через них много чего раскручивается.
Ну и плюс, помимо характера платежей, полезно учитывать аномалии (необычные для указанного назначения суммы, например), а также характéрные признаки самих сторон транзакции (если они очевидно похожи на "технички" / однодневки - надо сразу смотреть цепочку дальше). Да и вообще выявление цепочек тоже интересно (если выбивающаяся из обычных оборотов сумма так же быстро уходит, как и пришла, имеет смысл посмотреть, куда она ушла). Ну и т.п.
А если ещё подключить побольше источников - закупки, в которых участвовали совместно; исторические сведения ЕГРЮЛ на предмет пересечений персоналий, адресов, конкактных данных; да даже историю Whois по доменам иногда...
В общем, интересная тема, спасибо за статью.
Аномалия как фича - подход интересный, но если аномалий мало, то на них можно и переобучиться. А так то фичи можно генерить бесконечно при некотором опыте этого дела.
1. Ну кажется, что не зря физ. лица (не ИП) отфильтровали. Цель была не цепочки связей выявить, а понять кто из прямых бизнес-контрагентов является связанным, чтобы принять решение включать ли компанию в консолидацию при фин. анализе.
2. Начали с самого очевидного и простого в реализации (quick win)– проанализировать структуру операций с контрагентами, отличается ли она при работе со связанными компаниями.
А так да действительно улучшать модель можно и дальше, анализировать аномальные \ технические траназкции, отслеживать цепочки, построить графы, построить модели окружения, посмотреть другие источники данных (закупки). Если у бизнес заказчика будет интерес и ресурсы можно будет этим заняться.
В целом спасибо за комментарий, интересный и полезный.
Я правильно понимаю, что для того, чтобы скрыть связь с каким-то другим лицом клиенту Открытия достаточно проводить платёжи с ним не через р/с в банке Открытие, а через условный Сбербанк?
Почему решили ограничиться только транзакциями, а не стали прикручивать расшифровку статей баланса по кредиторской / дебиторской задолженности, финансовым вложениям и т.п. Или задачей было определить связанность не в рамках кредитной заявки (где эти расшифровки можно запросить), а в целом по всему массиву клиентов на РКО?
При фин. анализе компании при предоставлении кредита данные расшифровок и так смотрятся кредитным аналитиком. Цель модели в статье была посмотреть, чем можно именно дополнить вышеуказанные данные исходя из анализа транзакций. Возможно выявить дополнительные связи которые не выявили при фин. анализе, причем это достаточно быстро и нетрудоемко.
Как разработать модель выявления связанных компаний на основании анализа транзакций