Опыт построения антифрод-системы на основе поведенческого анализа для FreezerSports

Средний

4 мин

487

Информационная безопасность * Машинное обучение * Облачные вычисления * Высоконагруженные системы * Тестирование IT-систем *

Кейс

Проект по разработке системы антифрода для букмекерской конторы FreezerSports стал для нашей команды важным шагом в обеспечении честности игры на платформе. Основной целью было создание системы, которая бы эффективно боролась с манипуляциями, связанными с арбитражем ставок и использованием вилочных событий для обхода системы. В данной статье я расскажу о технической реализации антифрод-системы на основе поведенческого анализа.

Задача

Одной из главных задач было предотвратить использование арбитражных ставок и вилочных событий, которые игроки применяют для обхода системы. Эти схемы позволяют пользователям ставить на все возможные исходы события с гарантией выигрыша, что нарушает баланс и целостность ставок. Мы не могли полагаться только на традиционные методы защиты, такие как фильтрация по IP-адресам, поэтому был выбран подход, основанный на анализе поведения пользователей, который позволяет динамически адаптировать систему под новые угрозы.

Архитектура системы

Сбор данных

Основой системы является сбор данных о действиях пользователей на платформе. Мы фиксируем каждое событие: ставки, их размеры, последовательность ставок, а также время между действиями.

Системы сбора данных: Для этого использовалась Apache Kafka, которая обеспечивает обработку данных в реальном времени. Она позволяет эффективно собирать и передавать информацию о действиях пользователей без задержек, что особенно важно для предотвращения мошенничества в реальном времени.
Структура данных: Все действия пользователей записываются как события, которые отправляются на дальнейшую обработку в систему аналитики. Это позволяет быстро получить полную картину поведения пользователя на платформе.

Хранение данных

Для обработки и хранения больших объемов данных используется NoSQL базы данных — Apache Cassandra и MongoDB, которые идеально подходят для работы с неструктурированными данными и позволяют обрабатывать запросы в условиях большой нагрузки.

Cassandra гарантирует горизонтальное масштабирование, что важно для эффективной работы с большими объемами данных.
Redis используется для кэширования текущих сессий и быстрого доступа к данным, что ускоряет обработку запросов и снижает задержки.

Обработка и анализ данных

На этапе обработки данных используется мощная система аналитики, которая анализирует поведение пользователей в реальном времени.

Apache Flink для обработки потоковых данных позволяет выполнять сложные вычисления на лету и быстро реагировать на потенциально подозрительные действия.
Для выявления необычных паттернов в ставках применяется Flink CEP (Complex Event Processing), что позволяет не только отслеживать базовые отклонения, но и сложные мошеннические схемы, связанные с арбитражем ставок и вилочными событиями.

Модели машинного обучения

Для выявления аномального поведения мы использовали алгоритмы машинного обучения, что позволило значительно повысить точность системы. Основной задачей было обучить модель для анализа ставок и выявления действий, которые могут указывать на арбитражные схемы.

Алгоритмы машинного обучения:

Anomaly Detection: Применяли Isolation Forest, DBSCAN и Local Outlier Factor (LOF) для выявления нестандартных паттернов в ставках.
Нейронные сети: Для более точного анализа поведения использовались рекуррентные нейронные сети (RNN) с LSTM (Long Short-Term Memory), которые анализируют временные ряды ставок и помогают выявить подозрительные схемы.
Обучение с подкреплением: В случае успешной блокировки мошеннических действий система продолжала обучаться, улучшая свои алгоритмы для распознавания новых типов мошенничества.

Проверка в реальном времени

Когда система обнаруживает отклонение от нормального поведения, она мгновенно принимает меры:

Реакция в реальном времени: В случае обнаружения арбитражных ставок система автоматически блокирует такие ставки. Для этого используются алгоритмы на основе Apache Flink, которые обрабатывают события с минимальными задержками.
API для взаимодействия: Вся информация о подозрительных действиях передается в систему мониторинга, что позволяет быстро реагировать на нестандартные ситуации.

Интерфейс для оператора

Операторы имеют возможность вручную проверять и подтверждать подозрительные события, что даёт дополнительный уровень защиты.

Data Visualisation: Использование Grafana и Kibana позволяет операторам наглядно отслеживать все подозрительные ставки, видеть графики активности и вовремя принять решение.

Технические трудности и решения

Масштабируемость системы

Для обеспечения масштабируемости и высокой доступности системы мы использовали Kubernetes для управления контейнерами и автоматического масштабирования сервисов в зависимости от текущей нагрузки. Это позволяет динамически расширять вычислительные мощности при увеличении числа пользователей и ставок.

Точность предсказаний

Чтобы минимизировать ложные срабатывания, мы использовали TensorFlow и Keras для создания и оптимизации моделей машинного обучения. Алгоритмы ансамблирования и улучшение моделей с учётом новых данных позволили значительно повысить точность предсказаний.

Интеграция с существующими системами

В процессе интеграции с уже существующими компонентами платформы FreezerSports (например, системой ставок и платежных шлюзов) использовался GraphQL, что позволило эффективно обрабатывать запросы и получать только необходимую информацию для дальнейшей аналитики.

Результаты

После внедрения системы FreezerSports смогла значительно снизить количество мошенничества, связанного с арбитражными ставками и вилочными событиями. Алгоритмы на основе поведенческого анализа и машинного обучения позволили точнее прогнозировать поведение пользователей и оперативно реагировать на подозрительные действия.

Продолжаем развивать систему, добавляя новые методы и алгоритмы для борьбы с мошенниками и повышения надежности платформы.

Хабы:

Опыт построения антифрод-системы на основе поведенческого анализа для FreezerSports

Задача

Архитектура системы

Технические трудности и решения

Результаты

Публикации

Ближайшие события