
Компания МТС объявила о закрытии сделки по приобретению 67% акций группы Buzzoola, состоящей из двух ООО — «Баззула Интернет Технологии» и «Баззула Рекламные Технологии». Цель покупки — ускоренное развитие собственного AdTech-направления МТС.
Компания МТС объявила о закрытии сделки по приобретению 67% акций группы Buzzoola, состоящей из двух ООО — «Баззула Интернет Технологии» и «Баззула Рекламные Технологии». Цель покупки — ускоренное развитие собственного AdTech-направления МТС.
Всем привет! Мы из команды ML проекта DMP (Data Management Platform) в AdTech Rambler Group. В этой статье поговорим про эмбеддинги.
Эмбеддингом в машинном обучении принято называть вектор чисел фиксированной длины, который описывает некую сущность по ряду параметров. В нашем случае стоит задача представить наших пользователей в виде векторов. Расскажем, как мы это делаем и какие задачи решаем с помощью эмбеддингов.
Общее про DMP и зачем нам эмбеддинги?
Начнем с того, что у Rambler Group есть свой стек RTB-технологий (real-time-bidding), которые позволяют продавать и откручивать современную programmatic-рекламу, подбирая для конкретного пользователя наиболее оптимальные объявления. Еще у нас есть много логов пользовательского поведения, из которых нужно извлечь сигнал об их предпочтениях для персонализации рекламы. Здесь и появляется DMP.
DMP – это инструмент для создания единого профиля пользователя. Делается это путем сбора, обработки и структурирования событийных логов пользователей различных активов Rambler Group. Конечная цель DMP – построение и хранение аудиторных сегментов, которые используются для выделения целевых аудиторий и таргетирования онлайн-рекламы в системе RTB.
Еще весной 2021 года мы оценивали примерно половину трафика через наш рекламный продукт, как фрод. Для его фильтрации использовали сторонний инструмент, но сами были не в восторге от этого решения - мы вынуждены были платить за его использование, но не могли повлиять на происходившую под капотом “магию”.
Взяв дело в свои руки, мы разобрались в деталях и проработали собственную систему фильтров. После отключения партнеров, подавляющая часть трафика от которых принадлежала ботам, мы сократили долю входящего фрода до 10%. А с этой долей мы легко боремся ловушками в режиме реального времени.
Под катом не раскроем всех секретов, но расскажем о подходе.