Как стать автором
Обновить

Platforma и AmberData заявили о тестировании конвертации cookies в MAID

Время на прочтение 2 мин
Количество просмотров 3.2K
Браузеры Контекстная реклама *IT-компании

Разработчик bigdata-решений для бизнеса Platforma вместе с DMP-платформой AmberData провели пилотное преобразование cookies в идентификаторы мобильных устройств (MAID). Разработчики утверждают, что применение данной технологии обеспечит рекламному рынку стабильность после отмены cookies в Chrome в 2024 году и позволит дальше использовать накопленные ранее знания об аудиториях, хранящихся с помощью cookies. 

Читать далее
Всего голосов 7: ↑6 и ↓1 +5
Комментарии 0

МТС приобрела AdTech-компанию Buzzoola

Время на прочтение 3 мин
Количество просмотров 1.1K
Блог компании МТС

Компания МТС объявила о закрытии сделки по приобретению 67% акций группы Buzzoola, состоящей из двух ООО — «Баззула Интернет Технологии» и «Баззула Рекламные Технологии». Цель покупки — ускоренное развитие собственного AdTech-направления МТС.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Комментарии 1

Потоковая обработка данных при помощи Akka

Время на прочтение 5 мин
Количество просмотров 39K
Блог компании DCA (Data-Centric Alliance) Scala *Big Data *Hadoop *
Привет, Хабр! Все привыкли ассоциировать обработку больших данных с Hadoop (или Spark), которые реализуют парадигму MapReduce (или его расширения). В этой статье я расскажу о недостатках MapReduce, о том, почему мы приняли решение отказываться от MapReduce, и как мы приспособили Akka + Akka Cluster на замену MapReduce.


Читать дальше →
Всего голосов 47: ↑44 и ↓3 +41
Комментарии 50

Иерархическая классификация сайтов на Python

Время на прочтение 8 мин
Количество просмотров 26K
Блог компании DCA (Data-Centric Alliance) Python *Big Data *Машинное обучение *
Привет, Хабр! Как упоминалось в прошлой статье, немаловажной частью нашей работы является сегментация пользователей. Как же мы это делаем? Наша система видит пользователей как уникальные идентификаторы cookies, которые им присваиваем мы или наши поставщики данных. Выглядит этот id, например, так:

42bcfae8-2ecc-438f-9e0b-841575de7479

Эти номера выступают ключами в различных таблицах, но первоначальным value является, в первую очередь, URL страниц, на которых данная кука была загружена, поисковые запросы, а также иногда некоторая дополнительная информация, которую даёт поставщик – IP-адрес, timestamp, информация о клиенте и прочее. Эти данные довольно неоднородные, поэтому наибольшую ценность для сегментации представляет именно URL. Создавая новый сегмент, аналитик указывает некоторый список адресов, и если какая-то кука засветится на одной из этих страничек, то она попадает в соответствующий сегмент. Получается, что чуть ли не 90% рабочего времени таких аналитиков уходит на то, чтобы подобрать подходящий набор урлов – в результате кропотливой работы с поисковиками, Yandex.Wordstat и другими инструментами.
logo
Получив таким образом более тысячи сегментов, мы поняли, что этот процесс нужно максимально автоматизировать и упростить, при этом иметь возможность мониторинга качества алгоритмов и предоставить аналитикам удобный интерфейс для работы с новым инструментом. Под катом я расскажу, как мы решаем эти задачи.
Читать дальше →
Всего голосов 36: ↑36 и ↓0 +36
Комментарии 18

Типы личности по MBTI: влияние на восприятие рекламы

Время на прочтение 5 мин
Количество просмотров 38K
Блог компании DCA (Data-Centric Alliance) Big Data *Машинное обучение *
Привет Хабр! Анализируя пользовательские данные для нужд маркетинга и рекламы, мы решили исследовать влияние типа личности пользователя на то, как он реагирует на рекламное объявление. За основу решили взять, пожалуй, самую популярную типологию линостей MBTI (Myers-Briggs Type Indicator), известную еще с середины 20-го века. Многие крупные западные компании используют тесты MBTI при найме или при формировании команды для работы над проектами.

Но нас интересует, конечно, не готовность пользователя к командной работе, а влияние его типа личности на желание кликнуть по баннеру. Поэтому вопрос, который мы исследовали звучит так: «Могут ли типы личности влиять на CTR в рекламных кампаниях?»

В этой статье я расскажу о том как мы это делали.


Читать дальше →
Всего голосов 34: ↑25 и ↓9 +16
Комментарии 46

DMP часть 1. Микросегментирование аудитории с помощью ключевых слов

Время на прочтение 7 мин
Количество просмотров 16K
Блог компании Targetix Высокая производительность *Разработка веб-сайтов *Big Data *
Авторы статьи: Данила Перепечин DanilaPerepechin, Дмитрий Чеклов dcheklov.

Здравствуйте.
Data management platform (DMP) — это наша любимая тема во всей истории про онлайн рекламу. RTB is all about the data.
В продолжение цикла рассказов о технологическом стеке Targetix (SSP, DSP), сегодня я опишу один из инструментов, входящих
в DMP — Keyword Builder.


Читать дальше →
Всего голосов 12: ↑10 и ↓2 +8
Комментарии 20

Архитектура хранения данных в Facetz.DCA

Время на прочтение 5 мин
Количество просмотров 5.9K
Блог компании DCA (Data-Centric Alliance) IT-инфраструктура *Хранение данных *Хранилища данных *Hadoop *
В цикле статей «BigData от А до Я» мы рассмотрели один из наиболее часто используемых технологических стеков для работы с большими данными Apache Hadoop и привели примеры его использования в продуктах DCA. Теперь мы расскажем, как выглядит архитектура хранения данных в Facetz.DCA.


Читать дальше →
Всего голосов 10: ↑10 и ↓0 +10
Комментарии 2

Как мы сделали сервис рекламных кампаний, соответствующий положениям GDPR

Время на прочтение 6 мин
Количество просмотров 2.2K
Блог компании Maxilect Интернет-маркетинг *Медийная реклама *Законодательство в IT Управление медиа *
Вступивший в действие в мае этого года GDPR серьезно повлиял на рынок интернет-маркетинга. Его участникам хочется формировать максимально точную аудиторию для показа объявлений, но теперь для этого необходимо получить явное согласие пользователя, иначе даже небольшой нишевый ресурс может нарваться на многомиллионные штрафы. Некоторые ресурсы закрылись, но многие преобразуются в соответствии с новыми требованиями. И наш проект сервиса управления рекламными кампаниями для клиента из США – отличный тому пример.

image
Читать дальше →
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 0

Простыми словами о Programmatic

Время на прочтение 3 мин
Количество просмотров 27K
Веб-аналитика *Интернет-маркетинг *Медийная реклама *Контекстная реклама *Поисковая оптимизация *
Статья провалидирована и обновлена автором 26.05.2023


Меня часто спрашивают, что же такое программатик, и чем он отличается от других digital-инструментов. Решил написать небольшую статью (своего рода «кратчайшая история программатика»), чтобы закрыть все базовые вопросы по этой теме.

Приступим!

image
Автор картинки Karolis Strautnieka
Читать дальше →
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 5

Digital Material Passport. Ч.1 — Скрытые грани «цифровых двойников»

Время на прочтение 10 мин
Количество просмотров 1.7K
CAD/CAM *Исследования и прогнозы в IT *Управление продуктом *Суперкомпьютеры Data Engineering *

Рано или поздно, непременно возникнет вопрос – а насколько можно доверять цифровым «двойникам» и насколько они на самом деле являются двойниками физическим образцам?  На 60%? на 80%? Вчера было на 80%, а сегодня другой поставщик и возможно уже только 60%?

Достаточно ли Вам будет такого отчета в документах о гарантии тормозной системы автомобиля, как «виртуальные испытания тормозной системы автомобиля подтвердили длину тормозного пути на сухом асфальте с разогретыми шинами ~40 метров со скорости 100 км/час при отклонениях ± 30-40% на покупаемом Вами физическом экземпляре автомобиля.»

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 4

Digital Material Passport. Ч.2 – Цифровой парадокс и рынок DMP

Время на прочтение 14 мин
Количество просмотров 859
CAD/CAM *Исследования и прогнозы в IT *Управление продуктом *Суперкомпьютеры Data Engineering *

Увеличение потребности в новых данных напрямую связано с попыткой приблизить цифровой двойник к физическому объекту. Таким образом, сам процесс совершенствования цифровых двойников провоцирует прогрессивный рост стоимости такого совершенствования.

Этот цифровой парадокс заставляет усомниться в возможностях массового перехода на качественные Digital Twin и тем более использование DMP в России при «хаотичной» организации работы, даже в условиях распространения цифровизации.

В то же время потребность в данных порождает новый цифровой товар - на этот товар претендует не сам DMP, а цифровые данные производителей о физическом продукте.

Читать далее
Рейтинг 0
Комментарии 2

Как мы создавали Data Management Platform: архитектура, проблемы, выводы

Время на прочтение 11 мин
Количество просмотров 4.6K
Блог компании Конференции Олега Бунина (Онтико) Блог компании Ozon Tech Высокая производительность *PostgreSQL *Монетизация веб-сервисов *
✏️ Технотекст 2021

Для таргетинга мы в Ozon используем сегменты, в которые группируем пользователей по интересам. Интересы могут быть определены через систему трекинга событий. Последние в свою очередь формируются в процессе взаимодействия пользователя с маркетплейсом Ozon. На основе сегментов мы отправляем нотификации, рассылаем письма, показываем рекомендации, баннеры, страницы с товарами и цены на товары, участвующие в маркетинговых акциях. В принципе, на сегменты можно завязать любую механику. Мы даже А/В тесты иногда проводим с ними.

Первоначально сегменты создавались вручную: поступал запрос от заказчика, после чего проводилась аналитическая работа по сбору требований. Количество заявок на создание сегментов со временем только увеличивалось. Чтобы автоматизировать процесс создания сегментов мы решили сделать конструктор сегментов для DMP — Data Management Platform. Это относительно молодой проект, ему чуть больше двух лет, но он полностью себя оправдал. Сегодня расскажу вам о нашем опыте. Меня зовут Евгений Чмель, и я руковожу командой DMP & CDP.

Читать далее
Всего голосов 22: ↑22 и ↓0 +22
Комментарии 0