Привет, Хабр! Меня зовут Владислав Абрамов, я аналитик в команде разработки компании Easy Commerce. Перед нами стояла задача создать алгоритм, который определяет влияние характеристик карточки товара на поисковую позицию в крупнейших российских маркетплейсах. Большинство из них не раскрывают принципы ранжирования — эту проблему нужно было решить с помощью анализа открытых данных. В этой статье расскажу, как мы прошли этот путь и проверили, что решение действительно работает.
Компания OKKAM Group временно не ведёт блог на Хабре
Как мы в dentsu Link.One строили (часть I-я)
Уже многое было написано как про low-code подход (хороший пост от vas3k), так и про платформу Power Platform от Microsoft, поэтому постараюсь не стать очередным КЭПом и не поднимать холиваров на тему “что лучше” и “кто там в будущем кого заменит и на что”.
И в этой части (всего их планируется две) расскажу лишь о нашем полугодовом опыте с позиции менеджера, который получил задачу оцифровать взаимодействия внутри компании с целью оптимизации и дальнейшей конвейеризации производства услуг и сел думать, как её решать в условиях ресурсных ограничений.
Как потом поняли – мы строим внутренние “Госуслуги” в хорошем смысле этого сравнения.
Умное планирование рекламы в подкастах. Как собрать базу слушателей и распознать аудиторию с помощью нейросети
Мы в dentsu придумали Podcaster – аналитический инструмент для измерения аудитории подкастов и планирования рекламы в них. О том, как мы начали собирать данные и решили проблему распознавания аудитории, с какими трудностями столкнулись и что из этого вышло, рассказываем в этой статье.
Вкалывают роботы, счастлив человек. Как мы настроили автоматическую закупку рекламы на ТВ
В прошлой статье мы уже писали о том, как в Dentsu занимаемся прогнозированием телесмотрения рекламы на ТВ и какие используем для этого алгоритмы. В этой статье мы расскажем, как используется этот прогноз для автоматического размещения рекламы на ТВ, как появилась сама идея Programmatic TV, с какими сложностями мы столкнулись при ее реализации и как это живет и работает сейчас, в непростом со всех точек зрения 2020 году.
Прогноз нестационарного ряда, или как жить дата-сайентисту в 2020 году
Пандемия и карантин изменили жизнь и поведение практически каждого жителя планеты. При этом некоторые изменения являются краткосрочными и исчезают со снятием карантинных мер, а другие могут остаться с нами надолго, возможно даже навсегда.
Мы, в Dentsu Aegis Network, в том числе прогнозируем изменения в поведении людей в части потребления видеоконтента, это необходимо для эффективного размещения рекламы наших клиентов в разных медиа. О том, как мы прогнозируем телесмотрение и насколько хорошо у нас это получается в реалиях динамично меняющегося 2020 года, и пойдёт речь в этой статье.
Новая медиавалюта. Исследование внимания аудитории к интернет-рекламе с применением технологии айтрекинга (часть 2)
Как оценивать эффективность рекламы в условиях информационного шума и меняющихся паттернов поведения потребителя? Классические метрики засчитывают просмотр, даже если он не был совершен: пользователь мог смотреть на экран, но не видеть рекламу. Специфика digital-форматов такова, что далеко не все рекламные ролики занимают 100% экрана, а значит, у аудитории есть возможность избежать просмотра. Мы решили протестировать технологичный подход, чтобы изучить внимание пользователей к рекламе на разных медиа сервисах и экранах.
В предыдущей статье мы уже немного рассказали о нашем пилотном исследовании Attention Economy Russia – целях, предыстории (глобальный проект и локализация) и ТВ-результатах. На этот раз хочется поделиться подробностями оценки внимания в digital, которое мы провели в партнерстве с UX-лабораторией Mail.ru Group. В рамках данного этапа исследования команда использовала айтрекеры, с помощью которых отслеживали взгляд человека при просмотре видеорекламы на десктопных и мобильных устройствах.
Tableau Hyper API – BI-команда скажет вам спасибо
В начале коротко расскажем, как выглядел процесс до и после того, как мы научили наш внутренний продукт А1 программно собирать датасорсы и публиковать их на Tableau Server. Затем подробнее разберем проблему BI-команды и найденное решение, а также заглянем под капот (здесь о создании .hyper файла, публикации файла на tableau-сервере и обновлении хайпера). Добро пожаловать под кат!
Как бесплатно перенести свои любимые треки в Spotify, используя Javascript
Все любители музыки в России с нетерпением ждали выхода Spotify на наш рынок. Когда наконец это случилось, перед пользователями встала проблема переноса музыки из других сервисов. Лично у меня за годы накопилась огромная коллекция музыки на разных платформах: Яндекс.Музыка, ВКонтакте, личная коллекция на жёстком диске и облако на Яндекс.Диске.
Сначала я думал воспользоваться сервисами вроде Soundiiz и TuneMyMusic. Но вдохновившись статьёй об использовании Python в тех же целях, мне стало интересно решить эту задачку с помощью Javascript. Далее я опишу ряд простых шагов с исходным кодом, которые помогут перенести вашу музыку из разных источников в Spotify.
Поиск автовладельцев в Instagram: от хвостов китов до автомобилей
К нам в рекламную группу Dentsu Aegis Network часто приходят компании-рекламодатели с запросом изучить и проанализировать их целевую аудиторию. И сделать это необходимо быстро и точно. Предположим, у нас есть клиент из автопрома, который хочет найти владельцев авто, а потом узнать их интересы, пол, возраст – в общем, «раскрасить» аудиторию. Логично было бы сделать социологическое исследование, но это займет несколько недель. А если у клиента очень дорогие авто стоимостью выше 2,5 млн рублей? Много ли таких владельцев наберется для исследования? А для фокус-группы?
Хорошим способом найти нужного человека остается социальная сеть. Это место, где пользователь оставляет о себе много полезной информации, а если даже информации нет, то можно попробовать собрать её с помощью “черной” магии. Да, все верно, тут на помощь приходит data science.
Новый tech – новая этика. Исследование отношения людей к технологиям и приватности
В этом году мы, конечно, не могли обойти стороной COVID-19 и решили посмотреть на то, как пандемия повлияла на цифровизацию. В итоге DSI 2020 вышел в двух частях: первая посвящена тому, как люди стали использовать и воспринимать технологии на фоне коронавирусных событий, вторая – как они теперь относятся к приватности и оценивают уровень своей уязвимости. Делимся результатами нашего исследования и прогнозами.
Новая медиавалюта: как мы решили измерить внимание к рекламе и что из этого вышло (часть 1)
Мы в рекламной группе Dentsu Aegis Network решились на изучение кардинально нового подхода к оценке эффективности рекламы, поставив во главу угла именно внимание как метрику, которая наиболее широко отражает человеческое восприятие рекламы.
FAISS: Быстрый поиск лиц и клонов на многомиллионных данных
Однажды в преддверии клиентской конференции, которую ежегодно проводит группа DAN, мы размышляли над тем, что интересного можно придумать, чтобы у наших партнеров и клиентов остались приятные впечатления и воспоминания о мероприятии. Мы решили разобрать архив из тысяч фотографий с этой конференции и нескольких прошлых (а всего их к тому моменту было 18): человек отправляет нам свою фотографию, а мы ему через пару секунд отправляем подборку фотографий с ним за несколько лет из наших архивов.
Велосипед мы не придумывали, взяли всем известную библиотеку dlib и получили эмбеддинги (векторные представления) каждого лица.
Добавили Telegram-бота для удобства, и всё было отлично. С точки зрения алгоритмов распознавания лиц всё работало на ура, но конференция завершилась, а расставаться с опробованными технологиями не хотелось. От нескольких тысяч лиц хотелось перейти к сотням миллионов, но конкретной бизнес-задачи у нас не было. Через некоторое время у наших коллег появилась задача, которая требовала работы с такими большими объемами данных.
Проверка идей через прототипирование дашбордами
После воркшопа от Ивана Замесина в начале 2019 года наша команда так прониклась идеями, заложенными в подходе по развитию клиентов, что стали применять его при работе над проектами и продуктами. И одно из направлений, про которое хотелось бы рассказать – это проверка идей через прототипирование в формате дашбордов.
Модель эффективности медиа рекламы для интернет-магазинов
TabPy для работы с данными в ClickHouse из Tableau
В этой статье мы расскажем, как нам удалось решить проблему взаимодействия Tableau с ClickHouse.
“Иван” по профессии чат-бот. Или творческие эксперименты с виртуальными ассистентами
В этой статье я хочу рассказать о наших экспериментах в области персональных ассистентов, с кейсами, антикейсами и, как принято теперь говорить, итоговыми lessons learned.
Сократить время вычислений от нескольких лет до минут. Разбираемся с квантовым машинным обучением
Обнаружение пересекающихся сообществ в Instagram для определения интересов пользователей
Источник
Как мы собирали данные по рекламным кампаниям с интернет-площадок (тернистый путь к продукту)
Источник
Коммуникационная группа Dentsu Aegis Network Russia — крупнейший игрок на рекламном digital рынке и активно инвестирует в технологии, пытаясь в оптимизировать и автоматизировать свои бизнес-процессы. Одной из нерешенных задач рынка интернет-рекламы стала задача сбора статистики по рекламным кампаниям с разных интернет-площадок. Решение этой задачи в итоге вылилось в создание продукта D1.Digital (читать как ДиВан), о разработке которого мы и хотим рассказать.