Как стать автором
Обновить

Компания OKKAM Group временно не ведёт блог на Хабре

Сначала показывать

Как мы определили веса алгоритмов ранжирования крупнейших маркетплейсов на открытых данных

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.4K

Привет, Хабр! Меня зовут Владислав Абрамов, я аналитик в команде разработки компании Easy Commerce. Перед нами стояла задача создать алгоритм, который определяет влияние характеристик карточки товара на поисковую позицию в крупнейших российских маркетплейсах. Большинство из них не раскрывают принципы ранжирования — эту проблему нужно было решить с помощью анализа открытых данных. В этой статье расскажу, как мы прошли этот путь и проверили, что решение действительно работает. 

Читать далее
Всего голосов 11: ↑10 и ↓1+12
Комментарии7

Как мы в dentsu Link.One строили (часть I-я)

Время на прочтение8 мин
Количество просмотров1.7K

Уже многое было написано как про low-code подход (хороший пост от vas3k), так и про платформу Power Platform от Microsoft, поэтому постараюсь не стать очередным КЭПом и не поднимать холиваров на тему “что лучше” и “кто там в будущем кого заменит и на что”. 

И в этой части (всего их планируется две) расскажу лишь о нашем полугодовом опыте с позиции менеджера, который получил задачу оцифровать взаимодействия внутри компании с целью оптимизации и дальнейшей конвейеризации производства услуг и сел думать, как её решать в условиях ресурсных ограничений. 

Как потом поняли – мы строим внутренние “Госуслуги” в хорошем смысле этого сравнения.

Давайте глянем
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Умное планирование рекламы в подкастах. Как собрать базу слушателей и распознать аудиторию с помощью нейросети

Время на прочтение5 мин
Количество просмотров2.5K
Подкасты – канал, который активно развивается весь 2020 год. Растет объем аудитории, да и самих подкастов становится все больше. При этом единого аудиторного измерителя слушателей не существует, да и вообще с измерениями этого канала дела обстоят не очень. При этом взаимный интерес подкастеров и рекламодателей довольно высокий.

Мы в dentsu придумали Podcaster – аналитический инструмент для измерения аудитории подкастов и планирования рекламы в них. О том, как мы начали собирать данные и решили проблему распознавания аудитории, с какими трудностями столкнулись и что из этого вышло, рассказываем в этой статье.

image
Читать дальше →
Всего голосов 5: ↑2 и ↓3+1
Комментарии7

Вкалывают роботы, счастлив человек. Как мы настроили автоматическую закупку рекламы на ТВ

Время на прочтение13 мин
Количество просмотров3.7K

В прошлой статье мы уже писали о том, как в Dentsu занимаемся прогнозированием телесмотрения рекламы на ТВ и какие используем для этого алгоритмы. В этой статье мы расскажем, как используется этот прогноз для автоматического размещения рекламы на ТВ, как появилась сама идея Programmatic TV, с какими сложностями мы столкнулись при ее реализации и как это живет и работает сейчас, в непростом со всех точек зрения 2020 году.

Читать далее
Всего голосов 6: ↑3 и ↓3+2
Комментарии2

Прогноз нестационарного ряда, или как жить дата-сайентисту в 2020 году

Время на прочтение13 мин
Количество просмотров4.3K

Пандемия и карантин изменили жизнь и поведение практически каждого жителя планеты. При этом некоторые изменения являются краткосрочными и исчезают со снятием карантинных мер, а другие могут остаться с нами надолго, возможно даже навсегда.

Мы, в Dentsu Aegis Network, в том числе прогнозируем изменения в поведении людей в части потребления видеоконтента, это необходимо для эффективного размещения рекламы наших клиентов в разных медиа. О том, как мы прогнозируем телесмотрение и насколько хорошо у нас это получается в реалиях динамично меняющегося 2020 года, и пойдёт речь в этой статье.

Читать далее
Всего голосов 9: ↑8 и ↓1+9
Комментарии6

Новая медиавалюта. Исследование внимания аудитории к интернет-рекламе с применением технологии айтрекинга (часть 2)

Время на прочтение6 мин
Количество просмотров1.5K

Как оценивать эффективность рекламы в условиях информационного шума и меняющихся паттернов поведения потребителя? Классические метрики засчитывают просмотр, даже если он не был совершен: пользователь мог смотреть на экран, но не видеть рекламу. Специфика digital-форматов такова, что далеко не все рекламные ролики занимают 100% экрана, а значит, у аудитории есть возможность избежать просмотра. Мы решили протестировать технологичный подход, чтобы изучить внимание пользователей к рекламе на разных медиа сервисах и экранах.


В предыдущей статье мы уже немного рассказали о нашем пилотном исследовании Attention Economy Russia – целях, предыстории (глобальный проект и локализация) и ТВ-результатах. На этот раз хочется поделиться подробностями оценки внимания в digital, которое мы провели в партнерстве с UX-лабораторией Mail.ru Group. В рамках данного этапа исследования команда использовала айтрекеры, с помощью которых отслеживали взгляд человека при просмотре видеорекламы на десктопных и мобильных устройствах.


Читать дальше →
Всего голосов 5: ↑4 и ↓1+5
Комментарии1

Tableau Hyper API – BI-команда скажет вам спасибо

Время на прочтение11 мин
Количество просмотров4.6K
Мы хотим рассказать вам о том, как мы помогли нашей BI-команде организовать автоматический процесс доставления данных на Tableau-сервер из MongoDB, используя таблошный формат хранения данных ”hyper”, а сам процесс настройки формирования данных осуществляется через простой веб-интерфейс.

В начале коротко расскажем, как выглядел процесс до и после того, как мы научили наш внутренний продукт А1 программно собирать датасорсы и публиковать их на Tableau Server. Затем подробнее разберем проблему BI-команды и найденное решение, а также заглянем под капот (здесь о создании .hyper файла, публикации файла на tableau-сервере и обновлении хайпера). Добро пожаловать под кат!

Tableau Hyper API – BI-команда скажет вам спасибо

Читать дальше →
Всего голосов 3: ↑3 и ↓0+3
Комментарии3

Как бесплатно перенести свои любимые треки в Spotify, используя Javascript

Время на прочтение6 мин
Количество просмотров16K

Все любители музыки в России с нетерпением ждали выхода Spotify на наш рынок. Когда наконец это случилось, перед пользователями встала проблема переноса музыки из других сервисов. Лично у меня за годы накопилась огромная коллекция музыки на разных платформах: Яндекс.Музыка, ВКонтакте, личная коллекция на жёстком диске и облако на Яндекс.Диске.


Сначала я думал воспользоваться сервисами вроде Soundiiz и TuneMyMusic. Но вдохновившись статьёй об использовании Python в тех же целях, мне стало интересно решить эту задачку с помощью Javascript. Далее я опишу ряд простых шагов с исходным кодом, которые помогут перенести вашу музыку из разных источников в Spotify.


Читать дальше →
Всего голосов 20: ↑20 и ↓0+20
Комментарии30

Поиск автовладельцев в Instagram: от хвостов китов до автомобилей

Время на прочтение9 мин
Количество просмотров4.9K

image


К нам в рекламную группу Dentsu Aegis Network часто приходят компании-рекламодатели с запросом изучить и проанализировать их целевую аудиторию. И сделать это необходимо быстро и точно. Предположим, у нас есть клиент из автопрома, который хочет найти владельцев авто, а потом узнать их интересы, пол, возраст – в общем, «раскрасить» аудиторию. Логично было бы сделать социологическое исследование, но это займет несколько недель. А если у клиента очень дорогие авто стоимостью выше 2,5 млн рублей? Много ли таких владельцев наберется для исследования? А для фокус-группы?


Хорошим способом найти нужного человека остается социальная сеть. Это место, где пользователь оставляет о себе много полезной информации, а если даже информации нет, то можно попробовать собрать её с помощью “черной” магии. Да, все верно, тут на помощь приходит data science.

Читать дальше →
Всего голосов 14: ↑13 и ↓1+15
Комментарии10

Новый tech – новая этика. Исследование отношения людей к технологиям и приватности

Время на прочтение6 мин
Количество просмотров1.5K
Мы в коммуникационной группе Dentsu Aegis Network ежегодно проводим исследование Digital Society Index (DSI). Это наш глобальный ресерч в 22 странах мира, включая Россию, о цифровой экономики и ее влиянии на общество.

В этом году мы, конечно, не могли обойти стороной COVID-19 и решили посмотреть на то, как пандемия повлияла на цифровизацию. В итоге DSI 2020 вышел в двух частях: первая посвящена тому, как люди стали использовать и воспринимать технологии на фоне коронавирусных событий, вторая – как они теперь относятся к приватности и оценивают уровень своей уязвимости. Делимся результатами нашего исследования и прогнозами.

image
Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Новая медиавалюта: как мы решили измерить внимание к рекламе и что из этого вышло (часть 1)

Время на прочтение7 мин
Количество просмотров2.3K
До 4000 рекламных сообщений догоняет нас ежедневно на разных носителях – от смартфона до билбордов. За внимание беспощадно конкурируют цифровые сервисы, бренды, медиа и не только. Очевидно, что в условиях переизбытка предложений, контента и рекламы традиционные метрики охвата и отклика становятся недостаточными KPI для product owners.

Мы в рекламной группе Dentsu Aegis Network решились на изучение кардинально нового подхода к оценке эффективности рекламы, поставив во главу угла именно внимание как метрику, которая наиболее широко отражает человеческое восприятие рекламы.

image
Читать дальше →
Всего голосов 7: ↑3 и ↓4+1
Комментарии2

FAISS: Быстрый поиск лиц и клонов на многомиллионных данных

Время на прочтение14 мин
Количество просмотров33K


Однажды в преддверии клиентской конференции, которую ежегодно проводит группа DAN, мы размышляли над тем, что интересного можно придумать, чтобы у наших партнеров и клиентов остались приятные впечатления и воспоминания о мероприятии. Мы решили разобрать архив из тысяч фотографий с этой конференции и нескольких прошлых (а всего их к тому моменту было 18): человек отправляет нам свою фотографию, а мы ему через пару секунд отправляем подборку фотографий с ним за несколько лет из наших архивов.

Велосипед мы не придумывали, взяли всем известную библиотеку dlib и получили эмбеддинги (векторные представления) каждого лица. 

Добавили Telegram-бота для удобства, и всё было отлично. С точки зрения алгоритмов распознавания лиц всё работало на ура, но конференция завершилась, а расставаться с опробованными технологиями не хотелось. От нескольких тысяч лиц хотелось перейти к сотням миллионов, но конкретной бизнес-задачи у нас не было. Через некоторое время у наших коллег появилась задача, которая требовала работы с такими большими объемами данных.
Читать дальше →
Всего голосов 14: ↑13 и ↓1+14
Комментарии15

Проверка идей через прототипирование дашбордами

Время на прочтение4 мин
Количество просмотров3.5K
Маркетинг – это та сфера, в которой довольно опасно полагаться только лишь на интуицию, любую гипотезу или супер-бизнес-идею предварительно имеет смысл проверить на состоятельность через Customer Development (далее развитие клиентов или custdev) и желательно ещё подтвердить серией экспериментов.

После воркшопа от Ивана Замесина в начале 2019 года наша команда так прониклась идеями, заложенными в подходе по развитию клиентов, что стали применять его при работе над проектами и продуктами. И одно из направлений, про которое хотелось бы рассказать – это проверка идей через прототипирование в формате дашбордов.


Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии2

Модель эффективности медиа рекламы для интернет-магазинов

Время на прочтение7 мин
Количество просмотров3.7K
Мы в агентстве People & Screens много лет работаем с онлайн-бизнесами в качестве рекламного партнера. Когда у нас появилась идея оценить вклад медийной рекламы в продажи интернет-магазинов, она казалась нереализуемой и даже безумной. Как только мы поняли, что все элементы мозаики можно найти и сложить вместе, то решили попробовать. Первые гипотезы начали подтверждаться, вместе с компанией Data Insight мы углубились в эту историю и за несколько месяцев кропотливой работы создали такое исследование, которое, по сути, является прикладным рабочим инструментом – модель оценки эффективности рекламы в 12 товарных категориях e-commerce. В этой статье мы расскажем о результатах и используемых методах анализа.

image
Читать дальше →
Всего голосов 5: ↑4 и ↓1+5
Комментарии12

TabPy для работы с данными в ClickHouse из Tableau

Время на прочтение6 мин
Количество просмотров5.5K
Выстраивание коммуникаций между брендами и людьми — то, чем мы в Dentsu Aegis Network занимаемся каждый день, и неотъемлемой частью этой работы является анализ данных. В ряде случаев этот процесс не требует data science (хотя и он у нас есть), тогда мы используем BI платформу Tableau. Ее основная цель — дать нашим сотрудникам и клиентам удобный интерфейс для потребления данных без написания скриптов, SQL запросов и т.п.

В этой статье мы расскажем, как нам удалось решить проблему взаимодействия Tableau с ClickHouse.
Читать дальше →
Всего голосов 7: ↑7 и ↓0+7
Комментарии0

“Иван” по профессии чат-бот. Или творческие эксперименты с виртуальными ассистентами

Время на прочтение7 мин
Количество просмотров3.9K
В Dentsu Aegis Network мы любим экспериментировать, потому что эксперименты это часть культуры нашей компании. Благодаря экспериментам можно выйти за границы собственной компетенции, сферы, взглянуть на вещи под другим углом, попутно изучив и применив что-то новое на практике.

В этой статье я хочу рассказать о наших экспериментах в области персональных ассистентов, с кейсами, антикейсами и, как принято теперь говорить, итоговыми lessons learned.

Читать дальше →
Всего голосов 18: ↑17 и ↓1+16
Комментарии15

Сократить время вычислений от нескольких лет до минут. Разбираемся с квантовым машинным обучением

Время на прочтение9 мин
Количество просмотров10K
Я давно интересуюсь квантовыми вычислениями и пишу программы для 5- и 14-кубитных квантовых компьютеров IBM Q Experience. Сегодня я расскажу о технологиях, которые можно будет применять в машинном обучении после того, как квантовые вычисления завоюют мир. Спойлер для дата сайентистов: в будущем у вас не получится запустить модель и уйти пить кофе на полдня. Квантовый компьютер щелкает задачи машинного обучения на раз, и отговорки вроде “модель обучается” уже не пройдут. Придется запускать не одну модель, а по меньшей мере миллион.

image
Читать дальше →
Всего голосов 34: ↑24 и ↓10+14
Комментарии48

Обнаружение пересекающихся сообществ в Instagram для определения интересов пользователей

Время на прочтение8 мин
Количество просмотров17K
Сколько может рассказать о человеке профиль в соцсети? Фотографии, посты, комментарии, подписки – непаханное поле для анализа. Сегодня поговорим о том, как мы определяем интересы пользователей на основе их подписок в сети Instagram.

image
Источник
Читать дальше →
Всего голосов 19: ↑19 и ↓0+19
Комментарии11

Как мы собирали данные по рекламным кампаниям с интернет-площадок (тернистый путь к продукту)

Время на прочтение12 мин
Количество просмотров5.7K
Кажется, что сфера интернет-рекламы должна быть максимально технологичной и автоматизированной. Ещё бы, ведь там работают такие гиганты и эксперты в своём деле, как Яндекс, Mail.Ru, Google и Facebook. Но, как оказалось, нет предела совершенству и всегда есть что автоматизировать.

image
Источник

Коммуникационная группа Dentsu Aegis Network Russia — крупнейший игрок на рекламном digital рынке и активно инвестирует в технологии, пытаясь в оптимизировать и автоматизировать свои бизнес-процессы. Одной из нерешенных задач рынка интернет-рекламы стала задача сбора статистики по рекламным кампаниям с разных интернет-площадок. Решение этой задачи в итоге вылилось в создание продукта D1.Digital (читать как ДиВан), о разработке которого мы и хотим рассказать.
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии3