Comments 18
Оказалось, что люди, получившие рекомендации, покупали меньше, чем клиенты, не получавшие рассылок
Никто не любит спам :)
Не факт, что тут именно про спам. Например, когда мне от одной крупной федеральной сети приходит рассылка о скидках на крепкий алкоголь — я чаще всего заезжаю в магазин именно за ним, а из прочего покупаю то, что вспомнится на бегу. А в другой день, без рассылки, я в тот же магазин наеду с готовым списком покупок, существенно превышающим первый кейс и по количеству позиций, и по сумме затрат.
Ваше предположение вполне жизненное и тоже имеет право на существование, но в нашем случае была выявлена другая закономерность.
Мы сравнивали средний чек пользователей «одного мессенджера» (конкретного канала получения информации) со всеми остальными клиентами, вошедшими в таргет-рассылку (как получившими в итоге напоминание и/или рекомендации, так и нет). Конкретно для этих пользователей «одного мессенджера» средний чек был заметно ниже, чем для остальных в таргет-рассылке. Это может быть связано с большим числом факторов (этим мессенджером в принципе пользуются менее выгодные магазину клиенты, или менее выгодные клиенты оставляют этот мессенджер в качестве контакта при заполнении анкеты, или что-то еще), теорий может быть много.
Мы сравнивали средний чек пользователей «одного мессенджера» (конкретного канала получения информации) со всеми остальными клиентами, вошедшими в таргет-рассылку (как получившими в итоге напоминание и/или рекомендации, так и нет). Конкретно для этих пользователей «одного мессенджера» средний чек был заметно ниже, чем для остальных в таргет-рассылке. Это может быть связано с большим числом факторов (этим мессенджером в принципе пользуются менее выгодные магазину клиенты, или менее выгодные клиенты оставляют этот мессенджер в качестве контакта при заполнении анкеты, или что-то еще), теорий может быть много.
Божественные диаграммы! Полное отсутствие читабельности!
я так понял, они после уменьшения размерности.
они просто красивые, разноцветные, информация представлена в неочевидном виде. Там, где должно быть по одному значению каждого цвета (вторая сверху), налеплено точек так… я вот не понимаю, что они там все делают?
У 3Д информативность нулевая.
В общем надо или уделять визуализации данных больше внимания или всё таблицами предоставлять, проще будет.
У 3Д информативность нулевая.
В общем надо или уделять визуализации данных больше внимания или всё таблицами предоставлять, проще будет.
Нет, это тоже спам, только маркетинговый. Сложная диаграмма, красивая, но не понятная никому.
Обычно основное предназначение таких визуализаций — медитировать на них
Хм… а если просто сделать мобильное приложение, где можно будет подписаться на акции по интересующему товару и предлагать пользователю подписываться на уведомления по покупаемому им товаром. Ну в уведомлениях писать «Товар рекомендованный искуственным интелектом».
А объем выборок не подскажете, когда это можно применять? Сеть Десяток магазинов, десяток — другой покупателей в день ( в зависимости от магазина) покупают пяток товаров на чек… Есть смысл анализировать?
Датасет в несколько миллионов покупателей, десятки магазинов.
Это у Вас… Интересует начиная с каких объемов это может начать работать?
Это может быть и один магазин с хорошо налаженным сбором данных о не очень многочисленных покупателях и транзакциях на протяжении нескольких лет. Или большая сеть, собравшая данные за несколько месяцев с несколькими миллионами транзакций. В конечном счете всё упирается именно в доступность данных.
Очевидно, что крафтовой лавке с десятком покупателей в месяц смысла нет точно, а сети, скажем, из десятка ларьков с фруктами может быть полезно, если они собирают данные о своих покупателях и их покупках.
Очевидно, что крафтовой лавке с десятком покупателей в месяц смысла нет точно, а сети, скажем, из десятка ларьков с фруктами может быть полезно, если они собирают данные о своих покупателях и их покупках.
Думаю понятие «статистической значимости» здесь применимо на 99,99%. Меня учили, что при анализе «человеков» ((С) Футурама) объём выборки в 1000 — минимально достаточен. При уменьшении этого числа точность деградирует значительно сильнее, чем повышается при его (даже значительном) увеличении.
Другими словами: 1000 — нормуль, 10000 — хорошо, 1 млн. — ещё лучше, 500 — скорее всего полня фигня.
Другими словами: 1000 — нормуль, 10000 — хорошо, 1 млн. — ещё лучше, 500 — скорее всего полня фигня.
Какие обозначения приняты для нижней диаграммы?
Стали искать причину и выяснили, что магазины отправляли клиентам сообщения в определенный мессенджер, а его пользователи в нашем сегменте изначально покупали меньше по сравнению с другими клиентами. Об этом не знали даже маркетологи заказчика. Так что эксперимент получился некорректным, но по его результатам мы добавили в модель параметр «пользователь мессенджера»
Вам бы вообще стоило начать с корректной постановки задачи для A/B и A/A тестов, прежде чем фичи добавлять.
У заказчика есть определенные ограничения, о которых не всегда известно в момент планирования эксперимента, плюс накладываются внешние факторы — например, решение о канале рассылки может приниматься не теми сотрудниками, с которыми вы планируете эксперимент. Выявленная нами особенность поведения этой группы покупателей стала новой информацией для маркетинга и была учтена в последующих экспериментах.
Sign up to leave a comment.
Что дает рознице машинное обучение: пример проекта