Комментарии / Профиль gofat / Хабр

Артем Ерохин@gofat

Data Scientist

ПрофильСтатьи2Посты1НовостиКомментарии50

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 1

@gofat 12 авг 2021 в 13:06

Из двух альтернатив (тест и контроль) выбрали тестовый вариант для того, чтобы его применить ко всем пользователям сервиса. То есть "раскатили тест".

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 1

@gofat 12 авг 2021 в 05:55

"Раскатить" от слова "катить". Например: "мы выкатили новые улучшения нашего сайта для всех пользователей". Получается, что мы выпустили некие обновления, которые теперь видны всем пользователям.

Насколько я вижу, именно в таком значении и используется данный оборот в тексте. Применить изменение ко всем нашим пользователям.

Как с помощью нейросети определить лучшую дату отправки email и повысить доход рассылки в 8,5 раз

@gofat 12 фев 2021 в 14:35

По открытиям для сравнения посчитал.
Просто кажется, что для вас это может и быть полезнее (отправок больше — оплата больше). Но для заказчика — не факт. Тут хорошо бы про их мотивацию рассказать (если это возможно). Нужно ли больше денег суммарно от кампании, или нужен выше доход на отправку?

Может одно письмо стоит 15 рублей (я условно, это преувеличение, конечно же). Тогда для заказчика рассылка по большей аудитории окажется убытком.

P.S. В целом, молодцы, конечно. Но LSTM вроде бы не такая нестандартная модель для такого рода задач.
P.P.S. Кажется, что вашу задачу можно дальше попробовать сформулировать в терминах uplift'а.

Как с помощью нейросети определить лучшую дату отправки email и повысить доход рассылки в 8,5 раз

@gofat 12 фев 2021 в 12:51

Значимость A/B теста на чем считали? Клики, открытия, покупки?

Кажется, что доход на отправку упал: 12000 / 470 = 25.5, а 102000 / 10600 = 9.6. Или 12000 / (470 * 0.2) = 127.67, 102000 / (10600 * 0.15) = 64.15, если считать не по отправкам, а по открытиям.

AI, который не просит хлеба

@gofat 17 ноя 2020 в 11:19

Самая простая история, почему центроиды могут различаться — не зафиксирована случайность инициализации.

Геомаркетинг как инструмент повышения качества проектов

@gofat 9 ноя 2020 в 06:16

А какие объективные показатели качества вашего моделирования? На какие метрики смотрите при проработке моделей?

Управление ценовыми скидками: модели для количественного измерения эффекта на примере АЗС

@gofat 5 мар 2020 в 10:14

Но даже плохая модель лучше, чем отсутствие модели. В прогнозировании то же самое. Плохая модель как минимум заставляет нас подумать об эффективности наших маркетинговых действий.

В сущности, все модели неправильны, но некоторые полезны

RICE: Простая приоритезация для Product-менеджеров

@gofat 23 дек 2019 в 07:10

500 х 30% = 450, Really?!
Допишите, что вы еще умножаете на 3 месяца, то есть 500 х 30% х 3 = 450

Про Планирование Спроса, Holt-Winters и XGboost

@gofat 10 дек 2019 в 07:41

Ок, я не заметил введенную собственную accuracy, моя невнимательность.
Но! Есть стандартные обозначения для некоторых метрик, так что такое название сбивает с толку.

Про Планирование Спроса, Holt-Winters и XGboost

@gofat 9 дек 2019 в 10:02

А вы уверены, что при прогнозировании объема продаж стоит использовать Accuracy (точность)? Кажется, что это не самая лучшая метрика для такой задачи.

Выявление мошенничества с помощью алгоритмов случайного леса, нейронного автокодировщика и изолирующего леса

@gofat 2 дек 2019 в 14:53

А потом переводную литературу читать невозможно по теме. Зато русский язык отстояли.
P.S. Не против использования русскоязычных терминов, но именно в данной области я за заимствования, максимально приближенные к оригиналу.

@gofat 2 дек 2019 в 10:23

Autoencoder (даже у вас именно так написано). По-русски пишут «автоэнкодер». У вас же трансформировалось в «автокодер».

Властелин прода в царстве legacy-кода (сказочка с открытым концом)

@gofat 22 ноя 2019 в 07:06

Изменил на другую ссылку

Властелин прода в царстве legacy-кода (сказочка с открытым концом)

@gofat 22 ноя 2019 в 06:44

А дальше были великие битвы и тонны сломанных копий.
А все оттого, что Великий Архитектор, что создавал миры, был очень дотошен. И крайне детально описывал свои миры, проектируя их. Но, вот незадача, однажды оплошал. И нигде не упомянул про штаны Арагорна. Что впоследствии использовали злобные тролли, которые нашли сию уязвимость и посредством ее сожгли немало эфедронов Поклонников Великого Архитектора.
Мораль: если тролли захотят, то они в замысле любого Великого Архитектора найдут «Арагорна без штанов». А это значит, что нужно не разжигать пламень войны, а тихонечко исправлять последствия.
P.S. Краткое содержание вопроса

Властелин прода в царстве legacy-кода (сказочка с открытым концом)

@gofat 21 ноя 2019 в 07:29

… все обернулись. А Арагорн-то без штанов!

Strong «caffe» на завтрак и выездные хакатоны: почему это важно для развития Data Science сообщества

@gofat 4 окт 2019 в 06:48

А как все эти дополнительные активности вяжутся с основной работой? Зарешка, или двухдневный хакатон — это хорошо, но если они не проводятся в свободное время (еще странно не давать мощностей, а просить решать своими силами).

И не очень понятно про общий вектор. Встречи хороши для синхронизации, но про выработку стратегии я что-то не увидел ничего.

Из советов — хорошо работает засылка «в поля», особенно если задача связана с улучшением какого-то определенного участка работы, где есть свой специалист, который и будет потом полученное решение как-то применять, или с ним взаимодействовать. Что-то вроде того, как в додо засылают разработчиков пиццу делать.

Как я построила прогнозную модель call-центра, чтобы их звонки не бесили пользователей

@gofat 29 авг 2019 в 04:10

На графиках с конверсиями хорошо бы еще доверительные интервалы сделать, чтобы было понятно, что это не просто случайно так вышло, а и правда есть закономерность.
В механизм последующего выбора времени дозвона хорошо бы еще встроить немного рандома, чтобы не переобучаться потом на себя.

Как обойти капчу: нейросеть на Tensorflow,Keras,python v числовая зашумленная капча

@gofat 21 авг 2019 в 08:33

Можно заморозить получившийся граф, выгрузив его из keras'а и использовать tensorflow-serving: github.com/tensorflow/serving
Через serving должно побыстрее заработать.

Персонализируй это: как мы в QIWI работаем с рекомендациями

@gofat 14 авг 2019 в 10:22

При «ручном» анализе вполне себе неплохой подход. Помогает сгенерировать гипотезы. Но это не обязательно тематическое моделирование, может быть другой способ кластеризации.
При автоматизации выплывают не столь приятные минусы — со временем может меняться набор кластеров + параметры подбирать сложно.

Статей немного, но не то, чтобы их совсем не было. Просто этот подход несколько нестабильный, т.к. в итоге он сильно зависит от последующей интерпретации пользователем.

ManyChat приглашает на «Что? Где? Когда?»

@gofat 14 авг 2019 в 10:17

Важно ли, что я в заявке не заполнил имена коллег по команде?
Люди есть, просто так быстро состав «не утрясся» и имена все равно поменялись бы.