Comments / Profile of Arseny_Info / Habr

How to become an author

Арсений Кравченко @Arseny_Info

machine learning engineer

Profile Publications 10Comments 415Bookmarks 51

Как я повышал конверсию машинным обучением

Arseny_Info Jun 8 2015 at 14:57

Классификатор может оценивать вероятность того, что клик относится к выбранному классу (сконвертившийся или нет), а не только булев факт. Линейная регрессия тут вообще не при чем, т.к. это задача классификации, а не регрессии.

Допустим, есть клик, который на самом деле сконвертился.
Первый классификатор оценил вероятность clf1.predict_proba(click) = (0.51, 0.49) — т.е. 49%.
Второй классификатор оценил вероятность clf1.predict_proba(click) = (0.95, 0.05) — т.е. 5%.

Если threshold для классификатора будет на уровне 0.5 (т.е. если вероятность выше 0.5, расценивать как успешный клик), оба классификатора ошибутся, но второй ошибется значительно сильнее.

+2

Как я повышал конверсию машинным обучением

Arseny_Info Jun 8 2015 at 14:11

Не browscap (проект же на Python), но решение похожее. Есть еще география, utm-метки, время − факторов хватает.

0

Как я повышал конверсию машинным обучением

Arseny_Info Jun 8 2015 at 12:23

Рандом в среднем на 30-50% хуже a/b теста.
Оптимизация под мобильный трафик была одинаковой (у одного клиента все хорошо на всех лендингах, у другого — все равномерно плохо).

0

Как я повышал конверсию машинным обучением

Arseny_Info Jun 8 2015 at 10:33

Я смотрел на связь matthews_corrcoef (он по сути похож на f1) и конверсию и тоже ничего не нашел.
Бустинг пробовал, в двух из шести экспериментов сейчас именно он и применяется. Ансамблевые методы вообще работают в среднем лучше :)

0

Как я повышал конверсию машинным обучением

Arseny_Info Jun 8 2015 at 10:18

И как результаты? Удалось добиться значительного роста конверсии?

+2

Как я повышал конверсию машинным обучением

Arseny_Info Jun 8 2015 at 10:17

Для каждого эксперимента — свой корпус, от 10 до 150 тыс. При этом learning curve достаточная плавная, уже на 10-20 тысячах точность обычно была близка к максимуму.

0

Создание системы для блога и работы с документацией: Опыт команды мессенджера Kato

Arseny_Info Feb 26 2015 at 17:12

Кстати, есть неплохая альтернатива на python – Pelican.

+1

Интеграция MS Excel и Python

Arseny_Info Aug 5 2014 at 19:38

Для работы с табличными данными также рекомендую обратить внимание на pandas. На мой взгляд, зачастую удобно прочитать данные из таблицы при помощи pandas, провести необходимые манипуляции с полученным DataFrame и потом опять экспортировать в xls.

+1

Как перестать беспокоиться и создать команду

Arseny_Info Jul 31 2014 at 14:43

Расскажите, пожалуйста, подробнее о проблемах использования django для реализации API.

+1

Знакомьтесь! Appnestic — хостинг-платформа нового поколения

Arseny_Info Mar 21 2014 at 20:58

Сертификат безопасности сайта не является доверенным!
Вы попытались перейти на сайт manage.appnestic.com, но сервер предоставил сертификат, выданный организацией, которую операционная система компьютера не считает надежной. Это может означать, что сервер создал свой собственный сертификат, которому Google Chrome не может доверять, или что вмешался злоумышленник.

+6

Growth Hacking: Как зарабатывать больше, правильно используя метрики

Arseny_Info Mar 13 2014 at 01:16

А где тут, собственно, Growth Hacking? Это абсолютно стандартные метрики и базовые советы «улучшайте конверсию».

0

Должен ли программист быть немножко «product manager-ом»?

Arseny_Info Jan 30 2014 at 01:38

Есть пара нюансов:
— нужно именно предлагать, а не делать по-своему без обсуждений (бывали грустные прецеденты);
— если идеи, предлагаемые разработчиком, постоянно отвергаются (к сожалению, не всегда разработчик хорошо понимает предметную область), это явно демотивируют.

Тем не менее, я всецело за — преимущества чаще перевешивают недостатки.

0

Бета-тестирование «Фрилансим 2.0»

Arseny_Info Jan 30 2014 at 01:33

«Старожил», подписка действует до 01.03.2014 :(

+2

Product management: от неплохой идеи к уместной фиче

Arseny_Info Nov 12 2013 at 11:35

Например, внутренняя (недоступная для сторонних заказчиков) баннерокрутилка.
Product manager заинтересован в том, чтобы повышать среднюю прибыль с тысячи показов (например, улучшая таргетинг); стейкхолдеров (бизнес-руководство) не особенно интересует, как именно это будет сделано; конечные посетители сайта вообще никак не заинтересованы в продукте.

0

Product management: от неплохой идеи к уместной фиче

Arseny_Info Nov 12 2013 at 03:03

Я в начале статьи сделал уточнил специально:

В основном занимаюсь сервисами, с которыми практически не сталкивается пользователь, что накладывает своеобразный отпечаток

Необязательно у сервиса бывает пользователь, который может что-то подсказать. Например, это может быть какой-то сугубо технический сервис или сервис, которым пользователи вообще предпочли бы не пользоваться, но по какой-то причине вынуждены.

Далеко не всегда пользователь прав в своем мнении.

0

Сетевая файловая система Хабра на 1.5 МБ

Arseny_Info Sep 20 2013 at 22:03

+16

Стоит ли идти в менеджмент и зона

Arseny_Info Sep 14 2013 at 02:08

Продакт менеджером сложно стать с нуля, нужен опыт в других сферах (аналитика, маркетинг, etc.) и понимание не только технологий, но и бизнеса.
У прожект менеджера порог вхождения слегка ниже, имхо.

0

Pure URL — автоматическое удаление utm_source и прочего мусора из URL

Arseny_Info Sep 2 2013 at 10:40

На каком основании кто-то может считать себя человеком, у которого есть моральное право судить, умеют ли рекламодатели трактовать эти данные?

-3

Pure URL — автоматическое удаление utm_source и прочего мусора из URL

Arseny_Info Sep 2 2013 at 10:39

Следуя подобной логике, можно оправдать, например, брутфорс паролей к чужим аккаунтам — «при желании можно было придумать стойкий пароль».

P.S. Сам сторонник единой метки-идентификатора, но для подавляющего большинства сторонних аналитических решений этого недостаточно.

-2

Pure URL — автоматическое удаление utm_source и прочего мусора из URL

Arseny_Info Sep 2 2013 at 10:24

Никогда не включал.

+6

6

7 8 ...