Нужно ли аналитику машинное обучение? Ответ неоднозначный: всё зависит от места работы и планов в профессии.
Меня зовут Раф, я аналитик ценообразования в Авито (а раньше в Яндекс Лавке), преподаватель машинного обучения в Центральном университете, выпускник факультета компьютерных наук в НИУ ВШЭ и курса «Специалист по Data Science» в Яндекс Практикуме.
В этой заметке я расскажу, зачем аналитику машинное обучение, когда без него можно обойтись и как его освоить, если этого потребуют задачи.
Где не нужно машинное обучение
Предположим, вы хорошо знаете классическую аналитику и совсем не разбираетесь в машинном обучении. Хорошая новость: есть много задач, где вы сможете проявить себя.
К ним относятся:
визуализация, создание BI-отчётов и дашбордов для мониторинга,
классическое A/B-тестирование и проверка гипотез (но за исключением продвинутых ML-методов проверки гипотез),
аналитические оценки на основе исторических данных, построение пайплайнов обработки данных при помощи SQL и Pandas.
Где без машинного обучения не обойтись
Есть и плохая новость: многие задачи в аналитике требуют знания машинного обучения.
Вот некоторые примеры:
кластеризация данных для выявления закономерностей,
построение прогнозов для временных рядов, оценка важности признаков и их влияния на сложные метрики,
обработка и анализ текстовых данных, картинок и видео,
автоматизация процессов на основе AI-моделей (не скажу, что этим часто занимается аналитик, но всё-таки такое может быть).
Это значит, что знание машинного обучения критически важно в нескольких сферах.
Маркетинговая аналитика. Машинное обучение помогает спрогнозировать отток или понять, какие пользователи принесут деньги бизнесу. Прогнозы в этой сфере часто необходимы, и без классического машинного обучения их будет делать непросто.
Ценообразование и e-commerce. Прогноз спроса, выбор оптимальной цены, моделирование продаж при разных сценариях — заниматься этим «руками» достаточно сложно. Машинное обучение позволяет быстро понять, как изменятся показатели при определённой цене, и выбрать оптимальную стоимость.
Антифрод. ML-модели используются для выявления аномалий, подозрительных транзакций и нечестных действий пользователей. Можно обойтись и простыми эмпирическими правилами, но всё-таки в машинном обучении существуют более элегантные подходы для детекций подозрительных объектов в данных.
Рекомендательные системы. Подбор товаров или контента, составление персонализированных подборок — всё это станет гораздо проще с пониманием ML-моделей.
Например, мой опыт работы в Авито сейчас почти не связан с машинным обучением, а в Яндекс Лавке оно требовалось примерно в 30% задач.
Как освоить машинное обучение
Если вы понимаете, что знание машинного обучения важно в вашей сфере, попробуйте освоить направление до того, как это отразится на задачах. Например, с помощью этих курсов и видео.
Основы машинного обучения, ФКН ВШЭ
На первом курсе я начинал с лекций курса «Интеллектуальный анализ данных» топового преподавателя ФКН ВШЭ — Евгения Соколова. Плюс этой программы в том, что лекции можно смотреть, даже не освоив программирование, а из математики потребуются лишь определения матрицы и производной, всё остальное будет поясняться прямо на лекциях.
Из такого описания может показаться, что курс поверхностный, однако это совсем не так — спустя несколько лекций начнётся разбор сложных моделей, но вы уже будете к этому готовы.
Курс состоит из трёх частей: «Основы машинного обучения», «Основы глубинного обучения» и «Прикладные задачи анализа данных».
Первая часть знакомит с классическим машинным обучением для табличных данных — от линейных и метрических моделей до подходов к обучению и обработке данных. Формирует фундаментальные навыки анализа данных и построения математических моделей. Именно такой курс по классическому машинному обучению будет наиболее актуален для аналитика, в отличие от глубинного обучения (которое обычно называется Deep Learning).
Основы глубинного обучения, ФКН ВШЭ
Для самых ненасытных есть часть по нейросетям, в которой разбирается оптимизация, обучение, архитектуры для текста и изображений. Плюс практический блок, посвящённый подготовке данных, подбору гиперпараметров и настройке модели под метрику.
Прикладные задачи анализа данных, ФКН ВШЭ
Эта часть о том, как применять машинное обучение в реальности. Даёт практический опыт решения задач NLP, CV, временных рядов и рекомендательных систем.
Инженер машинного обучения, Яндекс Практикум

Сам я учился на программе «Специалист по Data Science», но в Практикуме есть и курс «Инженер машинного обучения», на котором можно освоить направление и выполнить шесть проектов. Программа подходит аналитикам со знанием Python, SQL, Git, основ работы с данными и принципов классического машинного обучения.
Попробовать можно бесплатно: вводная часть «Создание пайплайна по подготовке данных и выводу ML-модели в продакшн» открыта всем желающим. Прохождение займёт пять часов — достаточно, чтобы понять, подходит ли курс и формат обучения.
Карьера в Data Science: типичные ошибки на собеседовании, Yandex for ML
Видео с разбором интервью от Валеры Бабушкина, одного из самых известных специалистов по Data Science в СНГ.
Топ вопросов Data Science собеседований: Classic ML, Alexandr Lokis
Неплохой пример сборника вопросов по машинному обучению с собеседований в двух частях.
Data Science, черные ящики — и почему вам сильно повезло, ФКН ВШЭ
Замечательная лекция от Андрея Себранта, благодаря которой я отчасти вдохновился изучать анализ данных (и аналитику как его составляющую) на первом курсе университета. Рекомендую!
Нужно ли аналитику машинное обучение? Всё будет зависеть от вакансии и задач. На определённых местах работы (и, по моим ощущениям, их много) будет достаточно лишь хорошего знания классической аналитики.
Однако можно точно сказать, что понимание машинного обучения будет отличным преимуществом перед другими кандидатами и откроет перед вами новый инструментарий для решения задач.

