Привет, я работаю в сфере уже около 10 лет, преимущественно по специальности чистой продуктовой аналитики. Иногда я оглядываюсь назад и думаю — с текущим пониманием что и как устроено в работе, как бы я выстраивал свой процесс обучения с нуля?
Закинул вопрос в группу, и оказалось, что даже при текущем наличии на рынке вообще всевозможных ресурсов, новичкам не хватает системы.
Эта статья — мои мысли на эту тему. В каком порядке и какие материалы впитывать, чтобы потом комфортно себя чувствовать в любой продуктовой компании.
Из челленджей — все материалы должны быть бесплатными, или достаточно дешёвыми, чтобы была возможность бросить учёбу на пол пути (ну не зашло, бывает) и не жалеть о потраченных деньгах на мега-курс от %big_tech_name%.
В этой статье я попробую собрать план обучения профессии, как бы я вкатывался сейчас, что бы изучал раньше, что позже, на что бы потратил больше сил и времени и т.д. У некоторых пунктов будут аналоги, можно выбрать на свой вкус без потерь качества.
По ходу повествования, я буду закидывать материалы в том порядке, в котором я бы их сам изучал, а в конце оставлю весь получившийся список с группировкой по темам, если вдруг интересует что-то конкретное.
По итогам всех усвоенных материалов, это будет уровень знаний примерно middle+, но фактически, грейды зависят больше от опыта (особенно в программировании), чем от объёма знаний.
И последнее — я тут не пытаюсь продать курсы, поэтому обещать что будет весело, интересно и быстро, а потом вас наймут на 300к/наносек я не буду. Будет долго, местами сложно, иногда душно, пару раз вы захотите слиться и бросить эту идею. Но… нет, тут не будет но 🙂
Ладно, пожалуй хватит предисловия, поехали.
Кто такой вообще продуктовый аналитик (ПА)? — Это человек, который работает внутри продукта, часто в составе команды разработки или развития. В основном, в тесной связке с продакт-менеджером и дизайнером. Занимается улучшением приложения или сайта, исследует, как себя чувствует продукт и его юзеры, проводит эксперименты, работает с метриками и тд.
Основная цель и назначение ПА — улучшать пользовательский опыт юзеров и за счёт этого увеличивать прибыль компании.
Исходя из вышеперечисленного, мы имеем такие основные требования к ПА:
Знание математики, применимой к классическому анализу данных;
Понимание как устроена разработка продукта с точки зрения его дизайна;
Понимание экономики продукта и бизнеса в целом;
Понимание как вообще работает система данных, умение эти данные извлекать;
Умение обрабатывать и анализировать данные с помощью различных алгоритмов;
Умение делать правильные выводы, искать и тестировать гипотезы;
Что ж, давайте разбирать всё это дело последовательно.
Шаг 1. Готовим базу
Начинать погружение в профессию я настоятельно рекомендую с математической базы. Тут у нас наиболее значимы две области математики, а именно статистика и теория вероятностей. Они смежные, поэтому зная одну, легко впитываешь другую.
На начальном этапе от нас не требуется защищать докторскую, так что не переживайте, разберёмся с основами и на время переключимся на более интересные вещи.
С чего начать? Начать стоит со статистики. Если вам только от этого слова не по себе, то, наверное, самая простая книга по теме — легендарная “Статистика и котики” от Владимира Савельева. Там вы на примере Барсиков разберётесь с базовыми понятиями и вам будет проще двигаться дальше.
Если вы и так умеете отличать среднее от медианы, а котики для вас очень уж простая книга, то хорошим решением будет начинать с не менее легендарного курса по статистике от Анатолия Карпова — “Основы статистики, часть 1”. Тут разбирается вся база, которая потребуется на начальном этапе.
После курса Карпова можно закрепить информацию с помощью книги “Статистика шаг за шагом” от Роберта Донелли. Легко и интересно читается и отлично дополняет первую часть курса Карпова.
Задача этапа: Разобраться в базовых терминах и понятиях статистики (меры центральной тенденции, центральная предельная теорема, виды и особенности распределений, базовые стат. критерии, корреляция, регрессия).
Пока этого достаточно. К более сложной статистике (и теории вероятностей) мы ещё вернёмся.
Шаг 2. Учимся писать код. SQL
Первым практическим шагом в любой аналитической задаче, почти всегда будет получение данных. Не важно — вы готовите исследование, анализируете аномалию, строите дашборд или отчёт, работаете над экспериментом — сперва нужно достать данные.
Чаще всего компании хранят данные в специальных базах, доступ к которым осуществляется через язык запросов SQL. Баз данных бывает огромное множество, и диалект языка в них отличается. Но это не страшно, базовые конструкции всегда одинаковые.
Для изучения SQL с нуля существует множество ресурсов и все они плюс минус одинаковы. Дальше будет небольшой список, выбирайте что-то одно, для начала этого будет достаточно.
Если есть приемлемый английский, лично я бы потратил 30$ на подписку DataCamp. Там много чего есть, что понадобится позже, не только SQL.
Второй вариант (опять же, если нет проблем с английским или хотя бы с плагином переводчика) — бесплатный вводный трек на Code Academy.
Третий и последний англоязычный ресурс — SQLBolt, очень популярный, толковый и бесплатный.
Четвертый вариант по порядку, но не по значимости (и, наконец-то, русскоязычный!) — бесплатный “Симулятор SQL” от Анатолия Карпова.
Задача этапа: Научиться базовым конструкциям и порешать задачки, чтобы немного наработать практику. SQL сам по себе достаточно простой язык для понимания. Его сложность заключается в умении мыслить языком запросов, но она закрывается с опытом.
Инструментарий: Для работы с SQL в будущем, можно сразу попробовать поставить себе окружение (прогу для ПК) и немного его изучить. Я большой фанат DataGrip, но он платный. Популярный open-source (читай бесплатный) аналог — DBeaver.
Шаг 3.1. Учимся писать код. R
Второй язык аналитика — скриптовый язык. Когда мы выгрузили данные из базы с помощью SQL, эти данные нужно обработать и почистить, а потом проанализировать и сделать выводы. Кроме того, скриптовый язык используется для визуализации, в АБ-тестах, в моделировании и вообще почти в любой аналитической задаче.
С этой ролью прекрасно справляются два популярных языка — R и Python.
Я лично выбрал R основным, потому что мне нравится его синтаксис (особенно с dplyr), поддержка большинства нужных методов “из коробки”, визуально приятный IDE, популярность на американском рынке и его сообщество. Вы можете выбирать Python, тут всё равно. В целом, никто не запрещает выучить оба. Но для начала нам достаточно любого из них.
Начать изучение R можно несколькими путями:
Если вы выбрали DataCamp для SQL, то можно сразу нырять в карьерный трек “Data Analyst with R”. Там разбираются основы на примере базовых задач аналитика.
Если хочется русскоязычного, то начать можно с курса Антона Антонова — “Основы программирования на R” на Stepik.
После него идём на курс Анатолия Карпова и команды — “Анализ данных в R, часть 1”
И потом на их же вторую часть — “Анализ данных в R, часть 2”
На первом этапе этого будет достаточно.
Задача этапа: Выучить базовый синтаксис языка, разобраться с типами данных, разобраться с аналитическими пакетами серии tidyverse (dplyr, tidyr, ggplot, lubridate).
Инструментарий: Для работы с R нужно установить сам дистрибутив и поставить окружение. Самое популярное и родное, конечно же — R Studio.
Бонусом, если вы захотите улучшить своё понимание языка в задачах анализа данных, я рекомендую прочитать ещё две книги:
Хэдли Уикхем, Гарретт Гроулмунд — “Язык R в задачах науки о данных”. Хэдли Уикхем, наверное, самый известный амбассадор языка R, можно сказать его крёстный отец. Он автор популярных пакетов серии tidyverse, без которого сложно представить современную работу с R. А ещё он пишет очень легко и интересно.
Сергей Мастицкий, Владимир Шитиков — “Статистический анализ и визуализация данных с помощью R”. На мой взгляд, более сложная книга, чем предыдущая (сложнее читается), но тоже очень информативная, разбирает тонны примеров типовых аналитических задач.
Эти книги больше про оттачивание навыка, чем про начальное погружение. Их лучше пока не трогать, а вернуться к ним после прохождения всех остальных шагов.
И ещё один бонус, относительно новая книга Хэдли Уикхема — “Изучаем Shiny”. Shiny — это мощнейший фреймворк, доступный как для R так и для Python, который позволяет писать интерактивные приложения. Он довольно большой, поэтому огромным плюсом тут является авторство Уикхема, который умеет объяснять сложные вещи простым языком. Но не спешите, этот шедевр тоже пока лучше не трогать, а приберечь на будущее, когда закончите основную подборку.
Шаг 3.2. Учимся писать код. Python
Так получилось, что я не фанат Python и имею довольно посредственный опыт работы с ним. Поэтому за помощью по актуальным ресурсам я обратился к ребятам в группе (кстати, подписывайтесь, там про ПА для новичков 🙂).
Там многие сейчас обучаются, поэтому у них информация самая свежая 🙂
Вот какие варианты мы собрали:
Курс от Тимура Гуева — “Поколение Python, начальный”
Курс от Тимура Гуева — “Поколение Python, продвинутый”
Курс от Алексея Задойного — “Практикум по математике и Python”
Курс от Артема Егорова — “Инди-курс программирования на Python”
И не забываем о курсе для новичков у Carpov Courses — “Основы Python”
От себя добавлю ещё вариант, если у вас есть подписка на DataCamp — карьерный трек “Data Analyst with Python”.
Они все подойдут новичкам и все достаточно хороши, выбирайте, для начала, какой-нибудь один.
Задача этапа: Выучить базовый синтаксис языка, разобраться с типами данных, разобраться с аналитическими пакетами (pandas, numpy, matplotlib). Научиться работать с блокнотом (Jupiter Notebook).
Инструментарий: Для работы с Python нужен дистрибутив, и какое-нибудь окружение на выбор, из популярных: Anaconda, PyCharm и VSCode.
Шаг 4. Усиливаемся в математике
Теперь, зная основы любого из скриптовых языков, мы можем немного больше углубиться в статистику.
Для начала рекомендую курс Анатолия Карпова — “Основы статистики, часть 2”, а сразу после него “Основы статистики, часть 3”. Там разбираются классические методы анализа с использованием R, но питонистам, в целом, тоже будет понятно. Система программирования там не то чтобы принципиально отличается.
После завершения этих курсов, пора немного погрузиться в теорию вероятностей. Вообще, этот шаг довольно опциональный. Статистика уже включает в себя множество идей теорвера, но если вы где-то на этом этапе понимаете, что вам всё нравится и вы настроены серьёзно, рекомендую сделать тут остановку.
По теорверу я не посоветую чего-то лёгкого и интересного, а просто зайду с классики, т.к. я бы их и читал:
Владимир Гмурман — “Теория вероятностей и математическая статистика”. Это учебник, но написан на удивление последовательно, поэтому и воспринимается легко.
Альберт Ширяев — “Вероятность”. Абсолютная классика, хоть и, на мой взгляд, сложнее предыдущего.
В целом, даже одна книга в арсенале уже сильно прокачает ваше понимание темы.
Но и это ещё не конец 🙂 в очередной раз мы вернемся к математике позже, когда затронем тему ML (Machine Learning).
Шаг 5. Формируем продуктовый вижн. Архитектура и дизайн
Продуктовая аналитика, в отличии от дата аналитики или других направлений, находится в тесной связи с бизнесом, в целом, и продуктом, в частности. Поэтому понимание, как вообще устроено приложение, с точки зрения дизайна, часто играет большую роль в формировании гипотез или в банальном понимании почему юзеры ведут себя так, а не иначе.
Начать погружение в эту тему лучше всего с пары простых книг:
Стив Круг — “Не заставляйте меня думать”
Дональд Норман — “Дизайн привычных вещей”
Робин Уильямс — “Дизайн. Книга для недизайнеров”
Они небольшие и написаны просто. Это даст вам базовое понимание зачем и какие кнопки тут вообще понатыканы, и в будущем, это хороший задел для коммуникаций с дизайнером на одном языке.
Пока этого достаточно. Потом, со временем, я рекомендую ещё больше погрузиться в эту тему, с помощью двух великих работ лучшего проектировщика современности (по версии меня):
Алан Купер — “Интерфейсы”
Алан Купер — “Психбольница в руках пациентов”
Они дадут ещё больше понимания логики тех или иных интерфейсных решений, и очень помогут в работе над анализом поведения юзеров.
Шаг 6. Формируем продуктовый вижн. Юнит-экономика
Вся работа продуктового аналитика так или иначе завязана на каких-то критериях оценки того или иного события. Эти критерии называются метриками. Они бывают экономические (доходы, расходы и т.д.) и поведенческие (возвращаемость, заинтересованность, вовлечённость и т.д.).
Ну и т.к. мы тут чтобы зарабатывать компании больше денег, важно понимать из чего эти деньги вообще складываются. Что лучше: дороже продать сразу, или дешевле, но много раз постепенно? Сколько стоит юзер и как понять много это или мало? Какой процент пользователей вернётся через месяц? — раздел юнит-экономики включает в себя все эти вопросы и старается описать их метриками.
В России есть два главных амбассадора этой темы — Илья Красинский и Даниил Ханин — которые сделали для развития направления, пожалуй, больше всех.
У Даниила Ханина есть два отличных цикла видео для новичков, с которыми я предлагаю ознакомиться в первую очередь:
Даниил Ханин — “Основы юнит-экономики”, плейлист на 44 видео
Даниил Ханин — “Метрики юнит-экономики”, плейлист на 22 видео
А потом рекомендую глянуть очень интересную старенькую (но актуальную) лекцию Ильи Красинского — “Юнит-экономика или поиск точек кратного роста”.
Вообще, юнит-экономика — штука довольно гибкая, для каждого продукта можно придумывать свои метрики, лишь бы в этом был смысл. Не обязательно зубрить все эти ARPPU и ROI (со временем сами запомнятся), главное уловить суть — как работа через метрики упрощает коммуникацию с командой и помогает всем мыслить в одной парадигме.
Шаг 7. Систематизируем задачу анализа данных
В продуктовой аналитике одной из важнейших задач является продуктовое исследование. Когда выходит новая фича в продукте, когда планируется редизайн старой, когда открывается новое направление, когда мы просто слабо понимаем как работает какой-то элемент интерфейса — всё это задачи исследований.
"Слушай, у нас есть вот такая фича, мы пушим её через маркетинг и влили туда уже дофига бабла. Нам бы понять, а что там вообще происходит-то!" — поверьте, это супер типичный запрос к продуктовому аналитику.
Это короткий, но очень важный шаг. Тут я порекомендую всего одну книгу, которая прекрасно закрывает вопрос о грамотном построении процесса продуктового исследования и анализа данных.
Кирилл Еременко — “Работа с данными в любой сфере”. Я её стабильно перечитываю раз в год, помогает бороться с первыми симптомами выгорания 🙂
Шаг 8. Учимся правильно визуализировать данные
Плотная работа с графиками, дашбордами и отчётами — обычно, прерогатива BI-аналитиков (Business intelligence). Но и в продуктовой аналитике часто приходится визуализировать свои данные, особенно в исследованиях, чтобы упростить усваивание информации заказчиком.
Слишком сильно в тему зарываться не обязательно, но есть одна очень хорошая книга, которая не только поможет разобраться когда какой график использовать, но и как сделать их качественнее. Это книга Александра Богачева — “Графики, которые убеждают всех”. Очень полно освещает тему, крайне рекомендую.
Шаг 9. Знакомимся с АБ-тестами
АБ-тесты — это огромная тема. В больших компаниях ими занимается отдельное подразделение дата аналитиков. Но в компаниях поменьше, часто эта задача уходит продуктовому аналитику. Начать своё знакомство с темой экспериментов я бы рекомендовал сразу с козыря — с книги Рона Кохави, Дианы Тан и Я Сюй — “Доверительное А/В-тестирование”. В ней достаточно подробно разбирается весь путь эксперимента, от запуска до принятия решения.
На первом этапе этого более чем достаточно, со временем, когда вы погрузитесь в сферу, информация по АБ будет сыпаться на вас со всех сторон.
После этого шага можно смело открывать своё резюме миру 🙂
Шаг 10. Разбираемся с ML для продуктовой аналитики
Это очень объёмная тема из сферы деятельности специалистов Data Science. В продуктовой аналитике модели машинного обучения тоже используются довольно часто, но в сильно ограниченном наборе методов.
К основным алгоритмам ПА можно отнести кластеризацию (K-means, DBSCAN), классификацию (k-NN, SVM, RF, GB) и регрессию (отдельно стоят векторы Шепли). В книге Анналина Ына — “Теоретический минимум по Big Data” разбираются основные алгоритмы ML для ПА. Не детально, а с теоретической стороны, как они работают и в каких задачах применяются. Это хорошая первая точка контакта с темой.
Обычно знание ML в вакансиях продуктового аналитика идёт в блоке "будет преимуществом", но на самом деле, когда вы прочувствуете всю прелесть ML-алгоритмов, вы начнёте применять их почти везде. Они очень хорошо расширяют границы продуктовых исследований.
В шаге 4 про углубленную математику я говорил, что мы ещё вернёмся к ней. И вот тут самое время доставать книгу Питера Брюса, Эндрю Брюса и Питера Гедека — “Практическая статистика для специалистов Data Science”. Эта книга разбирает главные понятия статистики с примерами на R и Python, затрагивая как базовые вещи типа Exploratory data analysis, так и те самые продуктовые ML алгоритмы.
Шаг 11. Погружаемся в аналитическую культуру
Этот шаг завершающий, он не столько про развитие скиллов, сколько про формирование понимания, что вообще происходит в аналитике внутри компании.
Тут очень хорошо вписывается, на мой взгляд, шедевральная книга Карла Андерсена — “Аналитическая культура”. Она, конечно, предназначена больше для CDO или тимлидов, и рассказывает о том, как выстроить культуру работы с данными внутри компании. Но я считаю, что каждый аналитик должен понимать эти идеи, чтобы комфортно вкатываться в работу на новом месте. Когда ты не просто пришёл и начал жить по внутренним правилам, а можешь оценить что в компании организовано хорошо, а что не очень. Ну и вообще, это такой взгляд сверху, часто очень полезный.
Материалы по темам
Математическая база
Статистика
Книга. Владимир Савельев — “Статистика и котики”
Книга. Робер Донелли — “Статистика шаг за шагом”
Курс. Анатолий Карпов — “Основы статистики, часть 1”
Курс. Анатолий Карпов — “Основы статистики, часть 2”
Курс. Анатолий Карпов — “Основы статистики, часть 3”
Книга. Питер Брюс, Эндрю Брюс, Питер Гедек — “Практическая статистика для специалистов Data Science”
Теория вероятностей
Книга. Владимир Гмурман — “Теория вероятностей и математическая статистика”
Книга. Альберт Ширяев — “Вероятность”
SQL
Платформа. Code Academy — “Learn SQL”
Платформа. SQLBolt
Платформа. DataCamp — “SQL fundamentals”
Платформа. Carpov Courses — “Симулятор SQL”
R
Платформа. DataCamp — “Data analyst with R”
Курс. Антон Антонов — “Основы программирования на R”
Курс. Анатолий Карпов — “Анализ данных в R, часть 1”
Курс. Анатолий Карпов — “Анализ данных в R, часть 2”
Книга. Хэдли Уикхем, Гарретт Гроулмунд — “Язык R в задачах науки о данных”
Книга. Сергей Мастицкий, Владимир Шитиков — “Статистический анализ и визуализация данных с помощью R”
Книга. Хэдли Уикхем — “Изучаем Shiny”
Python
Курс. Тимур Гуев — “Поколение Python, начальный”
Курс. Тимур Гуев — “Поколение Python, продвинутый”
Курс. Алексей Задойный — “Практикум по математике и Python“
Курс. Артем Егоров — “Инди-курс программирования на Python”
Курс. Carpov Courses — “Основы Python”
Платформа. DataCamp — “Data analyst with Python”
Продуктовый вижн
Архитектура и дизайн
Книга. Стив Круг — Не заставляйте меня думать
Книга. Робин Уильямс — Дизайн. Книга для недизайнеров
Книга. Дональд Норман — Дизайн привычных вещей
Книга. Алан Купер — Интерфейсы
Книга. Алан Купер — Психбольница в руках пациентов
Юнит-экономика
Видео. Даниил Ханин — “Основы юнит-экономики”, плейлист на 44 видео
Видео. Даниил Ханин — “Метрики юнит-экономики”, плейлист на 22 видео
Лекция. Илья Красинский — “Юнит-экономика или поиск точек кратного роста”
Продуктовые исследования, анализ
Книга. Кирилл Еременко — “Работа с данными в любой сфере”
Визуализация данных
Книга. Александр Богачев — “Графики, которые убеждают всех”
АБ-тесты
Книга. Рон Кохави, Диана Тан, Я Сюй — “Доверительное А/В-тестирование”
ML для продуктового аналитика
Книга. Анналин Ын — “Теоретический минимум по Big Data”
Аналитическая культура
Книга. Карл Андерсен — “Аналитическая культура”