Аналитик данных сегодня –это не человек, который умеет просто выгружать данные и знает SQL и этого достаточно, сейчас это человек-оркестр, который умеет выбирать правильный инструмент под задачу, конечно, где-то может быть и достаточно Excel, а для каких-то задач уже нужен сложный запрос с оконными функциями, а где-то нужно собрать быстрый дашборд в Power BI, чтобы заказчик сам мог смотреть цифры.
В этой статье разберу реальный инструментарий аналитика – не тот, который пишут в идеальных вакансиях, а тот, который реально используется в работе.
Зачем аналитику вообще инструменты?
Инструменты – это не цель, а средство и они нужны, чтобы отвечать на вопросы бизнеса:
- Что произошло? (отчеты, дашборды)
- Почему это произошло? (исследования, сегментация)
- Что будет дальше? (прогнозы, тренды)
- Что сделать, чтобы стало лучше? (эксперименты, рекомендации)
И для каждого этапа — свои инструменты, давайте по порядку.
Уровень 1. Базовый: без этого никуда
SQL – как основной язык общения с данными
Это не просто навык, это базовая база, без которой вы не аналитик, SQL – это способ получить данные, если вы не можете самостоятельно забрать данные из базы, вы зависите от других и это путь в никуда.
Что нужно знать обязательно:
Базовые запросы: SELECT, FROM, WHERE
Группировки: GROUP BY, HAVING
Соединения: JOIN (INNER, LEFT, RIGHT)
Подзапросы и CTE (WITH)
Оконные функции (ROW_NUMBER, LAG, SUM OVER)
Где учить:
- Stepik – бесплатные курсы
- SQL-Ex – бесплатный тренажер
- Симулятор SQL от Karpov Courses – отличный бесплатный курс
Как понять, что вы знаете SQL: вы можете написать запро��, который считает какую-нибудь базовую метрику(например, ретеншн), не выгружая данные в Excel.
Excel/Google Таблицы
Есть аналитики, которые относятся к Excel: "фу, это для бухгалтеров" и очень зря, ведь Excel – это самый быстрый инструмент для ad-hoc анализа.
Что нужно знать:
Сводные таблицы (Pivot Tables)
ВПР / ИНДЕКС+ПОИСКПОЗ (или XLOOKUP в новых версиях)
Условное форматирование
Базовые формулы: ЕСЛИ, СУММЕСЛИ, СЧЁТЕСЛИ
Как строить графики и диаграммы
Когда использовать: когда нужно быстро пощупать данные, посчитать что-то на коленке, показать коллеге, не погружая его в SQL или когда менеджер хочет видеть все формулы расчета.
Уровень 2. Продвинутый: для глубины и гибкости
Python (или R) – для сложных задач
SQL и Excel заканчиваются там, где начинается сложная математика, автоматизация или работа с большими данными и тут в игру вступает Python.
Что нужно знать:
Базовый синтаксис: циклы, функции, условия
Pandas – работа с табличными данными (чистка, фильтрация, трансформация)
NumPy – математические операции
Matplotlib/Seaborn – визуализация
Scipy/Statsmodels – статистические тесты
Пример задачи: посчитать t-тест для двух выборок, чтобы понять, значимо ли отличаются конверсии в A/B-тесте. В Excel это делать больно, в Python всего 3 строки кода.
Где учить:
Бесплатные курсы на Stepik
Kaggle – соревнования и ноутбуки
Видеохостинг (любой) – каналы с разборами
BI-системы (Power BI / Tableau) — для дашбордов
В какой-то момент вы устанете делать отчеты в Excel, и вам помогут BI-системы, которые позволяют автоматизировать этот процесс: один раз построил дашборд и бизнес сам смотрит цифры.
Что нужно знать ( на примере Power BI):
Подключение к данным (SQL, Excel, CSV)
Модель данных и связи между таблицами
DAX – язык формул (CALCULATE, FILTER, SUMX)
Визуализации и форматирование
Публикация и настройка доступа
Когда использовать: регулярные отчеты, метрики для руководства, мониторинг KPI.
Уровень 3. Экспертный: для понимания глубины
Понимание устройства DWH (Data Warehouse)
Вы будете работать с данными, которые кто-то до вас сложил в базу, но если вы понимаете, как они туда попали, вы будете писать более правильные запросы и меньше времени тратить на отладку.
Что нужно знать:
Схемы данных: ODS, DM, витрины (куда лезть за сырыми данными, а где брать агрегаты)
ETL-процессы: данные обновляются не мгновенно, а по расписанию
Партиционирование: почему запрос к большой таблице нужно писать с фильтром по дате
Зачем это аналитику: чтобы не задавать глупых вопросов дата-инженерам и не ждать сутками выполнения запросов.
Основы статистики и проверки гипотез
Аналитика – это не про "посчитать среднее", это про понимание случайности и умение отличать сигнал от шума.
Что нужно знать:
Описательная статистика: среднее, медиана, стандартное отклонение
Распределения: нормальное, биномиальное, Пуассона
Проверка гипотез: p-value, t-тест, критерий Манна-Уитни
A/B-тестирование: как правильно считать результаты
Ошибка новичка: увидеть, что конверсия выросла с 5% до 5.5%, и объявить победу не проверив статистическую знач��мость.
Книга: «Математика для Data Science» Т. Нилд (прямо с примерами кода).
Машинное обучение для аналитика (да, тоже нужно)
От вас не ждут, что вы напишете нейросеть. Но ждут, что вы:
Понимаете, какие задачи решает ML
Можете построить простую модель (линейную регрессию, логистическую регрессию, кластеризацию)
Умеете оценивать качество модели (Accuracy, Precision, Recall, F1, ROC-AUC)
Понимаете, что такое переобучение и почему идеальная модель на прошлых данных может провалиться на новых
Где учить: Kaggle, статьи на Хабре, курс "Машинное обучение для начинающих" на Stepik.
Софт-скиллы: то, что отличает хорошего аналитика от отличного
1 Понимание бизнеса
Самая частая ошибка – это сделать крутой отчет, который никому не нужен. Прежде чем писать запрос, спросите: "А зачем? Какую проблему мы решаем?" Хороший аналитик не просто считает цифры. Он переводит бизнес-вопросы в гипотезы и проверяет их на данных.
2. Коммуникация и визуализация
Аналитик – это переводчик с языка бизнеса на язык данных и обратно, если бизнес говорит: "Что-то продажи упали", вы должны перевести это в гипотезы:
- Проверим конверсию в воронке
- Посмотрим динамику по неделям
- Сегментируем по каналам трафика
- Сравним с прошлым годом
И ответить не таблицей с 100500 строк, а (условно) одним понятным графиком с выводами и предложениями.
3. Управление ожиданиями – это самый недооцененный навык
Бизнес часто не понимает, что можно получить от данных, а что нельзя, он ждет "серебряную пулю", а ваша задача с самого начала очертить границы возможного.
Как это работает на практике:
❌ Ошибка: Вас просят "сделай отчет по продажам за вчера". Вы говорите "хорошо, будет через час". А через час выясняется, что данные обновляются только в 10 утра, и отчета не будет до обеда.
✅ Как надо: Сразу уточнить: "Данные по продажам за вчера будут доступны только после 10 утра, отчет сделаю к 11:00".
❌ Ошибка: Вас просят "посмотреть динамику продаж". Вы присылаете график. Вам говорят: "А давай еще по регионам, по товарам, и еще прогноз на месяц".
✅ Как надо: На этапе постановки зафиксировать ТЗ: "Смотрим динамику продаж по неделям в целом по компании. Если потребуется детализация — это следующий этап".
❌ Ошибка: Вам дали "грязные" данные. Вы посчитали, получилась ерунда. Бизнес кричит: "Ты плохой аналитик!".
✅ Как надо: Прежде чем показывать цифры, сказать: "Даные выглядят сырыми, тут пропуски и дубликаты. Я почищу, но итоговые цифры могут отличаться от ваших ожиданий, и мы потеряем около 20% данных".
Золотое правило: Лучше пообещать меньше, но сделать быстрее и качественнее, чем пообещать золотые горы и не сдать. Всегда закладывайте люфт в сроки и всегда уточняйте вводные.
Итог: чек-лист начинающего аналитика
Если вы только входите в профессию, вот минимальный набор, к которому стоит стремиться:
Категория | Инструмент/навык | Уровень владения |
|---|---|---|
SQL | SELECT, JOIN, GROUP BY, оконные функции | Уверенно |
Excel | Сводные таблицы, ВПР, базовые формулы | Уверенно |
Python | Pandas, NumPy, визуализация | Базово |
BI | Power BI / Tableau (один на выбор) | Базово |
Статистика | Дескриптивная статистика, t-тест, p-value | Понимание |
Бизнес | Понимание метрик, умение задавать вопросы | Развивать |
Коммуникация | Понятно объяснять сложное | Развивать |
Предыдущие статьи на эту тему:
Путь в аналитику данных: базовый минимум для старта
Как стать аналитиком с нуля (и не потратить на это много денег)
💚Больше про будни и задачи аналитика данных в бигтехе в моем тг канале 🌸Таня и Данные📊
