Аналитик данных сегодня –это не человек, который умеет просто выгружать данные и знает SQL и этого достаточно, сейчас это человек-оркестр, который умеет выбирать правильный инструмент под задачу, конечно, где-то может быть и достаточно Excel, а для каких-то задач уже нужен сложный запрос с оконными функциями, а где-то нужно собрать быстрый дашборд в Power BI, чтобы заказчик сам мог смотреть цифры.

В этой статье разберу реальный инструментарий аналитика – не тот, который пишут в идеальных вакансиях, а тот, который реально используется в работе.

Зачем аналитику вообще инструменты?

Инструменты – это не цель, а средство и они нужны, чтобы отвечать на вопросы бизнеса:
- Что произошло? (отчеты, дашборды)
- Почему это произошло? (исследования, сегментация)
- Что будет дальше? (прогнозы, тренды)
- Что сделать, чтобы стало лучше? (эксперименты, рекомендации)

И для каждого этапа — свои инструменты, давайте по порядку.

Уровень 1. Базовый: без этого никуда

SQL – как основной язык общения с данными

Это не просто навык, это базовая база, без которой вы не аналитик, SQL – это способ получить данные, если вы не можете самостоятельно забрать данные из базы, вы зависите от других и это путь в никуда.

Что нужно знать обязательно:
Базовые запросы: SELECTFROMWHERE
Группировки: GROUP BYHAVING
Соединения: JOIN (INNER, LEFT, RIGHT)
Подзапросы и CTE (WITH)
Оконные функции (ROW_NUMBERLAGSUM OVER)

Где учить:
- Stepik – бесплатные курсы
- SQL-Ex – бесплатный тренажер
- Симулятор SQL от Karpov Courses – отличный бесплатный курс

Как понять, что вы знаете SQL: вы можете написать запро��, который считает какую-нибудь базовую метрику(например, ретеншн), не выгружая данные в Excel.

Excel/Google Таблицы

Есть аналитики, которые относятся к Excel: "фу, это для бухгалтеров" и очень зря, ведь Excel – это самый быстрый инструмент для ad-hoc анализа.

Что нужно знать:
Сводные таблицы (Pivot Tables)
ВПР / ИНДЕКС+ПОИСКПОЗ (или XLOOKUP в новых версиях)
Условное форматирование
Базовые формулы: ЕСЛИ, СУММЕСЛИ, СЧЁТЕСЛИ
Как строить графики и диаграммы

Когда использовать: когда нужно быстро пощупать данные, посчитать что-то на коленке, показать коллеге, не погружая его в SQL или когда менеджер хочет видеть все формулы расчета.

Уровень 2. Продвинутый: для глубины и гибкости

Python (или R) – для сложных задач

SQL и Excel заканчиваются там, где начинается сложная математика, автоматизация или работа с большими данными и тут в игру вступает Python.

Что нужно знать:
Базовый синтаксис: циклы, функции, условия
Pandas – работа с табличными данными (чистка, фильтрация, трансформация)
NumPy – математические операции
Matplotlib/Seaborn – визуализация
Scipy/Statsmodels – статистические тесты

Пример задачи: посчитать t-тест для двух выборок, чтобы понять, значимо ли отличаются конверсии в A/B-тесте. В Excel это делать больно, в Python всего 3 строки кода.

Где учить:
Бесплатные курсы на Stepik
Kaggle – соревнования и ноутбуки
Видеохостинг (любой) – каналы с разборами

BI-системы (Power BI / Tableau) — для дашбордов

В какой-то момент вы устанете делать отчеты в Excel, и вам помогут BI-системы, которые позволяют автоматизировать этот процесс: один раз построил дашборд и бизнес сам смотрит цифры.

Что нужно знать ( на примере Power BI):
Подключение к данным (SQL, Excel, CSV)
Модель данных и связи между таблицами
DAX – язык формул (CALCULATE, FILTER, SUMX)
Визуализации и форматирование
Публикация и настройка доступа

Когда использовать: регулярные отчеты, метрики для руководства, мониторинг KPI.

Уровень 3. Экспертный: для понимания глубины

Понимание устройства DWH (Data Warehouse)

Вы будете работать с данными, которые кто-то до вас сложил в базу, но если вы понимаете, как они туда попали, вы будете писать более правильные запросы и меньше времени тратить на отладку.

Что нужно знать:
Схемы данных: ODS, DM, витрины (куда лезть за сырыми данными, а где брать агрегаты)
ETL-процессы: данные обновляются не мгновенно, а по расписанию
Партиционирование: почему запрос к большой таблице нужно писать с фильтром по дате

Зачем это аналитику: чтобы не задавать глупых вопросов дата-инженерам и не ждать сутками выполнения запросов.

Основы статистики и проверки гипотез

Аналитика – это не про "посчитать среднее", это про понимание случайности и умение отличать сигнал от шума.

Что нужно знать:

Описательная статистика: среднее, медиана, стандартное отклонение
Распределения: нормальное, биномиальное, Пуассона
Проверка гипотез: p-value, t-тест, критерий Манна-Уитни
A/B-тестирование: как правильно считать результаты

Ошибка новичка: увидеть, что конверсия выросла с 5% до 5.5%, и объявить победу не проверив статистическую знач��мость.

Книга: «Математика для Data Science» Т. Нилд (прямо с примерами кода).

Машинное обучение для аналитика (да, тоже нужно)

От вас не ждут, что вы напишете нейросеть. Но ждут, что вы:
Понимаете, какие задачи решает ML
Можете построить простую модель (линейную регрессию, логистическую регрессию, кластеризацию)
Умеете оценивать качество модели (Accuracy, Precision, Recall, F1, ROC-AUC)
Понимаете, что такое переобучение и почему идеальная модель на прошлых данных может провалиться на новых

Где учить: Kaggle, статьи на Хабре, курс "Машинное обучение для начинающих" на Stepik.

Софт-скиллы: то, что отличает хорошего аналитика от отличного

1 Понимание бизнеса

Самая частая ошибка – это сделать крутой отчет, который никому не нужен. Прежде чем писать запрос, спросите: "А зачем? Какую проблему мы решаем?" Хороший аналитик не просто считает цифры. Он переводит бизнес-вопросы в гипотезы и проверяет их на данных.

2. Коммуникация и визуализация

Аналитик – это переводчик с языка бизнеса на язык данных и обратно, если бизнес говорит: "Что-то продажи упали", вы должны перевести это в гипотезы:
- Проверим конверсию в воронке
- Посмотрим динамику по неделям
- Сегментируем по каналам трафика
- Сравним с прошлым годом

И ответить не таблицей с 100500 строк, а (условно) одним понятным графиком с выводами и предложениями.

3. Управление ожиданиями – это самый недооцененный навык

Бизнес часто не понимает, что можно получить от данных, а что нельзя, он ждет "серебряную пулю", а ваша задача с самого начала очертить границы возможного.

Как это работает на практике:

❌ Ошибка: Вас просят "сделай отчет по продажам за вчера". Вы говорите "хорошо, будет через час". А через час выясняется, что данные обновляются только в 10 утра, и отчета не будет до обеда.
✅ Как надо: Сразу уточнить: "Данные по продажам за вчера будут доступны только после 10 утра, отчет сделаю к 11:00".

❌ Ошибка: Вас просят "посмотреть динамику продаж". Вы присылаете график. Вам говорят: "А давай еще по регионам, по товарам, и еще прогноз на месяц".
✅ Как надо: На этапе постановки зафиксировать ТЗ: "Смотрим динамику продаж по неделям в целом по компании. Если потребуется детализация — это следующий этап".

❌ Ошибка: Вам дали "грязные" данные. Вы посчитали, получилась ерунда. Бизнес кричит: "Ты плохой аналитик!".
✅ Как надо: Прежде чем показывать цифры, сказать: "Даные выглядят сырыми, тут пропуски и дубликаты. Я почищу, но итоговые цифры могут отличаться от ваших ожиданий, и мы потеряем около 20% данных".

Золотое правило: Лучше пообещать меньше, но сделать быстрее и качественнее, чем пообещать золотые горы и не сдать. Всегда закладывайте люфт в сроки и всегда уточняйте вводные.

Итог: чек-лист начинающего аналитика

Если вы только входите в профессию, вот минимальный набор, к которому стоит стремиться:

Категория

Инструмент/навык

Уровень владения

SQL

SELECT, JOIN, GROUP BY, оконные функции

Уверенно

Excel

Сводные таблицы, ВПР, базовые формулы

Уверенно

Python

Pandas, NumPy, визуализация

Базово

BI

Power BI / Tableau (один на выбор)

Базово

Статистика

Дескриптивная статистика, t-тест, p-value

Понимание

Бизнес

Понимание метрик, умение задавать вопросы

Развивать

Коммуникация

Понятно объяснять сложное

Развивать

Предыдущие статьи на эту тему:
Путь в аналитику данных: базовый минимум для старта
Как стать аналитиком с нуля (и не потратить на это много денег)

💚Больше про будни и задачи аналитика данных в бигтехе в моем тг канале 🌸Таня и Данные📊