Комментарии / Профиль sofia-l / Хабр

Софья Лисичкина@sofia-l

Дата аналитик в Лемана Тех, преподаватель НИУ ВШЭ

Рейтинг

Подписчики

Как устроена работа продуктовых аналитиков в 2026 году. Исследование ИТ-компаний

Привет! У меня обычно так: сначала дейлик и разбор блокеров. Потом — бэклог: что берем в работу сейчас, что откладываем, что нужно уточнить до старта. Дальше много времени уходит на формирование методологии по текущим задачам: договориться о определениях метрик, правилах расчета, сегментациях, допущениях, критериях качества данных и “что считаем успехом”. Параллельно — консультации и ревью: отвечаю на вопросы аналитиков, проверяю подходы/расчеты, помогаю выбрать корректный дизайн проверки гипотез.

Как мы научили Фурье отличать гирлянду от газонокосилки: детектирование сезонности товаров без ML

sofia-l 18 фев в 12:32

Мы этот вариант тоже рассматривали, но для нашей цели (категория, минимум 2 года, один пик, нужно “пик/вход/выход” + стабильность) Фурье оказался проще и устойчивее.

Дамми на 12 месяцев = 12 параметров сезонности (+ тренд, + внешние факторы). На 24–36 точках это уже легко переоценить/получить нестабильные коэффициенты, особенно если категория меняется. Первая гармоника Фурье — это по сути “сжать сезонность до 2 чисел” (амплитуда+фаза), то есть сильная регуляризация по умолчанию.

Нам нужен “один сезон / один пик” как бизнес-объект. Регрессия с дамми сама по себе не гарантирует гладкую сезонную форму: соседние месяцы могут прыгать из‑за шума, а потом нужно отдельно сглаживать/навязывать ограничения (а это снова усложнение). У Фурье форма сразу гладкая и интерпретируемая в терминах пика/сдвига.

В общем, регрессия с дамми дает больше степеней свободы, чем нам было нужно, поэтому и остановились на Фурье.

Как мы научили Фурье отличать гирлянду от газонокосилки: детектирование сезонности товаров без ML

sofia-l 17 фев в 15:02

Тут важно, что именно мы решаем. Наша задача не “классифицировать сезонно/несезонно любой ценой”, а получить устойчивые и интерпретируемые признаки на уровне категории: сила сезонности + месяц пика + границы сезона, чтобы это легло в планирование закупок/ассортимента и объяснялось бизнесу.

Если “перцептрон” = обучаемый классификатор только для метки seasonal / non-seasonal, то это из пушки по воробьям в нашем контексте, потому что перцептрон требует разметки/обучения/контроля качества, а на выходе даёт лишь класс (и, в лучшем случае, скор). А нам нужны ещё пик, фаза, вход/выход сезона и (а это крайне важно) объяснимость. То есть мы усложняем систему (обучение, дрейф, переобучение, мониторинг), но не закрываем ключевые бизнес-вопросы без дополнительных слоёв логики. Фурье здесь готовая физически интерпретируемая модель: первая гармоника даёт амплитуду/фазу, из фазы напрямую получаем пик, дальше — простые пороги для границ.

Как мы научили Фурье отличать гирлянду от газонокосилки: детектирование сезонности товаров без ML

sofia-l 17 фев в 14:49

делаю так, чтобы НЕ нужные товары НЕ оказывались в НЕ нужном месте в НЕ нужное время

Согласна, мертвый сток - это отдельная боль)

Как мы научили Фурье отличать гирлянду от газонокосилки: детектирование сезонности товаров без ML

sofia-l 17 фев в 09:36

STL смотрели, но в нашей постановке она проигрывает как продакшен‑инструмент под стратегические решения.
1) Нам важен не только факт сезонности, а прозрачные “пик/вход/выход”. STL даёт сезонную компоненту, но дальше всё равно нужен второй слой правил: как из неё стабильно вытащить пик и границы сезона (плато, шум, сдвиги). Эти правила и их параметры сложнее договорить/защитить перед бизнесом, чем амплитуду/фазу первой гармоники.
2) Про “нерегулярную сезонность”: да, здесь STL может быть сильнее, но для нас это часто не то, что нужно оптимизировать. Если нерегулярность — погода/разовые сдвиги, то подстраиваться под неё = повышать волатильность управленческих решений. Нам важнее устойчивый “базовый” профиль категории.
3) Объяснимость: фазу и амплитуду можно показать на одной синусоиде (“вот сила сезонности, вот месяц пика”). STL в объяснении обычно упирается в выбор окон/сглаживания и почему разложение получилось именно таким.

Согласна, что сравнение методов как доп. валидация — хорошая идея, но как основной метод для нашей цели (категории, новинки, простая интерпретация) Фурье оказался практичнее. STL мы бы скорее брали для операционного прогнозирования на длинной истории, а у нас другой уровень решения

Информация

Специализация