Ох как вовремя статья! Я работаю в стартапе, у нас в собственности приблизительно 100 мелко-средних бизнесов. Бизнесы в разных местах, в разных индустриях, но планировать-то все равно надо. Группа финансов создает годовой план топором: 3-процентный годовой рост на каждый бизнес и хватит. Мы решили попробовать улучшить подход: Первая фаза крайне простая, берем ежемесячную прибыль каждого бизнеса как тайм-серии фичи и пытаемся делать предсказания через ARIMA/SARIMAX и Facebook Prophet. Интересно что SARIMAX с exogenous variable (тайм-серии прибыли индустрии данной компании) показала себя намного лучше чем Prophet: у SARIMAX+exog был MAPE в 16%, в тоже время у Prophet 3х-месячный MAPE был >22%. Начинаем работу над следующей фазой: будем высчитывать операционные метрики бизнеса (% возврата, брака, итд) как дополнительные фичи. Конкретно буду брать предсказания САРИМАКСА а так же доп. метрики и давать их XGBT в надежде что основная часть сезонности уже была прогнозирована первой моделью, а сложные взаимодействия метрик будут интерпретированы деревом XGBT.
Ох как вовремя статья!
Я работаю в стартапе, у нас в собственности приблизительно 100 мелко-средних бизнесов. Бизнесы в разных местах, в разных индустриях, но планировать-то все равно надо. Группа финансов создает годовой план топором: 3-процентный годовой рост на каждый бизнес и хватит. Мы решили попробовать улучшить подход:
Первая фаза крайне простая, берем ежемесячную прибыль каждого бизнеса как тайм-серии фичи и пытаемся делать предсказания через ARIMA/SARIMAX и Facebook Prophet. Интересно что SARIMAX с exogenous variable (тайм-серии прибыли индустрии данной компании) показала себя намного лучше чем Prophet: у SARIMAX+exog был MAPE в 16%, в тоже время у Prophet 3х-месячный MAPE был >22%.
Начинаем работу над следующей фазой: будем высчитывать операционные метрики бизнеса (% возврата, брака, итд) как дополнительные фичи. Конкретно буду брать предсказания САРИМАКСА а так же доп. метрики и давать их XGBT в надежде что основная часть сезонности уже была прогнозирована первой моделью, а сложные взаимодействия метрик будут интерпретированы деревом XGBT.