Comments 4
А что делаете с появлением нового ингридиента? Ждать пока накопиться статистика?
А если меняется меню сильно?
SARIMAX может и побить бустинг, если он на правильно подобранных рядах Фурье, взаимодействиях Фурье и календарных признаков строится, в личку кинул материал, там есть полезные примеры и по ETNA большой раздел. Также советую Greykite. Там можно настраивать не только точки изменения тренда, но и точки изменения сезонности, ну и агрегированные лаги (произведения лагов с фиксированным или случайно подбираемым инкрементом) тоже могут быть полезны. ETNA да, очень хороша. В последних версиях разработчики ETNA выкатили вовсе царский подарок – классы SklearnMultiSegmentModel и SklearnPerSegmentModel. С помощью них (выступают как классы-родители) пишем классы-обертки PerSegmentModel и MultiSegmentModel над любимым регрессором sklearn и вперед. Так, например, в одной из задач у меня RandomForestRegressor со 100 деревьями глубиной 5 побивает CatBoost c 800 деревьями. Работает лучше и быстрее, а последнее важно, у меня там пять сотен рядов. Но поскольку RandomForestRegressor ругается на пропуски, как и некоторые другие модели sklearn, а после создания лагов пропуски неизбежны, в конвейере после создания лагов ставим TimeSeriesImputerTransform для каждого лага.
Был excel — стал ML: как мы расход ингредиентов учились прогнозировать