Pull to refresh
9
0
Мария Суртаева @marieee

DS

Send message

Слушайте, интересный подход! Идея напоминает тюнинг changepoint'ов в Prophet, однозначно стоит попробовать, спасибо!

Определенных книжных гигантов не приведу, для начинающего, думаю, подойдут курсы излюбленной спецификации от МФТИ и Яндекса, в практических задачах есть анализ временных рядов (сейчас на Coursera недоступен, но я видела на сайте МФТИ). Лекции от CSC тоже подойдут, как и конспекты Соколова. Для Prophet, LSTM и других изощерний есть довольно подробная документация и статьи здесь же, на Хабре. Удачи!

Спасибо за ваш удивительно развернутый комментарий! Вы довольно точно описали суть и боль страх и ненависть любого моделирования и моделей машинного обучения в частности: результат без ошибок получить НЕВОЗМОЖНО. Любой прогноз будет инструментом принятия решений, и тем более мощным, чем большее количество элементов в него включено, и сколькими из них мы можем управлять. Часто это реализуется через целевые параметры прогноза (желаемую доступность, например) или через интервальное прогнозирование, которое позволит нивелировать ошибки и подстроиться под особенности других систем, те же нюансы логистики или управление страховыми запасами. С другой стороны, можно не брать продиктованные бизнес-моделью параметры, а вычислять и задавать их самостоятельно, исходя из оценки просчитанного сценария и what-if анализа. Этот способ супер пригодится для влияния на решения внутри компании, где воздействие внешних непредвиденных факторов не так велико

О, вы правы, в статье я довольно вскользь упоминаю сезонные и циклические изменения спроса. Отчасти это обоснованно тем, что мы пока не получили однозначного результата при учете этих факторов. Довольно успешно удается воспроизводить недельные циклы продаж включением простых скользящих статистик, но вот с годовой сезонностью и "календарными масками" все немного сложнее. В нашем случае мы разделяем эти случаи, как говорится, на две большие разницы. Первый - это сезонные продажи, условные мороженое и квас летом, цитрусовые зимой. Второй - это праздничные продажи - зачастую более тематическая история. Загуглите доклад коллег из Озона (Алексайцева, если правильно помню), там есть чудесная и очень жизненная история про то, какой длины исторические данные и какое шаманство в FE бывает необходимо, чтобы автоматически прогнозировать спрос определенных товаров под праздник.

В первом случае есть довольно много подводных камней, когда дело доходит до практики, и с наскоку преодолеть эти проблемы классическими статистическими подходами пока не удалось. Во многом это связано с супер-сезонными товарами, которые продаются только 1-2 месяца в году или вообще не имеют историю. Отчасти со сложностью учета одновременного сезонного подъема и ввода товара с промо. Отчасти с отсутствием у товара/группы товаров достаточно долгой истории, чтобы судить о календарных эффектах вообще. Частично помогает использование длинных лагов в факторах (как прозорливо заметили в комментариях), но сложные кейсы остаются болеть.

Очень надеюсь, что в скором времени мы поборем эти недостатки и обязательно расскажем об этом в следующих статьях :)

Information

Rating
Does not participate
Works in
Registered
Activity