Комментарии 10
А вы только старты рассматриваете? В прошлом сезоне активно пользовался самокатами. Рассматривал их в том числе как альтернативу маршрутки до метро. Езжу после часа пик. Вот не получается стартануть ни утром, и ни вечером. Утром все самокаты у метро, вечером у домов.
Здравствуйте, кроме стартов так же прогнозируются финиши, чтобы оценить общую миграцию флота и позволить спрогнозировать данные по дефициту\профициту на каждую конкретную парковку.
От меня у вас нет ни стартов, ни финишей. Ну просто потому, что самокатов в нужное мне время просто нет. Без явного учета доступности, ваша модель это не увидит. Она будет свято верить, что все хорошо, ибо ожидание старта нулевое.
Доброго времени суток!
Подскажите, пожалуйста, как вы выбрали начальную точку (от которой начали обучение)? Что если в данный период на какой-то парковке изначально не было самокатов (при этом это потенциальная точка старта) и из-за этого старты были 0. Не будет ли в таком случае ошибки при обучении?
Здравствуйте! Да, такая ситуация имела место. На раннем этапе обходили это увеличением прогноза для таких значений, т.е. там, где прогнозировался 0 стартов, все равно подвозится не более 1-2 самоката (актуально для прогноза на ночной и утренний (~ 6:00) период). Как правило, из 10-12 таких "перепрогнозированных" (в превентивный мерах) парковок только на одной в итоге был фактический старт.
Спасибо за то что поделились! Dart не пробовали? Общий API и большое кол-во моделей из коробки + можно оборачивать их API на линейные модели вроде sklearn, есть даже интересности вроде N-BEATS или NLinearModel с возможно обучения на GPU через pytorch lightning. Есть модельки Future-known covariates, например добавить прогноз погоды на неделю, с самокатами будет актуально
Здравствуйте, нет, Dart не тестировали, но посмотрю документацию на возможность совместить с нашими требованиями. По поводу добавления ковариационный переменных - в финальной Prophet-модели независимые переменные погоды (температура и осадки) уже используются при прогнозирование (и все верно - связь между поездками и погодой практически линейная).
А вы для каждой парковки строили свою модель деревьев получается? Не пробовали обучить одну модель на много схожих парковок?
Да, для каждой парковки строится своя модель. Обобщенную модель пробовали, но в нашем случае не подошло: часто парковки схожи по типу (допустим, все парковки топовые) и общему количеству стартов, но при этом сильно различаться по суточной\недельной структуре спроса - например, у первой один суточные пик в 19 часов, у второй два пика спроса - в 9 и 20, и модель, обученная на структуре первой парковки будет давать высокую ошибку на второй парковке.
Как спрогнозировать спрос на самокаты и не захламить город, версия Whoosh