Как стать автором
Обновить

Комментарии 19

А как ваша программа справилась бы с изменением прогноза потоков 21 сентября?

и с приграничными областями, где за год ниодного гражданского не пролетело.

Можно ли предвидеть непредвиденные обстоятельства?

Ну, с прошлого года планирование вообще идёт только краткосрочное

Модель ориентирована на прогнозирование долгосрочных потоков, а ажиотаж конца сентября - это статистический "выброс", поэтому глобально тенденция сильно не менялась, только на очень краткосрочный период. Да и модель построена для прогнозирования внутреннего трафика. Грубо говоря, это оценка "сколько потенциально здесь может полететь пассажиров", безотносительно редких, но существенных явлений. "Черные лебеди" на то и черные лебеди, что встроить их в модель нельзя)

... а у нас стаи черных лебедей...

Прогнозирование авиапассажиропотока между городами РФ

Если ничего не поменялось в плане воровства лизинговых самолетов, то плавное снижение до околонуля? :)

30% ошибка - это очень и очень много.
С учетом прогресивной цены на билеты.
Тот, кто полетит за 5000р (купив билет за месяц) уже не полетит за 25000, купив билет за неделю. Он или полетит другой авиакомпанией, или поедет на поезде или перенсет свою поездку. Аналогично и для тех, кому билет оплачивает компания.
Теоретический пассажиропоток при цене билетов в 5000р и в 15000р будет разным. - а в вашей моделе цена на билеты вроде вообще никак не заложена.

А теоретическое расстояние между городами кажется совсем нереальным - рейс Сочи-Москва летит теперь совсем не по прямой, даже не близко. Да и в обычное время самолеты не по прямой летают.

На самом деле модели надо смотреть, относительно тривиального бэйзлайна, например оптимальной константы. Тогда ясно на сколько улучшается метрика, возможно 30% для начала не так уж и плохо.

Да, тарифная составляющая - очень важная. Я хочу попробовать встроить фактор наподобие средней стоимости поездки или средняя стоимость километра полета на направлении. Пока думаю: как, где и откуда вытащить эти данные.

Тем не менее, по опыту могу сказать, что «пустыми» авиакомпании стараются не летать, поэтому готовы опускаться в тарифе до уровня хорошей загрузки (не все случаи, но большинство, на субсидированных рейсах немного не так - там можно позволить себе летать и пустыми). Так что тариф складывается в таком диапазоне, который обеспечит умеренную загрузку выставленных емкостей.

Классно видеть такую статью, но жаль, что я уже несколько лет не работаю в аэропорту... Вот бы её в 2017 году - может чего совместного придумали))
Теперь критика.
Что тут кластеризовать - я не очень понял... Любой, кто хоть немного поработал в пассажирской авиации понимает специфику и назовёт кластеры без анализа: Москва, СПБ, Юг, топ 10 аэропортов, остальные аэропорты (где можно выделить региональную сеть для каждого), вахтовики...
Расстояния рассчитывать - тоже так себе затея, лучше было получить данные от навигационных служб, ну да ладно, наверняка там своя бюрократия, а данные нужны - кто же сделает лучше, чем сам))

Прогнозирование отдельная тема. Пока выходит не очень, среди параметров рекомендую учитывать дату покупки, дату рейса, день недели вылета, время вылета, наличие конкурентов, тип вс, компоновку, наличие поездов, цены (всевозможные)... Тут же посылаю лучи сочувствия - прогнозировать в текущих условиях тяжко. Да и вообще будущее не всегда похоже на прошлое)) Можете попробовать давать прогнозы с отклонением, несколько сценариев...

В общем пока статья совсем слабая и малополезная, хотя может чего-то я не понял...
В любом случае я рад видеть коллегу из авиации на хабре))

Насчет кластеризации - да, однозначно, деление направлений даже неработающий в авиации человек может провести и сам. Но чтобы сделать модель универсальной, я дал на откуп машине процесс разделения направлений на подгруппы, нежели чем почти вручную отбирать направления по подгруппам.

Да, с расстояниями понимаю (особенно про закрытые а/п юга). Исходил из допущения, что сформировавшийся спрос за многие годы сохраняется на прежнем уровне, несмотря на рост времени облета. В целом, расстояние не оказалось очень существенным фактором, влияющим на пассажиропоток, хотя корреляция, конечно, есть.

Про метрики - вы, как человек из авиации, знаете, как много новых направлений закрываются (по моей оценке, для внутренних рейсов таких 40-60%), так и не выполнив одного рейса, либо же не выдерживают даже сезон полетов. Что косвенно и говорит о том, как работает прогнозирование трафика в отрасли))

Про параметры - особенность в том, что я пытался предсказать глобально пассажиропоток (пролетный) за год, поэтому глубина продаж на это не сильно влияет. Про наличие конкурентов - трафик я брал по всей отрасли в целом, и модель прогнозирует суммарный авиатрафик. Объемы рынка и предложенные кресла буду включать в следующие итерации модели.

А как с такой большой ошибкой можно заниматься прогнозированием продаж? Либо в компании попустительски относятся к плану? Не стараюсь обидеть или задеть, сам понимаю, что при невыполнении плана продаж весь отдел не увольняют на первый, второй и даже на 10ый раз, но, всё-таки.

Предсказывать трафик - сложная задача, а количество открытых и потом отмененных рейсов в РФ довольно существенное - около 40-60%. Это косвенно говорит о "качестве" текущего прогнозирования в отрасли. Для новых рейсов в целом сильные отклонения что в плюс, что в минус, могут быть нормой из-за специфики потоков.

Не думаю, что это связано с низким профессионализмом сотрудников, а скорее со слишком большой неопределенностью. Однозначно, модель не конечная, буду расширять ее за счет новых вводных и стараться заметно уменьшать ошибку.

Плюс авансом. Для отдельной статьи всё же коротковато, ИМХО.

Спасибо. Да, это мой первый опыт и делился пока тем, что есть промежуточно. Первый блин всегда комом)) Когда закончу этот большой проект, обязательно напишу большую и подробную статью

У вас пока задача прогнозирования спроса. Для бизнеса актуальнее задача ценообразования в разрезе максимизации прибыли. А тут обычной регрессией на спрос не обойдешься - нужно копать в сторону моделей эластичности и навешивать многоруких бандитов для оптимизации цены билета на конкретную дату, а можно еще и для конкретного класса покупателей.

Добрый день! Прошу посоветовать полезные книги на русском языке по машинному обучению человеку в подарок. Кратко, человек может в Phyton и намерен вкатиться в эти ваши нейронные сети.

Спасибо!

А поделитесь источниками данных?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации