Да, тарифная составляющая - очень важная. Я хочу попробовать встроить фактор наподобие средней стоимости поездки или средняя стоимость километра полета на направлении. Пока думаю: как, где и откуда вытащить эти данные.
Тем не менее, по опыту могу сказать, что «пустыми» авиакомпании стараются не летать, поэтому готовы опускаться в тарифе до уровня хорошей загрузки (не все случаи, но большинство, на субсидированных рейсах немного не так - там можно позволить себе летать и пустыми). Так что тариф складывается в таком диапазоне, который обеспечит умеренную загрузку выставленных емкостей.
Предсказывать трафик - сложная задача, а количество открытых и потом отмененных рейсов в РФ довольно существенное - около 40-60%. Это косвенно говорит о "качестве" текущего прогнозирования в отрасли. Для новых рейсов в целом сильные отклонения что в плюс, что в минус, могут быть нормой из-за специфики потоков.
Не думаю, что это связано с низким профессионализмом сотрудников, а скорее со слишком большой неопределенностью. Однозначно, модель не конечная, буду расширять ее за счет новых вводных и стараться заметно уменьшать ошибку.
Насчет кластеризации - да, однозначно, деление направлений даже неработающий в авиации человек может провести и сам. Но чтобы сделать модель универсальной, я дал на откуп машине процесс разделения направлений на подгруппы, нежели чем почти вручную отбирать направления по подгруппам.
Да, с расстояниями понимаю (особенно про закрытые а/п юга). Исходил из допущения, что сформировавшийся спрос за многие годы сохраняется на прежнем уровне, несмотря на рост времени облета. В целом, расстояние не оказалось очень существенным фактором, влияющим на пассажиропоток, хотя корреляция, конечно, есть.
Про метрики - вы, как человек из авиации, знаете, как много новых направлений закрываются (по моей оценке, для внутренних рейсов таких 40-60%), так и не выполнив одного рейса, либо же не выдерживают даже сезон полетов. Что косвенно и говорит о том, как работает прогнозирование трафика в отрасли))
Про параметры - особенность в том, что я пытался предсказать глобально пассажиропоток (пролетный) за год, поэтому глубина продаж на это не сильно влияет. Про наличие конкурентов - трафик я брал по всей отрасли в целом, и модель прогнозирует суммарный авиатрафик. Объемы рынка и предложенные кресла буду включать в следующие итерации модели.
Спасибо. Да, это мой первый опыт и делился пока тем, что есть промежуточно. Первый блин всегда комом)) Когда закончу этот большой проект, обязательно напишу большую и подробную статью
Модель ориентирована на прогнозирование долгосрочных потоков, а ажиотаж конца сентября - это статистический "выброс", поэтому глобально тенденция сильно не менялась, только на очень краткосрочный период. Да и модель построена для прогнозирования внутреннего трафика. Грубо говоря, это оценка "сколько потенциально здесь может полететь пассажиров", безотносительно редких, но существенных явлений. "Черные лебеди" на то и черные лебеди, что встроить их в модель нельзя)
Да, тарифная составляющая - очень важная. Я хочу попробовать встроить фактор наподобие средней стоимости поездки или средняя стоимость километра полета на направлении. Пока думаю: как, где и откуда вытащить эти данные.
Тем не менее, по опыту могу сказать, что «пустыми» авиакомпании стараются не летать, поэтому готовы опускаться в тарифе до уровня хорошей загрузки (не все случаи, но большинство, на субсидированных рейсах немного не так - там можно позволить себе летать и пустыми). Так что тариф складывается в таком диапазоне, который обеспечит умеренную загрузку выставленных емкостей.
Предсказывать трафик - сложная задача, а количество открытых и потом отмененных рейсов в РФ довольно существенное - около 40-60%. Это косвенно говорит о "качестве" текущего прогнозирования в отрасли. Для новых рейсов в целом сильные отклонения что в плюс, что в минус, могут быть нормой из-за специфики потоков.
Не думаю, что это связано с низким профессионализмом сотрудников, а скорее со слишком большой неопределенностью. Однозначно, модель не конечная, буду расширять ее за счет новых вводных и стараться заметно уменьшать ошибку.
Насчет кластеризации - да, однозначно, деление направлений даже неработающий в авиации человек может провести и сам. Но чтобы сделать модель универсальной, я дал на откуп машине процесс разделения направлений на подгруппы, нежели чем почти вручную отбирать направления по подгруппам.
Да, с расстояниями понимаю (особенно про закрытые а/п юга). Исходил из допущения, что сформировавшийся спрос за многие годы сохраняется на прежнем уровне, несмотря на рост времени облета. В целом, расстояние не оказалось очень существенным фактором, влияющим на пассажиропоток, хотя корреляция, конечно, есть.
Про метрики - вы, как человек из авиации, знаете, как много новых направлений закрываются (по моей оценке, для внутренних рейсов таких 40-60%), так и не выполнив одного рейса, либо же не выдерживают даже сезон полетов. Что косвенно и говорит о том, как работает прогнозирование трафика в отрасли))
Про параметры - особенность в том, что я пытался предсказать глобально пассажиропоток (пролетный) за год, поэтому глубина продаж на это не сильно влияет. Про наличие конкурентов - трафик я брал по всей отрасли в целом, и модель прогнозирует суммарный авиатрафик. Объемы рынка и предложенные кресла буду включать в следующие итерации модели.
Спасибо. Да, это мой первый опыт и делился пока тем, что есть промежуточно. Первый блин всегда комом)) Когда закончу этот большой проект, обязательно напишу большую и подробную статью
Модель ориентирована на прогнозирование долгосрочных потоков, а ажиотаж конца сентября - это статистический "выброс", поэтому глобально тенденция сильно не менялась, только на очень краткосрочный период. Да и модель построена для прогнозирования внутреннего трафика. Грубо говоря, это оценка "сколько потенциально здесь может полететь пассажиров", безотносительно редких, но существенных явлений. "Черные лебеди" на то и черные лебеди, что встроить их в модель нельзя)