Pull to refresh
8
0
Send message

Да, тарифная составляющая - очень важная. Я хочу попробовать встроить фактор наподобие средней стоимости поездки или средняя стоимость километра полета на направлении. Пока думаю: как, где и откуда вытащить эти данные.

Тем не менее, по опыту могу сказать, что «пустыми» авиакомпании стараются не летать, поэтому готовы опускаться в тарифе до уровня хорошей загрузки (не все случаи, но большинство, на субсидированных рейсах немного не так - там можно позволить себе летать и пустыми). Так что тариф складывается в таком диапазоне, который обеспечит умеренную загрузку выставленных емкостей.

Предсказывать трафик - сложная задача, а количество открытых и потом отмененных рейсов в РФ довольно существенное - около 40-60%. Это косвенно говорит о "качестве" текущего прогнозирования в отрасли. Для новых рейсов в целом сильные отклонения что в плюс, что в минус, могут быть нормой из-за специфики потоков.

Не думаю, что это связано с низким профессионализмом сотрудников, а скорее со слишком большой неопределенностью. Однозначно, модель не конечная, буду расширять ее за счет новых вводных и стараться заметно уменьшать ошибку.

Насчет кластеризации - да, однозначно, деление направлений даже неработающий в авиации человек может провести и сам. Но чтобы сделать модель универсальной, я дал на откуп машине процесс разделения направлений на подгруппы, нежели чем почти вручную отбирать направления по подгруппам.

Да, с расстояниями понимаю (особенно про закрытые а/п юга). Исходил из допущения, что сформировавшийся спрос за многие годы сохраняется на прежнем уровне, несмотря на рост времени облета. В целом, расстояние не оказалось очень существенным фактором, влияющим на пассажиропоток, хотя корреляция, конечно, есть.

Про метрики - вы, как человек из авиации, знаете, как много новых направлений закрываются (по моей оценке, для внутренних рейсов таких 40-60%), так и не выполнив одного рейса, либо же не выдерживают даже сезон полетов. Что косвенно и говорит о том, как работает прогнозирование трафика в отрасли))

Про параметры - особенность в том, что я пытался предсказать глобально пассажиропоток (пролетный) за год, поэтому глубина продаж на это не сильно влияет. Про наличие конкурентов - трафик я брал по всей отрасли в целом, и модель прогнозирует суммарный авиатрафик. Объемы рынка и предложенные кресла буду включать в следующие итерации модели.

Спасибо. Да, это мой первый опыт и делился пока тем, что есть промежуточно. Первый блин всегда комом)) Когда закончу этот большой проект, обязательно напишу большую и подробную статью

Модель ориентирована на прогнозирование долгосрочных потоков, а ажиотаж конца сентября - это статистический "выброс", поэтому глобально тенденция сильно не менялась, только на очень краткосрочный период. Да и модель построена для прогнозирования внутреннего трафика. Грубо говоря, это оценка "сколько потенциально здесь может полететь пассажиров", безотносительно редких, но существенных явлений. "Черные лебеди" на то и черные лебеди, что встроить их в модель нельзя)

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Analyst, Data Scientist
Senior
From 200,000 ₽
Python
MySQL
MongoDB