Comments 13
Датасет включает следующие признаки
Может я что то не понял..., но как эти признаки определяют успешность?
Для того, чтобы фильм окупился в прокате, он должен собрать в кинотеатральной сети примерно 2 своих бюджета (для ряда картин есть и другие каналы монетизации - мерч, ТВ, платформы, продажа прав за рубеж и т.п.). Здесь финансовая успешность проекта = окупаемость в прокате. Поэтому, сборы X2 это 0.0% прибыли. Если больше X2 - супер.
Модельки маленькие, тут гридсерч - куда ни шло (имею ввиду, что он долгий, взяли б хоть random search), но посмотрите на optuna
- вроде как стандарт в индустрии вместо GSCV.
Почему метрикой сразу с входа было не взять f1 - тоже не понял, но посчитал, что это ученическая статья (больше на новичков рассчитанная) и тогда ок.
Вы правы, модель на большой датасет делается с random search и f1.
ну тогда и "машину опорных векторов" стоило бы перевести нормально. Он хоть и "support vector machine", но в русском все же "Метод опорных векторов".
Да, кстати, как быть с условным Ридли Скоттом, который сначала снимает "Гладиатора", а потом невнятную пургу "типа Чужой завет"?
Чужой: Завет не провальный фильм. Сборы к бюджету 2,5:1. Даже если на рекламу потратились - по прокату вероятно вышел в ноль, а по стримингам и всякому мерчу получили прибыль.
Франшизы - это отдельная песня: может наблюдаться как синергетический эффект, особенно если идет кроссплатформенная схема дистрибуции и несколько каналов монетизации (кино, сериал, видеоигра, книги, мерч, продакт-плейсмент и т.п.). Но после определенного периода она начинает угасать и попытки ее ребилда или ребута - сходни с попытками оживления трупа гальванизацией.
Человеку свойственно ошибаться: и после 10 прибыльных фильмов подряд режиссер может снять "пургу". Поэтому для инвестиции в кино "портфельность" и "диверсификация" - must have. Есть явные признаки "неуспешности" и "пурги", например, режиссер работает не в своем привычном жанре, затянутое производство (больше 5 лет), раздутый бюджет для локальной истории и узкого рынка - и сотни других факторов "под капотом", которые иногда затруднительно формализовать. Тем не менее, для российского кинопроизводства вполне возможно поднять долю окупившихся в прокате фильмов с 11,5% до 25-30% и выше, как и сами валовые сборы в 2-2,5 раза по текущей кинотеатральной сети - просто за счет повышения качества контента
Поскольку старт карьеры в киноиндустрии весьма сложный, просьба в дальнейшем раскрыть тему, какие параметры предполагаемого фильма перспективны, а какие точно не перспективны для новичков сценаристов и режиссеров.
Думаю это будет весьма полезно для всех, если появиться просчитанный фундамент для дебютантов. Тогда и студии/продюсеры будут чаще давать возможности, да и дебютанты чаще смогут стартовать карьеру и получать опыт, которому в киношколе не научат.
Прогнозируем результаты российского кинопроката с помощью ML