Comments 27
Спасибо за статью!
Может быть, пригодится моя статья на хабре про то, как парсить КиноПоиск: https://habrahabr.ru/post/280238/
Кроме того, у меня остался dataset и сырые html-ки (правда, он был собран полгода назад и не содержит последние новинки). Если интересно, могу поделиться для дальнейших изысканий :)
А датасет состоит только из фичей указанных в статье? Я был бы очень благодарен за возможность поиграться с ним :)
Я бы еще Россию добавил на график:
средний рейтинг фильма vs страна
И добавил начало координат, а то может сложиться впечатление, что в Великобритании фильмы в 4 раза лучше чем в Канаде.
Для своих рейтингов, кстати, имдб фильтрует на уровне 1500 голосов.
http://shiny.rstudio.com/gallery/movie-explorer.html
Может и автору пригодится подобная идея.
Нужно учитывать, что мы имеем дело с типичным случаем ошибки выжившего. Если выборка фильмов за последние лет 20 более-менее репрезентативна (в базу попадает большинство фильмов, вышедших в прокат), то за прошлые десятилетия мы имеем только лучшие (или наиболее популярные по другим причинам) фильмы. Отсюда могут быть всякие странные зависимости от года выпуска.
А скачок длительности фильмов вероятно связан с крушением "Студийной системы" и массовым распространением телевидения.
Вполне логично. Деньги идут на спецэффекты и формальное «качество» фильма, что идет в ущерб реальному качеству.
По сути ведь за редким исключением фильмы производства США (особенно последнее время) являются добротными боевиками, триллерами и проч, но не имеющими притом почти ничего примечательного, выделяющего фильм из общего ряда. Иначе говоря, действие в ущерб здравому смыслу и глубине мысли, ибо развлечение, а не «чтоб подумать».
А отдельные шедевры никак не могут переломить общей тенденции и существенно сместить общий рейтинг.
Кстати, все это вполне логичным образом согласуется и с последующими результатами.
> Из последних двух графиков можно сделать вывод, что с годами мы тратим на фильмы больше, а получаем их по качеству ниже.
Техническая сложность фильмов растет (спецэффекты, оборудование), вот и расходы растут.
А качество падает от все возрастающего перекоса в сторону спецэффектов и формального технического качества (FullHD, 4k, 8k...).
А вот это тоже может, кстати, быть ошибкой выжившего. Какой процент из фильмов 30-40-50-60-70 годов сейчас известен массам? Да копеечный. И в памяти остаются лучшие, и пересматриваютя-перепоказываются, опять же — лучшие. А значительная часть фильмов, которые были «ну так себе», банально забывается. И тогда тоже могли вполне себе быть какие-нибудь дорогущие «пеплумы», например, которые, в итоге, ничем не запомнились и сейчас известны только очень узким спецам.
Только есть такая тенденция нехорошая.
Раньше в нехорошие попадала только откровенная халтура. А если было старание с технической стороны (именно старание, а не объемы этой самой технической стороны), то и сценарий был как правило хорош, и режиссура.
А теперь, в эпоху компьютерных спецэффектов, часто видно, что когда фильм делали, очень старались, выкладывались, не халтурили, а фильм все равно получается ни о чем. И все похоже на то, что все оно постольку, поскольку выкладывались только на технической стороне вопроса, забывая и о сюжете, и о игре актеров.
Есть и другой момент.
Количество выпускаемых фильмов заметно возрасло, а количество хороших притом столь же заметно уменьшилось относительно предыдущих годов. Причем это практически во всех странах.
А если и появляется сейчас что-то действительнго хорошее, то в прокате его редко когда увидишь. Я уже и в кинотеатр на премьеры ходить перестал, ибо надоело тотальное разочарование почти во всех новых фильмах вне зависимости от их рейтинга.
выкладывались, не халтурили, а фильм все равно получается ни о чем.Такое бывает, но не так часто — разве что в случае, когда расчитывают на раскрученную франшизу. Но не стоит путать это с тем, что, мол «фильмы все про пыщь-пыщь» — значительная часть пеплумов или костюмных драм 30-50-х — про абсолютно такое же пыщь-пыщь.
Количество выпускаемых фильмов заметно возраслоВот тут, к сожалению, не могу ничего сказать, т.к. нету доступа к статистике выхода фильмов по годам — статистика ИМДБ тут тоже некорректна, т.к. включает в себя, с одной стороны «не все» по ранним фильмам, с другой стороны — заполнена телефильмами, «прямо на двд»-релизами и т.д.
Думаю может быть интересно посмотреть что русскому хорошо, а в мировом кинематографе смерть. :)
Кроме того прям просится посмотреть изменение по времени жанрового состава фильмов. И отношение сборы/бюджет — ключевой признак для американского кинематографа по понятным причинам, на IMDB эти данные есть, хотя не знаю есть ли они в кагловском датасете.
Исследование датасета с IMDB