В мире кино полно удивительных «что, если». Что, если в «Матрице» снялся бы не Киану Ривз, а Уилл Смит, которому предлагали роль в первую очередь? Что, если бы Николас Кейдж всё-таки смог сыграть Супермена в фильме Тима Бёртона? Были бы эти фильмы успешными, стали бы они частью франшизы? Актеры, режиссеры и продюсеры вынуждены постоянно принимать решения, меняющие судьбу всей индустрии.
Для людей, у которых на кону стоят сотни миллионов долларов, полагаться на удачу и инстинкты – не вариант. Если кастинг какой-то другой актрисы в роли Чудо-женщины может принести им дополнительно несколько десятков или сотен миллионов – они должны об этом знать. Вот почему в последнее время Голливуд начал использовать системы искусственного интеллекта для предсказания того, какие фильмы могут стать успешными, а какие провалятся в прокате. Причем ИИ теперь отвечает даже за некоторые ключевые решения: какого актера выбрать, какой режиссер подойдет, и какие сценарии стоят того, чтобы выделять на них большие деньги.
Стартап Cinelytic из Лос-Анджелеса – одна из многих компаний, предлагающих AI-системы для Голливуда. Их машинный интеллект выступает в роли продюсера. Он собирает всю историческую информацию о прибыльности фильмов, и проводит анализ всех факторов. Кто снимал, кто снимался, о чём был фильм, какие поднимал темы. Алгоритмы, натренированные машинным обучением, находят скрытые паттерны в информации. Может оказаться, например, что мелодрама с Мег Райан – это всегда успех. А вот если нанять режиссера Уэса Андерсона на такой проект – его ожидаемая прибыль падает на $47 млн.
В итоге продюсеры могут играть со своим будущим фильмом в фэнтези-футбол, подбирая персонажей, вплоть до второстепенных и третьестепенных, их «тренеров»-режиссеров, кинематографистов, композиторов и всех остальных. Качество фильма, разумеется, в учет не принимается – в основном, потому, что оно уже давно является не самым определяющим фактором в сборах. Хороший постер, подходящая дата релиза, актеры, которые «привносят» свою аудиторию, известная франшиза – зачастую дают куда более солидный эффект.
Это может объяснить, например, почему низкопробные комедии с Адамом Сэндлером, которые так «любят» кинокритики, всё еще выпускаются, причем с завидной регулярностью, по несколько штук каждый год. Или почему «Трансформеры», несмотря на свои традиционно низкие рейтинги на всех порталах, уже одобрены до десятого фильма.
Сооснователь Cinelytic Тобиас Кейссер объясняет:
Вы можете сравнить их отдельно, или сравнить их в пакете. Смоделировать, например, сценарии с Эммой Уотсон или Дженнифер Лоуренс, и посмотреть, для этого конкретного фильма – что будет лучше продаваться в разных странах.
Cinelytic – не единственная компания, предлагающая AI-решения для Голливуда. В последние несколько лет появилась целая группа фирм с похожими проектами. Например, ScriptBook из Бельгии, основанная в 2015-м, говорит, что её алгоритмы способны предсказать успех фильма на основании его сценария. Причем указываются все детали: ожидаемый рейтинг, процент женской аудитории, насколько людям понравится главный герой, и, конечно, какой примерно будет прибыль. Создатели компании говорят, что ошибка их AI обычно находится в пределах 18%. Неплохой результат, учитывая, что продюсеры Голливуда часто промахиваются в несколько раз.
Например, алгоритму скормили 62 сценария, одобренных студиями. ScriptBook вычислил, что 40 из них будут успешными, а 22 одобрять не стоит. Из этих 22 фильмов все 22 в итоге провалились в прокате. Из 40 одобренных алгоритмами фильмов 30 были успешными, еще 10 – оказались убыточными, но без серьезных потерь. Команда ScriptBook говорит, что, вероятно, в случае с этими 10 фильмами стоит винить неправильный маркетинг, или плохое время выхода кинокартины (конкуренция с чем-то более популярным).
Израильский стартап Vault помогает с демографией. Здесь, правда, фильм уже должен быть одобрен, и по нему даже выпущен тизер-трейлер. Анализируя, кто лайкнул этот трейлер в соцсетях, система помогает корректнее идентифицировать свою ключевую аудиторию. И сделать так, чтобы после просмотра второго, «основного» трейлера, они обязательно пришли в кинотеатр. Система натренирована на более чем 30 годах данных о фильмах, их прибыли, кастинге, аудитории.
Pilot использует AI и алгоритмы машинного обучения, опять же, для предсказывания доходов. Предсказания работают даже за 18 месяцев до выхода фильма. Причем их точность феноменальна: в пределах всего нескольких миллионов! Интересно посмотреть, для каких фильмов программа ошиблась в какую сторону. Например, «Гадкий я 3», по её мнению, в США должен был собрать на $7-$10 млн больше. «Малыш на драйве» – на $3 млн меньше. А провал комедии «Операция «Казино» система предсказала вплоть до мелочей, буквально в пределах $100 тысяч. Если бы руководители Warner Bros. доверились алгоритмам, они бы сэкономили несколько десятков миллионов.
«Операция «Казино» не принесла своим создателям денег
Не всем хочется полагаться на сторонние фирмы, раскрывая информацию о своих сценариях и желанных актерах. Поэтому крупные голливудские студии зачастую сами разрабатывают похожие системы. В прошлом ноябре «Двадцатый век Фокс» рассказала о том, как она использует AI для определения объектов и сцен внутри трейлеров, чтобы понять, что понравится аудитории. Работу исследователей из компании можно почитать тут (PDF). Система называется «Мерлин», и помогает компании решить, сколько выделить денег на раскрутку какого проекта.
«Мерлин» показывает неплохую точность, хотя без конфузов и тут не обошлось. Например, система проанализировала фильм «Логан» (довольно нестандартный для супергеройских боевиков), и выдала список фильмов, которые, скорее всего, найдут отклик у той же аудитории. Результаты «Мерлина» сравнили с ответами пользователей, полученными на выходе из кинозалов.
Среди них оказалось много точных попаданий. Например, «Мерлин» сказал, что эти же люди, наверное, заценят «Джон Уик» и «Великолепную семерку» (хотя они, казалось бы, даже не о супергероях, как он это понял?). Но в списке алгоритма попался и «Тарзан. Легенда», на которую реальная аудитория точно не собиралась идти. Причина? Обоим фильмам машиной были присвоены похожие теги, и, видимо, ей показалось, что в сумме эти два фильма примерно об одном и том же. Они получили такие теги как «много волос на голове», «борода», «драка», и, самое главное, «дерево». И в «Логане», и в «Тарзане. Легенда» было много деревьев, и боевые сцены проходили в лесу. А это значит, по мнению великого «Мерлина», что фильмы похожие!
Может быть, Мерлин прав?
Очевидно, системе еще нельзя доверять на 100%. Но руководители «Двадцатого века Фокс» говорили, что плюсы перевешивают минусы, а алгоритмы, очевидно, со временем станут еще умнее, и научатся отличать главные факторы от вторичных.
Тобиас Кейссер из Cinelytic думает, что студии могли бы адаптировать новый подход даже еще быстрее:
На съемочной площадке сейчас – роботы, дроны, зеленые и синие экраны. Это супер-высокие технологии. Но бизнес-сторона вещей не эволюционировала за 20 лет. Люди до сих пор используют Excel и Word, у них очень простые бизнес-методы. Многие полагаются на личные знания, аналитики и сбора данных практически нет.
Из тех систем, которые опросили журналисты The Verge, делится своими прогнозами не захотел никто: это может повредить их контрактам с текущими студиями. Только ScriptBook прислала свои предсказания для фильмов, выпущенных в 2017-м и 2018-м. Алгоритмы там оказались намного успешнее реальных людей, принимающих решения. Из выборки в 50 фильмов, включая такие необычные как «Реинкарнация», «Тихое место» и «Первому игроку приготовиться», только 44% получили профит, большинство провалились. Система ScriptBook же была права в 86% случаев. «Точность – в два раза выше, чем у текущей индустрии!»
Обратная сторона медали
Академическая работа, опубликованная на эту тему в 2016-м, тоже предсказывает, что такие алгоритмы смогут выдавать надежные и точные прогнозы по поводу успеха фильмов, основываясь на информации о сюжете, режиссерах и актерах. Но Кан Чжао, один из авторов работы, предупреждает, что у таких статистических подходов есть свои недостатки.
Первый минус – зачастую подобные предсказания и без того очевидны. Не нужно быть гением, чтобы предсказать, что фильм с Леонардо ДиКаприо или Томом Крузом соберет больше денег, чем тот же фильм без них. А убыточные кинокартины, в которых студии ошиблись, зачастую вообще не имеют никаких больших знаменитостей, у них просто не тот бюджет. Так что там и анализировать «прибыльность» актеров толком не зачем.
Другая проблема – алгоритмы, по своей природе, очень консервативны. Они работают на основании анализа того, что работало в прошлом. Но это не значит, что те же проекты всегда будут работать в будущем. Машины не следят за культурными сдвигами, не чувствуют текущего вкуса аудитории и предвзято относятся к новым идеям.
Такой «встроенный» консерватизм сейчас является вызовом всей индустрии AI. Например, мало кто умеет работать с искусственным интеллектом лучше, чем Amazon. Но даже эта компания в прошлом году вынуждена была прекратить использовать AI-инструментарий, помогающий с наймом программистов. Оказалось, что тот (на самом деле, без шуток) предвзято относился к соискателям-женщинам. Дело в том, что алгоритмы были натренированы на текущем штате компании, где разработкой софта в основном занимаются мужчины. Система, видимо, поняла, что мужчины «заходят» чаще. И просто начала занижать в выдаче любое резюме, в котором содержалось слово «женщина». Если бы это вовремя не заметили и не отключили алгоритм, через несколько лет женщин-девелоперов в Amazon вообще бы почти не осталось.
Кан Чжао предлагает другой пример – из индустрии кинофильмов. Фэнтези экшен «Варкрафт» 2016 года. Корректно предсказать его сборы системы на их текущем уровне никак не могли. Им нужно было бы понять, насколько популярной была эта ММОРПГ, уточнить, как к ней сейчас относится аудитория, учесть тысячи сторонних факторов, вплоть до того, какую именно часть сюжета пытается адаптировать фильм (если бы это была история Короля-лича, любой фанат саги скажет, прибыль кинокартины была бы куда выше).
В итоге в США фильм провалился, собрав всего $24 млн в свой первый уик-энд. Но – по итогам оказался очень хорошим коммерческим успехом. Всё благодаря Китаю, который, истосковавшись по саге, пошел на него стаями. Там «Варкрафт» стал самым успешным иностранным фильмом всех времен. Но никаких исторических данных, которые помогли бы предсказать такой результат, у AI-алгоритмов попросту не было.
Похожие истории встречаются и в предсказаниях ScriptBook на 2017-2018. Фильм-дебют Джордана Пила «Прочь» система корректно одобрила. Но предсказала ему $56 млн сборов – вместо реальных $176 млн. Алгоритмы также предупредили не спонсировать фильм «Горе-творец» с Джеймсом Франко. Но тот, благодаря культовой популярности «Комнаты» как худшей картины всех времен и народов, оказался более-менее успешным, и принес создателям $21 млн при бюджете $10 млн.
Андреа Скарсо, директор британской инвест-фирмы Ingenious Group, соглашается с тем, что такая проблема консерватизма присутствует. Его компания использует софт Cinelytic для принятия решений по поводу инвестиций в кинокартины. Помощь, он говорит, есть, и хорошая, но всё же использовать AI пока можно только в виде вспомогательного инструмента, чтобы подтвердить собственные выводы.
В числе клиентов ScriptBook – несколько «крупнейших голливудских студий», но контракты запрещают компании даже говорить их названия:
Люди не хотят, чтобы их ассоциировали с AI, потому что общее мнение пока такое, что AI – это плохо. Все хотят его использовать. Но никто не хочет говорить, что они его используют.
Скептицизм сейчас есть, но мнение довольно быстро меняется. Андреа Скарсо говорит, есть один фактор, который заставил Голливуд перестать игнорировать большие данные: Netflix. Стриминговый сервис, каждый год собирающий всё больше зрителей, продолжает доказывать, что его информационно-ориентированный подход к фильмам и сериалам является большим плюсом. Компания отслеживает действия миллионов подписчиков. И понимает, например, какую мини-картинку стоит им поставить, чтобы повысить вероятность того, что они на неё кликнут и пойдут смотреть фильм.
Один из топ-менеджеров Netflix, Тодд Йеллин, хвастался их AI-мозгом в 2016-м:
У нас один большой глобальный алгоритм, и это очень помогает, потому что он учитывает вкусы пользователей со всего мира.
Компания утверждает, что её алгоритм рекомендаций сам по себе приносит ей минимум $1 млрд в год. Учитывая затраты Netflix на создание оригинального контента (ожидается, что в этом году они превысят $15 млрд), даже самые консервативные продюсеры Голливуда начинают понимать, что работать с алгоритмами и даже частично на них полагаться – не такая уж и плохая идея.
Аналитик данных в ScriptBook Майкл Рюленс говорит, что трансформация индустрии очень заметна:
Когда мы только начинали четыре года назад, мы встречались с большими компаниями в Голливуде. Они все относились к нам супер-скептично. Сейчас всё изменилось. Компании провели собственные исследования, они ждали, чтобы понять, какие предсказания умеет делать софт. И, постепенно, научились доверять алгоритмам.
Они начинают принимать нашу технологию. Просто нужно было время, чтобы они поняли её преимущества.
P. S. Покупать в США выгодно с Pochtoy.com. Доставка с нами – от $11.99 за полкило. Плюс – скидка 7% при регистрации с промо-кодом HABR. А если вы бы хотели, наоборот, продавать свои товары в магазинах США, у нас теперь есть новая услуга – фулфилмент.