Теперь нельзя верить политикам, говорящим что-то в YouTube-роликах, и «сливам» секс-видео звёзд. Реддит-юзеры научили AI заменять лица на видео, и в последние недели это так взорвалось, что ни одна знаменитость не осталась нетронутой. Больше всего досталось Нику Кейджу, который, с его экспрессивностью, давно стал золотой жилой для создателей мемов. Благодаря искусственному интеллекту и возможностями машинного обучения это вышло на новый уровень, так что сейчас к технологии присматриваются и в Голливуде. Эффекты иногда получаются лучше, чем в последних блокбастерах. Вот только у некоторых пользователей другие интересы...
Как мы к этому пришли
Первым знакомством с идеей «вставки» человека внутрь видео для многих стал фильм «Форрест Гамп», снятый в 1994 году. При бюджете $55 млн персонажа Тома Хэнкса получилось «внедрить» в несколько известных сцен американской кинохроники. Но реалистичным эффект было не назвать. Даже нетренированный пользователь мог заметить, что что-то не так: слишком Форрест выделялся из фона. Лучшие специалисты Голливуда не могли незаметно вставить готового Тома Хэнкса в готовую хронику.
Не очень убедительно?
На новый уровень всё вышло буквально в последние несколько лет – с разработкой искусственного интеллекта и алгоритмов машинного обучения. В 2015-м Facebook начала тестировать среди пользователей технологию DeepFace. Соцсеть собрала самую большую в мире фотобиблиотеку, и ей захотелось связать в ней как можно больше лиц. Даже тех, которые сами пользователи не отмечали. DeepFace научилась определять, принадлежат ли два лица на разных фотографиях одному и тому же человеку, с точностью 97,25%. По данным Facebook, люди на этот же тест правильно отвечали в 97,53% случаев, то есть они оказывались всего на четверть процента успешнее системы.
Работа DeepFace
Знать, кто на чьих фотографиях, для Facebook очень важно: так она еще успешнее может продавать персонализированную рекламу, и торговать информацией о своих пользователях. В итоге технология DeepFace стала работать у «мордокниги» почти везде, кроме Евросоюза, где ей воспрепятствовали законы о конфиденциальности данных.
В 2016-м с технологией поиска и замены лиц начали играться сами пользователи. Фильтр Face Swap в Snapchat, меняющий лица местами, стал мега-хитом. Ежедневно видео с ним отправляли несколько сотен миллионов раз – и продолжают отправлять до сих пор. С похожими задачами также умеет справляться приложение MSQRD для iOS и Android (которое через 3 месяца после создания тоже купила Facebook), и другие.
Face Swap Live, еще одно приложение
Наконец, в 2016-м свою работу презентовали разработчики из Стэнфордского университета (кстати, Snapchat – это тоже бывшие студенты Стэнфорда). Их технология называется Face2Face и позволяет в реальном времени менять выражения лица на видео, используя самую обычную веб-камеру. Работа крайне интересная (можно почитать в PDF), а результаты просто потрясающие. Герою любого видеоролика можно «пересадить» свою мимику и речь. Веб-камера сканирует ваше лицо, а программа сопоставляет его с лицом персонажа, и накладывает на него все ваши выражения.
В демо-видео разработчики заставляют как угодно кривляться Буша, Трампа и Путина. Технология работает в RGB, умеет рендерить не только губы и щеки, а и внутренность рта персонажа, и не использует «геометрическое прокси расположения зубов», что для создателей является особенной гордостью. Итог – результат, который иногда сложно отличить от реальности. Обладая такой программой любого политика можно заставить сказать что угодно. «Видеодоказательствам», получается, верить больше нельзя, а съемку с охранной камеры или видео со смартфона в качестве улики в суде через несколько лет принимать перестанут. Спасибо, Стэнфорд!
Выход на новый уровень
Дальше начинается самое интересное. В декабре-2017 на арену выходит реддит-юзер DeepFakes (очевидная аллюзия на DeepFace от Facebook). Со своим алгоритмом, позволяющим создавать реалистичные видео с заменой лица, используя нейросети и машинное обучение. С открытым кодом, доступным для других энтузиастов (ссылка на GitHub). Со своего домашнего ПК он сделал первый «шедевр»: порно с Галь Гадот, «Чудо-женщиной», в главной роли.
В работе применялись библиотеки для глубокого обучения Keras и TensorFlow, и открытые алгоритмы machine learning. DeepFakes говорит, что его алгоритм похож на тот, который использует Nvidia в технологии, меняющей на видео время года или погодные условия, представленной чуть раньше в декабре. Сначала система «тренируется» на картинках в Google и роликах в YouTube. В процессе обучения ИИ пытается сопоставить фрагменты исходных портретов с видеозаписью, чтобы получить максимально правдоподобный ролик. Так был создан и порнофильм с Галь Гадот: машине «кормили» её фото из Google и видео разных интервью в YouTube. А когда она разобралась, что актриса из себя представляет, модель Галь Гадот наложили на ролик с порноактрисой похожих пропорций.
DeepFakes так объясняет работу своего творения в интервью Motherboard:
Я беру сотни фото, и генерирую из них миллионы искаженных изображений, чтобы тренировать сеть. Когда она готова, и знает, какое лицо мне нужно слепить, достаточно скормить сети чье-то другое лицо. Сеть думает, что это еще одно искаженное изображение, и пытается сделать его похожим на то лицо, с которым она тренировалась.
На Галь Гадот DeepFakes не остановился. Чтобы показать возможности своего алгоритма, он сделал порно с Мэйзи Уильямс (Арья из «Игры Престолов»), Скарлетт Йоханссон, Тейлор Свифт и другими.
Но взлетело все тогда, когда другой пользователь, Deepfakeapp, месяц спустя создал программу FakeApp, чтобы каждый мог баловаться так, как захочет, даже без знаний Python. 31 января программа достигла 100 000 загрузок.
Интерфейс FakeApp
Создание данных для тренировки нейросети, обучение модели, создание подделок – с новой программой это стало доступно без необходимости установки Python и без познаний в синтаксическом анализе.
Сразу же пошли мемы. Одним из самых безобидных среди них стал Николас Кейдж, которого стали вставлять, куда только можно. Во-первых, лицо характерное, во-вторых, это забавно, в-третьих, разве справедливо, что Ник Кейджу не дают самых хороших ролей?
Кейдж-Лоис
Кейдж в «Терминатор 2»
По словам Deepfakes, на создание одного короткого видео у программы занимает в среднем 8-12 часов. Дорогая видеокарта может справиться с такой задачей довольно быстро, а бюджетному ПК на создание ролика требуется пара дней.
Кейдж-Супермен
Единственной преградой для алгоритма может стать недостаток исходных материалов, однако в эпоху интернета с этим не возникнет проблем. Так, только с 2015-го по 2016-й пользователи сети опубликовали больше 24 млрд селфи.
Два Кейджа
Также создатели AI-подделок сделали сабреддит со своими «творениями» (осторожно, 18+!). Он взорвался в популярности, за несколько недель у него набралось 56 тысяч юзеров (апд.: уже 65 тысяч, за три часа). Каждая знаменитость, которую хоть кто-то хотел видеть голой, представлена в десяти вариантах. Дошло до того, что сервис Gfycat запретил размещать у себя гифки с фейковым порно, потому что они забили весь топ просмотров.
Три дня назад канал Deepfakes AI с порном знаменитостей был заблокирован Discord. Reddit, на котором идея родилась, пока что молчит. Ну а видео пока что (вероятно, временно) нашло себе пристанище на Pornhub (опять, строго 18+).
Кэти Перри
Некоторые фейковые порно уже успешно выдали за настоящие. Ролик с Эммой Уотсон, принимающей душ, подхватил сайт Celebjihad, постящий «утечки» обнаженных знаменитостей. Учитывая, сколько фото в широком доступе в интернете есть у большинства пользователей социальных сетей, возникают опасения, что порно теперь могут сделать абсолютно с любым. У этого уже есть термин – «порно-месть». Если неудачливый ухажёр или бывший бойфренд захочет испортить жизнь своей пассии, ему достаточно обратиться к одиночке-программисту с мощным ПК.
Дэйзи Ридли из «Звездных войн»
Wired сообщает, что создатель FakeApp может быть подвергнут ответственности, если удастся доказать, что технология используется для создания «несогласованного порно». Но прецедентов делу пока не было, и очевидно, как только какая-то знаменитость подаст в суд, трафик к его/её роликам возрастет многократно. Также легальная проблема заключается в том, что тело на видео не принадлежит персоне, подающей иск, и это будет сложно классифицировать как нарушение конфиденциальности. «Вы не можете засудить кого-то за раскрытие интимных подробностей вашей жизни, если это не вы, кого они раскрывают», пишет Wired.
Многие люди в сети называют труды пользователей FakeApp «цифровым изнасилованием». Но юзер с Реддита Gravity_Horse защищает их эксперименты:
То, что мы делаем в этом сообществе, не имеет злого умысла. Наоборот. Мы рисуем с революционной, экспериментальной технологией, которая вполне может выстроить будущее медиа и креативного дизайна. Если кто-то хочет сделать подделку, чтобы навредить человеку, есть Фотошоп. Он куда проще и существует много лет. К тому же, чем быстрее эта технология станет мейнстримом, тем менее эффективной будет порноместь. Даже от настоящих снятых дома сцен, выложенных бывшим бойфрендом, можно будет отмахнуться, сказав, что это подделка.
В то же время, ожидается, что у технологии найдется применение в Голливуде. Например, нейросеть в FakeApp за один день и с затратами в $0 сделала молодую принцессу Лею более качественно, чем команда экспертов в «Изгой-один: Звездные войны» с бюджетом $200 млн. У технологии может быть большое будущее в киноиндустрии. Как обычно, порно – двигатель прогресса.
Попытки заменить старых героев компьютерной графикой у Disney и LucasFilm пока что получаются так себе (кадр из фильма «Изгой-один»)
P.S. Один из медиаэлементов со знаменитостями – реальный. Сможете без гугла понять, какой?
Не забываем, что самую выгодную и быструю доставку из США в Россию и Украину обеспечиваем мы в Pochtoy.com. Всем читателям при введении промо-кода HABR скидка 7% на первую доставку и бесплатный выкуп нами из магазинов.