Подмена человеческого голоса. Как ИИ лишает работы певцов и актёров озвучки / Хабр

Если сравнивать нашу реальность с киберпанком, то в первую очередь с «Матрицей». Во второй части, «Матрица: Перезагрузка», должен был сняться Джет Ли. Но Ли тогда отказался из-за опасений, что киношники оцифруют все его боевые приёмы. Его боевое искусство тогда стало бы принадлежать студии. Эта концепция обеспокоила Ли, он не хотел, чтобы в будущем его цифровая версия была бы использована без его согласия.

Сегодня под видом предоставления «фан-сервиса» или «дани уважения прошлому» крупные корпорации, такие как Sony, Disney, Warner и другие, могут воссоздавать цифровые версии умерших актёров. Но использование ИИ голливудскими студиями и медиакомпаниями затронет не только крупных артистов, это теперь коснётся всех участников отрасли. Актёров массовки сканируют для создания цифрового двойника, и они не получают должной компенсации за этот цифровой дубликат и не знают, где и как это творение будет использоваться.

Мы живём в мире, где Том Хэнкс оправдывается, что не снимался в рекламе стоматологической клиники, в которой использовали его лицо. Это событие сопровождается тем, что дочь Робина Уильямса критикует корпорации, которые хотят с помощью ИИ воссоздать голос её отца, за плечами которого было много узнаваемых персонажей.

Актёры озвучивания обеспокоены тем, что их голоса могут быть использованы для создания нового контента, на который они не подписывались. Настал момент для артистов озвучки внимательно следить за своими контрактами: их голос может быть клонирован продюсерами или мошенниками. Это касается и певцов с узнаваемыми голосами. Теперь им придётся соревноваться не только с другими музыкантами, но и с самими собой.

Люди меняются. И мир вместе с ними

Подобно ярким киноактёрам, которые бьют тревогу по поводу появления искусственного интеллекта и того, как он может повлиять на их работу, актёры озвучивания находятся на переднем крае технологических перемен. Но в отличие от других творческих областей, где авторы и художники объединяются в коллективных исках, чтобы противостоять использованию их работ, защищённых авторским правом, актёры озвучивания особенно уязвимы. Хотя голоса по своей природе различимы, они не защищены как интеллектуальная собственность.

Озвучка — это узкоспециализированный навык и требует особого таланта. Но генеративный искусственный интеллект становится всё более искусным в этом плане. CD Projekt, польский разработчик видеоигр, использует технологию искусственного интеллекта, чтобы воссоздать голос актёра озвучивания Милогоста Речека, умершего в 2021 году, для польскоязычной версии расширения Phantom Liberty для Cyberpunk 2077. CD Projekt запросила разрешение у семьи Речека, прежде чем использовать алгоритм ИИ, и рассмотрела такие альтернативы, как замена актёра или перезапись его реплик. Однако компания отказалась от этих вариантов, поскольку Речек считался одним из лучших польских талантов озвучивания, а его игра в роли Виктора Вектора была исключительной.

Вместо этого CD Projekt наняла другого актёра озвучивания для записи новых реплик персонажа и использовала программное обеспечение для клонирования голоса под названием Respeecher, чтобы адаптировать диалоги так, чтобы они звучали как голос Речека. Целью было сохранить образ Речека в игре и отдать должное его вкладу в роли Виктора Вектора.

Это решение было поддержано сыновьями Речека, которые, как сообщается, выступали за искусственное воспроизведение голоса их покойного отца. Этот шаг подчёркивает растущую распространённость генеративного искусственного интеллекта, который может создавать различные формы контента, включая текст, изображения и голос. Актёры озвучки беспокоятся о том, что их голоса будут украдены и скопированы для распространения дезинформации, что они станут жертвой дипфейков или услышат, как они появляются в порнографическом контенте без их согласия — всё это может нанести ущерб их репутации.

Эксперты отрасли сходятся во мнении, что из-за бума технологий искусственного интеллекта некоторые рабочие места будут потеряны. Дешёвую голосовую работу начального уровня можно заменить машинным вокалом. Но они также оптимистичны в отношении того, что ИИ не сможет полностью автоматизировать действия актёров озвучивания. Чтобы передать в ремесле правильные эмоции, диалекты и артистизм, продюсерам всё равно придётся нанимать людей. Для анимационных персонажей в дорогостоящих шоу жизненно важно наличие актёров-людей, способных передать культурные нюансы.

ИИ мог бы стать недорогим решением для компаний, которые делают информационные HR-видео, но синтетические голоса не привлекают людей так же, как люди. Каждый голос или акцент различен, и это одна из вещей, которые ИИ не может воспроизвести.

Тем не менее, компании рассматривают разные варианты. Spotify анонсировала пилотную версию функции перевода подкастов. Она частично работает на генеративной голосовой технологии OpenAI и переводит голоса подкастеров на другие языки. В первой партии представлены такие популярные личности, как актёр Дакс Шепард, спортивный комментатор Билл Симмонс и бывший ведущий Daily Show Тревор Ноа. Затем OpenAI также объявила, что интегрировала голосовую технологию в своего ChatGPT.

Компания ElevenLabs привлекла 19 миллионов долларов и была оценена в 100 миллионов долларов. Стартап, бета-версия которого была запущена в январе 2023 года, приобрёл значительную популярность благодаря своему естественно звучащему программному обеспечению для синтеза речи и преобразования текста в речь, в котором используются технологии искусственного интеллекта и методы глубокого обучения. Компания уже привлекла более миллиона зарегистрированных пользователей в различных отраслях создания контента.

Недавно ElevenLabs представила AI Dubbing, новую функцию, которая может конвертировать разговорный контент на другой язык, сохраняя при этом голос, модели речи, эмоции и интонации говорящего. Функция искусственного дубляжа предназначена для того, чтобы позволить аудитории по всему миру наслаждаться любимым фильмом/шоу на родном языке, конвертируя его за считанные минуты. Функция дублирования будет поддерживать более 20 языков.

ElevenLabs на данный момент является одной из самых популярных компаний в области голосового искусственного интеллекта. Её технологии требуется всего от 30 секунд до 10 минут аудио, чтобы создать то, что звучит как почти идентичная копия чьего-то голоса. Наряду с такими сайтами, как FakeYou и Voice AI, которые предлагают бесплатную библиотеку цифровых голосов, она также находится в центре влияния генеративного ИИ на актёров озвучивания.

И без того нестабильная отрасль находится на грани широкомасштабных перемен, поскольку работодатели начинают экспериментировать с этими инструментами преобразования текста в речь. Сообщество актёров озвучивания впервые заметило приток голосов, генерируемых искусственным интеллектом, после того, как в январе 2023 года Apple Books запустила цифровое озвучивание аудиокниг с набором голосов сопрано и баритона. Актёры начали обнаруживать тысячи аудиофайлов со знакомыми голосами, которые загружаются на различные сайты, в основном фанатами.

Актриса озвучивания Аллегра Кларк наткнулась в TikTok на видео с участием Бэйдо, персонажа из видеоигры Genshin Impact, которого она озвучила. В ролике Бэйдо участвовала в сцене сексуального характера и говорила вещи, которые Кларк никогда не записывала, хотя голос звучал точно так же, как у неё. Создатель видео клонировал голос Кларк с помощью ElevenLabs, после чего заставил её говорить всё, что хотел. Кларк, озвучившая более 100 персонажей видеоигр и десятки рекламных роликов, сказала, что сначала интерпретировала видео как шутку, но затем была обеспокоена тем, что её работодатели могут увидеть это компрометирующее видео и расторгнуть с ней контракт.

Она попросила стартап удалить загруженный аудиоклип и предотвратить клонирование её голоса в будущем, но компания заявила, что не обнаружила, что клип был создан с использованием её технологии. Они заявили, что примут меры только в том случае, если клип будет «разжигать ненависть», и заявили, что не несут ответственности за какое-либо нарушение авторских прав.

Соучредитель и генеральный директор ElevenLabs Мати Станишевски сообщил, что пользователям необходимо «явное согласие» человека, чей голос они клонируют, если созданный контент может быть «наносящим ущерб или клеветническим». Спустя несколько месяцев после истории с Кларк компания запустила инструмент «голосовой капчи», который требует от людей записывать случайно сгенерированное слово, и этот голос должен соответствовать голосу, который они пытаются клонировать.

Сотни актёров озвучивания обратились с просьбой удалить их голоса из генераторов голоса искусственного интеллекта Uberduck и FakeYou.ai, которые заявили, что удалят голоса со своих сайтов, если владелец голоса обратится к ним. Хотя FakeYou.ai по-прежнему предоставляет тысячи популярных голосов, таких как голоса Джона Сины и Канье Уэста, которые может использовать каждый, Uberduck удалил голоса, предоставленные пользователями, со своей платформы в июле.

Одним из актёров озвучивания, который публично потребовал удалить свой голос из генераторов голоса, является Джим Каммингс, озвучивающий таких персонажей, как Винни-Пух и Тэза из Looney Tunes. Он сказал Forbes, что согласится на то, чтобы пользователи использовали его голос только в том случае, если он и его семья получат за это гонорары.

Однако большинство контрактов, подписанных актёрами озвучивания, не запрещают использование записей их голосов для обучения систем искусственного интеллекта. На протяжении более десяти лет в контрактах говорилось, что продюсеры «бессрочно владеют записью с использованием любой технологии, существующей в настоящее время или разрабатываемой», — сказала Сисси Джонс, актриса озвучивания, которая является членом Национальной Ассоциации актёров озвучивания (NAVA), недавно созданной некоммерческой организации, защищающей интересы актёров озвучивания.

Эти контракты в основном были написаны и подписаны до появления систем искусственного интеллекта. Вот почему NAVA и профсоюз актёров SAG-AFTRA работают над тем, чтобы исключить из контрактов то, что позволяет работодателям использовать голос актёра для создания «цифрового двойника» или «синтезировать» его голос посредством машинного обучения. Организации также разработали новый шаблонный текст для включения в контракты, который защитит актёров озвучивания от потери прав на свой голос.

Способность ИИ точно имитировать голоса людей также создала возможности для мошенников. В этом году Федеральная торговая комиссия предупредила, что преступники используют голосовые клоны искусственного интеллекта, чтобы выдавать себя за близких, чтобы убедить своих жертв отправить им деньги. Или использовать инструмент ElevenLabs для создания клона голоса, которая может успешно войти в банковский счёт обладателя оригинального голоса.

В ответ на неправомерное использование сайты генерации голоса вводят ограничительные меры для контроля над своими технологиями. Компания Speechify, которая лицензирует голоса таких знаменитостей, как Снуп Дог и Гвинет Пэлтроу, не позволяет людям загружать контент для создания индивидуальных голосов без активного участия человека, чей голос они хотят использовать. А в Resemble AI, которая рекламирует корпоративных клиентов, таких как Netflix и World Bank Group, люди могут создать индивидуальный голос, сгенерированный ИИ, только после заявления о согласии тем человеком, голос которого они хотят сгенерировать.

Однако подобные проверки не затрагивают этические вопросы более высокого уровня, связанные с согласием. Актёры, например, на самом деле не имеют контроля над тем, как их голоса будут использоваться посмертно. Актёры потребовали удалить пункт в договоре, который игровая студия Hi-Rez Studios добавила, позволяющий ей клонировать голос с помощью ИИ после смерти владельца голоса.

Большая озабоченность по поводу всего этого заключается в том, есть ли будущее у актёров озвучивания. В настоящее время члены SAG бастуют, пытаясь договориться с голливудскими студиями, чтобы гарантировать, что их следующий контракт будет предлагать информированное согласие и справедливую компенсацию, когда их голос изменяется ИИ. Даже если профсоюз актёров получит более сильную защиту от искусственного интеллекта, чем те, которые предоставляются по контракту, который недавно Гильдия сценаристов Америки заключила с голливудскими студиями, он не защитит всех актёров озвучивания. Тем, кто работает над видеоиграми, по-прежнему нужны права, защищающие их работу. Переговоры между SAG и крупными компаниями, производящими видеоигры, завершились без заключения сделки.

Музыка будущего

Каждый день тысячи людей тренируют голосовые модели ИИ на основе работ известных артистов и используют эти модели для имитации их голосов, будь то путём ремиксов существующей музыки или преобразования своей собственной. Всё, что нужно для обучения модели, — это вырезать вокал из нескольких песен исполнителя, а затем пропустить их через программное обеспечение для клонирования голоса с открытым исходным кодом на базе искусственного интеллекта.

Это не простой процесс, но по мере развития технологий он станет только более доступным. Хотя большинство самодельных кавер-песен, созданных искусственным интеллектом, не монетизируются их создателями, а просто загружаются на TikTok и YouTube ради развлечения, некоторые пошли ещё дальше.

Ранее в этом году анонимный продюсер Ghostwriter977 клонировал голоса Дрейка и The Weeknd в треке Heart on My Sleeve, и загрузил песню в потоковые сервисы. Песня стала вирусной, набрав сотни тысяч прослушиваний и миллионы просмотров на TikTok, а затем исчезла так же быстро, как и появилась.

По оценкам Billboard, трек мог принести создателям около 10 000 долларов, прежде чем его удалили, но неизвестно, были ли выплачены эти гонорары. Видео Heart on My Sleeve также было удалено с YouTube, как сообщается, из-за претензий со стороны Universal Music Group, лейбла Drake и The Weeknd. С тех пор песня снова появилась на YouTube и размещена на нескольких различных каналах.

Ghostwriter рассказал, что некоторое время работал в музыкальной индустрии до выхода Heart On My Sleeve. Идея «fake Drake» возникла из-за разочарования в работе в качестве профессионального автора песен.

«Я был автором песен и продюсером. Со временем я начал понимать, что бизнес по написанию песен сошёл на нет. Авторам песен платят почти ничего. Это заставило меня задуматься: «Что я могу сделать как автор песен, который хочет быть услышан?»

Ghostwriter считает, что технология моделирования голоса с помощью искусственного интеллекта может в конечном итоге быть узаконена артистами и лейблами, чтобы фанаты могли лицензировать голоса своих любимых исполнителей для создания и выпуска своих собственных песен.

«Вокальные дипфейки никуда не денутся: клонирование голоса с помощью искусственного интеллекта навсегда изменит поп-музыку. Представьте себе, что вы поёте караоке-песню голосом исполнителя; персонализированное поздравление с днём рождения от вашего любимого исполнителя; хитовую пластинку, которая чётко обозначена и отнесена к категории AI. Это также маркетинговый стимул», — продолжает Ghostwriter. «Я сравниваю это с фанфиками — музыкальным жанром, созданным фанатами. Некоторые могут подумать, что это создаёт конкуренцию или отвлекает внимание от собственной музыки исполнителя, но я бы не согласился. Это будущее музыки».

После того, как «fake Drake» потряс музыкальную индустрию, крупные лейблы планируют узаконить клонирование вокала искусственным интеллектом известных исполнителей. Куда это может привести?

Как засудить ИИ?

В течение многих лет Ассоциация звукозаписывающей индустрии Америки (RIAA) ежегодно представляла Управлению торгового представителя США отчёт, состоящую из длинного списка пиратских сайтов, которые нелегально копируют и распространяют музыку, защищённую авторским правом. Однако в своём последнем отчёте за 2023 год RIAA добавило новую категорию нарушителей авторских прав: клонирование голоса с помощью искусственного интеллекта.

«В 2023 году произошёл всплеск несанкционированных сервисов клонирования вокала с использованием искусственного интеллекта, которые нарушают не только права артистов, чьи голоса клонируются, но и права тех, кто владеет звукозаписями», — говорится в сообщении RIAA. «Это привело к взрывному росту числа несанкционированных производных работ, которые наносят вред исполнителям звукозаписи и владельцам авторских прав».

В отчёте конкретно упоминается только один такой сервис: зарегистрированный в Великобритании Voicify.ai. Именно этим сервисом пользовался Ghostwriter для создания «fake Drake».

«Этот сайт позиционирует себя как «платформа №1 для создания высококачественных каверов с использованием искусственного интеллекта за считанные секунды» и включает в себя вокальные модели Майкла Джексона, Джастина Бибера, Ариану Гранде, Тейлор Свифт, Элвиса Пресли, Бруно Марса, Эминема, Гарри Стайлса, Адель, Эда Ширана и других, а также политических деятелей, включая Дональда Трампа, Джо Байдена и Барака Обаму», — говорится в докладе. «Сервис транслирует видео YouTube, выбранное пользователем, копирует акапеллу из трека, модифицирует акапеллу с использованием вокальной модели искусственного интеллекта, а затем предоставляет пользователю копии модифицированной основы акапеллы, базовой инструментальной основы и модифицированную запись ремикса».

Музыкальная индустрия обеспокоена тем, что она стоит на пороге новой волны пиратства, когда вокал артистов, и даже их собственную визуальную идентичность, крадут для создания контента, за который этим артистам не платят. Большой вопрос в музыкальном бизнесе сегодня заключается в следующем: могут ли правообладатели музыки монетизировать ИИ-клоны артистов? Может ли Дрейк получить гонорары за «fake Drake» (или другие подобные треки на таких сервисах, как Voicify.ai)?

Подписка на Voicify в Великобритании стоит пользователям от 7,99 фунтов стерлингов в месяц до 89,99 фунтов стерлингов в месяц. Вполне вероятно, что в ближайшие месяцы или годы Voicify.ai столкнётся с одним или несколькими судебными исками со стороны правообладателей музыки. Согласно исследованию RIAA, за последний год сайт Voicify.ai посетило 8,8 миллиона человек. Voicify.ai был создан 20-летним студентом Адитья Бансалом, изучающим информатику.

До сих пор в неизвестно, как будут применять суды закон об авторском праве на несанкционированные произведения, созданные ИИ. Если звукозаписывающая индустрия решит законно преследовать Бансала, более важным вопросом будет то, за что они его преследуют. Что ещё более важно, последняя четверть века цифрового пиратства научила музыкальный бизнес тому, что борьба с отдельными компаниями и отдельными лицами, нарушающими авторские права, редко помогает остановить пиратство в целом. Если Voicify.ai проиграет в суде, всегда найдётся другой, готовый занять его место.

Становится всё более очевидным, что крупные лейблы рассматривают несанкционированное клонирование голоса как реальную угрозу. Подобно тому, как цифровое пиратство угрожало перевернуть музыкальную индустрию в нулевых, появление легкодоступной новой технологии позволяет любому, у кого есть компьютер и подключение к Интернету, забрать что-то, принадлежащее лейблам и артистам, которых они представляют. Но там, где Napster позволял своим пользователям незаконно загружать музыку, защищённую авторским правом, клонирование голоса позволяет людям присваивать то, что, возможно, не защищено напрямую авторским правом: голос исполнителя.

«Когда меня не станет — я буду петь голосами моих детей и голосами их детей» — поёт Баста в песне «Сансара». А ещё, скорей всего, ты будешь петь голосами роботов из Интернета!

Как это часто бывает при появлении новых технологий, правовые системы недостаточно подготовлены к борьбе со злоупотреблением клонирования голоса. Закон об авторском праве касается произведений, защищенных авторским правом; песни, тексты песен и мелодии, которые можно идентифицировать и защитить. В музыкальном плане голос — это тембр, и музыканты постоянно используют одни и те же тембры.

Инструменты используются в тысячах разных песен, и вы не будете подавать в суд на кого-то за имитацию тона вашей гитары. Хотя программное обеспечение для клонирования голоса искусственного интеллекта обучается с использованием материалов, защищённых авторским правом (этика и законность которого являются отдельным и не менее сложным вопросом), его выходные данные только извлекают из этого материала тембр голоса, а не мелодии или тексты, защищенные авторским правом.

Однако голос является не просто тембром, а частью личности певца, и именно на этом основании закон может защитить тех, чьи голоса клонируются без разрешения. Большинство стран признают право человека на гласность; право контролировать коммерческое использование определённых аспектов своей личности, таких как имя, изображение и сходство.

Вместо этого наиболее эффективным подходом (когда речь идёт о взрывном росте пользовательской активности с использованием авторских прав на музыку) является монетизация несанкционированного контента через платформы, на которых он размещён. В конце концов, сотрудничество крупных платформ, таких как YouTube, с правообладателями музыки может быть всем, что необходимо для обеспечения достаточной защиты и контроля авторских прав в эпоху широкого распространения генеративного искусственного интеллекта.

Reality is wrong

Знаете такую шутку: «Тупак умер в 1996 году, но он всё ещё выпускает альбомы каждый год»? Конечно, каждый год не выходят новые альбомы, но вот несколько, а то и десятки, новых мэшапов точно появляются. Мэшап — это когда запись одного исполнителя смешивают с записью другого, и в итоге получается новое произведение. После смерти Тупака его друзья несколько лет подряд издавали его неизданные треки, а потом грамотно делали ремиксы и ремейки его старых треков. В итоге это подхватили фанаты и сделали некой культурной традицией.

Сегодня делать мэшапы стало проще простого. Если забить в строку поиска на YouTube «AI mashup», то получите тысячи треков, сделанные любителями, где голос одного человека поёт песню другого. Там есть и советский Винни-Пух, исполняющий каверы на System of a Down, и Егор Летов, орущий песни Nirvana, и Эминем, зачитывающий трек Оксимирона (признан инагентом в РФ). Есть также сотни туториалов, где наглядно показывают, что так может сделать любой человек. Для этого понадобятся несколько свободных часов, доступ в Интернет и пару веб-сайтов, где можно обработать голос музыканта.

Было забавно видеть, как в клипе Limp Bizkit слэмятся фейк-версии Владимира Путина, Джо Байдена, Си Цзиньпиня, Ким Чен Ына и Владимира Зеленского перед Томом Крузом, который жарит хот-доги. Точно также было забавно услышать Джонни Кэша, исполняющего евродэнс-хит Barbie Girl группы Aqua 1997 года или как Эрик Картман исполняет «Bring Me To Life» группы Evanescence.

Есть причина, по которой тысячи подростков в течение последнего года создавали и делились AI-каверами и мэшапами; на первый взгляд, это просто прикол. Но они поставили популярную музыку на пороге радикальной трансформации, в ходе которой ИИ заставит нас пересмотреть само представление о том, что представляет собой певческий голос.

Клонирование голоса позволяет смешивать и сочетать любой голос с любой песней, какой бы нелепой ни была эта комбинация. Голоса реальных людей, уникальные тембры, когда-то неразрывно связанные с личностью человека, становятся просто инструментами, новыми красками, которыми можно раскрашивать холст популярной музыки так, как заблагорассудится.

Однако во время прослушивания трудно не почувствовать приступ беспокойства. Технология настолько продвинута, что «кавер» звучит почти так же, как Кэш; создатель даже предоставил убедительно блюзовую минусовку. Но что-то не так, и дело не только в эффекте Зловещей долины. Шутка быстро устаревает, и приходится размышлять о последствиях того факта, что теперь чей-либо голос может быть изъят из его музыки и использован в чьей-либо другой, свободно, легко и без разрешения.

Многочисленные технологические компании работают над разработкой инструментов обнаружения ИИ. YouTube устанавливает партнерские отношения с крупными музыкальными компаниями, что, по всей видимости, является первым шагом к развитию коммерческого партнёрства в области новых музыкальных инструментов искусственного интеллекта. В августе YouTube и Universal Music Group объявили о совместной разработке инструментов искусственного интеллекта, которые предлагают правообладателям музыкальных прав «безопасные, ответственные и прибыльные» возможности.

В настоящее время платформы для клонирования голоса основаны на браузере; вы авторизуетесь, загружаете запись вокала и скачиваете обработанную версию. Это может быть непрактичным рабочим процессом для тех, кто работает на профессиональном уровне, но такие платформы как Moises.ai, и myvox разрабатывают VST-плагины, которые привносят в DAW технологию клонирования голоса. Вскоре появится возможность записать собственный вокал, открыть плагин и просмотреть библиотеку потенциальных голосов для клонирования.

Вместо того чтобы сотрудничать с такими сервисами, как myvox, некоторые артисты берут дело в свои руки. Ранее в этом году Граймс запустила Elf.Tech, программный инструмент с открытым исходным кодом, который можно использовать для клонирования её голоса, заявив: «Теперь Граймс имеет открытый исходный код и самовоспроизводится». Любой может выпустить музыку, созданную с помощью этого программного обеспечения, но Граймс потребовала, чтобы она получала 50% с гонораров. Elf.Tech уже использовали тысячи артистов; австралийский диджей и продюсер Кито недавно выпустил Cold Touch, официальную совместную работу с голосовой моделью Граймс, которая получила название GrimesAI.

Музыкант и продюсер Холли Херндон уже несколько лет опережает всех в области клонирования голоса. В 2021 году Херндон представила Holly+, первую модель голоса с искусственным интеллектом, когда-либо представленную публике. Херндон создала кооператив DAO (Decentralised Autonomous Organization), который владеет интеллектуальной собственностью и голосует за одобрение её использования. Любые средства, полученные от использования модели голоса, будут перенаправлены в DAO, где они будут распределены между использующими её артистами и поддержат дальнейшее развитие.

«Необходимо найти баланс между защитой артистов и поощрением людей экспериментировать с новыми технологиями. Вот почему мы проводим этот эксперимент по коллективному владению голосом. Голос по своей сути является общинным, усваивается посредством мимесиса и языка и интерпретируется отдельными людьми».

Хотя видение Херндона справедливого будущего для клонирования голоса достойно уважения, сомнительно, что крупные лейблы примут такой подход. К чему именно может привести внедрение этой технологии, неясно, но вполне возможно, что через несколько лет для артистов станет обычной практикой лицензировать использование своей голосовой модели в больших масштабах.

Так что, не удивляйтесь, включив радио вы не будете знать, слышите ли вы Софию Ротару или официально лицензированный Sofia Rotaru AI; это действительно гостевой куплет 1kla$ или это просто его голосовая модель (привет, Диме Бамбергу). Возможно, вы даже сможете загрузить свою DAW, записать вокал, открыть плагин и просмотреть список известных исполнителей (живых и мёртвых), прежде чем решить, кто «появится» на вашем следующем треке.

Как и многие недавние разработки в области искусственного интеллекта, клонирование голоса грозит создать столько же проблем, сколько и решить. Если его использование станет широко распространённым в популярной музыке, не перенасытятся ли чарты клонированными голосами? Как слушатели заметят разницу? А если каждый день на потоковые сервисы загружается 120 000 новых треков, как мы будем идентифицировать и удалять песни, содержащие нелицензированные голосовые клоны? Такие платформы, как Moises.ai, заявляют, что разработали технологию, которая позволяет артистам и лейблам обнаруживать треки, в которых используется их голосовая модель без разрешения, но ещё неизвестно, эффективно ли это работает на практике в более широком масштабе.

Более того, проблемы, возникающие при клонировании голоса, носят не только практический, но и этический характер. В мире, где каждый может повторить голос Тейлор Свифт, не обесценится ли этот голос, который является воплощением артистизма певицы? Для профессиональных вокалистов и авторов песен певческий голос является не только важным элементом их личной и творческой идентичности, но и инструментом, с помощью которого они зарабатывают на жизнь. До сих пор голоса неотделимо принадлежали их владельцам; их можно было выдать за другое лицо, но нельзя украсть сразу. Но оцифровывая, деконтекстуализируя и превращая голос в товар, клонирование голоса лишает его владельца и превращает его в такой же инструмент, как и любой другой, — инструмент, которым можно злоупотреблять.

Мы уже видим, как артисты отказываются от прав на свои мастер-записи в начале своей карьеры, стремясь достичь успеха; легко представить, как начинающие вокалисты передают лейблам право собственности на свои клонированные голоса по той же причине. Если UMG и Warner разрабатывают инструменты клонирования голоса для своих артистов, возникает вопрос, верят ли они, что голоса артистов принадлежат, по крайней мере частично, звукозаписывающим лейблам, и будут ли справедливо распределяться деньги, полученные от клонирования голосов этих артистов.

Хотя подобные вопросы необходимы, стоит помнить, что клонирование голоса существенно отличается от чисто генеративного ИИ в том смысле, что оно не создаёт что-то из ничего. Вместо этого оно трансформирует то, что уже существует. По крайней мере, в своем нынешнем виде технология требует наличия существующей записи голоса. Пока владельцы обоих голосов получают компенсацию, клонирование голоса не лишит вокалистов работы — оно может облегчить их работу.

Ранее в этом году рэпера Айс Кьюба обвинили в лицемерии, когда он назвал ИИ «демоническим». Как праотец хип-хопа, его успех был частично основан на использовании семплирования, ещё одной инновационной и революционной технологии, которая позволила преобразовывать музыкальный материал, созданный другими, во что-то новое. Звучит знакомо, неправда ли?

Семплирование вызвало изрядную долю скептицизма в первые дни своего существования, и многие из них в последующие годы стали жертвами его неправильного использования, их работы были отобраны без признания или компенсации. Однако в конечном итоге индустрия адаптировалась к новым возможностям, которые открывала технология, и сэмплирование стало мощным инструментом, который изменил звучание современной музыки к лучшему. Готовясь к клонированию голоса, которое изменит музыкальную индустрию, будем надеяться, что у этой истории будет аналогичный конец.

Подмена человеческого голоса. Как ИИ лишает работы певцов и актёров озвучки

Люди меняются. И мир вместе с ними

Музыка будущего

Как засудить ИИ?

Reality is wrong

Публикации

Информация