company_banner

Детектор плагиата на базе ИИ в патенте Spotify — на самом деле метод сбора данных?

Автор оригинала: Dave Gershgorn
  • Перевод

Как Uber хочет сделать беспилотные автомобили, так и Spotify хочет создавать музыку с помощью компьютера.

Spotify — гигант музыкального стриминга, неохотно делящийся прибылью с исполнителями, — в патенте, выданном Европейским Союзом, описывает технологию, которая, как предполагается, должна защитить музыкантов от обвинений в плагиате.

Согласно заявке на патент, поданной в 2019 г., перед публикацией композиции или во время ее написания музыкант передает компании «нотную тетрадь» — документ, описывающий мелодию, аккорды, а иногда и текст песни. ИИ-алгоритм переводит ноты в более удобный для компьютера формат, а затем сравнивает их с музыкой, имеющейся в базе данных Spotify. Изданию OneZero компания пояснила, что не каждый патент внедряется в продукты, однако осталось неизвестным, была эта система внедрена или нет.

Плагиат — серьезная проблема в музыкальной отрасли. Достаточно вспомнить судебную тяжбу в отношении композиции «Blurred Lines», по итогу которой суд постановил, что Робин Тик и Фаррелл Уильямс скопировали один из хитов Марвина Гэя, и поэтому должны выплатить семье автора более 5 миллионов долларов. С помощью описанной в патенте системы проблему с плагиатом мелодии можно было бы своевременно устранить — даже виртуальные чернила не успели бы высохнуть.

На других платформах (например, YouTube) есть системы идентификации музыки, защищенной авторским правом (YouTube называет ее ContentID), но подход Spotify больше ориентирован на авторов, создающих музыку, а не на тех, кто добавляет уже защищенную авторским правом музыку в видео. Кроме того, системы вроде ContentID полагаются на анализ самого звука, а не соответствующих нот.

Музыкант передает компании «нотную тетрадь» — документ, описывающий мелодию, аккорды, а иногда и текст песни.

Но будут ли музыканты и звукозаписывающие лейблы полагаться именно на Spotify, как на своего рода юридическую защиту от потенциального плагиата?

Джордж Ховард (George Howard), профессор теории музыкального бизнеса в колледже Беркли, настроен в этом отношении скептически. Ховард — бывший президент музыкального лейбла Rykodisc, владелец одноименной консалтинговой фирмы и сооснователь компании Music Audience Exchange, которая помогает авторам лицензировать музыку для брендов. Также он стоял у истоков сервиса TuneCore, посредством которого исполнители продают музыку на крупных стриминговых платформах (например, Spotify).

Ховард поясняет свою позицию так: «Не думаю, что хоть кому-то придет в голову считать, что мотив Spotify — помочь музыкантам. Продукт этой компании — музыка и подкасты. И этот инструмент поможет им либо защитить себя от судебных разбирательств, либо создать больше композиций, за которые не придется выплачивать гонорары. Я как автор и музыкант оба варианта считаю оскорбительными».

Профессор полагает, что этот новый инструмент будет больше защищать от исков о плагиате саму платформу, а не музыкантов: на суде компания в качестве смягчающего обстоятельства может указать на внедренный ею упреждающий подход, но если иск будет против музыканта, то окажется, что вывод проприетарного непроверенного инструмента о том, что мелодия не была украдена, — не очень весомый аргумент.

Специалисты Spotify по искусственному интеллекту — это одни из лучших ученых в области создания музыки посредством ИИ, поэтому Ховард опасается, что предоставленные авторами музыкальные данные могут помочь в создании алгоритмов, которые генерируют музыку без участия человека.

«Как Uber хочет сделать беспилотные автомобили, так и Spotify хочет создавать музыку с помощью компьютера», — говорит Ховард.

Предположение о потенциале Spotify по созданию музыки с использованием ИИ высказываются и другими — особенно в свете того, что в качестве главы исследовательской лаборатории Spotify Creator Technology Research Lab фирма наняла Франсуа Паше. При этом компания уклоняется от ответа на вопрос, является ли создание музыки одной из конечных целей.

В упомянутой патентной заявке в качестве изобретателя указан Паше, известный своими многолетними исследованиями по созданию алгоритмов, которые могут сочинять музыку, и по изучению вопроса о том, почему людям нравится конкретная музыка. В рамках своей предыдущей работы в качестве стандартного формата для «понимания» музыки компьютером он использовал как раз нотные тетради.

Так что если кто-то и может применить нотные тетради в обучении алгоритмов создания музыки, то это Паше.

Самый известный проект Паше — Flow Machines — в создании музыки в значительной степени полагался на нотные тетради и привлек внимание прессы после того, как в его рамках искусственным интеллектом впервые была создания поп-песня. Перед этим Паше с командой пять лет (с 2012 по 2017 г.) собирали базу данных, в которой в итоге оказалось более 12 000 машиночитаемых нотных тетрадей, использованных для обучения алгоритмов.

В 2016 г. Паше стал соавтором статьи, описывающей алгоритм, генерирующий новую музыку в стиле Баха — о чем я уже писал. Несколько месяцев спустя, в начале 2017 г., Паше стал одним из авторов исследования о вариантах выборки нотных тетрадей «Sampling Variations of Lead Sheets», в котором группа исследователей вышла за рамки репертуара Баха. Например, алгоритм сгенерировал список потенциальных нотных тетрадей для версии «In A Sentimental Mood» Дюка Эллингтона и Джона Колтрейна в стиле The Beatles.

Несмотря на написанное выше, пока что нет никаких доказательств того, что детектор плагиата — это на самом деле способ собрать у музыкантов данные о написании песен.

Но патент служит важным напоминанием о деталях работы любого бесплатного инструмента, предлагаемого компанией, которая занимается машинным обучением: часто предоставляемые пользователями данные могут быть более ценными, чем сам инструмент.


О переводчике

Перевод статьи выполнен в Alconost.

Alconost занимается локализацией игр, приложений и сайтов на 70 языков. Переводчики-носители языка, лингвистическое тестирование, облачная платформа с API, непрерывная локализация, менеджеры проектов 24/7, любые форматы строковых ресурсов.

Мы также делаем рекламные и обучающие видеоролики — для сайтов, продающие, имиджевые, рекламные, обучающие, тизеры, эксплейнеры, трейлеры для Google Play и App Store.

Alconost
Локализуем на 70 языков, делаем видеоролики для IT

Комментарии 1

    0
    «Кроме того, системы вроде ContentID полагаются на анализ самого звука, а не соответствующих нот.»
    но это не так, на ютюбе на раз два определяются каверы, т.е. система разбивает трек на ноты

    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

    Самое читаемое