В Театре на Таганке появится ИИ с голосом Владимира Высоцкого



    Московский театр на Таганке анонсировал проект, в котором при помощи искусственного интеллекта воссоздан голос Владимира Высоцкого. По информации ТАСС, воссозданный голос посетители театра могли услышать уже на этой неделе в рамках творческой лаборатории «Метаморфозы Таганки», однако полноценный запуск проекта состоится летом.

    «Мы планируем презентовать помещение, куда любой человек смог бы прийти и пообщаться с Высоцким. Мы планируем это сделать к 25 июля, когда будет 40 лет со дня смерти Высоцкого», — рассказала директор театра Ирина Апексимова.

    Воссозданием голоса Владимира Высоцкого занимался проект Vera Voice, разработанный компанией режиссера Тимура Бекмамбетова Screenlife Technologies совместно с командой «Робот Вера».

    Как ранее сообщало издание РБК, проект создан для того, чтобы воспроизводить голоса знаменитостей. В его основе лежит нейросеть, которая обучается копировать речь, «слушая» записи оригинала. Разработчики планируют использовать Vera Voice для озвучивания аудиокниг, фильмов, игр, а также в других сферах. Чтобы получать голоса знаменитостей на законных основаниях, проект будет заключать с артистами соответствующие договоры. На сегодня у Vera Voice уже есть соглашение на использование голоса Руслана Габидуллина из студии «Кубик в кубе» ИИ будет записывать его голосом аудиопоздравления, рекламу и озвучивать аудиокниги.

    Подобные проекты в России уже создавались. Например, в 2013 году компания АБК, учреждённая Сбербанком, представила ролик с воспроизведённым голосом актёра Иннокентия Смоктуновского. Ролик длится около 20 секунд, на нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом». Затем Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. На форуме заместитель председателя правления банка Станислав Кузнецов отметил, что подобные проекты могут использовать злоумышленники. После этого Кузнецов включил на форуме запись, на которой вымышленный губернатор попросил голосом актера Иннокентия Смоктуновского 5 млрд руб. на постройку моста.

    Технологию синтезирования человеческой речи в 2016 году представил стартап DeepMind. Его нейросеть под названием WaveNet способна имитировать «любой человеческий голос», утверждается на сайте проекта.

    Летом текущего года разработчики компании Facebook Шон Васкес и Майк Льюис также представили алгоритм, который генерирует человеческую речь. Алгоритм под названием MelNet воссоздал голос Билла Гейтса и ещё нескольких знаменитостей, включая Стивена Хокинга, профессора Дафни Коллер, актера Джорджа Такеи и других. Голосом Гейтса машина произносит несколько кажущихся бессмысленными фраз, например, «Свечение усилилось в глазах милой девушки». Фразы составлены из сборника «Гарвардские предложения», к которому инженеры часто обращаются для тестирования систем связи или голосовых программ, указывалось в статье MIT News, посвящённой проекту.

    В июне стартап AI Dessa представил аудиоклип, на котором искусственный интеллект «говорит» голосом известного радиоведущего Джо Рогана. В сентябре Amazon сообщил, что вскоре голосовой помощник Alexa сможет разговаривать голосами знаменитостей. Первым, с кем Amazon подписал соответствующий контракт, стал актер Сэмуэль Л. Джексон. Всего же, как пишет РБК, по оценке консалтинговой компании Markets&Markets к 2023 году рынок клонирования голоса достигнет $1,73 млрд.
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 12

      +2

      Не приумаляя достижения в области синтеза речи, задача озвучки произвольного текста на базе парсинга голоса решалась без особых проблем еще лет 15 назад.
      Да, в те тёмные времена приходилось нарезать звуки вручную, выделять сочетания букв, начало/конец фразы, пунктуацию и прочее.
      Но собиралось воедино оно уже тогда без особых проблем при чтении строчек.
      Сейчас, очевидно, это гораздо более автоматизировано, нейросеть сама разобьёт на фонемы, склеит правильно и т.п.
      Да, риалтайм, все дела, в начале 2000х на обычном "пне" такие задачи сложновато шли.

        0

        Иде, хоть и давняя, но интересная и перспективная
        Но было бы очень интересно, если бы ИИ ещё проанализировал все высказывания человека и мог формулировать позицию человека, пускай и умершего, по различным вопросам…
        А протестировать можно было бы и на живых.

        +2
        Такими темпами нам придётся обучать нейросеть, чтобы получить штампованный «роботообразный» голос, который сейчас вдруг стал архаичным во всём медия, кроме редких фильмов типа «Она» и «Интерстеллар».
          0
          планируем презентовать помещение, куда любой человек смог бы прийти и пообщаться с Высоцким
          А тема для общения тоже любая?) Если так, то мнение ИИ ВС Высоцкого о психическом здоровье его тёзки по фамилии Путин я бы послушал
            +1
            От имитации голоса до имитации мнения огромная пропасть, вам не кажется? :)
            +1
            В плане развития технологий вроде все отлично, а вот использование голоса мертвого человека в таком амплуа… как-то передергивает меня, представил — приношу цветы к памятнику, а он — спасибо, в общем не укладывается в голове эта идея
            Да и неуважительно как-то…
              0

              А озвучка всяких новых серий "Ну, Погоди!" и других "Постоквашино" — это уважительно к уже умершим?

                0
                Теперь уже и не знаю )))
                Но одно дело когда просто озвучка, а другое когда имитация живого — предполагается ведь что отвечать будет
                  +2
                  Меня, например, покоробил не факт имитации, а то, что голосом Высоцкого эти люди синтезировали похвалы самим себе.
              –1
              Думаю, нужно дать людям этот инструментарий, чтобы люди могли творить. Примерно так, как сейчас японцы делают новые песни при помощи вокалоидов.
              Только тут сам мог бы сделать вокалоида, скормив ему побольше фраз того или иного человека для обучения нейросети.
              Понятно, что если голос человека в подборке фраз в основном говорит, а не поёт — нейросеть будет хорошо им говорить, а не петь, и наоборот.
              • НЛО прилетело и опубликовало эту надпись здесь
                • НЛО прилетело и опубликовало эту надпись здесь

                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                  Самое читаемое