Русский голос TED



    Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык. Вдвойне приятно, когда делают качественную озвучку. Но если в этом замешаны высокие технологии — тогда вообще замечательно.

    Недавно Центр речевых технологий — компания, одна из немногих имеющая собственные системы синтеза и распознавания речи, — начала озвучивание на русский язык материалов конференции TED, используя технологию синтеза русской речи. Озвученные роботом материалы размещаются в блоге «Фабрика речи» (VoiceFabric).

    Синтезированная звуковая дорожка создается по субтитрам (.srt) в автоматическом режиме и также автоматически подклеивается к оригинальному ролику. Комфортное ощущение от просмотра, редко встречающееся при прослушивании синтезированных голосов, в данном случае достигается за счет совмещения оригинального звучания и накладываемого роботоголоса. Таким образом, эмоциональное интонирование — то в чем так слабы любые роботы — в приведенных примерах не режет слух.
    Ролики выкладываются на Яндекс.Видео.
    PS. Возможно вам будут интересны и предыдущие опыты:
    Стив Джобс и презентация iPad2
    Леди Гага в Google (интервью)
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 64

      +2
      Таки надо оригинальную звуковую дорожу делать тише, а то треш какой-то получился.
        0
        Заменил ролик на более правильный по звуку. Остальные ролики здесь.
          0
          О, теперь хорошо.
        +9
        очень недурно!
          +2
          Мне очень понравилось слушать эти переводы и они очень хорошо отражают научный подход TED. Очень иронично показалось слушать историю о человеке потерявшем голос таким переводом. Теперь на работе удобно слушать TED, я хотел бы, чтобы вся переведенная на русский база TED была озвучена подобным образом.
            +16
            Вы специально строите свои предложения, чтобы они были похожи на машинный перевод?
              +2
              Переводы берутся из субтитров, созданных усилиями сообщества TED.
              Все процессы представленного проекта предельно автоматизированы.
                0
                Я так понимаю все равно какой то тюнинг проводится. Потому что в демо на сайте vitalvoice.ru/demo/ далеко не так хорошо с интонациями и знаками препинания.
                  0
                  Новая версия движка на совершенно иных принципах. На демо еще не обновили.
                +2
                Ага, писал сразу после просмотра видео, втянулся видимо. Сейчас перечитал и правда похоже на машинный перевод. Иронично, что мне это заметил человек с Вашим никнеймом. =)
              +2
              Это синтезируемая речь? Я не верю!
                0
                Да, неплохо, но прослушиваются «провалы» в голосе подобно таким как в festival.
                  0
                  Или мне кажется, или иногда голос прямо посередине слов как будто реверберирует.
                  0
                  А я не верю, что можно принять ее за настоящую. Да, очень круто, иногда даже похоже. Но давайте без пафоса.
                  +2
                  Хорошая реклама от Dodge на эту тему ) www.youtube.com/watch?v=Qw7_UTk0d6Y
                    +1
                    А технология может работать real time? Я уже представил как это толкнет IT стран СНГ вперед...:)
                      +3
                      Может.
                      +1
                      Это просто невероятно.
                      А субтитры делаются вручную или генерируются системой распознавания голоса?
                        0
                        Вручную, конечно.
                        +3
                        Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык. Вдвойне приятно, когда делают качественную озвучку.

                        А втройне приятно смотреть материал в оригинале.
                          +1
                          ну да, очень неплохо изучить два-три десятка языков. ну и умереть потом спокойно, ощущая себя интеллектуалом
                            0
                            Вы о чем? Все видеоматериалы TED — на английском.
                              +2
                              А все серии рабыни Изауры — на португальском.
                              0
                              Зная два-три десятка языков, человек уже не просто знает два-три десятка языков. Странно это объяснять [вроде бы] образованному человеку.
                            +1
                            Хорошо, даже очень Хорошо.
                              +13
                              Насчет голоса скажу вам, что после американских фильмов 90-ых годов, нас жителей постсоветского пространства не испугаешь приятным голосом и дикцией робота))
                                +1
                                VoiceFabric — это скорее материя речи, чем фабрика речи.
                                  0
                                  Но на логотипе буквы I оформлены в виде труб, из которых валит дым (в форме «комиксного облачка»), что тоже намекает на «фабрику».
                                  +1
                                  Робоголос действительно хорош, как и идея русской озвучки TED.
                                  Единственное, что «резануло» по глазам — название («Фабрика речи» VoiceFabric), fabric в английском языке — это ткань, материал, а никак не фабрика.
                                    0
                                    На уровне, иногда бывают огрехи, но очень приятно что теперь я могу послушать выступления известных специалистов по космологии и квантовой физике. Жду продолжения.
                                      +6
                                      Каждый четверг — 10 новых роликов.
                                        +1
                                        Теперь буду ждать как сериал :)
                                          0
                                          А чем обусловлено такое ограничение? Просто очень интересно. Ресурсоемкость технологии, лицензионные ограничения, необходимость ручной доводки материала или желание растянуть интерес зрителя сериальной моделью?
                                            +1
                                            сериальная модель, отчасти :)
                                            С другой стороны — залить 10 роликов на vimeo + их оформить (ввести описание, поставить ссылки) + оформить на сайте, продумать, где оставить, чтобы заметили :) вообщем ресурсоемко.
                                            сам процесс озвучки занимает где-то на 1 час видео — 5 минут работы движка.
                                        +1
                                        Очень интересно — интонация в голосе выбирается автоматически основываясь только на пунктуации или каким-то образом используется оригинальная звуковая дорожка? Может быть вообще ее правил редактор?
                                        0
                                        Здорово! осталось только «булькание» убрать и будет не отличить
                                          0
                                          насколько я понял, бульканье появляется, когда робот торопится. когда медленно говорит — вообще незаметно, что это не человеческий диктор.

                                          всплывает проблема английского языка с его словами, более короткими, чем наши. думаю, в случае с немецким будет проще.
                                          0
                                          Клево, но как убрать английскую дорожку?
                                            +3
                                            С оригинальной дорожкой двойственная история. С одной стороны — она конечно мешает. С другой — помогает, так как из нее слушателем подсознательно берется оригинальное интонирование и эмоциональная окраска. А как известно, роботы хуже всего справляются с эмоциями.
                                              +1
                                              Согласен, но может быть, ее сильнее приглушить? Приходится вслушиваться в русский текст.
                                              Показалось, что русская речь немного отстает от английской, из-за этого интонации и акценты смещаются. Вы не подгоняли перевод так, чтобы он примерно попадал в английский темп?
                                                +1
                                                Это самая интересная с точки зрения реализации задача.
                                                Проблема ведь в том, что английская речь и русская разная по длительности звучания отдельных предложений. Английская короче. Поэтому синтез должен успеть произнести русское предложение и еще успеть его «привязать» (по смыслу и месту) к оригинальному звучанию. Профессиональный перевод (человеческий) справляется с этой задачей тем, что просто не все что говорится озвучивается. Плюс к этому человек-дублер работает на различных темпах. У синтеза тоже есть разные темпы, но звучит это неприятно для уха, когда одна фраза спокойная по темпу, а другая — с места в карьер.
                                                  0
                                                  И есть еще небольшая хитрость. Начало каждой фразы роботосинтеза смещено по отношению к оригиналу во всех роликах на 1,5 сек. Для достижения «эффекта Володарского», так сказать :)
                                              0
                                              Кстати, то ли технология другая то ли синтезированный голос «подтюнили», но на сайте продукт «RSS-радио» синтезирует голос на порядок «роботизированней» speechpro.ru/techno/synthesis -> rssradio.ru/
                                                0
                                                Новая версия движка на совершенно иных принципах. На демо еще не обновили.
                                                +2
                                                Google уже хочет вас купить =)
                                                  +1
                                                  2:55 «Понимаете ли вы что все они [аварии] стали следствием человеческой ошибки, а не ошибки машины… И могут быть предотвращены с помощью той же машины.»

                                                  Когда ситнезированный голос, говорит про ошибки человека и предлагает заменить человека на машину — это как-то очень напоминает GladOS из Portal :)

                                                  ps: Проект отличный! Будущее здесь.
                                                    0
                                                    Спасибо. Очень интересно, как IT специалисту. Немного неинтересно, как человеку, изучающему английский язык с помощью TED.
                                                      +2
                                                      Неужели мы дожили до этого момента?
                                                      Просто суперовая технология!
                                                      Будущее здесь!
                                                        –6
                                                        > Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык.

                                                        Почему приятно? Вы не знаете английский язык? Вы, пишуший на Хабрахабре. Сайте об IT. Ужас…
                                                          +2
                                                          Поверьте, не все знают английский настолько хорошо, чтобы нормально понимать разговорную речь
                                                            0
                                                            Я верю. Поэтому надо не переводить и тормозить процесс обучения, а изучать долбанный английский язык!
                                                          0
                                                          Интонирование речи приятно удивило. Как это достигается? Расставить правильные интонации — это очень сложная задача.

                                                          С синтезом, конечно, косяки вылазят. Форманты плохо стыкуются. Не пойму, в чем проблема добиться гладкой стыковки?
                                                            0
                                                            Птица Говорун)
                                                              +2
                                                              Очень впечатляет
                                                                0
                                                                я понял, что это не человек, только когда он начал заикаться в середине.

                                                                и голос очень приятный, бархатистый. надеюсь, диктор, отдавший его бездушной машине, не будет распят какой-нибудь актёрской гильдией ;)
                                                                  0
                                                                  Очень впечатляет! А скоро у простых юзеров появится возможность использовать Вашу технологию?
                                                                    +1
                                                                    У меня на базе ЦРТ работает автоматическое радио — bot.fm
                                                                    Просто выделяешь любой текст, выбираешь голос, жмешь внопку — оно озвучивается и вставляется тебе в боткаст.
                                                                      0
                                                                      Ссылку не открыть.
                                                                        0
                                                                        Сайт стоит на locum.ru к сожалению. Они нестабильны и медленны.
                                                                        Сейчас вот заработало.
                                                                      0
                                                                      Шикарно! Не знал что есть что-то подобное. Интересно насколько сложно заставить робота интонировать основываясь на оригинальной дорожке…
                                                                        0
                                                                        Что такое «оригинальня дорожка»?
                                                                          0
                                                                          английская речь
                                                                      • НЛО прилетело и опубликовало эту надпись здесь

                                                                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                        Самое читаемое