Microsoft показывает почти мгновенный перевод с английского языка на китайский


    На фото: Спок с универсальным переводчиком, сериал Star Trek

    Реальная демонстрация возможности голосового перевода с одного языка на другой просто во время разговора с задержкой всего около секунды была показана шефом исследовательского подразделения Microsoft Reasearch Риком Решидом (Rick Rashid) на мероприятии компании Microsoft Research Asia’s 21st Century Computing в Китае.

    На довольно длинном видео (см. с 7:12) Решид рассуждает о возможностях автоматического перевода на различных языках: при этом видно, что его английские слова идеально распознаются и приводятся на одном из экранов и, наконец, когда спикер произносит фразу "I'm speaking in English and hopefully you''ll hear me speaking Chinese in my own voice" после некоторой задержки ясно слышно синтезированную китайскую речь. При этом, очевидно, аплодисменты в зале относятся к корректности перевода.



    Системы мгновенного синхронного перевода предпринимаются многими компаниями, в том числе и Google и Apple, тем не менее в данном случае упор делается именно на универсальность системы и качественный перевод.Технологической основой подобного перевода является система, основанная на использовании обучающейся нейронной сети. При этом Решид честно говорит, что эффективность и точность системы еще далека от совершенства, хотя улучшение уровня распознавания слов выросло на 30% с прошлых её версий. Если ранее на 4-5 верно распознанных слов приходилась одна ошибка, то теперь этот показатель вырос до 7-8 слов.

    [Источник]
    Поделиться публикацией

    Похожие публикации

    Комментарии 32
      +2
      Леонид Володарский владел этой технологией еще в конце конце 1970-х ))
      Особенность работы Володарского в том, что фильмы он переводил синхронно и с первого раза. Это заметно по сильно обобщённому лексикону: многие слова, для перевода которых требуется подготовка переводчика и знание темы разговора, переводятся либо самым общим из всех возможных смыслов, либо, при отсутствии такового, смысл изобретается на ходу.


      По поводу
      когда спикер произносит фразу «I'm speaking in English and hopefully you''ll hear me in my own voice» после некоторой задержки ясно слышно синтезированную китайскую речь.

      Тут можно произвольный текст включать даже без секундной задержки, никто ничего не поймет )
        +12
        на мероприятии компании Microsoft Research Asia’s 21st Century Computing в Китае
          –2
          Пропустил этот момент.
        +1
        Шикарно просто. Вполне возможно, что задержку с ростом вычислительной мощности можно будет исключить совсем, тогда можно будет по телефону или типа того общаться с носителями любого языка. :)
          +3
          Предвижу ещё более фейерические истории на сайтах вроде damnyouautocorrect.com
            +8
            Совсем исключить будет нельзя. Для качественного перевода переводить нужно предложение целиком (разумеется, с учётом ранее сказанного), а для этого его надо сперва выслушать и распознать.
              0
              тут речь о синхронном переводе. перевод дается как можно скорее, в идеале полностью синхроно с говорящим, без ожидания конца фразы. качество ниже правда. но переводчик должен разбиратся в тематике, вычленять основную информацию. боюсь вне общих фраз этот софт покажет плачевные результаты, особенно если будет использоватся профессиональный сленг.
                0
                Да чего там профессиональный сленг. Пусть сперва попробует хотя бы перевести абонента, у которого при общении по-русски через слово идёт нецензурщина в качестве междометия.
                  0
                  Суть этих слов в том, что удалив их, в большинстве случаев, смысл не изменится.
                    0
                    Это всё понятно. А вот понял бы машинный переводчик этот момент. А то ведь можно и нарваться и не на междометие, причём с самым широким смыслом.
                0
                Мгновенный перевод в конце предложения — это для меня без задержки :)
              +1
              А вот в обратную сторону? Интересно насколько успешно решается проблема разбора языков, где важна интонация. В том же китайском 4 тона да 2 типа интонации, и это еще не самый сложный вариант для азиатских языков.
              Вот, для примера ru.wikipedia.org/wiki/%D0%A8%D0%B8_%D0%A8%D0%B8_%D1%88%D0%B8_%D1%88%D0%B8_%D1%88%D0%B8
                +1
                Китайский, как и все языки, идёт в сторону упрощения. Из статьи же:

                Текст, записанный на классическом китайском, понятен большинству образованных читателей, но скорее в иероглифическом варианте, а не на слух. Более чем 2500-летняя история изменений произношения привела к большой степени омофонии в классическом китайском, в результате чего при произнесении вслух на пекинском диалекте или при записи в фонетической системе он становится абсолютно непонятным.

                То есть этот текст и сами современные китайцы на слух не разберут.
                  +1
                  Послушать как это звучит поможет Google Translate.
                  0
                  Интересно как они этого добились если для перевода между языками зачастую надо целиком разворачивать предложение.
                    +1
                    Вы видео смотрели? Там же прекрасно видно, что переводится текст не после каждого сказанного слова, а после всего предложения (или логического блога, что тоже вполне уместно). Обратите внимание с какой частотой появляются английские субтитры и китайские.
                      +2
                      логического блока*
                    +17
                    В статье упущен один важный ключевой момент технологии: перевод озвучивается голосом говорящего, то есть китайцы слышат не электронный синтезатор, а то, как собеседник сказал бы фразу на китайском своим голосом.
                      –2
                      По приведенной цитате, думаю, это было и так понятно.
                      +10
                      Был случай. В немецком отрицание находится в конце предложения. Переводчик бодро перечисляет всё, что говорит немец, в конце немец вставляет отрицание, переводчику пришлось выкручиваться заворотом типа «могли бы подумать вы».
                        +9
                        В немецком языке есть загадочная частичка отрицания «нихт». Говорится она почему-то в конце предложения и отрицает все сказанное… Происходит тут как-то беседа между 2 партнерами (русский-немец) через переводчика. Немец говорит долгое предложение, переводчик сразу в реальном времени переводит: «Мы согласны на ваши условия, будем сотрудничать постоянно, скидки, льготы, блаблабла...». И тут немец заканчивает предложение вышеупомянутой частичкой «нихт». Переводчик не растерявшись: "… Думаете вы… но..."
                          +2
                          Ага, оно
                        0
                        А не могли бы они эту технологию для начала представить в текстовом варианте работы? А то пока что не известен природе хоть один вменяемый текстовый переводчик. Что уж там о голосе говорить?
                          +1
                          «I'm speaking in English and hopefully you''ll hear me speaking Chinese in my own voice» — у автора топика пропущено было, и это сильно влияет на смысл — перевод на китайский звучит его же голосом — они подкрутили систему синтеза речи так, чтобы голос был похож на голос Рика.
                            +1
                            На фото Спок с трикодером.
                              +1
                              Действительно, это трикодер, а не универсальный переводчик. Кстати, насколько я помню, в оригинальном Star Trek универсальный переводчик толком и не упоминался, его придумали только в The Next Generation чтобы как-то оправдать, почему это вся галактика говорит на английском. Кажется, у землян универсальный переводчик был встроен в коммуникатор (или вообще не уточнялось, где он находится), а ференги например носили его встроенным прямо в ухо.

                              Вообще в сериале была еще пара забавных оправданий, например, почему все расы более-менее похожи между собой и почему в оригинальном Star Trek клингоны почти не отличаются от людей, а в более поздних сезонах это не так.
                              +1
                              Я не в состоянии держать в себе вопрос:
                              Что если два таких автопереводчика поставить рядом друг с другом, один выключить, произнести фразу на 0.5 секунды, после чего включить выключенный?
                              • НЛО прилетело и опубликовало эту надпись здесь
                                +1
                                Честно говоря, плохо и мало учил китайский и не могу провести экспертизу перевода, кроме как по последнему «Xie xie».
                                Но, невероятно круто, что для презентации выбран именно китайский: перевод с английского на языки латинской или романо-германской группы — не великая задача для современных систем перевода. В общих чертах они имеют схожие правила грамматики, часто, схожую фонетику и синтаксис. Хотя, конечно, в каждом языке есть своя специфика.
                                Особняком стоят языки арабского региона, бывшего СССР и Восточной Азии.
                                В частности, китайский, как было замечено выше, язык тоновый, но китайцы давно понимают друг друга исходя из контекста, ведь, невозможно в современном мире общаться с требуемой скоростью ещё и интонируя. Однако, есть особенности, которые нельзя обойти. Например, счётные слова: нельзя перевести просто «пять членов семьи», должно быть «пять (ртов) членов семьи» или же не «восемь собак», а «восемь (полос) собак» и так далее. Или, опять же, порядок слов. Вопросительное предложение на английском языке остаётся вопросительным если убрать восклицательный знак (напр. «Is there anybody here(?)»), в китайском же, насколько я помню, вопросительное предложение аналогично утвердительному, но с добавлением специального слова «ma» (напр., «Youren ma» против утвердительного «Youren you»).
                                Не говоря уже о дикой разнице южного и северного диалектов.
                                К чему это я: чтобы правильно понять какой «йоужень» имеется ввиду, необходимо обрабатывать весь контекст. Для этого просто сложного алгоритма недостаточно. Это действительно должна быть серьёзная нейросеть, и огромные ресурсы.
                                На мой взляд, эта демонстрация — гигантский прорыв, если не боясь можно выйти на сцену и нагрузить модуль распознаванием речи, переводом на китайский и синтезом переведённого материала, оговорившись, что существуют небольшие погрешности, то уже сейчас можно вольно применять систему для общения «английский-испанский-английский» уже в полях, я полагаю.
                                  0
                                  Ну. На самом-то деле, сгенерировать фразу, зная правила генерации не так уж и сложно, если известен смысл сказанного. Проблема именно в «понимании» смысла, а не собственно в поиске эквивалентного выражения. Хотя, Google под «смыслом» фразы понимает именно набор эквивалентных переводов. То есть, imho (я не великий специалист, конечно), тут проблема именно в распознавании сказанного.

                                  Нейронные сети — это уже отжившая свой век технология. Очень не верится, что MS использовала именно нейронную сеть в этом деле. Ну существуют же более эффективные статистические методы. Те же графовые марковские и байесовские методы. Которые по сути тоже могут быть большой сетью переменных, но позволяют производить более могучий анализ, и прямой, и обратный.
                                    0
                                    На видео www.youtube.com/watch?feature=player_embedded&v=vGYKxrRWDKo#t=226s говорят о технологии deep neural network, некие глубокие нейронные сети в сравнение с if you use that to take it much more data than previosly been able to used with the hidden markov models. Обещают что данная технология позволяет использовать большее кол-во данных чем СММ.
                                    Найти что-нибудь про зверя не удалось.
                                  0
                                  Ух ты, мой коммент практически притворили в жизнь, шустро работают.
                                  habrahabr.ru/post/152179/#comment_5171389

                                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                  Самое читаемое