Машинный перевод стихов

Автор оригинала: Dmitriy Genzel
  • Перевод
image
Once upon a midnight dreary, long we pondered weak and weary,
Over many a quaint and curious volume of translation lore.
When our system does translation, lifeless prose is its creation;
Making verse with inspiration no machine has done before.
So we want to boldly go where no machine has gone before.
Quoth now Google, «Nevermore!»


Роберт Фрост (его «Неизбранная дорога» (рус|eng) считается одним из лучших англоязычных стихотворений — прим. пер.) сказал однажды: «Поэзия теряется в переводе». Переводить стихи очень сложно даже для людей, а для машинных переводчиков такая задача воспринимается как из ряда вон. Поэтому мы, движимые азартом и сложностью поставленной задачи, приступили к тестированию системы перевода стихов и оказались приятно удивлены результатами.

Так, в этом году на конференции EMNLP, мы собираемся представить доклад о переводе поэзии. В этой работе мы исследуем чисто технические проблемы с генерированием стихов с заданными размерностью стиха и фиксированной рифмой.

Значение сохранения размерности и рифмы в поэтическом переводе обсуждалась очень широко. Владимир Набоков, например, смело утверждал, что так как невозможно одновременно сохранить и форму и точное содержание переводного стихотворения, то форму в переводе можно не соблюдать. Другое не менее (а для кого-то и более авторитетное) мнение Дугласа Хофштадтера (Douglas Hofstadter), заключается в том, что сохранение формы является очень важным, поскольку передает чувство и звучание стихотворения. Именно в таком ключе мы и решили поэкспериментировать с переносом не только смысла, но и формы.

Машинный перевод таких систем, как Google Translate, как правило, выполняется путем поиска возможных переводов, руководствуясь при этом статистическими данными об употребимости словосочетаний. Для стихов такая модель оказалась неприемлемой, поэтому в своем докладе мы расскажем, какую новую систему решено было использовать. В целом, можно сказать, что мы поступились стопроцентной точностью во имя художественности перевода.

В качестве приятного побочного эффекта, можно отметить, что и прозу теперь можно переводить в поэзию, причем выбирая конечный ее жанр (хоть хокку) или позволяя системе самой выбрать подходящую форму. На данном этапе система работает очень медленно для того, чтобы обнародовать ее, однако некоторыми выдержками мы поделимся:

Строфа из Essai monographique sur les Dianthus des Pyrénées françaises, написанная Edouard Timbal-Lagrave и Eugène Bucquoy, переведена на аглицкий как пара куплетов ямба:

So here's the dear child under land,
will not reflect her beauty and
besides the Great, no alter dark,
the pure ray, fronts elected mark.


La Henriade Вольтера преобразована в дактелический тетраметр:

These words compassion forced the small to lift her head
gently and tell him to whisper: “I'm not dead."


Старинная французская поэма Le Miroir des simples âmes, написанная Marguerite Porete, была переведена на современный французский уже до нас, а мы переделали ее в хайку:

“Well, gentle soul”, said
Love, “say whatever you please,
for I want to hear.”


Больше примеров и технических моментов отражено в докладе.
Поделиться публикацией
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее
Реклама

Комментарии 26

    +6
    Вот эту софтину непросто будет русифицировать...:)
      +2
      Уже представляю себе русификатор, превосходящий по стоимости саму программу.
        0
        Что там сложного?

        1. Создать БД слов и синонимов.
        2. Научить алгоритм учитывать лексические и грамматические отличия русского от английского.
        3. Продать алгоритм гуглу.
        4. ???
        5. PROFIT!!!
          +2
          Пожалуйста, поподробнее о п.4 Видимо, здесь и кроется вся трудность :)
            0
            Смысл моего комментария заключался в том, что переводчик, который имеет опыт перевода стихов RU — EN, знаком с теоретической базой (лексика, грамматика) и способен разобраться в исходном алгоритме (сам или с помощью программиста), сможет добавить поддержку русского языка в программу. Я не знаком с исходными кодами и алгоритмом работы, но предполагаю, что для этой задачи потребуется намного меньше ресурсов, чем потребовалось для разработки оригинального алгоритма.

            Также я, не обладая актуальной информацией, сделал намек на то, что подобными исследованиями (а именно: открытыми исследованиями в области перспективных направлений развития IT и интернета вообще, проведенными группой энтузиастов) кто-то заинтересуется, и предположил, что это будет Google. Но когда я ознакомился с докладом, для меня не было неожиданным то, что разработчики уже тесно контактируют с вышеупомянутой корпорацией.

            И наконец, насчет п. 4. Если вы откроете доклад и прочтете шапку, то с удивлением обнаружите, что исследователи нашли гениальное решение — они попросту его пропустили.
              –1
              Было бы всё так просто, то величайшие умы математики и кибернетики 50-70-хх годов давно бы уже додумались до этого решения раньше, чем какой-то студент из далёкого для них 2010-го года. Ведь это на их разработках сделаны лучшие на данный момент времени переводчики.
              Машинный перевод — это очень трудная задача.
                +1
                > величайшие умы математики и кибернетики 50-70-хх годов давно бы уже додумались до этого решения раньше, чем какой-то студент из далёкого для них 2010-го года

                Увы, у великих гениев прошлого не было того, что в наши дни есть у какого-то студента — персонального компьютера.

                К тому же, основная часть алгоритма — не перевод, а подбор рифмы и размерности. Я это уже написал вот здесь:
                habrahabr.ru/blogs/htranslations/105801/#comment_3319641

                P.S. Пожалуйста, не стоит недооценивать студентов. Разум и интеллект приходят с опытом, а не с возрастом.
      +1
      Вот это да. Google Translate и так уже удивляет своими переводами (довольно неплохими для машинных), а тут еще и стихи, и в рифму, и в ритм! Скоро переводчики останутся без работы :)

      Было бы интересно Маяковского на английский перевести, с сохранением смысла, ритма. Не думаю что это будет легкой задачей, даже для такой программы.
        0
        У Google Translate очень плохой уровень машинного перевода. Он выезжает только за счет того что люди предлагают свой перевод который потом используется.
        +2
        а интересно по стилю можно автора определять?

        I am happy, I have kissed a woman,
        I have slept in grass and flower-bed,
        And I never, like a decent human,
        Hit a dog or kitten in the head.
          0
          Не думаю, что это так просто. Ведь даже у Пушкина есть «Подражания», а поэты часто экспериментируют с формой и словами, смешивая стили. Разве что Шекспира в его староанглийском оригинале легко будет определить по употребляющимся словам…
            0
            Хм. Редко на Хабре бывает, что комментарий едва ли не лучше исходного поста.
            +5
            Once upon a midnight dreary, long we pondered weak and weary,
            Over many a quaint and curious volume of translation lore.
            When our system does translation, lifeless prose is its creation;
            Making verse with inspiration no machine has done before.
            So we want to boldly go where no machine has gone before.


            Отличная вариация на тему Эдгара По. Just translation, nothing more :)
              +2
              Слышал такую поговорку от переводчиков — «Перевод — как женщина. Если красивая — то неверная, если верная, то — некрасивая»
                +1
                А можно поинтересоваться, почему в статье перевод в основном с английского на английский?
                  0
                  Может быть, вы имели в виду «с французского»?
                    0
                    Нет, именно с английского. Есть примеры трансформации английского текста в поэтическую форму (на английском), и перевод системой Оскара Уайльда (опять-таки на английском). Мне гораздо интереснее было бы увидеть примеры перевода на русский — будет более понятен принцип работы алгоритма.
                      +1
                      Насколько я понимаю принцип работы подобных алгоритмов, программа сначала переводит текст с языка источника на требуемый язык, а затем, с помощью списка синонимов и правил подстановки, рифмует полученный текст.
                      Отсюда следует, что:

                      1. С помощью этого алгоритма возможен перевод с исходного языка на исходный (да, именно перевод).
                      2. Имея алгоритм работы, можно с незначительными (в зависимости от выбранного языка; например, адаптация для русского займёт меньше времени, чем для китайского, поскольку русский и английский языки во многом схожи) изменениями адаптировать программу для работы с любым языком.
                      3. Разработчики при разработке подобной системы в условиях недостатка ресурсов реализуют лишь основной алгоритм и поддержку двух, возможно трех языков (родных языков разработчиков и английского).

                      З.Ы. Когда прочел статью, сразу пришла в голову мысль, что прототип алгоритма был чрезвычайно прост: брутфорсер текста через Google Translate плюс проверка размерности и рифмы.
                        0
                        Спасибо за развернутый ответ, стало немного понятнее.
                      0
                      Небольшое уточнение — я говорю про доклад, который доступен по ссылке в формате pdf.
                        0
                        Прошу прощения, я не был с ним знаком.
                    0
                    Конференция ЕМНЛП :)

                    По теме — думаю, получится достаточно неплохо, потому что стихи зачастую и на родном-то языке звучат так, что понимай как хочешь, а значит и на другом языке, если сохранить смысл, останется то же настроение. Правда, такой программе будет абсолютно бессысленно давать на перевод, например, Спайка Миллигана или других авторов, у которых в стихах присутствует игра слов. Тут машина будет абсолютно бессильна.
                      +5
                      Down the river drifts an axe,
                      From the town of Byron
                      Let it float by itself
                      F**king piece of iron

                      PS: Молодцы ребята, очень интересно было бы попробовать систему в деле.
                        0
                        Down the river drifts a brick,
                        Wooden like a piece of glass.
                        Let it float by itself,
                        We don't need a styrofoam.
                        +3
                        Только мне захотелось натравить эту систему на «Бармаглота» Л. Кэррола?
                          0
                          А был ли мальчик?

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое