1. Создать БД слов и синонимов.
2. Научить алгоритм учитывать лексические и грамматические отличия русского от английского.
3. Продать алгоритм гуглу.
4. ???
5. PROFIT!!!
Смысл моего комментария заключался в том, что переводчик, который имеет опыт перевода стихов RU — EN, знаком с теоретической базой (лексика, грамматика) и способен разобраться в исходном алгоритме (сам или с помощью программиста), сможет добавить поддержку русского языка в программу. Я не знаком с исходными кодами и алгоритмом работы, но предполагаю, что для этой задачи потребуется намного меньше ресурсов, чем потребовалось для разработки оригинального алгоритма.
Также я, не обладая актуальной информацией, сделал намек на то, что подобными исследованиями (а именно: открытыми исследованиями в области перспективных направлений развития IT и интернета вообще, проведенными группой энтузиастов) кто-то заинтересуется, и предположил, что это будет Google. Но когда я ознакомился с докладом, для меня не было неожиданным то, что разработчики уже тесно контактируют с вышеупомянутой корпорацией.
И наконец, насчет п. 4. Если вы откроете доклад и прочтете шапку, то с удивлением обнаружите, что исследователи нашли гениальное решение — они попросту его пропустили.
Было бы всё так просто, то величайшие умы математики и кибернетики 50-70-хх годов давно бы уже додумались до этого решения раньше, чем какой-то студент из далёкого для них 2010-го года. Ведь это на их разработках сделаны лучшие на данный момент времени переводчики.
Машинный перевод — это очень трудная задача.
> величайшие умы математики и кибернетики 50-70-хх годов давно бы уже додумались до этого решения раньше, чем какой-то студент из далёкого для них 2010-го года
Увы, у великих гениев прошлого не было того, что в наши дни есть у какого-то студента — персонального компьютера.
Вот это да. Google Translate и так уже удивляет своими переводами (довольно неплохими для машинных), а тут еще и стихи, и в рифму, и в ритм! Скоро переводчики останутся без работы :)
Было бы интересно Маяковского на английский перевести, с сохранением смысла, ритма. Не думаю что это будет легкой задачей, даже для такой программы.
У Google Translate очень плохой уровень машинного перевода. Он выезжает только за счет того что люди предлагают свой перевод который потом используется.
Не думаю, что это так просто. Ведь даже у Пушкина есть «Подражания», а поэты часто экспериментируют с формой и словами, смешивая стили. Разве что Шекспира в его староанглийском оригинале легко будет определить по употребляющимся словам…
Once upon a midnight dreary, long we pondered weak and weary,
Over many a quaint and curious volume of translation lore.
When our system does translation, lifeless prose is its creation;
Making verse with inspiration no machine has done before.
So we want to boldly go where no machine has gone before.
Отличная вариация на тему Эдгара По. Just translation, nothing more :)
Нет, именно с английского. Есть примеры трансформации английского текста в поэтическую форму (на английском), и перевод системой Оскара Уайльда (опять-таки на английском). Мне гораздо интереснее было бы увидеть примеры перевода на русский — будет более понятен принцип работы алгоритма.
Насколько я понимаю принцип работы подобных алгоритмов, программа сначала переводит текст с языка источника на требуемый язык, а затем, с помощью списка синонимов и правил подстановки, рифмует полученный текст.
Отсюда следует, что:
1. С помощью этого алгоритма возможен перевод с исходного языка на исходный (да, именно перевод).
2. Имея алгоритм работы, можно с незначительными (в зависимости от выбранного языка; например, адаптация для русского займёт меньше времени, чем для китайского, поскольку русский и английский языки во многом схожи) изменениями адаптировать программу для работы с любым языком.
3. Разработчики при разработке подобной системы в условиях недостатка ресурсов реализуют лишь основной алгоритм и поддержку двух, возможно трех языков (родных языков разработчиков и английского).
З.Ы. Когда прочел статью, сразу пришла в голову мысль, что прототип алгоритма был чрезвычайно прост: брутфорсер текста через Google Translate плюс проверка размерности и рифмы.
По теме — думаю, получится достаточно неплохо, потому что стихи зачастую и на родном-то языке звучат так, что понимай как хочешь, а значит и на другом языке, если сохранить смысл, останется то же настроение. Правда, такой программе будет абсолютно бессысленно давать на перевод, например, Спайка Миллигана или других авторов, у которых в стихах присутствует игра слов. Тут машина будет абсолютно бессильна.
Машинный перевод стихов