Я понимаю, что для дзен-чистоты статистичности перевода нельзя было систему научить общеупотребительным прибауткам, но сомнительно, что в тырнете не встречаются эти слова по-отдельности…
ЭПИК ФЕИЛ в том, что перевод происходит в транслит. уже второй или третий раз сталкиваюсь с тем, что переводя слова на незнакомые мне языки я просто отсылаю «транслитерацию» своего слова в алфавите языка.
Вообще, Яндекс (в отличии от Google) незнакомые слова как раз не транслитерует:
Тут же он нашел в тексты в которых употреблялась фраза «mama myla ramu» и решил, что это и есть нормальный, употребляемый перевод. Такая фраза, очевидно, встречается гораздо чаще, чем всякие «Mother washed the frame».
Интересно, через какое время они заменят адрес страницы переводчика с «translate.yandex.ru» на «perevod.yandex.ru»?
(weather.yandex.ru продержался года два?..)
Ура! История про Карла с Кларой переведена верно!
Выводы? В Интернете не встречается в переводах одновременно слово «мыла». А вот «украл» — встречается.
Если пользоваться английским алфавитом, то лучше писать английские слова.
Я для русского алфавита лучше русские слова.
А то от сегодняшних «супермаркетов» уже тошнит :-)
И что? Посмотрите внимательнее на скриншоты в комментариях, которые я отметил, и найдите три различия во фразах для перевода. Я нашел только два, существенное из них одно — точка.
Не согласен, иной раз приходилось со строчной буквы писать (в середине предложения), чтобы это слово перевелось вообще. Может это из-за того, что он думает, что это название… Не знаю.
Господа украинцы, скажите, насколько правильно переводится РУ>УА? Не отдельные слова, а предложения.
Годится ли для автоматического перевода сайта без каких-либо правок?
лучше так, чем как у гугла, который неверный перевод и подменяет слова антонимами, меняя смысл на противоположный.
p.s. Тестил на мануале по оптимизации mysql, весьма точный перевод. но делать выводы не спешу, а то ведь и гуглоперевод превозносил, пока не понял насколько он опасен. пока промт и лингво спасает.
the grass in the yard, the wood on the grass -ru->
трава во дворе, в лесу, на траве -en->
the grass in the yard, in the forest, on the grass -ru->
трава во дворе, в лесу, на траве
…
Когда я читаю про топорный машинный перевод, то сразу вспоминается первая русская озвучка фильма «Девушка по вызову».
Актёрам озвучки заказчик передал текст, очень коряво переведённый автоматическим переводчиком и даже не отредактированный. Когда они возразили, что этот текст полный бред и нужно его перевести по-нормальному, заказчик ответил, что текст уже переведён и им нужно просто озвучить. Ну они и озвучили строго по присланному тексту.
Получилось эпично, вот фрагмент: www.youtube.com/watch?v=ISZyezxCL8Q
с перлами вроде «кубик с кубом» и диалогами вида:
— Вам нужно вентиляция, вам нужно подняться по лестнице или то, что чашка кофе.
— Не.
блин сууупер, дублеры такие молодцы, читали этот бредовый перевод с таким выражением, что можно засомневаться: «а вдруг я чего-то не понимаю». — Что вы пьете?
— Не
— Как ваш отец к вам?
— А так же линия.
— Вы уверены?
— Не
…
— Кубик с кубом, они вызывали меня во влагалище
Полную версию именно с этим переводом я не видел, только отдельные отрывки на YouTube.
Я смотрел полную версию уже с нормальным переводом. Но рекомендовать бы этот фильм я не стал. Занудная мелодрама, основанная на эмоциональных переживаниях элитной проститутки.
От словарей (slovari.yandex.ru) мы и не ожидаем вменяемого полнотекстового перевода.
А вот от переводчика (translate.yandex.ru) мы вправе этого ожидать.
Тот же переводчик Google заметно лучше с этим справляется, хоть тоже и неидеально.
Яндекс хорош, нет серьезно же хорош, двигается в нужном направлении. Пусть и пока в некоторых местах коряво, но я за него стал последнее время болеть :)
Пока автоматические переводчики не научатся алгоритмически переводить знаменитое «James while John had had had had had had had had had had had a better effect on the teacher» (Примерный перевод на русский язык: В то время как Джон использовал «had», Джеймс использовал «had had»; учитель предпочёл «had had».), я не буду им доверять! Лучше самому знать язык(и)… [см. Википедию ru.wikipedia.org/wiki/James_while_John_had_had_had_had_had_had_had_had_had_had_had_a_better_effect_on_the_teacher]
Если вы еще и прочитаете упомянутую вами же статью, то увидите, что там требуется правильно расставить знаки препинания (опрометчиво было бы требовать подобного от автоматического переводчика). Если это сделать, то и гугл, и яндекс переведут эту фразу достаточно сносно со скидкой на то, что слово «have» и его производные формы имеют огромное количество значений.
Яндекс: «Джеймс, в то время как Джон имел „имели“, имел „имел“; „имел“ имел больший эффект на учителя.»
Гугл: «Джеймс, в то время как Джон был «был», имели «пришлось», «пришлось» имели лучшее влияние на учителя.»
Зато с «Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo» все гораздо хуже.
Я помогал писать эту статью, не говоря уже о «Если вы еще и прочитаете упомянутую вами же статью» :) Разумеется, знаки препинания важны, а как же?! Так и пусть переводчик сам расставляет знаки! Уж если такие никому не известные программы, как «АвтоОпись», пытаются это делать, то Гуглу сам Бог велел! Не правда ли? Вот и пусть переводчик сам расставляет при необходимости знаки препинания, а если речь коснется «казнить нельзя помиловать» — спросит пользователя!
Ну и вот еще одна штука, которой я люблю позабавиться: возьмите слова «день», «вечер», «ночь», «утро». И повбивайте в переводчик, скажем, с французского на русский, фразы: «Tant de jours.», «Tant de soirs.», «Tant de nuits.» и «Tant de matins.». Переводится это как «Столько дней.» (или «Так много дней.»), «Так много вечеров», «Так много ночей» и… :))) «Так много утр»? «Так много утрей»? «Так много утров»? :)) Гугл, кстати, лажает с «Tant de soirs.» — вместо «Так много вечеров» лепит «Так много ночей». Ну да ладно. Но забавнее всего он переводит «Tant de matins.»
Я помогал писать эту статью, не говоря уже о «Если вы еще и прочитаете упомянутую вами же статью» :) Разумеется, знаки препинания важны, а как же?! Так и пусть переводчик сам расставляет знаки!
Сразу бы тогда и озвучили свою мысль в таком виде. На данный момент это слишком высокие требования к автоматическим системам. Для подобных вещей требуется понимать смысл написанного. Без готового искусственного интеллекта такая задача нерешаема. Да и есть ситуации, когда не каждый человек справится. А уж про построение ИИ можно долго перечислять сложности.
интересный момент. Он криво парсит текст:
хабра, хабр, хабрахабр. -> the habr, habr, habrahabr.
Но при этом, если дописать что-либо после точки, то последнее слово не переводится ([слово][точка][пробел]). img.12pings.net/yandex_habr.png
Comments 98
Only users with full accounts can post comments. Log in, please.