Как стать автором
Обновить

Как Яндекс применил технологии искусственного интеллекта для перевода веб-страниц

Время на прочтение8 мин
Количество просмотров21K
Всего голосов 59: ↑59 и ↓0+59
Комментарии31

Комментарии 31

Очень хорошее качество перевода, иногда даже лучше переводных хабра-статей, спасибо Яндексу
Пожалуй, это самое толковое нововведение Яндекса за последние годы.
Вот еще кто-то скрестит новый Я-Переводчик и все те источники, откуда «редакторы» Хабра свою нетлетку тянут — и получим сайт, где то же будет появляться, но на три дня раньше, чем на Хабре. Ой!
Чтобы самим не копаться в горах нетленок, я доверяю редакторам Хабра в их выборе самых интересных и свежих статей.

Так иногда у них такое выходит из-под пера, что… Ну, нетленку-то пишут первоисточники, а что редакторы создают — это не нетленку-то, а мумифицированные останки!

Такой перевод работает только в Яндекс Браузер?
поддерживаю вопрос. я попробовал поискать в расширения хрома — но нашел только 3 авторских плагина. не знаю какие технологии они используют и доступен ли «новый» переводчик для всех (чтобы использовать его в ПО), поэтому не рискнул ставить.
Обращение к авторам: мы можем использовать отечественный переводчик в хроме? :)
А можно увидеть сравнение по BLEU с лучшими из доступных конкурентов?
Переводы текстов из Википедии автоматизированным системам даются довольно легко ввиду очевидных причин — стремление делать текст простым и понятным рядовому пользователю. А вот попробуем орешек по-сложнее —
сайт Формулы1
Перевод:
Стратегия шарить на Гран-При Австрии оставил их звезда водитель шарить, прежде чем оба автомобиля Mercedes DNF'D впервые с Испании 2016. Но это анализ и обучение, а не взаимные обвинения, что команда теперь должна все исправить, говорит директор команды Mercedes Тото Вульф.
Мерседес, в команде, чтобы победить в Формуле-1 После 2014 гибридной эры, были виновны три Льюиса Хэмилтона, связанных с безопасностью или виртуальной машины безопасности ошибок в этом сезоне, не сумев столкнуть его для новых шин в Австралии, Китае и теперь в Австрии во время этих гонок были нейтрализованы.

Оригинал:
A strategy fumble at the Austrian Grand Prix left their star driver fuming, before both Mercedes cars DNF’d for the first time since Spain 2016. But it’s analysis and learning, not recriminations, that the team now need to put things right, says Mercedes Team Principal Toto Wolff.
Mercedes, the team to beat in Formula 1’s post-2014 hybrid era, have now been guilty of three Lewis Hamilton-related Safety or Virtual Safety Car errors this season, having failed to pit him for new tyres in Australia, China and now Austria while those races were being neutralised.
Так что учиться, учиться и ещё раз учиться (с).
А чем вы переводили? В Яндекс.Браузере несколько другой результат:
Стратегия возиться на Гран-При Австрии оставила своего звездного водителя дымящимся, прежде чем оба автомобиля Mercedes DNF'D впервые с Испании 2016 года. Но это анализ и обучение, а не взаимные обвинения, что команде теперь нужно все исправить, говорит директор команды Mercedes Тото Вольфф.
Mercedes, команда, победившая в гибридной эре Формулы-1 После 2014 года, теперь виновна в трех ошибках, связанных с безопасностью или виртуальной безопасностью автомобилей Льюиса Хэмилтона в этом сезоне, не сумев столкнуть его с новыми шинами в Австралии, Китае и теперь Австрии, пока эти гонки были нейтрализованы.


Тоже не идеал, но получше вроде.
Да, действительно чуть лучше в плане согласования членов предложения. Я использовал Яндекс.Переводчик, т.к. ставить Яндекс.Браузер только ради этого теста не хотелось. Странно, что разница вообще есть.
У меня translate.yandex.ru переводит так же, как ответили
Вы не поверите, но теперь и у меня тоже.
Гугл, перевод через браузер:
Стратегия, пробивавшаяся на Гран-при Австрии, оставила свой звездный водитель дымящим, прежде чем оба автомобиля Mercedes DNF'd впервые после Испании 2016 года. Но это анализ и обучение, а не взаимные обвинения, что команде сейчас нужно все исправить, говорит Mercedes Руководитель команды Тото Вольф.
«Мерседес», команда, которая обыграла гибридную эру Формулы-1 в 2014 году, теперь виновна в трех ошибках безопасности в области безопасности или виртуальной безопасности в Льюисе Хэмилтоне в этом сезоне, не сумев нанести удар по новым шинам в Австралии, Китае и Австрии эти расы были нейтрализованы.
Видимо, не мог выбрать какой перевод лучше.
а у меня на translate.yandex.ru уже отличающийся вариант:
Стратегия промаха на Гран-При Австрии оставила своего звездного водителя дымящимся, прежде чем оба автомобиля Mercedes DNF впервые с Испании 2016 года. Но это анализ и изучение, а не взаимные обвинения, что команде теперь нужно все исправить, говорит директор команды Mercedes Тото Вольфф.
Mercedes, команда, которая победила в гибридной эре Формулы-1 После 2014 года, теперь виновна в трех ошибках безопасности Льюиса Хэмилтона или виртуальной безопасности в этом сезоне, не сумев столкнуть его за новые шины в Австралии, Китае и теперь Австрии, пока эти гонки нейтрализуются

«в Австралии, Китае и Австрии эти расы были нейтрализованы.» — Google Translate

Прямо какой-то XCOM или SCP.
Может подскажете, почему ваш переводчик совсем не может переводить сайты с эстонского на английский?
www.postimees.ee как пример
Я только что попробовал в Яндекс.Браузере, переводит.
А у меня не переводит:
no_Translation
Пытаемся воспроизвести, спасибо.
Пока не получилось. Можете рассказать подробности? Какая в точности у вас версия браузера? Какая версия и локаль ОС?
Зарепортил issue только что через ваш инструмент в браузере для этого, этого хватит? Могу еще в лс указанный там имейл скинуть
Заголовки сложны даже для человека.

Feds charge Man after FCC boss Ajit Pai's kids get death threat over net neutrality axe vote
DNS ad-hocracy in peril as ICANN advisors mull root server shakeup (глагол? Какой такой глагол?)
Software delays, lack of purpose means Microsoft’s “Andromeda” may never arrive
'Coding' cockup blamed for NHS cough-up of confidential info against patients' wishes
Mikel John Obi told father had been kidnapped hours before World Cup match

(последнее я даже сам не смог перевести пока не прочитал тизер — (Mikel John Obi was told that his father had been kidnapped and would be killed if he reported anything – just hours before he led Nigeria into their final World Cup group phase tie against Argentina.)
Operations available on Datasets are divided into transformations and actions. Transformations are the ones that produce new Datasets, and actions are the ones that trigger computation and return results. Example transformations include map, filter, select, and aggregate (groupBy). Example actions count, show, or writing data out to file systems.

Доступные наборы данных подразделяются на преобразования и действия. Преобразования-это преобразования, которые создают новые наборы данных, а действия-те, которые запускают вычисления и возвращают результаты. К примерам преобразований относятся map, filter, select и aggregate (groupBy). Примеры действий count, show или запись данных в файловые системы.

Operations available on Datasets -> Доступные наборы данных — серьезно?

На сугубо техническом тексте все еще уныло. Термины и аббревиатуры полностью сносят ему башку.
Для сравнения Google Translate
Операции, доступные в наборах данных, делятся на преобразования и действия. Преобразования — это те, которые создают новые наборы данных, а действия — это те, которые вызывают результаты расчета и возврата. Примеры преобразований включают в себя карту, фильтр, выбор и агрегат (groupBy). Примеры действий подсчитывают, показывают или записывают данные в файловые системы.
Хм. Знаете, местами тут лучше, но проблема с терминами налицо — никто не просил переводить названия методов :(
Заголовок часто содержит суть новости, поэтому важно перевести его правильно

Как показывает практика, 99% заголовков не соответствует статьям, даже если их не то что переводили, а и просто сочиняли живые люди-журнализды :)
Спасибо за статью! А была ли на хабре статья про сам переход Яндекс.Переводчика на нейросети? Правда ли, что используется RNN? Некоторые источники, например vc.ru/32616-mashinnyy-perevod-ot-holodnoy-voyny-do-glubokogo-obucheniya, об этом пишут.
В последнее время (примерно с год) периодически сравниваю качество перевода с английского на русский всех основных онлайн переводчиков (гугл, яндекс, Майкрософт, промт), по итогу могу сказать что только Яндекс периодически работает над переводом у остальных застой (что было год назад, то осталось и сейчас).
Зарегистрируйтесь на Хабре, чтобы оставить комментарий