Спасибо, Константин! Не могу не согласиться. Во многом перекликается с общими требованиями к упрощенному техническому русскому языку (ГОСТ Р 58049-2017, п. 8.2)
Спасибо за вопрос. Ответ на него зависит от уровня качества перевода, о котором мы говорим.
Нейронный машинный перевод существует уже несколько лет, именно на нейронной модели построены движки всех ведущих компаний (Amazon, Google, Yandex и т. д.). Рутинную работу с низкими требования к качеству машинка может выполнять уже сегодня, но слабых мест пока много.
Я много работаю с машинным переводом как постредактор (отпостредактировала тысячи страниц). НМП «учитывает контекст» пока только в кавычках. Фактически он построен на базе матричных вычислений, с помощью которых создаются более сложные вероятностные модели и векторные представления слов. Он не учитывает условия взаимодействия, не даёт оценку ситуациям и т. д. Опять же, перевод вслепую не может дать предсказуемый результат.
Типовые ошибки НМП (на основе опыта специалистов компании Phrase):
· грамматика (нарушение согласования в падежах, числах, родах, временах);
· синтаксис (порядок слов, конструкции, несвойственные для языка);
· орфография и пунктуация (диакритика, апострофизация, капитализация);
· терминология (неверное употребление терминов в тексте, несоблюдение единообразия терминологии);
· стиль (книжный/разговорный, буквальный перевод, сухой информативный язык, который не передает образность);
· форматирование (теги, переменные/ссылки, искажение знаков, длина строки);
· зоны локализации (форматы даты и времени, формат денежных величин, единицы измерения).
Ещё одна проблема машинного перевода: на некоторые языки он выполняется через «языки-посредники». Перевод с иврита на русский может выполняться через английский, при этом африканское государство Togo превращается в «Идти», а Iran в «Я побежал».
С русского на болгарский машинный перевод тоже может выполняться через английский, при этом «долгожительница» (long liver) превращается в «длинную печень» (дълъг черен дроб).
С машинным переводом для игр вообще сложно. Рандомный дед, который old man, при переводе машинкой на английский всё ещё grandfather (чей-то кровный родственник). «Ты водишь!» в значении «ты голя», «ты голишь» — You drive! И это с учётом того, что фраза не вырвана из контекста, вокруг куча слов, есть предыстория.
Кроме того, не будем забывать, что с нейронкой не подпишешь NDA, нейронке не предъявишь иск в случае чего, а загрузка документов в онлайн-переводчики — это передача документа третьим лицам, для конфиденциальной информации вообще не подходит.
Спасибо, Константин! Не могу не согласиться. Во многом перекликается с общими требованиями к упрощенному техническому русскому языку (ГОСТ Р 58049-2017, п. 8.2)
Для этих целей лучше подойдёт авторитетный источник: А. Э. Мильчин, Л. К. Чельцова. Справочник издателя и автора.
Спасибо за вопрос. Ответ на него зависит от уровня качества перевода, о котором мы говорим.
Нейронный машинный перевод существует уже несколько лет, именно на нейронной модели построены движки всех ведущих компаний (Amazon, Google, Yandex и т. д.). Рутинную работу с низкими требования к качеству машинка может выполнять уже сегодня, но слабых мест пока много.
Я много работаю с машинным переводом как постредактор (отпостредактировала тысячи страниц). НМП «учитывает контекст» пока только в кавычках. Фактически он построен на базе матричных вычислений, с помощью которых создаются более сложные вероятностные модели и векторные представления слов. Он не учитывает условия взаимодействия, не даёт оценку ситуациям и т. д. Опять же, перевод вслепую не может дать предсказуемый результат.
Типовые ошибки НМП (на основе опыта специалистов компании Phrase):
· грамматика (нарушение согласования в падежах, числах, родах, временах);
· синтаксис (порядок слов, конструкции, несвойственные для языка);
· орфография и пунктуация (диакритика, апострофизация, капитализация);
· терминология (неверное употребление терминов в тексте, несоблюдение единообразия терминологии);
· точность перевода (неправильный перевод, опущения, добавления, повторы, неологизмы);
· стиль (книжный/разговорный, буквальный перевод, сухой информативный язык, который не передает образность);
· форматирование (теги, переменные/ссылки, искажение знаков, длина строки);
· зоны локализации (форматы даты и времени, формат денежных величин, единицы измерения).
Ещё одна проблема машинного перевода: на некоторые языки он выполняется через «языки-посредники». Перевод с иврита на русский может выполняться через английский, при этом африканское государство Togo превращается в «Идти», а Iran в «Я побежал».
С русского на болгарский машинный перевод тоже может выполняться через английский, при этом «долгожительница» (long liver) превращается в «длинную печень» (дълъг черен дроб).
С машинным переводом для игр вообще сложно. Рандомный дед, который old man, при переводе машинкой на английский всё ещё grandfather (чей-то кровный родственник). «Ты водишь!» в значении «ты голя», «ты голишь» — You drive! И это с учётом того, что фраза не вырвана из контекста, вокруг куча слов, есть предыстория.
Кроме того, не будем забывать, что с нейронкой не подпишешь NDA, нейронке не предъявишь иск в случае чего, а загрузка документов в онлайн-переводчики — это передача документа третьим лицам, для конфиденциальной информации вообще не подходит.