usagi_flint 29 дек 2019 в 14:45

Четыре принципа перевода, или в чем же человек не уступит машинному переводчику?

4 мин

8.6K

Фриланс Читальный зал Изучение языков

Из песочницы

Комментарии 51

LibrarianOok 29 дек 2019 в 15:02

Толково расписаны основные моменты и сложности. Особенно подбешивают местные идиомы в технических текстах. Но, благодаря справочникам, можно и их одолеть.

Ryppka 29 дек 2019 в 15:44

Полностью согласен с тем, что основной проблемой является плохое владение русским языком, знание языка оригинала тут на втором месте.
Безликий технический текст, да еще и на simplified English, машина если уже не может, то скоро сможет перевести без потери качества. А вот если текст авторский, а у автора есть авторская позиция (а ее тоже желательно передать без потерь) — не уверен насчет качественного машинного перевода.

sshikov 29 дек 2019 в 16:03

Я бы сказал, что знание языка оригинала для технических текстов возможно даже на третьем месте — после знания русского, и после знания предмета. Можно хорошо перевести со словарем, зная предмет и русский язык, но без знания двух первых получается обычно малограмотная или нечитаемая чушь.

mvv-rus 29 дек 2019 в 18:53

Ну, не знаю, не знаю. Язык оригинала — это ведь не только лексика, но и грамматика. А её по словарю особенно не переведешь.
В результате, я например, нагляделся во вполне безликих технических текстах случаев перевода чего-нибудь типа «is followed by» с помощью «божьей искры»((с)Гоблин), после которых очень хочется, подобно профессору Преображенскому, спросить с переводчика «кто на ком стоял».
Правда, машина таких ошибок как раз не делает.

sshikov 29 дек 2019 в 19:10

>Ну, не знаю, не знаю.
Ну, во первых, я написал «возможно» :) То есть, это лишь мой собственный опыт, хотя и достаточно большой.

И потом, я не говорю, что знать язык вообще не нужно. Я лишь думаю, что именно для технических текстов, когда важно передать нюансы скорее правильно, нежели красиво, знание языка оригинала скорее где-то на третьем месте, чем на первом. То есть, если вы переводите что-то про Hadoop — то знать нужно а) русский б) Hadoop в) английский. И грамматика в технических текстах обычно попроще, без изысков.

>Правда, машина таких ошибок как раз не делает.
Зато неверно выбрать термин, потому что не знает контекста, машина очень даже может. Да не, не просто может — обычно так и делает. Я много раз пытался подсунуть машине для перевода сугубо технические тексты, типа руководств по программному продукту. Обычно выходит такая фигня… и в основном потому, что машина не понимает, где имя собственное (скажем, название продукта), где аббревиатура, а где все остальное. И пытается переводить то, что вообще переводить не следует.

И уже человек как раз обычно практически не делает таких ошибок.

НЛО прилетело и опубликовало эту надпись здесь

usagi_flint 31 дек 2019 в 20:26

И все же надо поставить между знанием родного языка и иностранным языком знак «равно». Для хорошего переводчика важно и то, и другое.

TheGodfather 29 дек 2019 в 16:16

Есть две позиции — сторонники «перевода» и сторонники «локализации». И у обеих сторон есть свои аргументы.

Например, «ну так же автор писал» — это вот про «Бильбо Бэггинс» (Властелин Колец), «Северус Снейп» (Гарри Поттер), «парень» (God of War). Это «перевод». Может, непривычно русскому глазу\уху, но зато точно. Где был косяк автора в оригинале — там он и останется в переводе. Персонажи шутили про условную разницу часовых поясов в Лос-Анжелесе и Нью-Йорке — про эти же города и будут шутить в переводе.

Или попытка как-то локализовать текст: «Бильбо Торбинс/Сумкин», «Злотеус Злей», «сын». Не всегда удачная (вот «сын» в недавнем обзоре локализации просто с плинтусом сравняли, хотя, на мой взгляд, локализация вполне корректная и передает оригинальный смысл), но по крайней мере есть попытки. Если переводчики хорошие, то в итоге может получиться локализованный шедевр (может, локальные мемасики, может, русские пословицы и поговорки, удачное переложение авторского [американского] юмора на российские реалии («в Петропавловске-Камчатском полночь») и пр.). Но если вдруг прочитавший локализацию будет читать оригинал, то с большой вероятностью может обнаружиться, что это *другая* книга.

Какой вариант ближе — личное дело каждого. Довольно логично думать, что те, кто не знают ни одного языка, кроме родного, будут фанатами «локализаций». Просто потому что хорошая локализация почти наверняка будет «ближе к телу».

Но видно, что автор текста целиком и полностью фанат «локализаций». А уж какие выводы из этого делать — решать вам.

homocomputeris 29 дек 2019 в 16:31

Локализация — это то, то в «классической“ теории теории и называется переводом, потому что там исходят из того, что читателю должны быть понятны и смысл, и художественные приёмы автора. И по этой же причинл, люблй неподстрочник — другое произведение.

Забавно, что слово «локализация» в таком значении — ленивая калька с английского.

Eldhenn 29 дек 2019 в 18:13

Но ведь Профессор сам рекомендовал локализовать имена… Ведь Baggins — это перевод с Вестрона на английский

SinsI 29 дек 2019 в 20:00

Может, непривычно русскому глазу\уху, но зато точно.

Вы путаете «что автор написал» и транслитерацию.
Авторы не писали Бильбо Бэггинс или Северус Снейп. Они писали Bilbo Baggins и Severus Snape — и надо либо спрашивать самого автора, либо глубинно исследовать всё произведение чтобы понять — хотел ли он написать Бэггинс (т.е. фамилия ничего не значит а выбрана из-за благозвучия), Сумочкин или вообще Карманник (учитывая профессию).

Какой вариант ближе — личное дело каждого

Не совсем так. Транслитерация очень часто приводит к мешанине и путанице.

Особенно это заметно в переводах китайских веб-новел: фамилии или имена в оригинале написаны иероглифами — которые сплошь и рядом омографы. Поэтому можно запросто встретить несколько персонажей с идентично транслитерируемыми именами — притом что в оригинале никто одного с другим не спутает.

hjornson 30 дек 2019 в 10:08

За «русские пословицы и поговорки» вкряченные в иностранный текст нало отрубать руки. По самую жопу.

TheGodfather 30 дек 2019 в 12:16

Вот вы, видно, сторонник «перевода». Но не все такие :)

Но если в книжке где-то встретилось условное «There is no such thing as a free lunch», то как русскоязычный читатель я бы ожидал локализации как «бесплатный сыр бывает только в мышеловке» (просто первая попавшаяся пословица с переводом). Хотя, конечно, можно и перевести «Не бывает бесплатного обеда», и даже будет понятно, о чем речь.
Более «живых» примеров под рукой нет, но легко допускаю, что если если в определенном произведении герой ругается (не пословицами, а просто) про, допустим, темноту, то я не вижу ничего плохого, если в локализации там окажется что-нибудь типа «Не видно не зги» \ «Темно как у негра в ...». Или там «Сжить с белого света меня решил, да?» вместо какого-нибудь эмоционального «Do you wanna kill me?» в разгар спора между супругами, если это вписывается в остальной контекст.

sbnur 29 дек 2019 в 20:04

Хотелось бы взглянуть на перевод, сделанный автором

usagi_flint 31 дек 2019 в 20:23

Могу скинуть кое-какие, но только надо уточнить: Вы знаете японский?

НЛО прилетело и опубликовало эту надпись здесь

LibrarianOok 29 дек 2019 в 21:10

За Чебурашкина интересуюсь — годный ли букварь?

НЛО прилетело и опубликовало эту надпись здесь

ProSev 30 дек 2019 в 17:19

А какие учебники аналогичного уровня используются в наше время? Кто-то может подсказать?

defuz 30 дек 2019 в 08:37

Нейросети конечно круты, но во многих случаях они спокойно могут напортачить, так что человеческий контроль все равно нужен. Иначе такой брак может проскочить, что возможны проблемы.

Помните еще пару лет назад вы вводили капчу на каждом сайте, чтобы не дай бог не оказаться машиной? Так вот, сегодня нейронные сети распознают эти самые капчи в разы точнее чем это способен сделать любой человек. Как на счет распознавания речи? Нейронные сети уже вплотную приблизились к человеческому пределу, а в некоторых случаях уже его преодолели.

Качество человеческого перевода сохраняется на одном и том же уровне из года в год. Качество машинного перевода каждый год возрастает. Пройдет 5-10 лет и будет:

Некоторые люди-переводчики конечно круты (и их услуги дорогие), но во многих случаях они спокойно могут напортачить, так что машинный контроль все равно нужен. Иначе такой брак может проскочить, что возможны проблемы.

НЛО прилетело и опубликовало эту надпись здесь

usagi_flint 31 дек 2019 в 20:05

Спасибо за подробный комментарий! Действительно, нюансов перевода много, как в художественном, так и в техническом. Сложности есть и в том и ином, и если технический требует точности «буква в букву», то в художественном — нагрузка ложится на способы передачи. Особенно понравилась фраза «лучше всего переводят литературу по физике — физики, а стихи — поэты», кратко и емко.

FForth 30 дек 2019 в 00:25

Интересно, вроде не такой «сложный» контекст, но правильное понимание транслятором google не формируется в таком случае (что переводить, как и какие лексемы ядра текста не переводить)

Forth Words Glossary

P.S. Как нейросети объяснить такие «казусы» контекста для перевода?

defuz 30 дек 2019 в 08:43

Единственная причина, по которой Google Translate не справляется с переводом в таких случаях заключается в том, что его не тренировали на аналогичных случаях.

Как нейросети объяснить такие «казусы» контекста для перевода?

Показать примеры правильных и не правильных переводов.

НЛО прилетело и опубликовало эту надпись здесь

plashenkov 30 дек 2019 в 03:43

Аналогично с qaru.site, на котором собраны автоматические переводы со StackOverflow. И гугл часто показывает его выше, чем StackOverflow. Жеесть

НЛО прилетело и опубликовало эту надпись здесь

inferrna 30 дек 2019 в 05:21

Статья напомнила мне высказывания Каспарова о компьютерных шахматах года эдак до 1997. Нейросети пока имеют проблемы с переводом в контексте, но научить их извлекать контекст не так сложно. Кроме того, при переводе на конкретный язык их можно обучать на массиве готовых литературных переводов сразу блоками текста — где контекст уже учтён.

НЛО прилетело и опубликовало эту надпись здесь

inferrna 30 дек 2019 в 09:40

С учётом того, что нейронные сети научились генерить выглядящие осмысленными тексты, дело осталось за малым.

usagi_flint 31 дек 2019 в 20:44

Ключевое слово «выглядящие».

defuz 30 дек 2019 в 08:26

Спасибо, что поделились вашими предрассудками с Хабром! У меня для вас плохие новости, но:

Неужели искусственный интеллект [...] сможет подменить человека?

Да.

Существенный недостаток машинного переводчика — он не может понять смысл текста.

Можете чем-нибудь аргументировать, почему ваш белковый интеллект способен понимать Смысл текста хоть чем-то лучше машины? Или вам просто хочется верить, что понимание Смысла – это какая-то эксклюзивная человеческая способность?

Развивай свои знания переводимого языка, вплоть до уровня крылатых фраз, пословиц и поговорок, фразеологизмов

Выходит, преимущество белкового переводчика перед машиной в том, что он изучил крылатые фразы, пословицы и поговорки? Камон. Куда уж нейронным сетям до таких тонких способностей.

Перевод должен полностью соответствовать нормам языка, на который ведется перевод

И тут у меня плохие новости: средняя искусственная нейронная сеть будет способна оперировать «родным» языком в разы лучше, чем любой отдельно взятый белковый профессор лингвистики, как с точки зрения объема словарного запаса, так и с точки зрения правил языка со всеми тонкостями их применения. Просто потому что искусственная сеть способна учиться гораздо быстрее чем человек и ее знания не портятся со временем.

Машина переводит «как есть», а человек может решить «как лучше».

Ваши стереотипы о том как переводит машина безнадежно устарели. Комбинируем GAN+NLP и очень скоро машины смогут не только переводить «как лучше», но и имитировать стиль отдельно взятого переводчика настолько, что вы и сами не отличите собственный перевод от подделки.

Ибо перевод текста — это очень тяжкий труд, требующий много сил и времени, а также знаний, широкого кругозора и умения адаптироваться.

Блаблабла, набивание цены собственной профессии, блаблабла, мы правда незаменимы. Ну, посоревнуйтесь еще лет пять с машинами в терпеливости и усидчивости, посмотрим кто кого.

НЛО прилетело и опубликовало эту надпись здесь

Ryppka 30 дек 2019 в 10:30

Спасибо, что поделились вашими предрассудками с Хабром! У меня для вас плохие новости, но:
Неужели искусственный интеллект [...] сможет подменить человека?
Да.

Вслед за людоедами я согласен с тем, что машина никогда не сможет заменить человека…

hjornson 30 дек 2019 в 11:39

Разговоры насчет того что еще пять лет и переводчиков полностью заменят машины я слышу постоянно уже эдак с четверть века.
А в реальности оно, в общем улучшается, но до сих пор выглядит примерно как-то так (причем изложение тут вообще-то от лица женского персонажа.):

«I've got an idea!» Dad said. «Let's go to the moon.»

«Huh—?» I looked up from my comic.

«I mean it. What do you kids think? Do you want to go to the moon?»

«Yeah, sure,» I said, not believing him any more than I had all the other times he'd dangled promises in front of my nose. In the last thirteen years, or at least as much of them as I could remember, he'd promised me the stars, the sky, and a trip to Disneyland. The only time I saw the stars was on TV, the sky was brown, and I still hadn't ridden the Matterhorn bobsleds and probably never would, at least not until I paid for the trip myself. So when he asked me if I'd like to go to the moon, it sounded like just another one of those things that adults say for no other reason than to use up air.

«У меня есть идея!» Папа сказал. «Пойдем на луну».

«Huh-?» Я поднял глаза от моего комикса.

«Я имею в виду. Что вы, дети, думаете? Вы хотите поехать на Луну?»

«Да, конечно», — сказал я, не веря ему больше, чем когда-либо раньше, когда он болтал с обещаниями перед моим носом. За последние тринадцать лет, или, по крайней мере, столько, сколько я помню, он обещал мне звезды, небо и поездку в Диснейленд. Единственный раз, когда я видел звезды по телевизору, небо было коричневым, и я все еще не ездил на бобслеях из Маттерхорна, и, вероятно, никогда не буду, по крайней мере, пока я сам не заплатил за поездку. Поэтому, когда он спросил меня, не хочу ли я поехать на Луну, это прозвучало как еще одна из тех вещей, которые взрослые говорят только по одной причине — не использовать воздух.

ProSev 30 дек 2019 в 17:07

«Пойдем на луну»

Какие знакомые вещи… здесь только прочитать чуть-чуть и окончания поправить. Ведь, летать то ещё не научились, всё пешком.

defuz 2 янв 2020 в 16:41

Проблема в том что с развитием технологий незаметно повышаются и ожидания от них, и в особенности это касается возможностей «машин» и искусственного интеллекта.

У меня есть старая советская книга где-то 1980 года, где написано примерно следующее: «Сегодня ИИ способен решать только простые задачи, вот когда машина сможет обыграть человека в шахматы, можно будет сказать что мы создали сильный ИИ».

Выходит, сильный ИИ создали лет 20 назад, а мы и не заметили. Потому что уже 20 лет назад обыгрывание человека в шахматы перестало быть достаточным условием для того чтобы считаться «настоящим» ИИ.

Примерно 20 лет назад говорили, что шахматы — это просто алгоритм, но ведь картину ИИ нарисовать не сможет, у него нет вдохновения. Сегодня ИИ успешно рисует картины, но нас это уже как-то мало впечатляет.

usagi_flint 31 дек 2019 в 20:16

У меня есть плохая новость и для Вас: Ваш комментарий написали не Вы, а ИИ, что Вас подменил, а Вы думаете, что это Вы, но просто не понимаете этого.

LibrarianOok 30 дек 2019 в 09:22

В своей практике перевода использую переводчики от гугла, яндекса, promt и bing одновременно, благо несколько мониторов и переключалка рабочих столов в линуксе это позволяют легко. Недавно вот зарубежные товарищи подсказали deepl.com — тоже хороший.

НЛО прилетело и опубликовало эту надпись здесь

LibrarianOok 30 дек 2019 в 09:55

Сами себе эти инструменты цель не поставят. Это всё равно что спросить, в чём ваша роль, как столяра, ведь есть же рубанок, стамеска, долото? Инструменты повышают производительность труда, в этом их роль. Вот, например, недавно я перевёл небольшую книгу с французского на испанский за день. Со всеми моими знаниями языков, такой скорости печати руками мне не достигнуть. Да оно и незачем.

НЛО прилетело и опубликовало эту надпись здесь

LibrarianOok 30 дек 2019 в 16:21

Ну, что поделать, если вы даже не утруждаете себя попыткой что-либо понять из моих объяснений? [Пожимает плечами.] Думается, заказчику виднее, за что отдавать деньги.

usagi_flint 31 дек 2019 в 20:19

Я никоим образом не хотел уничижить перечисленные и неперечисленные переводчики, да и существование их приносит скорее пользу, нежели вред, по моей точке зрения. Какую-никакую, а они создают конкуренцию.

НЛО прилетело и опубликовало эту надпись здесь

Quasarsmith 31 дек 2019 в 20:10

Развития САТ программ точно положительно скажется на качестве перевода. Но вот с полным вытеснением людей с профессии переводчика то что называют ИИ ещё далеко, да и качество всегда будет под сомнением. Думаю, гораздо проще научить ИИ воспроизводить уникальный текст на человеческом уровне чем переводить (формулы Панини в помощь программистам надеюсь они их используют).

usagi_flint 31 дек 2019 в 20:46

Использую Trados (то еще убожество) и считаю его полезным для рутинных задач. С тезисом согласен.

hypoglossus 31 дек 2019 в 20:10

Не хотелось бы никого обижать, но статья читается сложно. Обученная на текстах Маршака (например) нейросеть переписала бы её более мягким слогом без потери того самого Смысла.

И позвольте уточнить, как вы сами определяете Смысл текстов и постов? Вы всегда это умели или научились в результате обработки большого объёма данных? Так вот у нейросети есть фатальное для белковых переводчиков преимущество: скорость обучения. За часы-недели можно уточнить модель перевода на текстах из свежих источников живого человеческого общения (социальные сети, мессенджеры) и нейросеть сможет использовать сленг, мемы и сокращения. А сколько времени нужно вам, чтобы выучить мемы?

usagi_flint 31 дек 2019 в 20:14

Она бы переписала текст на русском языке на тот же русский, но с более мягким слогом, это вы верно подметили. Но в статье говорится о переводе с одного языка на другой, так что тексты Маршака тут не помогут. А обучить можно и обезьяну, что она засовывала шарик в круглое отверстие, но от этого ее умение осознавать, что же она делает, не появляется. Обучении ИИ сродни дрессировке собаки, все дело в безусловных рефлексах.

hypoglossus 31 дек 2019 в 20:21

Самуил Маршак был в том числе и переводчиком.

usagi_flint 31 дек 2019 в 20:29

А вот этот тезис никоим образом не соотносится с Вашим предыдущим. И это указывает на то, что произошло отклонение от изначальной темы и продолжение сулит лишнее словоблюдство. В любом случае, благодарен за комментарии.

Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Четыре принципа перевода, или в чем же человек не уступит машинному переводчику?

Комментарии 51

Публикации

Истории