Комментарии 51
Безликий технический текст, да еще и на simplified English, машина если уже не может, то скоро сможет перевести без потери качества. А вот если текст авторский, а у автора есть авторская позиция (а ее тоже желательно передать без потерь) — не уверен насчет качественного машинного перевода.
В результате, я например, нагляделся во вполне безликих технических текстах случаев перевода чего-нибудь типа «is followed by» с помощью «божьей искры»((с)Гоблин), после которых очень хочется, подобно профессору Преображенскому, спросить с переводчика «кто на ком стоял».
Правда, машина таких ошибок как раз не делает.
Ну, во первых, я написал «возможно» :) То есть, это лишь мой собственный опыт, хотя и достаточно большой.
И потом, я не говорю, что знать язык вообще не нужно. Я лишь думаю, что именно для технических текстов, когда важно передать нюансы скорее правильно, нежели красиво, знание языка оригинала скорее где-то на третьем месте, чем на первом. То есть, если вы переводите что-то про Hadoop — то знать нужно а) русский б) Hadoop в) английский. И грамматика в технических текстах обычно попроще, без изысков.
>Правда, машина таких ошибок как раз не делает.
Зато неверно выбрать термин, потому что не знает контекста, машина очень даже может. Да не, не просто может — обычно так и делает. Я много раз пытался подсунуть машине для перевода сугубо технические тексты, типа руководств по программному продукту. Обычно выходит такая фигня… и в основном потому, что машина не понимает, где имя собственное (скажем, название продукта), где аббревиатура, а где все остальное. И пытается переводить то, что вообще переводить не следует.
И уже человек как раз обычно практически не делает таких ошибок.
Например, «ну так же автор писал» — это вот про «Бильбо Бэггинс» (Властелин Колец), «Северус Снейп» (Гарри Поттер), «парень» (God of War). Это «перевод». Может, непривычно русскому глазу\уху, но зато точно. Где был косяк автора в оригинале — там он и останется в переводе. Персонажи шутили про условную разницу часовых поясов в Лос-Анжелесе и Нью-Йорке — про эти же города и будут шутить в переводе.
Или попытка как-то локализовать текст: «Бильбо Торбинс/Сумкин», «Злотеус Злей», «сын». Не всегда удачная (вот «сын» в недавнем обзоре локализации просто с плинтусом сравняли, хотя, на мой взгляд, локализация вполне корректная и передает оригинальный смысл), но по крайней мере есть попытки. Если переводчики хорошие, то в итоге может получиться локализованный шедевр (может, локальные мемасики, может, русские пословицы и поговорки, удачное переложение авторского [американского] юмора на российские реалии («в Петропавловске-Камчатском полночь») и пр.). Но если вдруг прочитавший локализацию будет читать оригинал, то с большой вероятностью может обнаружиться, что это *другая* книга.
Какой вариант ближе — личное дело каждого. Довольно логично думать, что те, кто не знают ни одного языка, кроме родного, будут фанатами «локализаций». Просто потому что хорошая локализация почти наверняка будет «ближе к телу».
Но видно, что автор текста целиком и полностью фанат «локализаций». А уж какие выводы из этого делать — решать вам.
Забавно, что слово «локализация» в таком значении — ленивая калька с английского.
Но ведь Профессор сам рекомендовал локализовать имена… Ведь Baggins — это перевод с Вестрона на английский
Может, непривычно русскому глазу\уху, но зато точно.Вы путаете «что автор написал» и транслитерацию.
Авторы не писали Бильбо Бэггинс или Северус Снейп. Они писали Bilbo Baggins и Severus Snape — и надо либо спрашивать самого автора, либо глубинно исследовать всё произведение чтобы понять — хотел ли он написать Бэггинс (т.е. фамилия ничего не значит а выбрана из-за благозвучия), Сумочкин или вообще Карманник (учитывая профессию).
Какой вариант ближе — личное дело каждогоНе совсем так. Транслитерация очень часто приводит к мешанине и путанице.
Особенно это заметно в переводах китайских веб-новел: фамилии или имена в оригинале написаны иероглифами — которые сплошь и рядом омографы. Поэтому можно запросто встретить несколько персонажей с идентично транслитерируемыми именами — притом что в оригинале никто одного с другим не спутает.
Но если в книжке где-то встретилось условное «There is no such thing as a free lunch», то как русскоязычный читатель я бы ожидал локализации как «бесплатный сыр бывает только в мышеловке» (просто первая попавшаяся пословица с переводом). Хотя, конечно, можно и перевести «Не бывает бесплатного обеда», и даже будет понятно, о чем речь.
Более «живых» примеров под рукой нет, но легко допускаю, что если если в определенном произведении герой ругается (не пословицами, а просто) про, допустим, темноту, то я не вижу ничего плохого, если в локализации там окажется что-нибудь типа «Не видно не зги» \ «Темно как у негра в ...». Или там «Сжить с белого света меня решил, да?» вместо какого-нибудь эмоционального «Do you wanna kill me?» в разгар спора между супругами, если это вписывается в остальной контекст.
Хотелось бы взглянуть на перевод, сделанный автором
Нейросети конечно круты, но во многих случаях они спокойно могут напортачить, так что человеческий контроль все равно нужен. Иначе такой брак может проскочить, что возможны проблемы.Помните еще пару лет назад вы вводили капчу на каждом сайте, чтобы не дай бог не оказаться машиной? Так вот, сегодня нейронные сети распознают эти самые капчи в разы точнее чем это способен сделать любой человек. Как на счет распознавания речи? Нейронные сети уже вплотную приблизились к человеческому пределу, а в некоторых случаях уже его преодолели.
Качество человеческого перевода сохраняется на одном и том же уровне из года в год. Качество машинного перевода каждый год возрастает. Пройдет 5-10 лет и будет:
Некоторые люди-переводчики конечно круты (и их услуги дорогие), но во многих случаях они спокойно могут напортачить, так что машинный контроль все равно нужен. Иначе такой брак может проскочить, что возможны проблемы.
Forth Words Glossary
P.S. Как нейросети объяснить такие «казусы» контекста для перевода?
Неужели искусственный интеллект [...] сможет подменить человека?Да.
Существенный недостаток машинного переводчика — он не может понять смысл текста.Можете чем-нибудь аргументировать, почему ваш белковый интеллект способен понимать Смысл текста хоть чем-то лучше машины? Или вам просто хочется верить, что понимание Смысла – это какая-то эксклюзивная человеческая способность?
Развивай свои знания переводимого языка, вплоть до уровня крылатых фраз, пословиц и поговорок, фразеологизмовВыходит, преимущество белкового переводчика перед машиной в том, что он изучил крылатые фразы, пословицы и поговорки? Камон. Куда уж нейронным сетям до таких тонких способностей.
Перевод должен полностью соответствовать нормам языка, на который ведется переводИ тут у меня плохие новости: средняя искусственная нейронная сеть будет способна оперировать «родным» языком в разы лучше, чем любой отдельно взятый белковый профессор лингвистики, как с точки зрения объема словарного запаса, так и с точки зрения правил языка со всеми тонкостями их применения. Просто потому что искусственная сеть способна учиться гораздо быстрее чем человек и ее знания не портятся со временем.
Машина переводит «как есть», а человек может решить «как лучше».Ваши стереотипы о том как переводит машина безнадежно устарели. Комбинируем GAN+NLP и очень скоро машины смогут не только переводить «как лучше», но и имитировать стиль отдельно взятого переводчика настолько, что вы и сами не отличите собственный перевод от подделки.
Ибо перевод текста — это очень тяжкий труд, требующий много сил и времени, а также знаний, широкого кругозора и умения адаптироваться.Блаблабла, набивание цены собственной профессии, блаблабла, мы правда незаменимы. Ну, посоревнуйтесь еще лет пять с машинами в терпеливости и усидчивости, посмотрим кто кого.
Спасибо, что поделились вашими предрассудками с Хабром! У меня для вас плохие новости, но:
Неужели искусственный интеллект [...] сможет подменить человека?
Да.
Вслед за людоедами я согласен с тем, что машина никогда не сможет заменить человека…
А в реальности оно, в общем улучшается, но до сих пор выглядит примерно как-то так (причем изложение тут вообще-то от лица женского персонажа.):
«I've got an idea!» Dad said. «Let's go to the moon.»
«Huh—?» I looked up from my comic.
«I mean it. What do you kids think? Do you want to go to the moon?»
«Yeah, sure,» I said, not believing him any more than I had all the other times he'd dangled promises in front of my nose. In the last thirteen years, or at least as much of them as I could remember, he'd promised me the stars, the sky, and a trip to Disneyland. The only time I saw the stars was on TV, the sky was brown, and I still hadn't ridden the Matterhorn bobsleds and probably never would, at least not until I paid for the trip myself. So when he asked me if I'd like to go to the moon, it sounded like just another one of those things that adults say for no other reason than to use up air.
«У меня есть идея!» Папа сказал. «Пойдем на луну».
«Huh-?» Я поднял глаза от моего комикса.
«Я имею в виду. Что вы, дети, думаете? Вы хотите поехать на Луну?»
«Да, конечно», — сказал я, не веря ему больше, чем когда-либо раньше, когда он болтал с обещаниями перед моим носом. За последние тринадцать лет, или, по крайней мере, столько, сколько я помню, он обещал мне звезды, небо и поездку в Диснейленд. Единственный раз, когда я видел звезды по телевизору, небо было коричневым, и я все еще не ездил на бобслеях из Маттерхорна, и, вероятно, никогда не буду, по крайней мере, пока я сам не заплатил за поездку. Поэтому, когда он спросил меня, не хочу ли я поехать на Луну, это прозвучало как еще одна из тех вещей, которые взрослые говорят только по одной причине — не использовать воздух.
«Пойдем на луну»
Какие знакомые вещи… здесь только прочитать чуть-чуть и окончания поправить. Ведь, летать то ещё не научились, всё пешком.
Проблема в том что с развитием технологий незаметно повышаются и ожидания от них, и в особенности это касается возможностей «машин» и искусственного интеллекта.
У меня есть старая советская книга где-то 1980 года, где написано примерно следующее: «Сегодня ИИ способен решать только простые задачи, вот когда машина сможет обыграть человека в шахматы, можно будет сказать что мы создали сильный ИИ».
Выходит, сильный ИИ создали лет 20 назад, а мы и не заметили. Потому что уже 20 лет назад обыгрывание человека в шахматы перестало быть достаточным условием для того чтобы считаться «настоящим» ИИ.
Примерно 20 лет назад говорили, что шахматы — это просто алгоритм, но ведь картину ИИ нарисовать не сможет, у него нет вдохновения. Сегодня ИИ успешно рисует картины, но нас это уже как-то мало впечатляет.
И позвольте уточнить, как вы сами определяете Смысл текстов и постов? Вы всегда это умели или научились в результате обработки большого объёма данных? Так вот у нейросети есть фатальное для белковых переводчиков преимущество: скорость обучения. За часы-недели можно уточнить модель перевода на текстах из свежих источников живого человеческого общения (социальные сети, мессенджеры) и нейросеть сможет использовать сленг, мемы и сокращения. А сколько времени нужно вам, чтобы выучить мемы?
Четыре принципа перевода, или в чем же человек не уступит машинному переводчику?