vanxant Mar 8 2017 at 02:31

Почему переводчикам не нужно бояться нейросетей Гугла

5 min

27K

Artificial Intelligence

+15

Comments 86

Kenya-West Mar 8 2017 at 03:40

С универсальным машинным переводчиком среднего уровня, пусть и немного корявым, «журналисты» типа alizar или ragequit становятся просто безработными.

Давно их пора мокнуть в… Ну вы поняли

justhabrauser Mar 9 2017 at 09:19

Т.е. Вы точно уверены, что они не аватары гуглетранслейта?

demimurych Mar 8 2017 at 04:02

Я к чему клоню: этим людям нечего бояться, потому что они сами формируют язык, вводят в него новые слова и термины. Нейросети всего лишь учатся на их решениях.

Мне кажется это утверждение спорным.
Не так давно была игра в Го между машиной и человеком, где машина одержала безоговорочную победу. В одной из партий машина совершила ход, который вызвал недоумение у следящих за игрой. Ход показался «безумным». Он выходил за рамки привычных ходов профессионалов игры в Го. Тем не менее через несколько ходов стало очевидным, что «невиданное» действие машины принесло ей преимущество.

Процесс формирования — это не какой-то магический процесс, где что-то вдруг достается из черного ящика, но выводы из той информации которой обладают. И на примере той игры в Го, хорошо видно, как машина оказалась на это способна — совершить вывод и действие выходящее за рамки понимания игры у человека.

vanxant Mar 8 2017 at 04:20

Это про гуманитарные науки, тут «точная» логика не работает. Верно не то, что истинно, а то, что считается верным в данном сообществе.
Простите, не хочу переходить в политоту или кого-то задеть, но очень яркий пример — лозунг «Україна це європа».
Ну вроде как никто никогда не утверждал, что данное государство (в своё время союзная республика, территория) не относится к європе.
Однако тут навешали кучу смыслов на вроде бы старое слово. Причём это не Київ, в общем-то, начал, тут есть конкретные разногласия между Брюсселем с его евро-фигней и давно существующими Советом Европы, УЕФА и т.д. Короче некие непонятные люди попытались приватизировать четыре буквы «евро».

Теперь к вашему комменту: машина может, конечно, что-то там решить. Или предложить список вариантов. Точно так же, как условный доцент из Урюпинска. Проблема в том, что всем будет пофиг. И уж тем более, при выборе между человеко-предложенным вариантом и машинным, можно ожидать неприкрытый шовинизм. Любой предложенный человеком вариант будет принят просто в пику машинному.

Ну и нейросети пока очень сильно не доросли до того, чтобы спорить с докторами наук.

Posigrade Mar 8 2017 at 15:09

>не доросли до того, чтобы спорить с докторами наук
В го машина играет по конкретным правилам го, но в гуманитарщину она играет не по правилам гуманитарных наук и академических подковерных игр, соревнуясь с профессурой, но по актуальным правилом зыбкой социальной вселенной (играя за свою группу, скорее всего, весьма далекую от академических интересов). Никто не будет делать машину, чтоб помериться пенисами, скажем, с членами национальной ассоциации политических и социальных наук. «Профессура, вы не смогли Крым и Трампа в отличии от нашей машины предсказать, МВАХАХА!!!» — этого нет, реальный игрок, обладающий даже минимальными возможностями, будет играть не против профессоров, а за/против Трампов/Крымов.

>Короче некие непонятные люди попытались приватизировать четыре буквы «евро».
тут и стоит машинный игрок — на приватизиции букв (или шагов в Го) в области непонятного (на которую даже у самых лобастых докторов/мастеров_го ума/мотивации не хватает, т.к. для них и другой интересной и важной работы полно. Писал когда-то по похожему поводу — https://geektimes.ru/post/107047/#comment_3372115). А не на составлении академических справочников приватизированных букв и теоретизировании постфактум.

dipsy Mar 8 2017 at 05:12

Я бы уточнил, в ближайшей перспективе, год, два, возможно 5, да, всё вышенаписанное останется верным и бояться не следует. Но 5-6 лет пролетят (один президентский срок) и глазом не моргнете, а искусственные нейроморфные когнитивные системы станут в несколько раз лучше, возможно качественно лучше, а не просто количественно. Станут использовать контекст предметной области, станут использовать понятия «красота изложения» или чему их там ещё научат, это всё не божественные откровения, как постепенно выясняется, а вполне себе «алгоритмизируются».

vanxant Mar 8 2017 at 05:17

Возможно, но пока не доказано.
Про ИИ, который всех зохавает, разговоры идут с 60-ых годов. В те времена компьютеры занимали спортзал… и сейчас компьютеры, способные на ИИ, тоже занимают спортзал. Так что про 5-6 лет вы, вероятно, немного погорячились.

dipsy Mar 8 2017 at 05:19

С 60 годами конечно хорошее сравнение, хотя в корне неправильное. Спишем на гуманитарное мировоззрение.

UFO landed and left these words here

dipsy Mar 8 2017 at 07:02

Ну а вы принципиальной разницы между клубком проводов с фото и матрицей из N миллиардов транзисторов на одном чипе не чувствуете?
А вообще лучше сравните мозг гориллы и человека, ведь практически то же самое, ну человеческий чуть больше, стоило ли эволюции так напрягаться, чувствуете к чему веду? Ещё раз более толсто намекну: не произошло ли какого-то качественного скачка в интеллекте человека с «небольшим» на первый взгляд усложнением его мозга по сравнению с мартышками? Не может ли подобная ситуация повториться с искусственным «разумом» в какой-то момент усложнения его программно-аппаратной платформы?

sergku1213 Mar 8 2017 at 07:38

Ещё один качественный скачок Вы не упомянули: Скачок неуловимого Джо. Это я про старый анекдот о «неуловимом Джо», который неуловим постольку, поскольку никому нафик не нужен. Так вот, если ИИ раньше был сугубо игрушкой для ученый, хоть и с финансированием, но по остаточному принципу, то теперь ИИ слабого типа становятся рабочим инструментом. Это касается как переводов, так и робоводителей и так далее и тому подобное. Моё мнение — прогресс в этой области должен быть достаточно быстр. Посмотрите на аналогию с Биг Дата. Не так уж долго длилось это увлечение, но всё задействовано. Теперь новый этап — слабый ИИ. Будут пихать всюду. Потом — приход сильного ИИ, который может быть не вполне очевиден. Я в том смысле, что управление Государствами и людьми вряд ли будут декларировать для задач ИИ. Но, поскольку это несет громадные эволюционные преимущества для Государств — вероятно будет внедряться volens-nolens.

river-fall Mar 9 2017 at 11:57

Слабый ИИ уже почти везде — и в фейсбуковской выдаче, и в системах управления двигателем и режимах работы АКПП, а также в гуглтранслейте, рекламных серверах, диспетчерской аэропоротов, фондовых биржах итд

insolite Mar 12 2017 at 16:23

Коммерческий интерес к AI полностью укладывается в концепцию hype-циклов и на пиках он был огромен. Поэтому странно говорить о каком-то остаточном финансировании. Понятие AI winter возникло неспроста.

Показательный из прошлого пример коммерческий состоятельности AI — экспертные системы. Подобные системы используются в определенных областях до сих пор, просто под другими названиями. Суть их от этого не меняется, т.к. принципы устройства те же: база знаний плюс правила вывода.

UFO landed and left these words here

red75prim Mar 8 2017 at 07:28

В 60-е отсуствовало: понимание исключительной сложности задач построения ИИ, знание о перспективах различных подходов, вычислительные мощности, на которых эти подходы можно реализовать в полной мере. Присутствовали: талантливые люди, которые есть и сейчас.

Не стоить сравнивать сегодняшнюю ситуацию с 60-ми. Задачи уже стали намного более конкретными: улучшить обучение на небольшом количестве примеров, решить проблему катастрофического забывания, найти способ стабилизировать и ускорить нейронное обучение с подкреплением, и т.п.

Вычислительных мощностей достаточно, исследований и новых идей хватает. Прогнозы тут делать сложно, но я очень удивлюсь, если качественный скачок не произойдет в течении 15 лет.

abstracto Mar 8 2017 at 08:10

ага, только вы похоже не заметили экспоненциального внедрения компов… везде.
и если сравнивать их использование между 60ыми и 70ыми, то их стало не сильно много. а если между 2007ым и 2017 то и стало в тысячи раз больше.
также и с ИИ — его он был, с ним играли, только вот за несколько лет его внедрение может превзойти целое десятилетие. В том и суть экспоненты — всё может поменяться ОЧЕНЬ быстро.

teifo Mar 8 2017 at 10:02

Стоило засомневаться в прогнозе на 5-6 лет, прям какая точность, и опа на минус. Странные дела творятся.

vitaliy2 Mar 10 2017 at 05:50

Даже люди не могут переводить с одного языка на другой, как вы предлагаете сделать это машине? Да ещё и через 5-6 лет.

dipsy Mar 10 2017 at 11:17

Ну да, если даже люди не могут, то это проблема. Возможно нерешаемая. Я имел в виду толкьо те задачи, которые способны сейчас делать люди.

wtigga Mar 8 2017 at 05:26

а дальше, по сути, состоит в редакторской правке машинного перевода в специализированном софте.

CAT — специализированный софт. А «правка машинного перевода» это как раз учесть тех несчастных 80%, которые уже и сегодня без google translate переводить не в состоянии.

Ezhyg Mar 8 2017 at 09:53

Допустим, вы не знаете язык Хмонг, но после машинного перевода, даже получив корявенький текст, сможете его причесать и сделать удобоваримым, просто пользуясь контекстом, описанием, картинкой. Или вы предпочтёте изучить новый язык, но не воспользуетесь помощью «автомата»?

wtigga Mar 8 2017 at 10:58

А вы в такой ситуации себя называете «переводчиком»? :-)
Переводчику МТ может ускорить процесс, но не заменить его: нужно вычитывать и находить смысловые ошибки (это большой порок гугловской нейросети). Без знания языка вы не переводчик, а биологическая приставка-спеллчекер :)

alex_zzzz Mar 8 2017 at 15:43

Или замедлить. Часто быстрее написать с нуля, чем исправлять смысл, терминологию, а потом ещё и выворачивать наизнанку каждое предложение, чтобы звучало по-человечески, а не как явный дословный перевод.

eiennohito Mar 9 2017 at 04:06

Вот на что нейросетевые переводы не похожи, так это на дословный перевод.
Это больше к статистическим системам машинного перевода.

у нейросетей больше проблем с тем, что они «забывают» перевести некоторые слова или делают достаточно бредовые замены одних слов на похожие другие.
Нейросетевой перевод по сути дела — сэмпл из очень очень мощной языковой модели целевого языка, подкрашеный исходным предложением как «темой».

Ezhyg Mar 10 2017 at 06:27

Нет. Но и говорил я немного о другом. О помощи машины человеку.

Например, у вас использовано слово «учесть» вместо «участь», это вам так «помогла машина» (спеллчекер), возможная опечатка или вы сам? :)

wtigga Mar 10 2017 at 06:35

Спасибо Т9 (или как там это в телефонах теперь называется) :-)

3aicheg Mar 9 2017 at 03:42

Ага, а потом «то ли он шубу украл, то ли у него шубу украли»…

wormball Mar 8 2017 at 12:19

> CAT — специализированный софт.

Настоящие переводчики тоже его используют? https://xkcd.com/378/

wtigga Mar 8 2017 at 12:23

Я не знаю, что за коты у программистов, а у переводчиков это computer aided translations (всякие trados, omegat, memoq, crowdin и прочее)

Ryppka Mar 8 2017 at 11:23

В свое время довелось координировать команду добровольцев-переводчиков одного Linux-ориентированного сетевого ресурса. Ребята были замечательными, но переделывать за ними приходилось «почти все». В результате появилось стойкое убеждение, что главная проблема технического перевода не незнание языка оригинала, а незнание родного языка: как терминологии предметной области, так и трудности выразить мысль на родном языке. Сравните научно-технические переводы издательства «Мир» и современные. Хабр, кстати, очень хорошо иллюстрирует трудности, испытываемые IT-сообществом с овладением русским языком. ) Оно правописание не-ни и не-вместе с не-раздельно чего стоит))

teleghost Mar 8 2017 at 11:48

ditto: та же история с переводом брошюр, только убирать приходится не за добровольцами, а за «профессионалами», оставляющими за собой настоящие буреломы оригинальных оборотов с кучами отглагольных существительных и мерзких буквализмов; самое печальное, что потом на этих же, простите, говнопереводах и тренируют машины. Я не grammar nazi, просто нормальный язык люблю.

Настоящий ИИ — это когда машина пропарсит, например, книжку Норы Галь «Слово живое и мёртвое», после чего сама перестанет издеваться над русским языком:)

VovanZ Mar 8 2017 at 15:44

При переводе технических ресурсов на русский, есть ещё такая проблема: IT-специалисты читают очень много профессиональных текстов на английском, и знают английскую терминологию лучше, чем русскую.

Например, во многих языках программирования есть такая конструкция, как list comprehension. Я понятия не имею, как назвать её по-русски.

P. S. Википедия переводит list comprehension как списковое включение. Честно скажу, если бы я встретил такой термин в тексте, я бы не понял, что имеется ввиду.

dipsy Mar 8 2017 at 17:51

Мой любимый вариант, «runtime exception», как «исключительная ситуация времени выполнения». Поэтому, собственно, предпочитаю англ. вариант для такого рода литературы и такой же язык интерфейса в софте, понятнее, короче и нагляднее.

Andrey_Epifantsev Mar 9 2017 at 02:24

Вроде как «исключение» — стандартный термин. «Функция выбросила исключение» ну или «Функция сгенерировала исключение».

Ryppka Mar 9 2017 at 08:25

Мне больше всего понравилась «чрезплатформенная библиотека графики», которую пилили стартаперы — персонажи Microserfs"…

aapazhe Mar 8 2017 at 22:45

В начале этого века несколько лет работал на удалёнке переводчиком в питерской конторе, импортировавшей металлобрабатывающее оборудование. Штатный их переводчик была замечательная девушка, закончившая иняз с красным дипломом. Меня же ещё в СССР выгнали из девятого класса средней школы и английский я изучал сам (в основном как раз переводя различную документацию).

Но, в отличие от девушки, у меня были за плечами почти десять лет разнообразной работы на производстве, в том числе четвёртый разряд токаря-фрезеровщика.

Девушка ездила по переговорам и заграницам, я сидел дома в Великом Новгороде и пачками херачил инструкции к токарным станкам, ленточным пилам и кузнечным прессам с ЧПУ. Зарабатывали мы одинаково.

Так что да, во многих областях знание устоявшейся терминологии и умение обращаться с родным языком важнее идеального знания языка, с которого переводишь.

vanxant Mar 8 2017 at 22:52

На ин. язе, на самом деле, учат в-основном всякой научной фигне, мало применимой в реальной жизни. Ну, знала ваша девушка-переводчица древнеанглийский (у них там в 15 веке революция в языке была). Могла Шекспира в оригинале декламировать по памяти часами (а он не так далеко ушёл от древнеанглийского, и у него «тяжелых» слов, нигде кроме самого Шекспира сегодня не встречающихся, по три штуки на страницу). Дальше что? Как ей это могло помочь в переводе про станки?
На ин. язе готовят три типа специалистов: учёных-лингвистов (в идеальном случае), художественных переводчиков классики (если повезёт), училок и репетиторов для школы (обычный путь). Для научно-технического перевода нужно идти в соответствующий научно-технический вуз. Я, например, учился на переводчика, внезапно, в Бауманке.

zomby Mar 9 2017 at 21:57

Два ассенизатора, молодой и старый идут прочищать очередной засор.
Подошли к канализационному колодцу и старый мигом в него нырнул.
Выниривает через полминуты, воздух набрал, и говорит:
— Дай ключ на тридцать два! Опять нырнул.
Выниривает через минуту, кричит:
— Дай ключ на восемнадцать! — и опять ныряет в дерьмо. Проходит еще пол-минуты, выниривает весь в дерьме, устало вытирает лоб, лицо и говорит
молодому:
— Учись, сынок, пока я жив, а то так и будешь всю жизнь ключи подавать.

teleghost Mar 8 2017 at 11:38

база ООН отличается точнейшей передачей тончайших оттенков смысла и идеальным соответствием литературным нормам

я не знаком с документацией ООН, но ожидаю в ней достаточно сильный «юридический» уклон, это так?
если да, то:
1) это литературно-корректный, но не «литературный» в широком смысле текст;
2) в производных автопереводчиках ожидается такой же юридический уклон;
3) в плохом пределе «юридический язык» может принимать уродливые формы канцеляритов, на следы которых я порой напарываюсь в автопереводчиках (увы, примеры тут не могу привести)

про развитие ИИ добавлять ничего не буду:)

vanxant Mar 8 2017 at 15:47

Под литературными нормами понимаются расстановка запятых, корректное спряжение падежов и просто правильное употребление слов и оборотов. Понятно, что документы ООН это не художественные тексты, поэтому ждать от них «литературных достоинств» и не следует.

river-fall Mar 9 2017 at 12:09

«корректное спряжение падежов» :)

Wizard_of_light Mar 8 2017 at 12:42

ИМХО, опасность не в том, что профессии исчезнут, а в том, что технологии нивелируют разницу между новичком и середнячком. Произойдёт, скажем метафорически, «размывание профессионального ландшафта» — будет ровное поле, над которым торчат отдельные скалы высокого мастерства. Проблема в том, что новичку при этом к вершинам мастерства тянуться нет смысла — усилия по самосовершенствованию не будут давать результата, пока не превзойдёшь уровень поддержки. А уровень поддержки уже довольно высок, и будет всё выше.
А так, конечно, все будут при деле. Секретарь, которому спелчекер ворда тся/ться поправляет. Инженер, которому -CAD не даёт ломкую деталь спроектировать. Водитель, которому ABS не даёт юзом пойти. И переводчик, который слегка поправляет текст после гугль-транслейта.

125kg Mar 8 2017 at 15:44

Товарищ уже 7 лет работает в области переводов, начинал с «правки машинного перевода» на фриансе, после был корректором, сейчас старший переводчик достаточно крупной конторы занимающейся экспортом, теперь по необходимости работает как синхронист (в настоящее время в Турции, впереди Австралия), так он утверждает, что одинаковый перевод может быть только на стандартизированных документах (а-я запрос на визу или какое стандартное прошение), а даже сухой технический текст каждый переводчик переведет по сути одинаково, но стилистически совершенно по разному, а толковый переводчик-синхронист, по его мнению это не только знания, но и врожденный талант (себя как синхрониста он считает ~~говном~~ достаточно слабым), это как писать умеет каждый, некоторые даже без ошибок, а вот написать толковую книгу или статью — это дано не каждому, хотя все средства имеются.
Так, что пока не будет плагина творчества, толкового переводчика из нейросети не поучится.

we1 Mar 8 2017 at 20:15

Кстати, переводы статей тоже не такое простое дело. Ведь они могут быть научными. Или, еще хуже, тексты по искусству (где действительно, не все термины в русском устоялись).

pda0 Mar 8 2017 at 20:25

Я бы не боялся ИИ в этой сфере и не ждал бы прогресса в литературном и синхронном переводе. (В том числе и on fly переводчиках, позволяющих напрямую говорить с иностранцами.) Работу-то свою они делать будут, но без сильного ИИ, понимания сути и культуры говорящих, перевод, по моему мнению начнёт испытывать эффект зловещей долины, аналогичный таковому у андроидов. Людям будет не по себе от предельно правильных, но «мёртвых» предложений. Пользоваться будут, но исключительно по необходимости.

darthmaul Mar 8 2017 at 21:35

Учитывая то, что хороший синхронист — специалист редкий и высокооплачиваемый, то ИИ с идеально правильными «мёртвыми» предложениями будет пользоватся хорошим спросом. Естественно, для прессы ручной перевод незаменим. Вопрос тут другой: насколько реально создать такой ИИ? Возможно ли без сильного челевекоподобного ИИ выполнять задачи, не имеющие формального математического критерия «правильности» исполнения? Я понимаю, что существует нечёткая логика, но понятие «граммотно составленое предложение» в виде набора функций принадлежности представить сложновато.

Orcus13 Mar 8 2017 at 21:08

Конечно, для очень качественного перевода необходимо «понимание» текста, что бы это ни значило. Но ведь даже люди неслабо тупят на таких задачах. Причем у большинства людей есть серьезный недостаток — один язык для них неродной. Тогда как у нейросетей такого дефекта нет.

Но с таким категоричным утверждением «Почему переводчикам не стоит бояться нейросетей» — я не согласен. Думаю, выбирать сегодня себе карьеру переводчика на десятилетия — не самый перспективный вариант в большинстве случаев.

Поверьте, нейросети (или другой вариант ИИ) проскочат разницу между плохим переводом и хорошим в считанные годы — стоит только приложить к этому немного средств. А потенциальный рынок огромен, — это десятки и сотни миллиардов долларов. И чем лучше будет становиться перевод, тем быстрее будет расти качество.

hidalgo007 Mar 8 2017 at 22:02

Думаю, автор немного заблуждается. Ситуация точно отразит произошедшее в цифровой фотографии — не такие уж и плохие «мыльницы» были вытеснены убогими камерами в телефонах, и даже сегмент топовых зеркалок находится под их прессингом. Вот точно так же серенькие машинные переводы, как только достигнут уровня минимальной удобочитаемости, вытеснят на обочину всех переводчиков, кроме «топовых». Конечно, процесс будет размазан во времени, но всё придет именно к этому. Я сам немного занимаюсь литературным переводом, и знаю, что в этой работе так много тонкостей и нюансов, что ИИ очень и очень нескоро сможет овладеть этим искусством, но вот весьма формализованные тексты инструкций, технических описаний, юридических документов ИИ освоит очень быстро. Так что переводчикам начального и среднего уровня придется вскоре задуматься о смене рода занятий.

vanxant Mar 8 2017 at 22:20

Такое ощущение, что статью вы не читали.
Нижний ценовой сегмент огорожен бюрократией. Бюрократам не нужен перевод документа, им нужна бумажка с мокрой печатью. А что в ней будет написано — часто вообще неважно. Вот придумала какая-то начальница среднего звена, что для такого-то бюрократического действия должны быть такие-то бумажки по списку, этот список высочайше утвердили — вот все и выполняют.
Вы пишете про человеческую логику, а я вам про аппаратную.
И на ваш пример человеческой логики про фотоаппараты у меня есть контр-пример логики аппаратной.
Лет 20 назад все надеялись, что компьютеры и приносимые ими «безбумажные» технологии приведут к сокращению потребления бумаги и разорению бумажных фабрик.
Ну так оно в общем и произошло, везде, кроме бюрократии.
Раньше все документы писались вручную (ну ок, на пишущей машинке, но всё равно почти вручную). Машинистка (ха-ха какое слово) могла сделать 2-3 копии через копирку (помните такую?), но только одновременно с изготовлением основного документа. И всё.
Но с развитием электроники потребление бумаги бюрократами выросло не в разы, а на порядки. Потому что стало возможно требовать «а дайте мне ксерокопию того, того и того документа». И это всё помимо оригиналов. Раньше чиновник писал в журнале «документы проверил, число подпись». Сейчас он прикладывает в дело стопку копий. Больше бумаги — чище попа (с).
То же самое будет и с переводами. По мере удешевления их просто будут требовать всё больше и больше. Переводчики нижнего звена превратятся в операторов гугл-транслейта, которые распечатывают машинный перевод и пишут на нём синей ручкой «перевёл Иванов, число, подпись». И ставят мокрую печать.

river-fall Mar 9 2017 at 12:15

В Германии, стране знаменитой любовью к бюрократии, уже во многие учреждения можно отправлять сканы документов или использовать электронные системы учёта через интернет и авторизацию по карточке удостоверения личности.

Бумаги, конечно, по-прежнему немало, но значительная часть современного бизнеса называет себя «paperless company» на деле. Принтеры, конечно, есть, но используются крайне редко. Во всех переговорках висят экраны вместо распечаток, и т.д.

UFO landed and left these words here

Ezhyg Mar 9 2017 at 17:27

Чтобы подписать электронный документ цифровой подписью, печатается бумажка, на которую ставится обычная подпись и печать… :(

UFO landed and left these words here

Igor_34_rus Mar 9 2017 at 16:16

Нижний ценовой сегмент огорожен бюрократией.

По моему ничего не мешает ввести или лицензировать машинный перевод.
Просто у натариуса будет печать "переведено ИИ-Перводчик1, в моём присутствии", так же как сейчас делают ксерокопии. Положил на сканер, распечатал, поставил печати… ну и оплату взять не забыл.
А это выгодно всем и разработчикам и бюрократам(цены можно и поднять, а человеку ЗП платить не надо).

er1 Mar 8 2017 at 22:22

У переводов есть серьёзное отличие от цифровой фотографии, что автор и указал — это требования законодательства. Пока они допускают только человека, причём не первого попавшегося. И менять это никто не будет, ведь если машина допустит ошибку в переводе, то кто будет виноват?..
А там, где переводы не регулируются законом (например, в журналистике), там и машинные переводы вытеснят людей. Что автор и написал.

beegoist Mar 10 2017 at 19:35

Ничто не мешает заменить 20 «рабов»-переводчиков 1 нейросетью. Подпишет бумажку 1 дежурный «переводчик»-подписыватель, заверит (и ответит за качество) — компания.

UFO landed and left these words here

vanxant Mar 9 2017 at 00:08

Вот на счёт Италии, довелось мне там жить и работать. Вы упускаете самый очевидный вариант, это когда оригинал на итальянском изначально г… но.
Ну вот есть Марио, он реально крутой конструктор и сделал что-то качественное. Но! Даже если он в принципе умеет связно писать, никто никогда не заставит его заниматься написанием документации. «Чукча не писатель», да.
Для документации есть условная Люченца. Писатель она может и хороший, но в инженерном деле ни в зуб ногой (иначе бы не занималась писательством). Она, конечно, чего-то там нахваталась за годы работы, но это фрагментарные знания. И вот она пишет полную фигню, совершенно не понимая, что важно, а что нет.
Потом этот её труд таки заставляют прочитать Марио. Он матерится и перечёркивает ту половину, где содержатся фактические ошибки. Люченца переписывает, процесс повторяется, но не до «победы», а только до наступления дедлайна (который обычно уже прошёл к моменту сдачи работы Марио).
А теперь помножьте это на разницу в диалектах. Ну вот у нас три диалекта — русский, белорусский и украинский. А у них в Италии почти в каждой области свой. Причём, допустим, неаполитанский итальянский ближе к барселонскому испанскому, чем к римскому итальянскому. То, что мы знаем как литературный итальянский — это миланский диалект, просто радио и ТВ в Милане появилось раньше, чем в остальной Италии.

sim31r Mar 8 2017 at 22:53

Банальные примеры — слова «негр» и «инвалид»

В принципе нейросеть может компенсировать смысловые оттенки теоретически. В случае слова «негр» в России причина редкость в чернокожих людях. В России можно годами не встретить чернокожих. Поэтому количество слов сопоставимых с чернокожими редуцировано до минимума. И наоборот, у чукчей есть слова соответствующие десяткам оттенков снега, но может вообще не быть слова аналогичному слову негр. В южных странах Африки всё точно наоборот.

Этот негр с ограниченными способностями. This nigger with disabilities.
Этот негр инвалид. This negro is disabled.
Это чернокожий человек или афроамериканец. It's a black man or an African American.

Интересно, если для ИИ поставить обратную задачу, он сможет создать единый планетарный язык, на основе карты смыслов всех языков? Можно оптимизировать язык по точности, лаконичности, гибкости. Когда слова создаются на основе простой логики, общих корней. На примере знакомых нам языков, можно сделать вывод, что логика выражения мыслей может быть практически любой, мозг подстраивается под самые странные языки, возможно во вред способности мыслить. И под сомнением, что один из старинных устоявшихся языков более оптимален, похоже на набор костылей, исключений на исключении, потому что так сложилось исторически. Искусственные языки тоже не то, они придуманы людьми и тоже далеки от оптимальности. Оптимальный язык можно сделать на основе карты смыслов всех текстов человечества, вот этот язык будет точкой лингвистической эволюции.

3aicheg Mar 9 2017 at 00:49

Такие переводчики могут не бояться ИИ: никто никогда не доверит такую ответственность машине.

Andrey_Epifantsev Mar 9 2017 at 02:33

Нельзя ли подойти к задаче автоперевода с другой стороны: создать ограниченные формализованные версии языкок с фиксированным списком конструкций и слов специально для технических текстов. Тогда их перевести будет не сложнее чем XML преобразовать.

А то я смотрю на MSDN и его автоматические переводы статей на русский и возникает такая мысль. Там ведь язык очень сильно ограничен. Если формализовать языки, на котором пишуться тексты в этой базе знаний и сделать соотвествующую провреку соотвествия текста правилам, чтобы автор сразу писал текст укладывающийся в ограничения, то можно автоматом иметь статьи сразу на всех языках.

UFO landed and left these words here

vanxant Mar 9 2017 at 04:12

Те кто участвует в общении на высоком экономическом или политическом уровне, должны

Кому должны? Товарищ Хрущёв человека в космос отправил и взорвал царь-бомбу. Кому он что должен был? Какой-такой «международный» язык? Большая часть планеты русский учило, чтобы кредит у СССР получить.

UFO landed and left these words here

Khayrullin Mar 9 2017 at 04:34

Внедрение все более и более сильного ИИ в перевод увеличит лишь количество отсебятины, привносимой в изначальный смысл. Так как наиболее сильный интеллект, имеющийся на планете на сегодня — человеческий, именно так и поступает. Ибо он уже «автор», «он так видит». Нет ни одного переведенного человеком произведения, лингвистически более сложного чем лозунг из одной строки, не подвергавшегося критике за перевод. Если перевод будет «юридически» точным, то он не будет передавать оттенков смысла, игру слов, задумку автора. Например, он может использовать тоже слово через три страницы, или даже в другой (еще не изданной) книге, что бы напомнить о чем-то читателю — а машина съест его, «передав смысл фразы более точно в данный момент». Только вот литературу мы читаем не для передачи смысла фраз, а для передачи смысла всего произведения, или даже что бы ознакомиться с мировоззрением автора, с привязкой к конкретной серии книг, статей, неизданных публикаций.

При этом не подумайте, что я против машин. Я только за — чем больше профессий они убьют, тем будет лучше. Даже если человек как вид исчезнет — это нельзя будет воспринимать как катастрофу, если «идея» сохранится (вернее разовьется, так как на сегодняшний день «идея» у нас довольно слабая) в другой физической форме.

Мне кажется, что переводчики не нужны (в перспективе). И не потому, что ИИ разовьется, а потому, что в идеале следует переходить на один универсальный язык. И это произойдет, хоть и не без скрипа. Уже сегодня многие профессиональные области настолько привязаны к конкретному языку, что проще изучить его, чем всю жизнь мучаться с переводами.

Давайте будем смотреть правде в глаза — количество контента (научного или развлекательного), создаваемого на английском языке, уже на порядок превосходит количество на русском. Для более мелких языков — на два-три порядка меньше чем на русском. И этот разрыв увеличивается. Сегодня носители русского языка всё чаще чувствуют себя находящимися в информационном вакууме, который вынужденно заполняется низкосортной информацией производимой телевидением. Еще два-три десятка лет (в лучшем случае), и мы (носители русского языка) сможем почувствовать себя в роли ненцев с их 10 словами для обозначения видов снега. Вроде как и забавно, но применить в современном мире нельзя.

fpir Mar 9 2017 at 11:35

10 слов для снега(на самом деле более 50) -это не просто 10 слов, это особенности восприятия и мышления. И если со снегом мы не можем почувствовать всю разницу(в снеге мы и сами неплохо разбираемся), то как Вам 10 названий цвета листьев? И самое интересное, что мы(условные европейцы) не способны различить эти 10 разных цветов, даже когда видим их вместе. И с точки зрения видового разнообразия, и с точки зрения культуры-не хотелось-бы терять эти различия.

Khayrullin Mar 9 2017 at 21:16

Согласен по всем пунктам, но мир меняется, и меняются особенности восприятия и мышления.

С точки зрения культурного разнообразия и племена каннибалов терять не хочется. Пока они где-то там в джунглях, конечно.

Но разводить их искусственно никто не станет, мешать их вымиранию — тоже (ну кроме совсем упоротых). Преимуществ они не имеют, значит вымрут, как конквистадоры или древние египтяне. Хочется вам этого или нет. Если же они, вдруг, начнут развиваться, как, допустим, сторонники радикального ислама — их истребят, как истребили не одну тысячу культурных прослоек (сильный слабого, справедливости тут нет). А ведь тоже было разнообразие.

Мы будем и дальше двигаться в эту сторону, и это не хорошо и не плохо — это другой, совершенно новый уровень развития. Человечество на сегодняшний день, это своего рода моно-организм, имеющий моно-культуру. Вы ведь тоже состоите из миллиардов клеток, не всегда согласных между собой, и посещают вас совершенно разные мысли, противоречивые и порой — бредовые. То, каким мыслям и действиям вы даете ход, а каким нет — определяет вас как личность. Точно так же можно «определить личность» человечества, на основе того, чему оно позволяет существовать, а чему — нет. И здесь «нам» как «личности», безусловно есть к чему стремиться.

Например, мы недавно победили рабство. Кто-то скажет что нет, но это лишь один из этапов, не всё сразу. По мне — это положительное культурное достижение. Разнообразие организму не нужно, если оно не представляет какой-либо функции. Есть у нас на теле и откровенные «раковые опухоли», которые тянут нас назад, не дают развиваться, и хорошо, если они будут «удалены» с тела человечества.

Я воспринимаю языковой барьер сегодня как огромный груз, который не позволяет человечеству идти вперед еще быстрее. Это как нарушение обмена веществ. Есть вон у ненцев умный «Вася», который мог бы открыть лекарство от рака, но вместо этого он вынужден пасти оленей, потому что ему с его языком ни в университет поступить, ни статью научную не прочитать. Образ мышления хороший, конечно, если ставить своей целью разведение оленей. Но на большее расчитывать не приходится.

И дальше ситуация будет «ухудшаться». Да, крупные языковые группы, в том числе, и возможно русская — будут долго двигаться по инерции, но ведь было бы куда более правильно сбросить этот груз и начать уже ускоряться, нет?

fpir Mar 10 2017 at 11:10

Тут трудно сказать однозначно. Длительный период, когда существовал «дефолтный» язык уже был, и особых прорывов это не переносило, до тех пока не стали появляться переводы на «дикие» языки. Это позволило включаться «аборигенам» в сферы, обсуждаемые на этом «дефолтном» языке, на подготовительном уровне, и далее уже учить его, если им было что сказать. Приходить в эту сферу с другой культурой, а не со сформированной этим «дефолтным» языком. Я про латынь, если что.
Больше тысячи лет вся Европа получала образование на латыне и это делало всю Европу единым кругом общения и единой культурой, но прорывов в науках не происходило. Не знаю что первично, а что вторично. но когда перестали считать английский недоязыком, а французкий языком для лёгких бесед и появились переводы научных(или научно-популярных работ), тут-же появился и расцвет науки. И хотя учёные по прежнему чаще общались на латыне, процесс почему-то пошёл в обратную сторону, нежли обозначили Вы.
Ведь «ненец Вася», он-же не сферический в вакууме, он продукт своей культуры и своего окружения, и именно понимание структуры 50 «сортов» снега натолкнуло его на лекарство от рака. Конечно знание биологии в этом вопросе намного важнее. Но пока мы не составили детальный алгоритм гениальных научных открытий приходится допускать, что умение отличить 10 оттенков листвы одного дерева является неотъемлемой частью открытия лекарства от рака.

Ryppka Mar 10 2017 at 11:24

Время собирать и время разбрасывать, ничто не ново под луной…

UFO landed and left these words here

Khayrullin Mar 9 2017 at 21:37

А я за культурное, языковое и профессиональное разнообразие. Тот мир, который Вы описали, можно охарактеризовать одним словом — бедный.

Современный мир более бедный культурно, чем мир двухтысячелетней давности? Несомненно. Истреблены тысячи профессий, языков и народностей. Есть альтернатива? Да, кто-то считает что поддержание искусственной «жизни» в том, что уже давно мертво это выход. Однако, практика показывает, что это лишь уход от реальности, и «природа», как вы выражаетесь, возьмет свое. Ваше так называемое «разнообразие» не нужно людям, и более того, оно не нужно человечеству. Оно тянет нас на дно. Все, что оно могло дать, уже записано, сфотографировано, и будет использоваться в качестве методического материала. А бегать по улицам и мешать — не надо.

И это хорошо! Сама природа говорит: «Создавайте своё! Индивидуальность — необходимый элемент прогресса и эволюции». Только мы не слушаем, производя и потребляя, в основном, дженерик-фильмы, дженерик-музыку и дженерик-литературу.

«Природа» это по вашему какой-то отдельный организм или божество? Если мы потребляем что-то, значит мы чувствуем необходимость в этом. Если это нас убьет, значит туда нам и дорога. Это эволюция мемов. Это естественный процесс, и мешать ему нет смысла. Если вы чувствуете свое родство с какой-то иной меметической группе, то ваше личное вымирание не помешает развиваться этой группе. Относитесь к этому философски — вам не обязательно продолжать генетическое родство для передачи своей культуры и идей. Более того, мы уже знаем что это бессмысленно, так как концентрация ваших генов в ваших потомках тает в прогрессии.

Конечно, ведь язык — зеркало народа. Не секрет, что наиболее развитые народы являются носителями более сложных и богатых языков. Так что проблема не в русском (или ещё каком) языке, а в нас самих и в том, куда мы движемся.

Мы движемся именно туда — на задворки человечества. И как то вы себе противоречите — раз язык умирает, значит он не дает нам развиваться лучше других, значит — проблема в нем? Вернее в нас, но ведь язык не существует без его носителя. Но как мы станем сложнее, если язык не дает нам такой возможности? Разовьемся постепенно до более сложной культуры? Ну так это будет уже не русский язык. И более того — нам такая возможность была предоставлена. Мы проигрываем эволюционную гонку. Это хорошо или плохо? Сама природа говорит нам — ваш язык отстой, и культура ваша не нужна.

UFO landed and left these words here

lazil Mar 9 2017 at 10:58

А можно подробней про тачсоты/querquency?

amarao Mar 9 2017 at 15:42

И да и нет. Человек, задача которого перевести с одного языка на другой документ, не обязательно должен «владеть тонкостями языка», есть масса случаев, когда это избыточно. Например, если компании нужно перевести руководство пользователя к чайнику, то достаточно просто не делать грубых ошибок.

Компьютеры подъедают рабочие места людей низкой квалификации. Людям с высокой квалификацией бояться нечего.

LazyTalent Mar 9 2017 at 16:14

Глава Google Translate Барак Туровски — о том, как сервис переходит на нейросети

dimitrion Mar 9 2017 at 16:15

Такие переводчики могут не бояться ИИ: никто никогда не доверит такую ответственность машине

Смешно читать. Автопилот УЖЕ доверяют машине, а эта ответственность намного выше

UFO landed and left these words here

dimitrion Mar 9 2017 at 21:29

Да, у автора довольно буйная фантазия.

Одна ошибка переводчика при передаче даже не смысла — эмоций, может привести, в самом худшем случае, к атомной войне

Не заметил, чтобы началась какая-то война, когда Дутерте называл Обаму сыном шлюхи. А вы тут про непереводимые оттенки эмоций фантазируете.

vanxant Mar 10 2017 at 06:08

Расскажите про это Саддаму, который был уверен, что на Кувейт напасть можно.

dimitrion Mar 10 2017 at 07:06

Не думаю, что это было следствием ошибки в переводе

Vlad_Bercut Mar 10 2017 at 10:12

Об Искусственном интеллекте в переводе

Скажите пожалуйста: с каких это пор профессионалы-переводчики спорят БЕСПРЕДМЕТНО? Где обоснованная аргументация и ссылки на источники? Где культура научной полемики? Не говоря уже о «сыне шлюхи» и прочих ЭКСТРАЛИНГВИСТИЧЕСКИХ факторах.

Предмет дискуссии — это прежде всего новые разработки Google Traтslate.
Возьмем ту область, в которой Google должен просто быть идеален: формализованный, официальный язык.
Я ввожу статью из стндартного договора на английском для того, чтобы проверить, как Google справится с грамматикой и синтаксисом:

«The Supplier shall be entitled to extension the Project Implementation Plan for completion only in case it has delivered to the Сustomer a notice of the circumstances occurring on the Сustomer’s side, which affect the Project Implementation Plan, and additional payment to the Supplier due to such extension shall be limited to the amount which would have been due if the Supplier had taken all reasonable steps to minimize these effects of the delay.»

На выходе мы видим:

«Поставщик имеет право продлить План реализации проекта до тех пор, пока он не предоставит Заказчику уведомление об обстоятельствах, происходящих со стороны Заказчика, которые влияют на План реализации проекта, и дополнительную оплату Поставщику в связи с таким продлением Должна быть ограничена суммой, которая должна была быть выплачена, если Поставщик принял все разумные меры для минимизации этих последствий задержки.»

Увы, результат анализа и перевода грамматической и синтаксической структуры неутешителен. Нереальное условие не передано адекватно с английского на русский, налицо несогласованность подлежащего и сказуемого («доплату… ограничена») синтаксическая структура текста — могло быть и лучше.

Как же Google справляется с терминологией? Вводим просто заголовок статьи:

«Equipment and Hardware Requirements»

Результат:

«Требования к оборудованию и оборудованию».

Что можно сказать? Уж «аппаратное обеспечение» или «аппаратуру» («hardware») можно было бы ввести в словарь.

Вы говорите: 5-6 лет, и все свободны? Все потребности в переводе будут покрыты Искуственным интеллектом? А как насчет постоянного появления новых реалий, терминов, которые, как снежный ком, нарастают по экспоненнте именно в результате небывалого технического прогресса?
20 лет — как минимум, если мы говорим именно о КАЧЕСТВЕ и финансовой и моральной ОТВЕТСТВЕННОСТИ за каждое слово со стороны переводчика, которую никто не отменял при создании юридической и технической документации в рамках многомилионных договоров.

dipsy Mar 10 2017 at 11:22

насчет постоянного появления новых реалий, терминов, которые, как снежный ком, нарастают по экспоненнте именно в результате небывалого технического прогресса?

Тем более, человеку будет за этим не угнаться, а машина в реальном времени будет свой скилл прокачивать, по мере появления новых реалий etc.

ОТВЕТСТВЕННОСТИ за каждое слово

формулируйте однозначно и конкретно, не имейте дело с мошенниками, пытающимися за счет запутанных формулировок или мелкого шрифта на полях что-то себе выгадать.

Vlad_Bercut Mar 10 2017 at 12:28

1. Прежде чем машина сможет прокачать «свой скилл», эти понятия и реалии вводит человек и человек же им дает толкования, причем эти толкования постоянно меняются по мере изменения и доработок.
2. Ответственность переводчика — максимально точно передать на целевой язык сообщение оригинала так, чтобы в результате трансформации не потерялся ни один элемент важной информации. Все остальное — экстралингвистические факторы и демагогия. Текст есть текст — неважно, кто его написал. Также и врач делает операцию независимо от того, кто лежит на операционном столе. Есть единственный критерий — профессионализм.

Именно профессионал в первую очередь ответил бы по существу. Где конкретные примеры в доказательство профессионального перевода Google Tкanslate? Чтобы конкретным текстом опровергнуть мои примеры и выводы?
Так неинтересно.

Vlad_Bercut Mar 10 2017 at 12:47

И еще одна мысль.
Я бы сказал аксиома:
пока память переводов пополняется на 80% дилетантами — работа профессионалам всегда будет.
А дилетанты или просто ленивые люди тоже будут всегда. Делайте выводы!

Ведь это невозможно без слез видеть, какие смысловые и стилистические ошибки допускаются без учета контекста и ситуации, которые чаще всего уникальны.

sdiz Mar 11 2017 at 08:33

Буквально на днях делал заверенный перевод кандидат кого

sdiz Mar 11 2017 at 08:37

Буквально на днях делал заверенные переводы дипломов о высшем образовании и кандидатский. Только через два дня, когда сканировал, обнаружил чудовищную ошибку: из кандидата физ.-мат. наук я стал CANDIDATE чего-то там, вместо PhD. Теперь думаю, идти ругаться или ну его, все равно ничего не докажу.