Pull to refresh

Comments 30

область не стоит на месте и предлагаются новые идеи


Я как-то уже приводил здесь пример машинного перевода 50х годов в сравнении с современным гуглопереводом того же самого текста.
Конечно, скорость перевода и его доступность резко выросли, но качество осталось на том же уровне.

(кстати, большая часть переводных статей на этом ресурсе самым явным образом доказывает, что машинному переводу еще есть куда развиваться дальше )
Заголовок спойлера
Somehow I have already cited the example of the machine translation is 50s in comparison with modern gugloperevodom the same text.
Of course, the transfer speed and its availability increased dramatically, but the quality remains at the same level.

(By the way, most of the translated articles on this resource thus clearly shows that the machine translation there is much more to develop further)
Конечно, скорость перевода и его доступность резко выросли, но качество осталось на том же уровне.

Английский язык очень специфический относительно русского языка, например фраза «make friends» можно перевести как «делать дружбу» или «совершать дружбу» а не «заводить дружбу», это конечно простая фраза и гугл переводит ее правильно, но все же подобных фраз десятки тысяч и вряд ли удастся исправить эту проблему.
Английский язык очень специфический относительно русского языка


Ну, вот этот результат поиска однозначно свидетельствует о том, что поисковая система Гугла правильно распознала значение слова «гуглперевод»:

image

найдя в этом составном слове «перевод».
Почему же переводчик от того же Гугла не смог сделать точно такое же действие?
(это, кстати, характерно и для других случаев, когда переводится составное слово — переводчик гугла иногда не способен распознать составные слова на английском языке)

Эм, вот у меня, например, гуглоперевод выдал такой результат:


I once already gave here an example of a machine translation of the 50s in comparison with modern Google translation of the same text.
Of course, the speed of translation and its availability have increased dramatically, but the quality has remained at the same level.

(by the way, most of the translated articles on this resource most clearly prove that machine translation still has much to develop further)

Так что всё распознаётся :)

Эм, вот у меня, например, гуглоперевод выдал такой результат:


у нас с вами разный гуглперевод:
image

Я с сайта переводил:


Я верю.
Но и там и там, по идее — одна система.

(кстати о системе)

«4.4. The software is protected by laws of Russian Federation and international copyright treaties»

Гугл, вне контекста QTranslate — знает только одну QuestSoft.

Но как-то сомнительно, что QTranslate — это ее разработка.

Ну, судя по всему, гугл через API, которым пользуется QTranslate, отдаёт перевод через более старую версию алгоритма (поскольку не вызывает сомнения тот факт, что на сайте будет использоваться самая новейшая версия, а с сайта и через API перевод различается, очевидно, что перевод через API использует более старую версию с качеством похуже).

Извините, 15 лет занимаюсь проблемой создания машинного перевода с русского на тюркский и обратно. И, такое ощущение, что мы с Вами не коллеги. Написать статью о машинном переводе с/на русский без единого упоминания слов: Зализняк, AOT, Яндекс — для меня — шок. Мы с Вами живём в ортогональных вселенных. В любом случае — большое искреннее спасибо за статью, ибо, на самом деле, решение задачи — в комплексном анализе, симбиозе аналитического и статистического подходов.
стоит начать с того, что я не являюсь специалистом по машинному переводу непосредственно, я им занимался существенно меньше, чем другими задачами обработки естественного языка; но да, я приверженец статистического подхода, на мой взгляд использование словарей и сложных автоматов для словоизменения — это излишне, все может быть реализовано статистически; само собой не претендую на абсолютную истину, но в данный момент развитие области идет в направлении статистического обучения

к слову, в нашем курсе мы стараемся дать полную картину и те подходы, которые вы упоминаете, там тоже описываются
UFO just landed and posted this here
Вряд-ли можно доказать это математически, язык это такая аморфная структура, которую человек не может объяснить. У лингвистов есть несколько теорий, некоторые вполне себе рабочие, но все держится на каких-то костылях, есть пробелы в логике.
Взять, например, идеи Ноама Хомского. Можно для многих ситуаций сделать универсальные парсеры и генераторы, вроде-бы даже перевод неплохой получится. Но проблема в том, что большая часть языковых конструкций определяется временем и культурой. Если что-то в языке строго описать и захардкодить, то через десяток лет оно развалится из-за того, что язык, контекст, культура и носители постоянно меняются.

Тут только два пути — либо ждать, когда все языки сольются в один, либо создать сильный ИИ (второе как-то реалистичней).
Тут только два пути — либо ждать, когда все языки сольются в один, либо создать сильный ИИ (второе как-то реалистичней).


Или ждать появления устройств, способных читать мысли (это как-то реалистичнее второго варианта)

Давно известен третий путь: вспомогательный международный язык — эсперанто. Он обладает таким важнейшим свойством: позволяет переводить на него почти дословно (для большинства языков Европы). Т.е. хороший посредник при переводе. Кроме того, относительно простая грамматика и логичность, в сочетании с выразительностью/гибкостью. Обученные роботы могли бы выразить и понять намного больше при использовании эсперанто.

(для большинства языков Европы)


Это и есть его главный недостаток.
(Центр мира сместился в Юго-восточную Азию, но мы этого еще не осознали).
Заголовок спойлера
image

Нет. Эсперантисты из восточных стран осваивают эсперанто намного быстрее, чем европейские языки (эсперанто близок им по способу словообразования, например, т.е. некоторая грамматическая близость есть; кроме того, он прост и логичен). Это они сами пишут.

Эсперантисты из восточных стран осваивают эсперанто намного быстрее


Тут ключевое слово — «эсперантисты». Т.е. энтузиасты этого языка.
А, например, мои знакомые лингвисты-профессионалы считают, что китайский им выучить легче.

О! Назовите, пожалуйста, одного из них. Это будет исключительный пример. Обычно лингвисты знают базовый эсперанто (в программе есть), а многие полиглоты советуют с него начинать (поскольку там международные корни и потом остальные языки легче выучить).

Назовите, пожалуйста, одного из них


Ближайший сидит в соседней комнате.
(не полиглот, но знает английский, немецкий, французский и шведский. Сейчас как раз учит китайский :)

Странно. Разговаривал пару месяцев назад с математиком Мартыновым, который знает 15 языков (включая китайский (мандарин)). Он сказал, что эсперанто настолько лёгкий, что он его играючи давно выучил и до сих пор помнит. Потом выдал речь на правильном эсперанто.

Китайцы пару лет эсперанто преподают в паре университетах и нескольких школах. Издают эл. журнал на эсперанто, переводят Курьер ЮНЕСКО на эсперанто (с согласия ЮНЕСКО, разумеется).

Разговаривал пару месяцев назад с математиком


Это другая сфера.
У юристов, например, своя. Где и на родном языке есть тонкости в значении слов.

Было важно: он полиглот и его оценка простоты эсперанто
(а китайский по его мнению намного сложнее; корейский ещё сложнее). Меня очень удивило мнение Вашего полиглота. У меня ещё одина знакомая-полиглот (8 языков) считает китайский сложным для нее языком.

а китайский по его мнению намного сложнее


Конечно. Но тем интереснее его изучать. Тем более — с перспективой поехать в Китай на стажировку (пока сорвалось, по известным событиям).

Кстати, попробуйте изучить шведский, не зная до этого немецкого :)
А вот знание эсперанто вряд ли сможет в этом помочь.

И от темы отвлеклись и не убедили.

И от темы отвлеклись


Уточню — знание эсперанто не помогает в изучении натуральных языков, но знание натуральных языков помогает в изучении эсперанто.

Сами проверяли :). Есть несколько исследований, Google в помощь.

Очевидным недостатком данной модели является также то, что для подготовки корпуса, в котором сделано выравнивание, требуются очень значительные усилия, профессиональные переводчики должны не просто перевести текст, но и указать, какое слово является переводом какого.

А как же автоматическое выравнивание? Собственно решение от IBM
fast align — отличная штука, но он был сделан в 2013 году, а IBM Models — это на 20 лет раньше
Sign up to leave a comment.