wtigga May 23 2017 at 11:40

OmegaT: переводим с помощью компьютера

13 min

32K

SoftwareLearning languages

Tutorial

+27

Comments 29

CarambaPirat May 23 2017 at 12:08

Когда-то переводил статью несколько лет назад. Вроде как программой OmegaT. Пробовал разные вещи, но именно двух-страничный режим с синхронизацией мне помог. Но по-моему я пользовался дополнительно программой словарем, хотя могу ошибаться.

wtigga May 23 2017 at 12:08

«Двухстраничный режим»? Вероятно, это было что-то другое :-)

g8tguy May 23 2017 at 12:27

Ой как же это удобно — особенно для вдумчивых переводов! В качестве десктопного переводчика еще очень помогает GoldenDict с толковыми словарями EN-EN — 谢谢

wtigga May 23 2017 at 12:27

Тоже GoldenDict пользуюсь, надёжнее чем онлайн-словари.

hmpd May 23 2017 at 13:32

Статья отличная. Спасибо!

1. В опросе не хватает пункта «SDL Trados»: SDL ведь купил их несколько лет назад.
2. Если говорить о сопоставлении сегментов оригинального текста и перевода, можно вспомнить еще WinAlign (входит в состав старого Традоса).
3. По моим ощущениям, главный недостаток при переводе с помощью CAT-программ — необходимость строго соблюдать структуру оригинала. Для работы с техническими текстами, документами и т. п. это подходит прекрасно, но вот с чем-то более художественным работать уже не очень удобно. Наверное, так и должно быть, все-таки перевод «художки» — это отдельная область.
4. Глоссарии и проверку текста по ним жутко удобно использовать для языков с бедной (англ.) или отсутствующей (кит.) морфологией. Тот же русский язык уже вызывает трудности: термины опознаются не всегда и не везде, потому что могут стоять в косвенном падеже или какой-нибудь особой форме.

Резюмируя: CATом можно зарабатывать неплохие деньги при переводе инструкций и всякого такого. Особенно если заказчик не прислал готовую «память перевода» (translation memory) и не знает, сколько в тексте новых сегментов (за них платят 100%), а сколько повторений (за них дают 20%).

Вопрос автору: насколько стабильна OmegaT? Можно использовать «в продакшене» или она годится только для фриланса? (Что касается перевода на КДПВ: пропущено тире в последнем предложении.)

wtigga May 23 2017 at 14:37

1. В опросе не хватает пункта «SDL Trados»: SDL ведь купил их несколько лет назад.

Упс, так и сделал опрос изначально, но что-то пошло не так :(

насколько стабильна OmegaT? Можно использовать «в продакшене»

Если под стабильностью понимать «не крашится ли с эксепшном» — то стабильна уже пару лет, во всяком случае stable-ветка. Впрочем, я сижу на latest и там не видел никаких проблем.

Но нужно принимать во внимание особенности работы, такие как костыль для разделения/сращивания сегментов, и поведение спецсимволов в памяти перевода. С последним я до конца не разобрался, то ли баг, то ли я что-то не так делаю.

Кроме того, я намеренно не покрыл в туториале командную работу: правильная настройка SVN и выстраивание рабочего процесса через него заслуживает отдельной статьи, потому что geek way и совершенно не дружелюбно к пользователю. Что, в общем-то, не мешало использовать OmegaT на моём предыдущем рабочем месте для команды из нескольких человек.

kaze_no_saga May 23 2017 at 16:44

>>правильная настройка SVN и выстраивание рабочего процесса через него заслуживает отдельной статьи

А вот это было бы чертовски интересно лично для меня. Ждем, верим.

wtigga May 23 2017 at 17:08

Я сам настраивал по инструкциям из интернетов. Чтобы нормально написать, это по хорошему бы опять начать проект минимум на два человека, иначе не описать все особенности и возможные подобные камни.

Я занесу в «ту-ду» со средним приоритетом :))

LazyTalent Jul 19 2019 at 18:21

Вот эти товарищи используют омегу для первода инструкций уже пару лет.

wtigga Jul 19 2019 at 18:23

in-house или на аутсорсе? не вижу в вакансиях у них ничего языкового

LazyTalent Jul 24 2019 at 14:58

аутсорс

AleCC May 23 2017 at 17:59

Если переводить по одному слову иди фрейзел вербс, то эби лингво.

wtigga May 24 2017 at 04:24

По-моему, вы не читали статью :)

betrachtung May 24 2017 at 06:59

Я обычно пользуюсь для перевода translated.by, очень удобный двухколоночный интерфейс, привязка к мультитрану. Тут стоит учесть, что я любитель, перевожу обычно новости какие-нибудь. Иногда перевожу сложные тексты для друзей, но от этого у меня мозг пухнет.

Iamkaant May 24 2017 at 08:16

Спасибо за статью! Очень полезная инструкция для начинающих. Я пользуюсь open source везде, где это возможно, но Омега в моей практике не прижилась. По моему мнению, интерфейс очень непродуманный и не выдерживает никакого сравнения с Memsource/Smartcat. Из претензий – отсутствие двухпанельного режима (не бейте сильно, если я просто не нашел его), отсутствие визуального выделения важной информации (куча циферок в строке статуса), замороченная процедура работы. Но и это терпимо, если бы не сложности с машинным переводом. С Яндексом у меня почему-то не получилось, остальные сервисы платные. Отдельное спасибо Вам за инструкцию по Яндексу, но для Украины это уже не актуально :) Большим плюсом Омеги я считаю возможность править глоссарий на лету, в SmartCAT этого очень не хватает. В общем, прочитав статью, попробую ещё раз пожевать кактус, но ничего не обещаю :)

wtigga May 24 2017 at 08:22

Двухпанельного режима с превью документа действительно нет. По «визуальному выделению информации» не совсем понял, что имеется в виду.

Встроенный машинный перевод разве проблема омеги? Сервисы сами по себе платные (кроме яндекса), ничего тут не поделаешь.

Я живу за великим китайским файерволом, поэтому у меня уже определённая деформация сознания: везде, где можно, пользоваться standalone или self-deployed решениями. Потому что сегодня облако работает, а завтра оно закрыто навсегда. Независимо от масштаба. (ваша блокировка яндекса — это так, пустяки ещё).

Да и по скорости отклика интерфейса облачным решениям всё ж таки далеко до обычных программ.

Iamkaant May 24 2017 at 10:35

По поводу визуального выделения: вот скриншот SmartCAT

SmartCAT

Вверху прогрессбар, справа совпадения с цветовым выделением процента, подтвержденные сегменты отмечены выделяющейся зеленой галочкой, ошибки обозначены оранжевым треугольником. Теги выделены желтым (на скриншоте нет). Информации минимум, важное выделено.

Вот скриншот OmegaT

OmegaT

Процент выполнения показан внизу мелкими малопонятными цифрами, причем тут смешана и статистика по текущему документу, и по проекту в целом. Окно Fuzzy Matches: за процент совпадения тем же шрифтом, что и собственно текст, нужно бить по рукам. Окно Editor: теги сливаются с основным текстом, в самих тегах слишком много текста. Можно было бы делать, как в Poedit: просто циферка в скобках.

В целом, я положительно оцениваю OmegaT: проведена гигантская работа и это достойный инструмент переводчика, но к нему очень сильно нужно привыкать. Про скорость отклика с Вами согласен.

Связку Яндекса с Омегой попробую, open source нужно поддерживать. MS переводчик вроде тоже можно получить бесплатно, только нужно бумажной почтой отправить подписанный договор в Редмонд :)

Ну и еще раз поблагодарю Вас за руководство, вышло очень толково. Представляю, сколько времени ушло на написание. Если будет желание, сделайте что-то похожее об Okapi — там все еще запутаннее…

wtigga May 24 2017 at 10:40

У вас на скриншоте версия OmegaT семилетней давности :))))) Сейчас получше: теги сворачиваются в компактные (...<t1/>) и блокируются от редактирования по-умолчанию, например. Косметические вещи — да, омега в этом смысле выглядит сермяжно и не юзер френдли. С другой стороны, элементов там не так уж и много, запомнить их можно быстро.

Работа действительно идёт. В последнем релизе наконец-то вынесли все настройки в одно удобное окно конфигурации, на порядок лучше стало. И добавили LanguageTools к простому сверятелю тегов.

С Okapi я не так плотно работаю, пользуюсь время от времени для каких-то совсем простых операций. Гайд по омеге же писал по своему многолетнему опыту, в основном чтобы не объяснять кому-нибудь в н-цатый раз одно и тоже, а просто кидать ссылку (:

Iamkaant May 24 2017 at 10:45

А, и еще одно отличие вспомнил — в том же SmartCAT можно скачать один переведенный файл из проекта, в окне перевода. В Омеге, как я понимаю, нужно конвертировать в Word весь проект целиком.

Что ж, если разработка идет, то и мотивации использовать гораздо больше :) можно даже попровать feature request, вдруг прокатит.

wtigga May 24 2017 at 10:54

«Скачать один переведённый файл» — это всмысле «финальный файл» или «вытащить все тексты проекта»?

Если первое, то Project -> Current translated document, и будет сгенерирован текущий финальный файл в том формате, в котором был оригинал.

Если второе, то Tools -> Scripting -> Write Excel table, и будет сгенерирован эксель со всем контетом из проекта.

Iamkaant May 24 2017 at 10:59

Спасибо. Я о втором варианте: на любом этапе перевода можно вытянуть частично переведенный docx-файл из окна перевода, не переходя к окну проекта. Но это уже мои придирки и вкусовщина, т.к. я это использую для бэкапа выполненной работы. ABBYY тоже под санкции попал, мало ли…

wtigga May 24 2017 at 11:06

Тогда первый ответ :) В любой момент времени, не переходя к окну проекта, можно горячей клавишей сгенерировать готовые (или частично готовые) файлы. Даже скачивать не надо, всё локально ведь :)

Iamkaant May 24 2017 at 11:44

Спасибо. Вы меня убедили :)

nad_oby May 24 2017 at 20:27

Спасибо за статью.
Использовал OmegaT лет 8-9 назад.
Как раз юридические документы.
А вот программы переводил просто в текстовом редакторе Vim.
Там обычно .po или .xml и омега как то не прижилась.
Но это так по мелочам.
Про настройку репозитория для Ворд/Эксель было бы интересно.
Особенно прикрутили ли diff и если да то как?

wtigga May 25 2017 at 05:15

А что за «репозиторий для ворд/эксель»? И каким образом может пригодиться diff?

nad_oby May 25 2017 at 06:53

Репозиторий это тот самый SVN или git.
Настройки тоже интересны, но на самом деле workflow — это самое вкусное.
Переводчики обычно не технари, организовать совместную работу такой команды это плюс 100500 очков к знанию подводных камней.
Вот ими делитесь, если желание останется.

По ответу понятно что никакими diff-tool не пользовались.
Обычно такой инструмент нужен когда сводишь вместе работу двух разных людей в одном файле — merge.
Для языков программирования это достаточно тривиально, простой текст он и в Африке текст, большинство инструментов с ним прекрасно справляются.
Для Ворд/Эксель нормальных diff не находил, когда искал.
Часто можно вывернуться поделив большой файл на части и распределив их в команде.
Кроме Майкрософтовских е немало форматов для которых контроль изменений — боль.

wtigga May 25 2017 at 07:50

Я знаю, что такое дифф, но переводы — не программирование же :-)
Если над доком работает несколько человек по SVN, то синхронизация идёт достаточно быстро. Плюс омега может оставлять пометки о том, кто именно перевёл тот или иной фрагмент. Т.е. память перевода постоянно синхронизируется между переводчиками, и любой из них в любой момент может сгенерировать конечный файл.

Когда мы работали командой, то просто обуславливались, с какого по какой сегмент переводим. Либо делили на разные файлы, да. (со всякими key=value документами это не проблема).

Командная работа идёт по SVN, но версионность как таковая в омеге не задействована.

nad_oby May 25 2017 at 08:57

Тогда всё становится понятнее.
У меня около года назад стояла задача создать и поддерживать репозиторий для файлов Simulink, так разработчикам пришлось перейти к разработке без мерджей, только версии.
Инструменты для дифф/мердж существуют но стоили невменяемых денег.

Для вас может подойти использование инструментов, которые конвертируют Word/Exel на лету в текстовый формат (Markdown?), происходит слияние (merge), а затем, так-же на лету происходит конвертация обратно.
В идеальном случае, в репозиторий попадет только текст, а реальный документ будет использоваться в работе и как конечный результат.
Более менее представляю как это сделать на Git, с SVN придется курить мануалы.

Я бы попробовал в Git использовать в качестве хуков скрипты на основе pandoc.
Правда это может поломать разметку некоторых файлов.

Есть ещё word_diff на первый взгляд немного заморочно.
За то не придется ставить на машины ничего кроме Git клиента, конвертация в собственном облаке.

wtigga May 25 2017 at 11:43

У меня уже просто деформация сознания переводчика :-) Для меня нет «документов», вся лингвистическая информация должна храниться в ТМ (памяти перевода). На основе которой уже можно в любой момент сгенерировать нужный документ.

Show the best of all time