средства для совместного он-лайн перевода

    Disclamer: Это незавершённая статья о средствах для совместной работы. Вы можете помочь сообществу, исправив и дополнив её :)
    (статья публикуется для аггрегации мнений и опыта онлайн перевода)

    В целом, при совместном переводе актуальны следующие моменты:
    • формат представления: разбивка текста на отдельные блоки — предолжеиня/параграфы
    • средства редактирования и импорта/експорта, возможность альтернативных переводов
    • доступ к словарю, автоматическому переводу
    • координация совместной деятельности
    • контроль состояния процесса:
      • обозначение статуса каждого переведённого блока (подстрочный перевод, литературизированный, спорный момент, окончательный вариант, итп)
      • индикатор завершённости
      • история изменений
    • предоставление доступа

    По этим пунктам, ИМХО, и стоит рассматривать доступные средства.

    Google Docs


    В нашем проекте мы, ничтоже сумняшеся, использовали google spreadsheet — с расшариванием рабочего файла между участниками. (гуглотулкит для перевода появился одновременно с началом нашего проекта). По опыту этой работы и пишется обзор возможностей.

    формат

    Поскольку мы переводили субтитры — они очевидным образом были разбиты на отдельные строчки, и засунуты в таблицу со столбцами: тайминг, исходный текст, перевод.
    Для перевода других форматов текста, тайминг, конечно, не актуален.
    В таком формате предложения естественным образом распределяются по строчакм таблицы.
    Возможно, такое представление будет не очень удобно для текстов с длинными предложениями, в особенности для немецкого языка, знаменитого возможностью составления сложных предложений, растягивающихся иногда на несколько страниц.

    средства

    В гуглотаблицы, естественным образом, импортируются всевозможные табличные форматы — csv, ods, xls
    Проблемный момент в том, что импортирование возможно только в новый, отдельный файл,
    переносить текст из него приходится в ручную, через буфер обмена, в который помещается не более ста строк.

    Для спорных моментов в дополнительную колонку записывались альтернативные версии перевода, с указанием автора и иногда комментариями. Альтернативы потом обсуждались в рассылке.

    Тамже, в дополнительной колонке, мы оставляли краткие замечания и пояснения для других участников, или пояснения по причинам выбора одного из вариантов.

    словари

    Понятное дело, что никаких встроенных средств доступа к словарям нет. Каждый пользуется тем, что ему удобнее.

    Для создания же глоссрия использовался дополнительный лист таблицы.
    Туда вписывались решения по спорным вопросам (типа того, как переводить слово Wave и переводить ли вообще).

    координация

    Онлайн координации в google speradsheet сделана на высоте.
    Только из-за одной этой фичи стоило бы сделать выбор в пользу гуглотаблиц.

    Для всех участников, одновременно открывших файл в режиме редактирования — есть встроенный чат.
    Участники раскрашиваются разными цветами, и тыкнув на имя — можно перейти к той клетке таблицы, на которой стоит курсор выбранного участника.
    Излишним будет говорить, что курсоры всех редактирующих и их перемещения видны в реальном времени, онитакже раскрашены в разные цвета, и подписываются именем при наведении на него мышки.

    Для оффлайн-координации была организована google-группа рассылки.
    В google docs предусмотрена возможность предоставления доступа к файлу целой группе, что решает вопрос синхронизации участников. Но эта возможность, кажется, пока в стадии бета.
    Гуглорассылки удобны тем, что в комментариях к переводимым фрагментам можно вставлять ссылки на обсуждение этого фрагмента в группе.

    процесс

    В нашем случае по каждому блоку получилось четыре состояния:
    1. черновой перевод (тут предлагалось использовать машинный, но из-за особенности речи ораторов они получились совсем уж ужасными)
    2. спорные моменты, затруднения
    3. литературизированный перевод
    4. окончательный вариант

    В гуглотаблицах состояние по каждой строчке легко и просто обозначается цветом фона клетки.
    Спорные моменты мы обозначали жёлтым фоном, чтобы обратить на них внимание.
    Выверенные по орфографии и грамматике фразы — зелёным, чтобы остальные не дублировали работу.
    Для формирования окончательного варианта один из участников был выбран в качестве редактора и специалиста по стилю.
    Предлагалось красить окончательный вариант в синий, но делать это заломало :)
    По факту, выверкой стиля занималось два человека — и для синхронизации своих действий им хватило встроенного чата.

    Оценить, насколько завершён процесс, при использовании таблиц возможно исключительно визуально.
    Но в нашем случае этот момент оказался не особо важным.

    История изменений в гуглотаблицах при совместном доступа ведётся автоматически, создавая новую версию на каждое изменение отдельной ячейки (ну, или блока). Автор этого изменения фиксируется в списке версий.
    Сравнение версий сделано весьма убого — изменения хоть и подсвечиваются, но тображается при этом только данные из последней версии, а кроме того, при переключении версий файл отображается с начала, и чтобы посмотреть, в какой версии была изменена конкретная ячейка — надо каждый проматывать.
    Сам список версий выводится в виде выпадающего меню. Это делает затруднительным оценку вклада каждого участника.

    доступ

    Возможно два уровня доступа: чтение и редактирование, и два способа аутентифиакции: без аутентификации, или же по гуглоаккаунту. Тут возникли некоторые проблемы с использованием аккаунта с отличным от gmail.com именем.

    Дополнительно, документ может быть «опубликован» для просмотра в общий доступ, в формате веб-страницы.
    (в нашем случае, рабочий документ был в публичном доступе всё время работы.) Опубликованный документ можно настроить на отражеине текущего состояния, или же публиковать отдельной командой.

    Google Translation Toolkit


    формат

    Текст представляется очевидным способом, в виде двух колонок (либо двух горизонтальных фреймов).
    Перевод осуществляется по предложениям, на которые текст разбивается автоматически.
    При выборе предложения, соответствующая строка перевода открывается в инлайн форме редактирования.
    Выделить/выбрать блок самостоятельно невозможно.

    средства

    Для заргузки и выгрузки поддерживаются форматы документов: rtf, doc, html, odt.
    Кроме этого, в систему можно загрузить произвольную страницу по урл, или статью из википедии или knol.
    Таблицы в систему не загружаются. Точно также, как и не перносится документ из GoogleDocs.
    Добавление и редактирование текста оригинала невозможно — прежде, чем начать перевод, необходимо полностью подготовить исходный текст.
    (таким образом если в процессе перевода необходимо делать транскрипт на слух — toolkit в этом не помощник)

    Из дополнительных фенечек есть возможность прикрепить переводимый блок и пролистать весь текст.

    К каждому блоку текста можно оставлять комментарии (но не более, чем одну строчку).
    Несколько вариантов перевода не предусмотрено.

    словари

    Сразу после загрузки текста и выбора языков, загружается машинный перевод всего текста.
    В дополнительной панели доступен поиск по словарю (котрый весьма убог по сравнению скажем с multitran.ru — нет ни указаний категорий употребления, слэнга, или ссылок на словосочетания)

    Дополнительно к словарю, есть средства организации глоссариев для хранения переводов слов и «translation memory» для хранения переводов фрагментов.
    И то, и другое может быть расшарено независимо от самого рабочего документа.
    И то, и другое может быть загружено только из внешних источников и в онлайне не редактируется.

    координация

    (не протестировано)

    процесс

    Судя по всему, фрагмент текста может быть в двух состояниях — исходный (автоматический перевод) и отредактированный.
    Отредактированный считается переведённым и количество такого текста отображается в % в списке рабочих документов.

    Никаких промежуточных состояний не предусмотрено, кроме как возможности обозначать их в комментариях.
    Истории изменений тоже нету.

    доступ

    Предусмотрено три уровня: просмотр, комментирование, редактирование. Аутентификация, естественно, по гуглоаккаунтам.
    Намёков на использование адреса группы нет.
    А значит, приётся синхронизировать список участников вручную.



    To be continued:

    notabenoid


    translated.by


    dotsub

    Поделиться публикацией
    Комментарии 8
    • НЛО прилетело и опубликовало эту надпись здесь
        0
        всё тобой перечисленное реализуется с помощью глоссария и «translation memory».
        надо только разобраться как с ними адекватно работать.
          0
          это да, только страшнее составление самих глоссария и баз данных для tm, нежели ознакомление с адекватностью процессов работы машинного перевода.
          да и труд этот должен пасть на плечи самого отчаянного борца за русскоязычную имплементацию
            0
            у нас боле менее получается составлять его совместно:
            spreadsheets.google.com/ccc?key=rf2XOitjZ5cJ8Z-kXSvva3Q
            (спорные варианты обсуждаются в рассылке)
              0
              а, ну это хорошо, правда что-то поздновато очнулась.
              но может на будущее пригодиться: в базу памяти можно добавлять не только спорные моменты, но и какие-то общие словосочетания, просто это может помочь сохранять грамматический строй предложения. Подобный перевод можно отнести к техническому, технический перевод имеет некоторую особенность этого строя и, наверное, некоторую свою педантичность. У нас в русском языке есть безличные предложения, чем не может похвастаться буржуйский, как следствие, предложение на иностранном может содержать якобы незвучные лишние обороты, как «is to be», «are to be».
              Не для онлайн, но для личного пользования можно посмотреть то, что предлагает промт своей последней версией. Если честно, то качество перевода, как мне кажется, даже несколько ухудшилось, в особенности с русского на английский, но такой перевод заведомо сложнее, но там есть поддержка tm, глоссариев, вывода и составления терминологии. Это может быть полезным инструментом для каждого отдельного переводчика на своем конце провода.
              Если говорить конкретно об онлайн-приложениях, и если не убегать далеко непосредственно от самого googl'a, то там есть своя политика, к которой серьезно наш русский человек подойти никак не может. Составление баз в глобальном масштабе и общественная поддержка зачастую принимает у нас комический смысл. Это можно заметить, прибегнув к помощи сего и столкнувшись с предложением на бредовый перевод. Потому, как ни крути, либо специализированные проекты, либо иностранные даже с русскоязычным переводом справляются немного поприличней.
              Но опять же, несколько поздновато. Ну если будут какие-то подобные проекты или вопросы, буду рада помочь. Сама знаю, как первое время подобное может выматывать, и как постоянно самому себе не нравится перевод. Имею опыт в профессиональном техническом переводе, так что даже для личного самообразования с радостью могу помочь любому.
              С ув.
                0
                идельно, если бы TM составлялся автоматически, просто по факту пеервода отдельных предложений, или словосочетаний.

                в гугловском тулките для переводчиков задумано составление glossary и TM, котрые могут выбираться/подбираться для каждого проекта индивидуально.
                такчто вполне реально создание «TM технического перевода», «TM политического украинского» итп.
                к сожалению, на данный момент составляются они весьма и весьма неудобно.
                по этому поводу был составлен grand feedback, где изложены функции, котрых не хватает в средствах для совместного онлайн перевоа.

                Касательно помощи, наша группа HabraTranslation занимается весьма техническими переводами.
                На данный момент в работе три топика.
        –1
        Есть также такой инструмент совместного онлайн-перевода — LangPrism. Только он адаптирован под совместный перевод именно веб-содержимого, то есть страниц в сети Интернет.
          0
          Гугловский тулкит как был дико неудобным, так и остался. Почему-то его создатели не понимают, что при хорошем переводе структура предложений меняется. Было одно большое английское предложение — стало два русских.

          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

          Самое читаемое