Как стать автором
Обновить

Комментарии 65

Электронными словарями тоже пользоваться нельзя?

Google translator? Не?

Ассоциация лионских ткачей, йо. Не, это другое )

Речь только о редактировании машинного перевода

Без словарей ни один современный переводчик не работает. А google translate для литературы довольно бесполезен

Для того, чтобы переводить, надо знать язык. На уровне автора исходного текста. И своим родным языком владеть, как писатель.
Если переводчик языком не владеет, то его перевод не будет лучше машинного.

Письменный переводчик обычно переводит на свой родной язык, и исходный может знать не так уж хорошо, или по крайней мере неровно.

Может хорошо понимать письменную речь, без этого очевидно никуда, но при этом плохо говорить или писать на иностранном. И уж на уровне автора, мастера своего родного языка, переводчик язык почти никогда не знает.

Ну там же надо понимать всякие нюансы языка, идиомы и т.д., то есть понимать, что автор пытается передать.

Не знаю как можно хорошо на литературном уровне понимать письмо при этом не умея писать на языке источника.

Допущу, что мастером быть необязательно. Но из раза в раз вижу, как эти подмастерья дословно переводят словосочетание, потому что не знают его или культурную отсылку. Не хватает смелости полностью выбросить или знаний, чтобы поискать толкование.

Легко, вон сколько людей может смотреть на языке фильмы-сериалы, при этом абсолютно не способны поговорить с иностранцами на простые темы.

С письмом то же самое.

А насчёт дословного - да, вы правы, сплошь и рядом.

А как они собираются проверять, использовал переводчик машинный перевод или не использовал?

Об этом не сообщается.

Наверное на честном слове, а нарушители, если вскроется, будут зашкварены и выдворены из ассоциации.

Обновлённый типовой контракт

Подозреваю, дело в этом. Скорее всего госучреждения выплачивают какие-то гранты по переводам книг на датский - и им очень не нравится, что переводчики используют машинный перевод, а потом допиливают вручную, срезая углы, получая за это денег, как за полноценный.

Имхо, это попытка принудить переводчиков к "делайте вручную", которая провалится в долгосрочной перспективе.

Обоснованно не нравится, в целом. Внезапный переход на MTPE может обвалить качество. По крайней мере в краткосрочной перспективе, пока лингвист не научится вычитывать МТ, т.к. это хоть и смежный, но все же отдельный от переводы навык.

Так что контракты уже давно меняют. К литературому издательскому делу я не близок, но например в игровой локализации еще два года назад начали, как чат выстрелил.

Имхо, цель этой инициативы в другом: не платить "авторам" машинного перевода (и я не просто так поставил кавычки).
Я с темой переводов знаком косвенно, как читатель (на русском) японских/корейских/китайских новелл. Но могу уверенно утверждать: машинный перевод ужасен. Например, в китайском рода нет вообще, а в английском он есть только в местоимениях; машина, не моргнув индикатором, на одной странице одному и тому же персонажу может ставить мужской или женский род, как ей вздумается.
На справедливую критику читателей публикаторы машинного перевода обычно реагируют агрессивно "Ачотакова?", "не нравится - не читайте".
( а есть ведь и произведения, целиком построенные на гендерной интриге).
Ставить отметку, кто приложил руку к машииному переводу - окей. Но платить за это не стоит.

Ознакомьтесь с https://habr.com/ru/articles/908280/

Вкратце - читателям (да и переводчикам) я как минимум рекомендую использовать хорошие платные нейросети, качество у них значительно выше.

Также есть возможность использовать глоссарий для явного учета пола персонажа в произведении - если заниматься этим хоть чуть-чуть профессионально, а не прогонять через Google Translate, чем грешат тонны "переводов" новелл (самого утомило такое отношение к читателям, да).

Добиться консистентного пола в машинном переводе несложно, достаточно промпта, и, в случае визуальных медиа вроде манги, разметки текстовых данных с указанием персонажей.

Сложные сюжетные ходы это конечно не покроет, но в большинстве случаев будет достаточно

Вот еще пример из моего туториала по использованию Luna Translator для перевода игр.

Скриншот под катом

Ну как бы разница между бесплатным Google Translate и даже недорогой Google Flash 2.5 СЛИШКОМ ЗАМЕТНА

Небо и земля

Но и небо такое себе прямо скажем

А как вы переводили? По-моему, что-то не так пошло, потому что если взять тот же текст и загрузить в гуглтранслейт, то разница перевода уже не заметна.

Гугло-переводчик

Возможно, транслейт в Luna Translator как-то по своему работает. Такой корявый перевод в транслейте не встречал, как будто Luna Translator просто отправила каждую строку отдельно и выдала вам. Может из-за ограничений для бесплатного перевода - хотя все-равно очень странно, встречал автопереводчики книг через бесплатный гугол - там было все неплохо и сравнимо с веб-версией транслейта.

Для сравнения с яндекс и дееп

По-моему, все три, приблизительно переводчика одинаковы (дип показался чуть лучше, яндекс, скорее хуже, "первокласные" тут не совсем то, имхо). Все три переводят посредственно и вполне может быть, что платные сервисы лучше, но вот такой каши с переводом, как на том скриншоте - не видел.

Разве по-русски можно сказать "путешествие по охоте"? Так что лучше всех справился всё-таки Яндекс.

Яндекс первый во втором спойлере. Т.е. именно яндекс и перевел "путешествие по охоте" и, в том числе, поэтому я считаю, что в том конкретном случае яндекс-переводчик - худший

полный скрин

Может я где-то ошибся с копи-пастом, но вы можете сами проверить, вот:

текст

You are about to embark on a journey of bounty hunting. To enjoy the premium services of the Bounty Hunter Association, please enter your basic information.

Я еще прокомментирую - я использовал самую дешевую Google Flash 2.5 просто чтобы на практике максимально уменьшить стоимость конкретного перевода реплики (до 1-2 копеек за реплику), и получать ответ с максимальной скоростью. Так в принципе можно подключить DeepSeek или Sonnet, и результат будет несколько получше. Но все равно получается лучше, чем если автоматом отправлять в бесплатные API - там как-то по опыту режется качество очень сильно.

Кстати у Mistral некоторые модели практически бесплатные при малом количестве запросов.

Можно юзать Mistral OCR + какие-то БЯМ вроде Pixtral через апи бесплатно. Конкретных лимитов я не нашел, но в тестовых целях вполне работает. В ту же Luna это наверное можно подключить.

Вероятно, можно. Но я фанат своего собственного сервиса )))

Чем дальше, тем больше преисполняюсь мыслью, что очень кайфово заплатить 200-300 рублей и не беспокоиться о VPN, зарубежных картах, рейт-лимитах по IP...

Так это как раз к тому, что эти штуки можно подключить наряду с другими бесплатными переводящими апи)

Либо я что-то не так понял, простите)

Наверное, можно. Но у меня ссылка на туториал выше, который я готовил - она про настройку на мой же сервис, который в этом смысле платный.

Просто имхо бесплатные вещи постепенно либо отключаются, либо начинают проседать в качестве. Поэтому я понемногу агитирую за то, чтобы по возможности интегрироваться с недорогими, но платными вещами, чтобы у сервисов была мотивация поддерживать работу.

А как вы переводили?

Через API Google Translate, встроенный в Luna. Любые встраиваемые штуки обращаются к API. Да, говорят там выдача может быть хуже чем в веб-интерфейсе, но другого общеупотребительного бесплатного устойчивого способа перевода особо нет.

Еще иногда говорят, что ситуативно выдача через API меняется, но у меня не настолько много времени, чтобы это как-то толково изучить :)

обращаются к API. Да, говорят там выдача может быть хуже чем в веб-интерфейсе

Обращаться можно по-разному, имхо, здесь отправили куски предложений и получился закономерный итог.

не настолько много времени, чтобы это как-то толково изучить

Никаких претензий, но удивительно было увидеть такой перевод в 2025 году... Понятно почему нейросетки так быстро продвигаются, они видимо и при неудачных случаях умудряются найти какой-то смысл.

Обращаться можно по-разному, имхо, здесь отправили куски предложений и получился закономерный итог.

Предположение интересное, но это в Luna делается просто настройкой "Включить переводчик 1" и "Включить переводчик 2". Обращение всегда идет единым запросом в целях оптимизации, и довольно логично, если туда передается один и тот же текст.

Необычно конечно. Спишу на то, что может это софт для перевода каких-нибудь японских игр и специфические настройки. "Охоту на отскок" - наверное даже у Промта не было.

 "Охоту на отскок" - наверное даже у Промта не было.

:)))

Но вообще Luna Translator классная. Опенсорс, куча разных опций для настройки, TTS-озвучка при желании. Китайская. И автору даже не лениво собирать её под WinXP, отчего я в легком офигении )

Вообще замечаю - по мере того, как западный мир уходит в облака, все больше интересного не вендорлокнутого "опенсорса для жизни на десктопе" появляется от китайцев. Например, для текстовых нейросетей я откопал не такую известную Cherry Studio. Тоже китайская с кучей доп опций типа проиндексировать базу знаний, вкрутить интернет-поиск, прикрутить MCP (сторонние инструменты, вызываемые сетью).

Наверное тоже из-за специфического интернета. А так, пора бы что-то от них тоже получить какой-то вклад - огромное население замкнутое на себя, опенсорсные было бы просто отлично. Впрочем вендорлокнутого облака у них хватает.

Хорошо, что опенсорс настолько глобальное движение. Я в принципе не задумывался, но если подумать, то из незалоченного опенсорса от "одного" разработчика, часто использую программы датского и австралийского сумрачных гениев. Остальные опенсорсы, посложнее атрибутировать, большие программы (вроде openoffice с кучей людей из разных стран, с коммерческим участием, принадлежность исходное конторы, скорее историческая), разве что vlc вроде от француза.

> откопал не такую известную Cherry Studio

математические формулы LaTex и химические KaTex

Что здесь имеется в виду под химические? MathJaX для LaTex и mhchem под KaTex?

Что здесь имеется в виду под химические? MathJaX для LaTex и mhchem под KaTex?

MathJaX да, для KaTex не знаю, что используется.

Выглядит так:

Скрытый текст

Больше похоже на то, что Luna Translator нагло врет, дабы показать свою важность.

А зачем please, если "введите" уже повелительное "вы"?

Ещё хуже перевод обходится с отрицаниями, частицы не и ни либо опускаются либо вставляются не в те места, что порой меняет смысл на противоположный.

Вроде БЯМ вообще не любят отрицания. Нередко встречал совет негативные ароматы строить не через отрицание - "не добавляй комментарии", а через синонимы - "избегай комментариев".

Видимо отрицательные токены не уводят общее значение достаточно далеко в векторном пространстве.

А не от ни и многие живые носители с трудом отличают)

Подозреваю, это один из этапов наметившегося разделения "Патрициям - человеческие работы, плебсу - ИИ слоп". Нужен признак, по которому можно отделять.

Датская инициатива в первую очередь касается библиотек, а это в целом довольно плебейская шутка в наше время :)

Используют машинный определитель машинных переводов. А потом решат что машинное определение машинных переводов не может считаться надежным определителем машинных переводов, и машинные переводы, определенные машинным определителем машинных переводов будут амнистированы ¯\_(ツ)_/¯

Можно и апелляционную комиссию из людей собирать. Машинный перевод человеком детектируется довольно легко

Да, но речь про отредактированный текст, в котором косяки машинного перевода и должны детектироваться и исправляться человеком. После этого уже становится не так просто, если редактура хорошая, но всеравно считается машинным по новым правилам.

Пост-редактуру пытаются с переменным успехом делить на лёгкую и глубокую, и вот глубокую распознать практически невозможно.

Не понимаю как они собираются отличать машинный перевод от плохого перевода человеком.

Может по каким-то частым словам или выражениям, как было с некоторым словами в чатгпт (delve). Или другой пример, выше обсуждался перевод на русский в играх и сравнение гугл-переводчика с платными нейроподелками, так вот и гугл-переводчик и нейроподелки (дополнительно пробовал переводить с chatgpt|deepseek), имхо, не очень хорошо справились, перевод непохож на человеческий. Перевод сносный, информацию можно понять, но пока нет ощущения, что «переводил образованный человек, для которого язык - родной». Корявый канцелярит, на котором «говорят» депутаты, может быть, и не будет различим в переводе с нейросетями, но что-то более серьезное, имхо, пока различить можно, борьба одних нейросетей и промтов с другими.

Еще, в соседней теме довольно неплохо отделили "человеческий" от искусственного Проводим слепой тест переводов прямо на Хабре / Хабр. В комментариях есть обсуждение особенностей плохого нейроперевода (отличили и от плохого перевода). Прогресс у нейропереводчиков - впечатляющий, но пока нейропереводчики не дотягивают до плохого переводчика.

Тут вопрос, что кто-то возьмет и натренирует ИИ именно на художественный перевод обучив на парах оригинал/перевод человеком. И будет ИИ уже переводить как сносный человек-переводчик. Да, перевод будет не уровня Самуила Маршака, но и людям переводчикам до него далеко.

Просто никто не смотрел на эту тему. Да и многие говнопереводчики вполне могу переводить через ИИ, а потом осуществлять редактуру, чтобы добавить человечности. Поди потом разберись ИИ переводил или "переводчик так чувствовал произведение".

И это еще нейросети только начали развиваться.

Здесь не идет речь о переводах плохого качества.

Тексты, которые бы получали гос поддержку в виде компенсации за бесплатное размещение в библиотеках, проходят, надо думать, не одну проверку. Так что мусорные тексты туда не попадут в любом случае, с машинным переводом или без.

Это скорее как био-органические-фермерские помидоры. Важно, чтобы огородник лично поливал, пропалывал и охранял от червячков, а не брызгал пестицидом, попивая пивко. Даже если финальные помидорки идентичны по всем параметрам.

В комменте было так:

как они собираются отличать машинный перевод от плохого перевода человеком

Мусорные тексты может и не попадут, но вопрос - как они собираются обеспечить выявление автопереведенных документов - интересен сам по себе.

проходят, надо думать, не одну проверку

Раз вопрос о постредактировании возник, то значит проверки что-то показали.

био-органические-фермерские помидоры. Важно, чтобы огородник лично поливал, пропалывал и охранял от червячков, а не брызгал пестицидом, попивая пивко

Ну как, эти самые как бы дурные органик фермеры вполне себе химикатами и даже антибиотиками поливают, как в известном случае с яблонями поливаемые тетрациклином сливаемым потом дождиком в речки и разными нехорошими последствиями. Иными словами, что разрешено, тем и будут поливать, если рамки закона позволяют называть итоговых бизнес-деятелей "суперпупер органик фермер". Логично, что к супер-био-органическим фермерам также возникает аналогичный вопрос, как доказать, что их продукция и методы не наносят вреда (а ведь оказывается, что они наносят заметный вред людям), в отличие от обычных фермеров, использующих обычные удобрения. С переводами, конечно нет такой проблемы, как с "органик фермерством", но вопрос сравнения качества - вполне интересный.

Мне кажется, перевод синонимов одним словом - неплохой маркер. То есть, если встречается что-то вроде "он выглядел храбрым и храбрым", то человек это вряд ли написал, разве что в бреду.

Ого, а я думал, что работу уже повсеместно стараются измерять результатом. А не "здесь мерилом работы является усталость". Я вот на датский без машинного перевода без проблем переведу, только чушь получится, потому что я датского не знаю. А другой машинный текст прогонит через Luna, потом через ChatGPT, чтобы согласовать рода и прочие языковые конструкции, потом прочитает, отредактирует, отполирует - и что же, это не считать переводом, потому что на него потрачена неделя, а не год? Или я чего-то недопонял?

Именно так оно и звучит, в общем-то.

Уже сейчас есть инструменты для традиционного перевода, но с элементами ИИ, которые можно подтянуть под машинный перевод, если очень захотеть. Они не переводят все подряд сами, но дают много контекстуальной информации и возможностей полуавтоматически создать перевод. Как считать в таких случаях - вопрос открытый.

Никто не говорит, что это не работа или плохая работа. Просто это другая работа, и её хотят маркировать соответствующе, вот и всё. Не понимаю, почему многие считают, будто бы это направлено против автоматических переводов, и будут охотиться за нарушителями с автоопределителями машинного перевода.

еще одно микроскопическое движение к пропасти руками апологетов ценности труда как такого, а не результата

Вообще плевать что они там решили. Они женщину от мужчины то отличать научились?

НЛО прилетело и опубликовало эту надпись здесь

Кто о чём, а эти всё о мужчинах и женщинах. Скажите, почему вы так возбуждаетесь на этой теме? Из-за чего у вас встал такой вопрос?

Мужчину от женщины в 100 случаев только анатом отличает. В проблемных случаях биопсию берут из разных мест (и то, в случае истинного гермафродитизма это не помогает получить два пола), но почему-то все уверены, что это простая задача. Перевести с китайского на эскимосский может быть более простой задачей в некоторых случаях)))

Эти - это кто?

Вы это к чему? Типа ох уж эти датчане, родитель 1, родитель 2, и все писают сидя?

Так вот, это шведы.

Не понимаю, зачем было приплетать вопросы гендерной политики к обсуждению перевода, и судя по оценке комментария я такой не один, но если уж у вас так накипело...

Если бы звучало "мнение тех, кто не способен сложить 2+2 меня не интересует" было бы понятнее? Вопросы гендерной политики волнуют не меня. :-))) Люди живут десятки тысяч лет без гендерной политики и научились отличать мужчину от женщины раньше, чем складывать 2+2. Ну а те, кто не научился - см. начало :-)

Это же Швейцария, не Швеция, вроде.

Про писать сидя? Это скорее шутка.

В Швеции был такой проект, но никуда не прошел. Про Швейцарию говорят, что там нельзя по ночам писать стоя, смывать толчок и т.д. из-за шума. Это отчасти правда, но только в контексте того, что нельзя создавать шум, который может помешать соседям. Если вы живёте в такой коробке, где слышно писающего соседа - наверное придется сесть. Хотя сомневаюсь, что людям, живущим в таких условиях, есть дело до полиции. Но абсолютное большинство швейцарцев это вообще не затрагивает.

Не про писать, а про родитель 1/2, если не путаю именно Швецарией пугали, что будет плохо "как в Швецарии Европе".
Про писать - даже не понятно как такое контролировать, нейросетки писать, чтобы звук отличало только.

Плохо как в Швейцарии, лол :)

Перплексити говорит, такое есть в США и Франции, а Швеция и Италия размышляют: https://www.perplexity.ai/search/what-countries-have-parent-1-a-lkXzO4atTRebcArsBHew0w

Перплексити все-таки обычный нейро-ходитель по ссылкам, на него ссылаться сложно. По ссылкам у перплексити ссылки на разные реддиты, например. В проверено.медиа пишут, что такое предлагали, но по факту такого нет, даже во Франции Правда ли, что в некоторых странах Запада запрещены термины «мама» и «папа», а вместо них используются «родитель 1» и «родитель 2»? - Проверено.Медиа:

такой законопроект был предложен, но после волны критики его переписали. Вместо замены на «родитель 1» и «родитель 2» в формуляры к двум графам «мать» и «отец» была добавлена третья — «другой законный представитель».

По ссылкам от перплексети в реддите в комментариях вообще предполагали, что это все вместо того, чтобы писать "родитель или законный представитель ребенка (опекун)".

На проверено.медиа, кстати, есть ссылки про швейцарскую историю на которую поднимали панику в российских сми, возможно с той истерической подачи СМИ и пошла идея про неизвестную страну с родителями 1 и 2.

Шут его знает, что на самом деле происходило и откуда эта шумиха. Сайты СМИ - ненадежный источник, а однозначных подтверждений (кроме заявлений политиков) в сети не могу найти.

Все спорили, кто же станет первой жертвой ИИ - программисты или художники. Оказалось - датские переводчики.

Машинный перевод используется уже более 20 лет, но раньше переводчики-киборги уступали натуральным переводчикам, для которых переводимый язык как родной.
В последние годы тот же гугл-переводчик существенно улучшил качество перевода. А LLM еще и пытается копировать стиль. Эта инициатива направлена на защиту натуральных переводчиков. Непонятно только почему именно датские переводчики оказались наиболее уязвимы.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости