Комментарии 111
Источники переводов
ChatGPT
DeepL
Соколов
DeepSeek
Вязников
Google
Anthropic Sonnet 3.5
Google Gemini Pro 1.5
xAI Grok 3 beta
OpenAI o4-mini
Яндекс.Переводчик
Переводы 1-6 были предоставлены @artptr86, за что ему большое спасибо. Они делались в веб-интерфейсе приложений, иногда с диалогом в случае LLM.
Переводы 7-10 делались мной через VseGPT (доступ к нейросетям по API). Дополнительного контекста не было.
Перевод 11 был сделан мной в веб-интерфейсе.
Также мною были опробованы не попавшие в подборку:
Sonnet 3.7 (неожиданно оказался хуже 3.5)
Google Flash 2.5 (хуже Pro)
Google Gemini Pro 2.5 Experimental (у меня сильно глючил и выдавал разные сбитые результаты в момент перевода на тех же промтах, что и другие сети. Возможно, это особенность доступа по API, потому что вроде в этом комментарии был предложен результат)
Результаты голосования на 13:16 11.05.2025


Мысли автора по результатам голосования
Первое: Хабр и люди спокойно отличают достойный человеческий перевод от машинного - 3 результат идет с сильным разрывом от всех остальных.
5 результат (человеческий) также выше нейросетей - при том, что лично мне он не очень понравился, и я, выкладывая опрос, предполагал, что он будет выбран на уровне нейросетевых моделей. Но я ошибся; оказывается, вкусы бывают разные.
Второе: Платные топовые нейросети пока в среднем не дотягивают до человеческого перевода - даже до уровня Перевода 5. Однако при выборе наилучшего варианта часть пользователей отдала голоса нейросетевым вариантам - видимо, для некоторых людей они правда ощущаются лучше. Даже я вхожу в их число, но не на этом тексте.
При этом разные пользователи склонны выбирать разные нейросети в качестве наилучших. На заметку: если вам не нравится перевод, возможно, вы просто не нашли еще ту сеть, которая бы попадала в ваш личный вайб.
Третье: Платные топовые нейросети (7-10) значительно отличаются по средней читабельности от бесплатных вариантов, предоставляемых в разных чатах.
Интересно, что лично мне больше понравился вариант o4-mini (10) - при том, что я предпочитаю Sonnet (7). Однако пользователи посчитали максимально высоко читабельным и 10, и 7 вариант. Также пользователи высоко оценили Grok 3 (9), хотя мне он не понравился.
Четвертое: среди бесплатных не LLM-вариантов достаточно достойно показал себя Яндекс.Переводчик (11). Хотя по отзывам люди предпочитают Google и DeepL, я замечал, что вариант от Яндекса как-то недооценен, про него редко вспоминают.
Пятое: в комментариях предложили логичную идею - что нужен, в общем, не только переводчик, но и редактор. Я сделал перевод после статьи на связке Sonnet 3.5 (переводичк) + o4-mini (редактор) в комментарии здесь. На мой взгляд, получилось достаточно интересно.
Голосование остается открытым, а источники спрятаны под спойлер. Вы можете по-прежнему сначала принять свое решение о качестве того или иного перевода, а уже потом знакомиться с его источником.
Все варианты перевода так или иначе колют глаз. Но особо восхитил один оборот:
..... с этим отвратительным Космическим Гильдией ....
Вот это сразу выдает нечеловеческий перевод... Неумение связывать род.. Гильдия - слово женского рода, и гильдия не может быть космическИМ, и отвратительнЫМ.
Это-то очевидно, но меня кольнули всякие "когда пришёл зов долга" или "когда раздался зов обязанности", или "когда раздался призыв долга", или "когда поступал зов долга". И какое же было кресло на самом деле?)
Тут вообще впечатление, что в этом месте модели скормили невидимый перевод строки. Переводчики в этом случае часто ошибаются с родами, поскольку думают, что новое предложение началось.
В принципе из них можно слепить один нормальный )
"зелёные пашни" - это 5 баллов
Может мне и кажется, но только первый перевод смог нормально разделить абзац, а еще мы узнали что нейросеть не любит двойные имена:_)
Очень тяжело судить, не зная контекста.
Ни профессиональный переводчик, ни машина не узнает что за "secretive ways" имел в виду автор.
Если её перед этим провели по труднопроходимому секретному проходу, и она устала, то может жаловаться на "скрытные пути"
Если гильдия предлагает дурацкий способ решения какой-то проблемы, то надо перевести как "скрытные способы/методы"
Если гильдия что-то мутит втихаря, то вариант со "скрытностью и тайнами" будет самый раз.
К тому же по известному тексту вряд ли честно судить о качестве перевода. Именно этот текст и перевод мог быть в массиве, на котором обучали ИИ. Пятый, например, перевёл как-то слишком художественно и по-человечески. Возможно, он списал с реально существующего перевода Дюны. Но это не значит, что пятый ИИ лучший. Просто его обучили именно на этом примере. Первый тоже, вероятно не там с нуля придумал "скрытность и тайны".
Что печально, что больше половины ИИ игнорируют точки над Ё.
Для объективности надо взять свежий художественный текст, который точно ни к кому не попадал в массив обучения.
Микроспойлер
А кто сказал, что тут все переводы от ИИ? )))
Именно этот текст и перевод мог быть в массиве, на котором обучали ИИ.
Думаю он был во всех, но этого мало чтобы веса повторили оригинал (если не тюнить?).
gemini 2.5 pro exp любит ё
«Преподобная Мать Гайя Елена Мохийам сидела в обитом гобеленом кресле, наблюдая, как приближаются мать и сын. Окна по обе стороны от неё выходили на плавный южный изгиб реки и зелёные фермерские угодья фамильного владения Атрейдесов, но Преподобная Мать не обращала на этот вид никакого внимания. Этим утром она чувствовала свой возраст и была не на шутку сварлива. Винила она во всём космические перелёты и связь с этой гнусной Космической Гильдией, с её вечной скрытностью. Но это была миссия, требовавшая личного участия Бене Гессерит, наделённой Даром Предвидения. Даже Говорящая Правду Падишаха-Императора не могла уклониться от этой ответственности, когда долг призывал.»
Нюансы перевода:
Reverend Mother Gaius Helen Mohiam: Преподобная Мать Гайя Елена Мохийам (стандартный перевод титула и имени).
tapestried chair: кресло, обитом гобеленом (или "гобеленовое кресло").
Atreides family holding: фамильное владение Атрейдесов (или "земли дома Атрейдес").
petulant: сварлива (хорошо передаёт раздражительность и капризность). Можно также "раздражительна", "не в духе".
abominable Spacing Guild: гнусная Космическая Гильдия (или "мерзкая", "отвратительная").
secretive ways: вечная скрытность (или "скрытные методы", "таинственность").
Bene Gesserit-with-the-Sight: Бене Гессерит, наделённая Даром Предвидения (или "обладающая Прозрением"). "Дар Предвидения" – устоявшийся термин для "The Sight" в контексте Дюны.
Padishah Emperor’s Truthsayer: Говорящая Правду Падишаха-Императора (стандартный перевод).
when the duty call came: когда долг призывал (или "когда её призывал долг").
У меня конкретно в момент подготовки теста gemini-2.5-pro заглючило и начало выдавать что-то несвязное на промте, который остальные сети ели нормально, поэтому именно её, увы, нет в примерах )))
Думаю он был во всех, но этого мало чтобы веса повторили оригинал (если не тюнить?).
Да, вы совершенно правы - полной мемоизации в духе цитирования переводов Библии я тут не наблюдаю.
Вопрос в том, какой перевод брали. Вряд ли существует единственный.
что за «secretive ways» имел в виду автор.
He was very secretive — «он был очень скрытным». Но это в отношении человека, а как точно перевести на русский, сейчас не придумывается, но естественно, это «такие, которые характерны для скрытных людей».
Тут меня бросило в холодный пот. Я тоже всегда игнорирую точки над е. Не может этого быть! Я прохожу капчу, честно, почти всегда.
По эксперименту согласен, чистым считать нельзя. Хотя бы спросили модели не читали ли они Дюну, особенно в переводе, не знают ли кто такая эта преподобная мать и что там у нее за секретные проходы. И про контекст тоже согласен, художественно перевести вырванный из книги абзац может быть затруднительно. Для чистоты эксперимента нужно взять целое произведение, не переведенное ни разу, а лучше вообще не изданное. И устроить соревнование. Но такой дизайн уже потребует изрядных ресурсов. Где-то должен быть компромисс. Кстати, эссе для последующего перевода тоже можно заставить писать команду ллм vs команду человеков. Одним выстрелом двух зайцев. Даже трех: еще тотализатор можно открыть.
Ссылку на комменты хотя бы дайте в статье, там интересная дискуссия, не флудилка:)
Перевод 1 llm, Космический Гильдий
Перевод 2 - возможно человек (Истинник, Пространственник) - так мог придумать и человек, и llm
Перевод 3 - скорее человек, без глюков, но и немного корявенько. Непрофессионал переводил, возможно.
Перевод 4 - красивый перевод, но "Космический гильдия" выдаёт llm.
Перевод 5 - 50% что llm, хотя с вероятностью других 50% и человек мог придумать "Гильдией Космогации" - ну не космонавтики же...
Перевод 6 - скорее llm, ибо "зеленые фермерские угодья" корявенько, и Правдосказчик... Но мог быть и человек-любитель...
Перевод 7 - llm, корявенько "общение с... её скрытными обычаями", и "когда пришел зов долга"...
Перевод 8 - llm, корявости там же, что и 7
Перевод 9 - однозначно человек, профессионал
Перевод 10 - человек, срезает углы, не пытается все перевести дословно.
Перевод 11 - человек, либо llm, достигшая уровня человека и неотличимая от него ;)
Выложил источники:
Перевод 9 - однозначно человек, профессионал
Профессионал не напишет «общение… с методами».
Человек мог (без редактора) перепутать "и" и "с", и я тоже недоглядел) Но перевод был красивый...
...была более чем немного раздражена.
В соседнем предложении тоже некрасиво
«общение с этой отвратительной Космической Гильдией с её таинственными методами» тоже коряво, профессионал так не напишет. К тому же слово «таинственный» лишено негативного оттенка и контрастирует с «отвратительной». «Методы» — это довольно тяжеловесный вариант для «ways».
Написание всех слов в названии с прописной буквы — это явный англицизм, если это не исключение вроде названия государств. Правильнее было бы «Космической гильдией». А рядом ещё один англицизм: «с этой».
Переводил как-то книжку... Ощутил существование двух стульев... точность vs читабельность. Лучше всего полностью переписать абзац, и это будет хорошо... но как-то нечестно по отношению к автору.
Раньше как то точностью особо не заморачивались
"И Боромир, превозмогая смерть, улыбнулся."
Перевод В. Муравьева, А. Кистяковского.
"Тень улыбки промелькнула на бледном, без кровинки, лице Боромира."
Перевод Н. Григорьевой, В. Грушецкого.
"Уста Боромира тронула слабая улыбка."
Перевод М. Каменкович, В. Каррика.
"Boromir smiled." (Боромир улыбнулся)
Оригинал.
Тест не слепой. Чтобы был слепой и проверял именно качество перевода, надо все имена заменить на стандартные и одинаковые. Исправить грамматические ошибки, которые LLM допускает иногда – ведь, человеческий текст, кроме того, что переводился, потом и редактировался и корректировался.
человеческий текст, кроме того, что переводился, потом и редактировался и корректировался.
А знаете, переводчики и грамотные бывают...
Я не спорю :)
Просто "лучшее - враг хорошего". Меня просто очень порадовали первые 6 вариантов от @artptr86, это было очень забавно, и захотелось сделать что-то подобное. Если бы я думал над этим дольше, возможно, этой бы статьи не было. Может, я бы сделал позже что-то более концептуальное... или нет.
Кстати, если нужно более формально - вообще-то я веду рейтинг COMET на паре en->ru для разных способов перевода :)
https://github.com/janvarev/OneRingTranslator/blob/main/docs_md/ESTIMATIONS.md#comet-scores
Но не уверен, что он так уж хорошо отражает реальность - многие LLM-системы получают более хорошие результаты от людей на более крупных текстах порядка абзаца или страницы (у меня COMET считается на части FLORES датасета, это по 1 предложению из вики-новостей вроде).
Несмотря на несогласование в роде, мне больше всего понравился 4-й перевод, вполне человеческое несогласование, когда много раз редактируешь и остаются такого рода хвосты. Важно иметь в виду, что при профессиональном переводе ВСЕГДА после переводчика должен работать редактор, каким бы грамотным и опытным переводчик ни был.
Спасибо за мысль. Я как-то делал вариант со связкой "ИИ-переводчик + ИИ-редактор", потом отказался, потому что метрики COMET перевода проседали - хотя текст имхо становился лучше.
Возможно, имеет смысл вернуться к идее и делать перевод в два прогона - перевод + редактура.
Сделал вариант - имхо, выглядит довольно достойно
ИИ-переводчик + ИИ-редактор
Преподобная мать Гайус Елена Мохиам погрузилась в резное гобеленовое кресло и безмолвно следила за тем, как к ней приближались мать и сын. По обеим сторонам её распахивались высокие окна, обрамлявшие извивы южного рукава реки и изумрудные поля Атрейдесовских владений, но ни одно из этих величественных видов не могло отвлечь её от собственных мыслей. В это утро годы ложились тяжким грузом на её плечи, и легкая раздражённость мелькнула в глубине глаз. Виной всему она считала бесконечные перелёты сквозь звёздную пустоту и загадочные обычаи отвратительной Космической Гильдии. Однако сама суть миссии требовала личного участия Бене Гессерит, наделённой Видением. Даже Правдовидица Падишах-Императора не могла уклониться от зова долга, когда тот звучал.
Есть к чему придраться. В человеческой процедуре очень многое тоже зависит от качества перевода и уже только потом от профессионализма, терпения и настроения редактора. Редактор, например, бывает «утренним», когда он еще бодр и благостен, и «вечерним», когда он чаще всего устал и раздражен. Здесь у нас пример благостной редактуры :)
Да нет, понятно, что есть к чему. Мне просто интересно, какая связка будет давать результат получше )
Скажу по секрету: grok + кожаный редактор
Кожаный редактор доставляет почти всегда :)) меня интересуют варианты без него )
Тогда подозреваю, что как раз редактором уже DeepSeek (может быть, Qwen). Еще от промптов зависит. Очень часто приходится явно указывать, что температура = 0, но для художественных произведений можно даже, допустим, и 1.25. Похожая фигня при редактуре.
Роль тоже полезно указывать: «Представь, что ты строгий преподаватель» – это точно работает. В принципе, сегодня уже можно настроить нормальный пайплайн с контекстом практически для любой приличной LLM, просто настройки могут различаться.
Да у меня же у самого сервис с доступом к разным LLM + меня интересуют переводы. Поэтому и статью сделал, и тест интересный - в нем топовые сети есть, интересна на них реакция.
Я чуть попозже планирую выложить источники переводов, но уже сейчас
Спойлер
заметно, что платные сети показывают лучшие результаты, чем бесплатные.
Моя пара ИИ-переводчик + ИИ-редактор - это Sonnet 3.5 + o4-mini. DeepSeek показывает себя не очень, увы - но это на фоне топов, конечно. Так-то довольно достойный.
И да, я конечно за полировку промтов и в особенности за указание глоссария, уже в нескольких комментах писал. Чем больше предварительной работы, тем в целом лучше попадание в стилистику.
DeepSeek перевел:
Достопочтенная Мать Гай Хелен Мохиам сидела в кресле, украшенном гобеленами, наблюдая за приближающимися матерью и сыном. Окна по обе стороны от неё открывали вид на южный изгиб реки и зелёные угодья семейства Атрейдесов, но Достопочтенная Мать не обращала внимания на пейзаж. Сегодня утром она особенно остро чувствовала свой возраст и была более чем капризна. Она винила в этом космические перелёты и общение с этим отвратительной Космической Гильдией и её скрытными методами. Но здесь было задание, требовавшее личного внимания Бене Гессерит-с-Прозрением. Даже Истиноговорительница Падишах-Императора не могла уклониться от этой ответственности, когда раздавался зов долга.
-----------------
вот здесь явная ошибка согласования падежей: отвратительным Космическая Гильдией
Вы абсолютно правы! Фраза "с этим отвратительным Космическая Гильдией" содержит ошибку: прилагательное "отвратительным" (творительный падеж) не согласовано с существительным "Космическая Гильдия" (именительный падеж вместо требуемого творительного).
Правильные варианты:
«с этим отвратительным орденом Космической Гильдии»
(если подчеркнуть её организационную структуру)«с этой отвратительной Космической Гильдией»
(простое согласование в женском роде, творительный падеж)
Исправленный фрагмент в тексте:
«Она винила в этом космические перелёты и вынужденное общение с этой отвратительной Космической Гильдией и её таинственными порядками».
Почему так?
— «Гильдия» в русском языке женского рода, поэтому:
отвратительная (а не «отвратительным»)
Космической Гильдией (творительный падеж)
Спасибо за внимательность! Это критично для грамотного перевода. Если нужно ещё что-то уточнить — готов помочь.
Можно еще попробовать переводить места, в которых нужно понять контекст, Остров сокровищ Стивенсона, к примеру. Там кожаные переводчики, не зная морской тематики, и с рифами в самом начале ошиблись, и с кортиками потом. Хотя и робот бы скорее всего налажал в этих случаях.
Или как бы был переведен текст, если язык оригинала имеет средства, которых нет в языке перевода, вроде "приключения голубого карбункула" из Шерлока Холмса
It is a stone!
It is the stone, Watson
(Не цитата. Но суть там в этом)
Как были бы переведены слова, которым нет соответствия в языке? (Вот у Толкиена были дворфы, которые как-то в русском не распространены. У нас они стали гномами. Неплохо, но у Роулинг в Гарри Поттере были и дворфы, и гномы. Долго не мучились - перевели обоих как гномов, видимо как оаз под влияним русских переводов Хоббита, хотя они даже по размеру отличались на порядок, не говоря уж о поведении. Как нейросети бы это перевели? Ошиблись бы так же или нет? Или хуже?)
Оттенки смысла синонимов: в Томе Сойере разницу между gal и girl удачно, на мой неискушенный взгляд в контексте разговора мальчишек (о Бекки Тетчер, если не вру) перевели "она не девчонка, она девочка). Что выдаст нейросеть в таком случае? Обычное для машинных "она не девушка, она девушка "?
В случае, если контекст не понятен, что будет делать робот? В Дракуле Брэма Стокера очень много отсылок к викторианским реалиям того времени, настолько, что уже для современного англоговорящего (но кажется не британца, а американца) там несколько страниц примечаний, иначе непонятно, что имеется в виду). В русском переводе "Дракула" очень сильно короче просто потому, что переводчик "творчески" выкидывал непонятный текст целыми абзацами, а иногда страницами (диалог с местным дедком, говорящим на лютом местном диалекте). С одной стороны плохо, с другой - основная линия сюжета сохранена, а исчезли мелкие реалии, в которых в противном случае он все равно бы облажался, а русский читатель и не понял бы. А робот так может?
Приведенный отрывок на мой взгляд малопоказателен - разницы особой нет, смысл оригинала слишком очевиден, и его сложно исказить.
Как были бы переведены слова, которым нет соответствия в языке?
Достоинство LLM (в отличие от публичных версий Google, DeepL) - в нем можно задавать Глоссарий. Я немного писал, как это делать здесь - там пример, как сделать перевод абзаца из Гарри Поттера в соответствии с собственными правилами именования персонажей. К сущностям, естественно, можно применить такой же подход - при желании переводчика, разумеется.
Если переводчик закидывает многозначные термины на перевод без указания правил или контекста, то результат, понятное дело, будет прилично непредсказуем, но к счастью, это можно купировать при приложении усилий.
В случае, если контекст не понятен, что будет делать робот? В Дракуле Брэма Стокера очень много отсылок к викторианским реалиям того времени, настолько, что уже для современного англоговорящего (но кажется не британца, а американца) там несколько страниц примечаний, иначе непонятно, что имеется в виду).
Первая идея - ИИ, к счастью или к сожалению, имеет очень много отсылок к разным временам. Возможно, он переведет специфические вещи даже лучше - собственно, отрывок из Дюны может, даже менее показателен именно потому что это фантастика с именами вымышленными.
Вторая идея - если есть несколько страниц комментариев, то это прям хорошо, и прямо так и напрашивается их засунуть в промт к модели, и это, вероятно, улучшит перевод.
А развернёте, в чём суть a/the камня?) Будто бы "тот самый камень" напрашивается, но без контентста всей истории сложно)
Оригинал
Sherlock Holmes sat up with a whistle. "By Jove, Peterson!" said he, "this is treasure trove indeed. I suppose you know what you have got?"
"A diamond, sir? A precious stone. It cuts into glass as though it were putty."
"It's more than a precious stone. It is the precious stone."
"Not the Countess of Morcar's blue carbuncle!" I ejaculated.
ChatGPT
Шерлок Холмс присел, свистнув сквозь зубы.
— Вот это да, Петерсон! — сказал он. — Настоящая находка. Вы, конечно, понимаете, что у вас в руках?
— Алмаз, сэр? Драгоценный камень. Он режет стекло, как масло.
— Это не просто драгоценный камень. Это — драгоценнейший из всех.
— Неужели синий карбункул графини Моркар?! — воскликнул я.
DeepSeek
Шерлок Холмс резко приподнялся, свистнув.
— Черт возьми, Петерсон! — воскликнул он. — Да это же настоящая находка! Полагаю, вы понимаете, что держите в руках?
— Алмаз, сэр? Драгоценный камень. Он режет стекло, как масло.
— Это больше чем драгоценный камень. Это тот самый драгоценный камень.
— Неужели это голубой карбункул графини Моркар?! — вырвалось у меня.
(Курсив сделал сам DeepSeek)
Хммм... значит, LLM по какой-то причине очень любят оставлять в тексте английское this/that, и в переводе получаем сплошное «этот-этот-этот». Омерзительно.
Остается неучтенным вопрос о знании английского у оценивающих. Вот прямо бы сравнить еще тех, кто слепо полагался на читаемость русского текста, а еще тех, кто при этом сопоставлял перевод.
Наблюдая за корявостью многих переводов, особенно на Хабре и т.п., я ожидаю завышения оценок еще у тех, кто вырос на интернетных текстах.
Источники переводов
ChatGPT
DeepL
Соколов
DeepSeek
Вязников
Google
Anthropic Sonnet 3.5
Google Gemini Pro 1.5
xAI Grok 3 beta
OpenAI o4-mini
Яндекс.Переводчик
Переводы 1-6 были предоставлены @artptr86, за что ему большое спасибо. Они делались в веб-интерфейсе приложений, иногда с диалогом в случае LLM.
Переводы 7-10 делались мной через VseGPT (доступ к нейросетям по API). Дополнительного контекста не было.
Перевод 11 был сделан мной в веб-интерфейсе.
Также мною были опробованы не попавшие в подборку:
Sonnet 3.7 (неожиданно оказался хуже 3.5)
Google Flash 2.5 (хуже Pro)
Google Gemini Pro 2.5 Experimental (у меня сильно глючил и выдавал разные сбитые результаты в момент перевода на тех же промтах, что и другие сети. Возможно, это особенность доступа по API, потому что вроде в этом комментарии был предложен результат)
Результаты голосования на 13:16 11.05.2025


Мысли автора по результатам голосования
Первое: Хабр и люди спокойно отличают достойный человеческий перевод от машинного - 3 результат идет с сильным разрывом от всех остальных.
5 результат (человеческий) также выше нейросетей - при том, что лично мне он не очень понравился, и я, выкладывая опрос, предполагал, что он будет выбран на уровне нейросетевых моделей. Но я ошибся; оказывается, вкусы бывают разные.
Второе: Платные топовые нейросети пока в среднем не дотягивают до человеческого перевода - даже до уровня Перевода 5. Однако при выборе наилучшего варианта часть пользователей отдала голоса нейросетевым вариантам - видимо, для некоторых людей они правда ощущаются лучше. Даже я вхожу в их число, но не на этом тексте.
При этом разные пользователи склонны выбирать разные нейросети в качестве наилучших. На заметку: если вам не нравится перевод, возможно, вы просто не нашли еще ту сеть, которая бы попадала в ваш личный вайб.
Третье: Платные топовые нейросети (7-10) значительно отличаются по средней читабельности от бесплатных вариантов, предоставляемых в разных чатах.
Интересно, что лично мне больше понравился вариант o4-mini (10) - при том, что я предпочитаю Sonnet (7). Однако пользователи посчитали максимально высоко читабельным и 10, и 7 вариант. Также пользователи высоко оценили Grok 3 (9), хотя мне он не понравился.
Четвертое: среди бесплатных не LLM-вариантов достаточно достойно показал себя Яндекс.Переводчик (11). Хотя по отзывам люди предпочитают Google и DeepL, я замечал, что вариант от Яндекса как-то недооценен, про него редко вспоминают.
Пятое: в комментариях предложили логичную идею - что нужен, в общем, не только переводчик, но и редактор. Я сделал перевод после статьи на связке Sonnet 3.5 (переводичк) + o4-mini (редактор) в комментарии здесь. На мой взгляд, получилось достаточно интересно.
Голосование остается открытым, а источники спрятаны под спойлер. Вы можете по-прежнему сначала принять свое решение о качестве того или иного перевода, а уже потом знакомиться с его источником.
Ого, я даже угадал. Действительно, человеки обошлись с this/that ровно так, как в русском языке положено обходиться с английским указательным артиклем, а нейронки везде навтыкали мерзотный «этот».
(Дисклеймер: я почему-то не смог осилить «Дюну». Начинал читать в оригинале несколько раз, так до конца даже первой книги не дотянул, бесит она меня.)
Пятый пункт сразу понятно, что человек переводил (точнее, сразу возникает уверенность):
- во-первых, "великолепный вид"
- во-вторых, "тайные интриги!" (да ещё с восклицательным знаком)
Если "интриги" ещё можно притянуть к "secretive ways", то слова "великолепный" в принципе нет в оригинале. На мой взгляд, это самый человекоориентированный перевод конкретного абзаца. Что там с остальным -- не в курсе.
Пмсм, "secretive ways" вполне можно перевести просто как "скрытность". Насколько я помню, Гилдия ревниво оберегала свои знания о "червоточинах в пространстве", позволявших перемещаться в Космосе со "сверхсветовой" скоростью...
Эти знания не секретны по лору) Просто применять по назначению безопасно их могут только навигаторы. Секретность гильдии скорее в закрытости и преследовании собственных интересов и все это помноженное на возможности предвидения. Так что интриги тут идеальный вариант. Этот контекст никак из отрывка не следует - поэтому нейронки слабо справились
По мне, все эти варианты укладываются в диапазон от откровенной нелепости до довольно слабой работы. Лучшим я посчитал № 5, но он тоже не ахти. № 3, скорее всего, человеческий, судя по смелой отсебятине.
И никто не знает, что Gaius — это Гай. Преподобная мать — тёзка Цезаря, и, надо полагать, это не просто так.
Статья наводит на две мысли.
Не настал ли ещё момент, когда основным потребителем литературы стали ИИ, а не люди?
Какие переводы больше нравятся ИИ?
Перевод 1 — "космическим гильдией"
Перевод 2 — "семейный холдинг", "гобеленовое кресло"
Перевод 3 человеческий
Перевод 4 — "космическим гильдией"
Перевод 5 человеческий, но отвратительный
Перевод 6 — перепутан род
Перевод 7 — "здесь была миссия"
Перевод 8 — "связь с скрытностью"
Перевод 9 — "общение с таинственными методами"
Перевод 10 — "скрытными порядками"
Перевод 11 — Джессерит
Есть мнение кто перевёл?
Преподобная Мать Гайус Хелен Мохийам сидела в обитом гобеленом кресле, наблюдая, как приближаются мать и сын. Окна по обе стороны от нее выходили на южную излучину реки и зеленые угодья владений Дома Атрейдес, но Преподобная Мать не обращала внимания на открывавшийся вид. Этим утром она особенно остро ощущала свой возраст и была изрядно брюзглива. Она винила во всем космические путешествия и связь с этой мерзостной Космической Гильдией и ее тягой к тайнам. Но предстояла миссия, требовавшая личного внимания от Бене Гессерит, обладающей Предвидением. Даже Провидица Истины Падишаха-Императора не могла уклониться от этой ответственности, когда звал долг.
А меня во всём этом больше всего интересовало, как Атрейдесы умудрились обить кресло плоским настенным ковром. Хохма в том, что tapestry — это тканая картинка, про форму которой ничего не говорится, а вот гобелен — это практически всегда висящий на стене ковёр (во всяком случае, я в своей жизни встречал только такие гобелены).
Повторюсь: в 100 500 прочитанных мною книжках время от времени встречалось «на стене висели гобелены», но ни разу не было «X был обтянут гобеленом».
Ну, как бы редкость употребления не означает, что так использовать слово нельзя. Та же Википедия ссылается на Большую советскую энциклопедию - вообще-то в научных спорах это считается достаточным аргументом, чтобы как минимум принять возможность такой точки зрения.
Я, например, за все свои 100 500 прочитанных книг не встречал использование по делу слова "синхрофазотрон". Это не означает, что синхрофазотронов не существует, или что их нельзя употреблять в текстах.
Наш спор несколько шуточный, но, честно говоря, я считаю достаточно некорректным прибегать к аргументу "мне не встречалось".
Так я же не говорю, что это неправильно. Может, за два комментария Вы забыли уже, но я рассказывал про свои собственные впечатлнеия.
А меня во всём этом больше всего интересовало, как Атрейдесы умудрились обить кресло плоским настенным ковром.
Ну если они на протяжении 26 поколений ухитрялись жить в груде камней...
В принципе, гобелен это ткань. Да, жесткая, но есть и тоньше и толще. Другое дело, что в русском (да и в других языках) узорчатую ткань для обивки мебели гобеленом не называется. А в английском называется. Отсюда и проблемы с переводом. DeepSeek, после некоторых разъяснений сам додумался перевести вот так:
Достопочтенная Мать Гайя Хелена Мохиам восседала в кресле, обитом узорчатой парчой
Использовал слово «парча», чтобы подчеркнуть роскошь обстановки.
Я тебя полюбил, я тебя научу.
В гугле пишем tapestried chair, тыкаем на закладку images и смотрим на результаты. Узорчатых там что-то недостача. Всё больше как раз картины на спинках.
Так о том-то и речь, что tapestry в английском — это тип ткани, а гобелен в русском — настенный ковёр. Ложный друг переводчика, сэр!
В настоящее время французским термином tapisserie (англ. tapestry, нем. Bildteppich) обозначается весь художественный текстиль. В России в научной литературе принят термин «шпалера», тогда как в широком обиходе чаще используется слово «гобелен»
...
В русском языке одновременно применяются два термина: «шпалера» и «гобелен», обозначавшие любое тканое произведение, в том числе обивку для мебели.
Из вики. Я конечно подозреваю что тов. Веша знает лучше и Ожогов нервно курит в сторонке, но думаю что как бы вот так.
Преподобная Мать Гайус Хелен Мохийам, неподвижно, словно древнее изваяние, сидела в массивном, обитом гобеленом кресле, наблюдая, как неторопливо приближаются мать и сын.
Высокие стрельчатые окна по обе стороны от нее выходили на плавную южную излучину полноводной реки и сочные зеленые угодья обширных владений дома Атрейдес, но Преподобная мать, погруженная в свои невеселые думы, не обращала внимания на открывавшийся вид.
Этим промозглым утром она особенно остро ощущала свой почтенный возраст и была, пожалуй, изрядно брюзглива, о чем не преминула бы съязвить, будь рядом кто достойный ее внимания.
Она винила во всем эти бесконечные, изматывающие космические путешествия и вынужденную, столь неприятную ей связь с этой мерзостной космической гильдией, с ее вечной тягой к интригам и многослойным тайнам.
Но теперь предстояла особая миссия, дело едва ли не государственной важности, требовавшее ее неусыпного личного внимания – внимания Бене Гессерит, обладающей великим даром предвидения.
Даже сама провидица Истины всемогущего Падишаха-Императора не посмела бы уклониться от подобной ответственности, когда звучал властный зов долга.
ИЧСХ, здесь переводчик обильно додумал от себя: в исходнике нет ничего про «неподвижно, словно древнее изваяние» и «высокие стрельчатые [окна]».
Человек или ллм?
Думаю, без участия человека не обошлось. В том плане, что это не просто "на, переведи этот текст", кмк. Я бы предположил гибрид: конкретизированный запрос -> машинный перевод -> ручная полировка
Чистый 100% ЛЛМ. Просто пример того как дополнительные инструкции могут сделать иллюзию переводов с "добавочной ценностью", то что раньше любили делать.
Здорово, что тут скажешь. А кто так любил делать (добавочную ценность создавать)? Просто я художки в оригинале почти не читал, не могу сравнивать.
Чрезмерная отсебятина мне кажется непрактичной. Даже точно пересказать чужую выдумку бывает очень непросто, а когда наслаиваешь ещё свою, нужно всё это поддерживать в непротиворечивом состоянии и не запутаться.
В связи с этим мне кажется, что такой хороший эффект LLM может быть обусловлен малой длиной исходного фрагмента. Если бы текст был больше, возможно, пошли бы нестыковки: стрельчатые окна изменили бы форму, река бы обмелела или что-нибудь в этом роде.
Сверху был коммент про подобное
"И Боромир, превозмогая смерть, улыбнулся."
Перевод В. Муравьева, А. Кистяковского.
"Тень улыбки промелькнула на бледном, без кровинки, лице Боромира."
Перевод Н. Григорьевой, В. Грушецкого.
"Уста Боромира тронула слабая улыбка."
Перевод М. Каменкович, В. Каррика.
"Boromir smiled." (Боромир улыбнулся)
Оригинал.
Что раньше было вот так.
Даже точно пересказать чужую выдумку бывает очень непросто, а когда наслаиваешь ещё свою, нужно всё это поддерживать в непротиворечивом состоянии и не запутаться.
В связи с этим мне кажется, что такой хороший эффект LLM может быть обусловлен малой длиной исходного фрагмента. Если бы текст был больше, возможно, пошли бы нестыковки: стрельчатые окна изменили бы форму, река бы обмелела или что-нибудь в этом роде.
Мне кажется это не проблема, если посмотреть на комментарии к книгам на автор тудей, там подобного у кожаных сплошь и рядом.
Тем более если это локальные, очень маленькие вкрапления, то они не появляются в дальнейшем тексте.
Плюс ллм очень хорошо делает анализ не только переводов, но и логических нестыковок.
Т.е. не надо надеяться одним промптом всё победить, а сделать некий пайплайн для трансформации.
Плюс редакторов никто не отменял, ну и бета-ридеров как на автор тудей, которые в панамку с удовольствием отсыпаться, только подставляй.
Мне понравились 3-й и 10 варианты.
А так переводит моё ИИ-творение "Толмачёвая клёпа":
"Преподобная мать Гай Хелен Мохиам сидела в лентестрированном кресле, наблюдая, как мать и сын приближаются. Виндовс с каждой стороны ее смотрел на изогнутый южный сгиб реки и зеленые земледельцы семейного холдинга Атридов, но преподобная мать игнорировала взгляд. Она чувствовала свой возраст сегодня утром, более чем немного петулантной. Она винила его в космических путешествиях и объединении с той мерзкой Способной Гильдией и ее тайными способами.
Но вот была миссия, требующая личного внимания от Бена Гессерита – с – Взгляд. Даже правдоподобный император Падиша не мог уклониться от этой ответственности, когда наступил дежурный звонок."
Определённо ещё есть куда расти.
А вот так перевела данный отрывок оффлайн нейронка Yandexgpt_8b_Q5_K_M отлично работающая на GeForce GTX 1070 c 8гб видеопамяти.
Преподобная Мать Гая Елена Мохийам сидела в кресле, обитом гобеленом, наблюдая за приближением матери и сына. Окна по обеим сторонам от неё выходили на изогнутый южный изгиб реки и зелёные сельскохозяйственные угодья владений семьи Атрейдес, но Преподобная Мать игнорировала вид. Сегодня утром она чувствовала свой возраст, была немного раздражительна. Она винила в этом космические путешествия и общение с этой отвратительной Космической Гильдией и её скрытными методами. Но здесь была миссия, которая требовала личного внимания от Бене Гессерит-со-Зрением. Даже Правдовидица Падишаха Императора не могла уклониться от этой ответственности, когда прозвучал зов долга.
Просто чтобы показать, что можно обходиться и без интернета.
Да, крутяк! Я тоже думал добавить переводы от чего-то типа Gemma 3 27B или Сайги 12B из последних, в квантизации, но подумал, что людей-то Sonnet не сильно радует...
А так да, по факту можно уже вполне обходится без интернета для перевода на уровне смыслов.
И в очередной раз сложно понять: то ли переводила LLM, то ли студент‑троечник («игнорировала вид»? «чувствовала свой возраст»? «здесь была миссия»? МГИМО, говоришь, ендед?)
GeForce GTX 1070 c 8гб видеопамяти.
И всё ещё лучше чем 80% пириводчикаф.
И всё ещё лучше чем 80% пириводчикаф.
О вседавящей жабе в своё время смачно высказался Жванецкий:
Вам не повезло. Специалист, который лечит, в отъезде, но есть второй — не хуже.
Лучше договориться лично. Хотя можно и по направлению.
У нас только по пропускам. Хотя можно пройти и так.
Лечение стоит дорого, но можно и не платить.
Нянечкам, сестрам обычно платят. Но они ухаживают и так.
Поэтому я вам советую подождать специалиста, договориться с нянечкой и заплатить.
Но можно этого и не делать. Если вас не интересует результат.
Халявы хотели? Получите, распишитесь. Кюшайте — не обляпайтесь.
Интересное упражнение. Если честно, ни один перевод не понравился на 100%. Но, кажется, голосование не совсем честное: кто-то голосовал просто за людей:))) как говорится, лишь бы не ИИ. Как по мне, версии ИИ были удобоваримее (например, 7 или 10), но, как было выше сказано - не без изъянов, однако лучше перевода под номером 3, за который проголосовало большинство
Основная проблема в данном тесте, это то что тестировалося перевод художественного направления. А это наверное меньше одного процента от объёма рынка переводов. Плюс специфика восприятия.
Понятно почему автор подобное выбрал, но от этого не легче.
По идее надо тестировать например технические тексты на точность перевода, а не на красоту.
Плюс есть масса случаев когда качество перевода требуется уровня "good enough".
Интересно узнать на сколько уже сейчас схлопнулся рынок переводов по сравнению с 2010, думаю процентов на 70%, из них процентов 20% держатся на плаву за счёт консервативности определённых заказчиков.
Абсолютно с Вами согласна: технические тексты - это несколько иная история.
Технические переводятся очень хорошо, особенно с глоссарием.
Где-то на Хабре была уже статья в духе "как мы перестали работать с переводчиками и автоматизировали перевод через LLM" - как раз для продуктовых историй.
Плюс есть масса случаев когда качество перевода требуется уровня "good enough".
Ну да, ну да...
Сэм — реально холодный кот. Он никогда не взрывает поленницу и не слетает с ручки. Более того, он знает, как сбежать с вещами
Оригинал
Sam is a real cool cat. He never blows his stack and hardly ever flies off the handle. What's more, he knows how to get away with things.
На самом деле™
Сэм — очень спокойный человек. Он никогда не теряет контроль над собой и редко сердится. Более того, он знает, как сделать так, чтобы многое сошло ему с рук.
Исходя из ОТРЫВКА, который вы привели (не знаю, откуда он), в "На самом деле" навалено отсебятины. Потому что исходя из отрывка Сэм - это кот.
Хорошо, на идиомах подловили; хотя в абсолютном большинстве технических текстов их знание не требуется. Как вы любите говорить по отношению к гобелену "в первый раз вижу, чтобы cool cat употреблялось в таком значении" )
Вот вам перевод от o4-mini, чтоб вы успокоились... хотя, это вряд ли.
Сэм - классный парень. Он никогда не выходит из себя и редко теряет самообладание. Более того, он умеет выкручиваться из любой ситуации.
Но, кажется, голосование не совсем честное: кто-то голосовал просто за людей:))) как говорится, лишь бы не ИИ.
До выкладки ответов в первом комментарии их мало кто знал, если не гуглил. Там же - результаты опросов до опубликования, имхо более релевантные.
Справедливости, мне больше понравился перевод 3, хотя когда я увидел 10 при подготовке, я удивился очень сильно.
Разочарован отсутствием перевода из "малиновой" Дюны
Проводим слепой тест переводов прямо на Хабре