Pull to refresh

Comments 7

По опыту PEMT: пока что MT в контекст не умеет совсем. Ни в текстовый в том же файле, и ни ТМ, ни ТБ не спасают. Ни, тем более, в поиск контекста за пределами файла/проекта. Там, где человек слазит в гугло и спросит у какого-нибудь перплексити, МТ тупо переведет по словарю. Хорошая, большая ТМ помогает сделать перевод, стандартный для нее, перемешать куски текста, совместить, подогнать, красиво сформулировать. Но не более.

Плюс галлюцинации: МТ любит иногда добавить отсебятины.

Как мне вещали сами ИИ перевод крупных текстов должен производится минимум в 3 этапа с тремя разными промптами. Если цена на токены не высокая (типа дипсика), то количество этапов можно увеличить. Правда мне требовался художественный перевод самиздата. Во многих случаях качество получилось лучше оригинала. Хотя небольшие косяки все же оставались, которые мне показалось проще исправлять ручками.

Не особо понимаю, в чем преимущество 3 этапов. Это что-то дает?

Если как у автора статьи подавать на вход по одной строке, то подозреваю, что не очень много. С одной строкой модели обычно справляются без проблем и при длинном промпте. Другое дело, что будет скакать стиль, модель не сможет отслеживать тавтологии и просто еще дикая куча проблем. Я такой вариант просто не рассматривал, так как он бредовый.

Я изначально старался подать на вход максимально возможных кусок, который модель в состоянии прожевать. Тогда текст становится намного более гладкий, но... Модель теряет фокус, если с нее потребовать все и сразу: и перевод точный и русский текст без ошибок, да еще и форматирование идеальное. Поэтому это три минимальных отдельных этапа для получения хорошего текста. При необходимости обращения внимания на какие то параметры, специфические для конкретного текста количество этапов может быть больше.

Я пришёл к похожим выводам при переводе технической литературы, и схожим с автором способом "удерживаю" модель в контексте.

Однако по художественной литературе, согласен с Вами, работает сомнительно. Стилистика очень сильно скачет...

Поделитесь пожалуйста своими промптами и техниками 🙏

Основная проблема в том, что очень часто приходится переводить кривые-косые дефектные тексты, написанные неносителями как языка, так и мозгов. И там каждый раз бред новый, закономерностей нет, RAG не получается. Например, писали инструкцию на англ. на станок 10 китайцев, не согласовывая свои действия. И каждый одно и тоже назвал разным термином, да еще все эти варианты идут вперемешку. Или писал статью наш академик в глубоком маразме и выдал бред, в котором слова есть, а смысла нет. И вот таких текстов у меня 90%. И с ними, как ни бейся, LLM не сильно помогают.

Тут я с вами соглашусь. От качества исходного текста зависит если не все, то очень многое.

Sign up to leave a comment.

Articles