Попробовал, ситуация интересная. Мне перевод показался плохим - в каких-то местах выдуманные куски, модель путает "вы-ты", странные конструкции. Но при этом формальная оценка - 91,33, выше, чем у любой другой модели. Добавил результаты в гугл-таблицу, ссылка на которую приведена в статье.
Все упирается в необходимость cuda для некоторых моделей. И перевод медиа, через whisper, тоже потребует. Если оставить только перевод через лм студио, то может и получится сделать портабельно. Но надо смотреть. Попробуйте установку по первому пункту, через внешние системы для портабельной установки. Я попробовал через одну из них, была одна проблема, я описал в документации решение.
Пишите, какие будут сложности или проблемы, попробуем решить)
В русском тексте слова могут быть практически в любом порядке, но в английском - нет. Поэтому при переводе на английский, без дополнительного контекста с нужными эмоциями, это будет потеряно.
Получается, что я сам пришёл к варианту с первым проходом, подача текста и предыдущего контекста. Но при переводе книг я подаю только один параграф, чтобы было проще делать соответствие оригинального параграфа и перевода, потому что пытаюсь читать сначала текст в оригинале, потом перевести мысленно, а потом уже заглянуть в перевод. Думаю, это очень редкий случай, что кто-то ещё захочет читать именно так, но делал в первую очередь под себя.
Если бы не этот подход, то можно было бы, как и описано выше, брать несколько абзацев (ограничение по длине взять из параметров) и отдавать в перевод. Возможно, стоит сделать и такой вариант тоже. И потом сравнить, на сколько это даст эффект в качестве.
Ниже обсуждалось, что есть вариант сделать глоссарий имён, возможно, сразу вида имя - пол - вид (если не человек) - краткая характеристика. Вопрос в том, сколько это займёт контекста и не запутается ли в нем модель.
При разбивке по предложениям перевод будет очень плохим, да, но и использовать его стоит только для тех моделей, которые иначе начмнают терять что-то. Все ллм модели нормально работают с несколькими параграфами текста.
Если бы речь шла про звезду, то был бы верный. Но в данном случае ожидалось, что будут именно кентавры, если смотреть на образец от команды переводчиков.
В зависимости от используемой модели. Скорее всего, каждая по своему истолкует.
Приложение само по себе не переводит, а только подгатавливает текст для перевода. А переводят модели, которые создали и обучили компании и возможно дообучили другие люди.
На модели saiga_yandexgpt: Тебя я люблю. -> I love you. -> Я люблю тебя.
Интересная статья. Я тоже написал переводчик на питоне, с поддержкой llm, и более специфичных моделей, в котором есть как модуль перевода (вроде гугл транслейт), так и перевод файлов. Есть кэши, разбивка на части и тд. Пока что только fb2, epub, txt. Планов много, разработка идёт. Все хочу написать статью, и все не соберусь)
Посмотрите обзор i-pro, который делал За рулем. Там рассказывают (примерно на 5-й минуте), что штатно установлен контур обогрева, который питается от солярки. Можно выбрать, как обогревать салон - электричеством, или соляркой.
Попробовал, ситуация интересная. Мне перевод показался плохим - в каких-то местах выдуманные куски, модель путает "вы-ты", странные конструкции. Но при этом формальная оценка - 91,33, выше, чем у любой другой модели. Добавил результаты в гугл-таблицу, ссылка на которую приведена в статье.
Нет, можно попробовать.
Наверно, можно ссылку на гугл док прикрепить
Было бы интересно почитать результаты, хотя бы субъективные.
Все упирается в необходимость cuda для некоторых моделей. И перевод медиа, через whisper, тоже потребует. Если оставить только перевод через лм студио, то может и получится сделать портабельно. Но надо смотреть. Попробуйте установку по первому пункту, через внешние системы для портабельной установки. Я попробовал через одну из них, была одна проблема, я описал в документации решение.
Пишите, какие будут сложности или проблемы, попробуем решить)
В русском тексте слова могут быть практически в любом порядке, но в английском - нет. Поэтому при переводе на английский, без дополнительного контекста с нужными эмоциями, это будет потеряно.
Получается, что я сам пришёл к варианту с первым проходом, подача текста и предыдущего контекста. Но при переводе книг я подаю только один параграф, чтобы было проще делать соответствие оригинального параграфа и перевода, потому что пытаюсь читать сначала текст в оригинале, потом перевести мысленно, а потом уже заглянуть в перевод. Думаю, это очень редкий случай, что кто-то ещё захочет читать именно так, но делал в первую очередь под себя.
Если бы не этот подход, то можно было бы, как и описано выше, брать несколько абзацев (ограничение по длине взять из параметров) и отдавать в перевод. Возможно, стоит сделать и такой вариант тоже. И потом сравнить, на сколько это даст эффект в качестве.
Ниже обсуждалось, что есть вариант сделать глоссарий имён, возможно, сразу вида имя - пол - вид (если не человек) - краткая характеристика. Вопрос в том, сколько это займёт контекста и не запутается ли в нем модель.
При разбивке по предложениям перевод будет очень плохим, да, но и использовать его стоит только для тех моделей, которые иначе начмнают терять что-то. Все ллм модели нормально работают с несколькими параграфами текста.
Это можно пробовать решить созданием контекста с именами и передачей его в перевод. Можно попробовать добавить.
Если бы речь шла про звезду, то был бы верный. Но в данном случае ожидалось, что будут именно кентавры, если смотреть на образец от команды переводчиков.
В зависимости от используемой модели. Скорее всего, каждая по своему истолкует.
Приложение само по себе не переводит, а только подгатавливает текст для перевода. А переводят модели, которые создали и обучили компании и возможно дообучили другие люди.
На модели saiga_yandexgpt: Тебя я люблю. -> I love you. -> Я люблю тебя.
Интересная статья. Я тоже написал переводчик на питоне, с поддержкой llm, и более специфичных моделей, в котором есть как модуль перевода (вроде гугл транслейт), так и перевод файлов. Есть кэши, разбивка на части и тд. Пока что только fb2, epub, txt. Планов много, разработка идёт. Все хочу написать статью, и все не соберусь)
Посмотрите обзор i-pro, который делал За рулем. Там рассказывают (примерно на 5-й минуте), что штатно установлен контур обогрева, который питается от солярки. Можно выбрать, как обогревать салон - электричеством, или соляркой.