Comments 8
Спасибо за техническую публикацию.
Интересно!
А вы не пробовали переводить с русского на английский? И как можно добавить в вашу систему терминологию из каких-то специфических областей, например, из квантовой механики или йоги/буддзма?
С русского на английский не пробовал.
Терминологию из каких-то специфических областей можно добавить в системный промт (прямо за основным текстом), Ну и поменять его начало на примерно следующее "Вы — дотошный переводчик, специализирующийся на переводе технической литературы по квантовой механики с английского на русский язык..."
в заголовке написано 'качественно', какими тестами вы это проверяли?
почему выбрана именно модель от yandex? у нее не очень хорошо со следованием инструкций или у вас есть системный промпт, который дает высокое качество?
"Про качество перевода" я расписал в конце своего поста, проверял на разных текстах (в основном художественных) просто переводил разными онлайн системами и сверял полученный результат, получалось примерно на одном с ними уровне.
Про "почему выбрана именно модель от yandex" тоже написано. Мне она показалась (после тестов) на сегодня лучшей.
рекомендую вместо 'примерно' и 'показалось' использовать какую то цифровую метрику, в идеале автоматически вычисляемую... в этом случае вы можете протестировать с разными моделями и получить возможность сравнивать их численно.
У крошечных 8б моделей периодически вылезают грубые ошибки, неправильное склонение и употребление слов, иногда вообще мусор.
Я пробовал переводить книгу с помощью нормальных крупных моделей, gemini flash, gemini pro, читал сначала то что написал флеш, потом Про, и закончил уже переводом от человека. Флеш был впринципе неплох но язык бедноватый и иногда вылезают грубые ошибки (но не такие как у крошечных, просто видно что он как то не так понял, грубо срезал углы), Про заметно лучше но тоже заметно что что то не так.
Спасибо!
А можно также подробно, но чтобы еще и "озвучка" была ? )
Собираем комплекс для качественного офлайн-перевода текстов, работающий на самом обычном игровом компьютере