Как стать автором
Поиск
Написать публикацию
Обновить

Собираем комплекс для качественного офлайн-перевода текстов, работающий на самом обычном игровом компьютере

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров5K
Всего голосов 10: ↑10 и ↓0+11
Комментарии10

Комментарии 10

Спасибо за техническую публикацию.

Интересно!

А вы не пробовали переводить с русского на английский? И как можно добавить в вашу систему терминологию из каких-то специфических областей, например, из квантовой механики или йоги/буддзма?

 С русского на английский не пробовал.

Терминологию из каких-то специфических областей можно добавить в системный промт (прямо за основным текстом), Ну и поменять его начало на примерно следующее "Вы — дотошный переводчик, специализирующийся на переводе технической литературы по квантовой механики с английского на русский язык..."

в заголовке написано 'качественно', какими тестами вы это проверяли?

почему выбрана именно модель от yandex? у нее не очень хорошо со следованием инструкций или у вас есть системный промпт, который дает высокое качество?

"Про качество перевода" я расписал в конце своего поста, проверял на разных текстах (в основном художественных) просто переводил разными онлайн системами и сверял полученный результат, получалось примерно на одном с ними уровне.

Про "почему выбрана именно модель от yandex" тоже написано. Мне она показалась (после тестов) на сегодня лучшей.

рекомендую вместо 'примерно' и 'показалось' использовать какую то цифровую метрику, в идеале автоматически вычисляемую... в этом случае вы можете протестировать с разными моделями и получить возможность сравнивать их численно.

У крошечных 8б моделей периодически вылезают грубые ошибки, неправильное склонение и употребление слов, иногда вообще мусор.

Я пробовал переводить книгу с помощью нормальных крупных моделей, gemini flash, gemini pro, читал сначала то что написал флеш, потом Про, и закончил уже переводом от человека. Флеш был впринципе неплох но язык бедноватый и иногда вылезают грубые ошибки (но не такие как у крошечных, просто видно что он как то не так понял, грубо срезал углы), Про заметно лучше но тоже заметно что что то не так.

Спасибо!

А можно также подробно, но чтобы еще и "озвучка" была ? )

Нет, не пользуюсь озвучкой (сам читаю). Но, немного побродив по интернету, нашёл форум тех, кто пользуется и у них на сегодня самая популярная сборка для оффлайн озвучки текста это Demagog + Model Silero. Там вроде всё довольно просто и уже описано как пользоваться.

https://mytts-info.ucoz.net/forum/16 (ссылка на их форум)

О, спасибо )

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации