Обновить

Наш синтез для 20 языков теперь работает локально под Windows как экранная читалка (SAPI5) и в Балаболке

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели6.3K
Всего голосов 19: ↑19 и ↓0+24
Комментарии3

Комментарии 3

Интересно, потестим, спасибо!

У кого-то может не работать без Microsoft Visual C++ Redistributable

Наш синтез для 20 языков теперь работает локально под Windows как экранная читалка (SAPI5) и в Балаболке

Отличная новость! Несколько лет назад, было много, вполне приличных, моделей под «Балаболку». Я использовал их для освоения иностранных языков. Но потом, по разным причинам, это направление стало значительно менее доступным. Из-за чего пришлось полностью отказаться от этой идеи. И переместить свое внимание на поиск более подходящих моделей.

Понравилось работать с моделями «Vosk» для распознавания иностранной речи в Питоне. Особенно порадовал там тайминг для каждого слова. Другие сервисы дают его более грубо.

Но, для синтеза речи, бесплатные модели нашел только сейчас. Есть отличная модель для английского языка: «onyx-v1.0.onnx» / «voices-v1.0.bin». Для французского языка – хорошая модель: «fr_FR-siwis-medium.onnx» / «fr_FR-siwis-medium.onnx.json». Есть и другие неплохие onnx-модели, судя по образцам их речи, но, пока, еще не было времени белее внимательно посмотреть на них.

Странно, но, главной проблемой оказалось добавление тишины в конец озвучиваемой фразы. В «Балаболке» это делалось на «раз/два», а в Питоне, с помощью утилиты «piper.exe» с этим нужно напрягаться. Плюс еще командная консоль глючит с UTF-8, даже при выборе кодовой страницы «chcp 65001», т.е., UTF-8.

Мне это нужно для создания озвученных данных для моей обучающей программы «L'école».

В конце концов, данную проблему решил, с помощью скрипта на Питоне, утилиты «piper.exe» из пакета Питона «piper-tts», утилиты «ffmpeg.exe» и командной консоли «cmd». Есть прототипы и на чистом Питоне, но там возни больше, а другие варианты требуют более мощной техники и более новой операционной системы, что мне подходит меньше.

Короче, как говорится: «Безвыходных ситуаций не бывает. Как минимум, всегда существует три выхода, даже, если вас съели.» ;) .

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации