Comments 10
Что-то подобное делал ранее, только в качестве самостоятельного устройства. Для синтеза речи лучше использовать модель v4_ru.pt, она быстрее.
Документация предлагает прослушать примеры голосов на странице https://data2data.ru/tts/ , однако страница недоступна. Не знаете где еще можно ознакомиться с примерами?
Теперь и у меня доступна. А до этого в разных браузерах происходил редирект на разные сайты.
Очень не удобно прослушивание сделано — нужно скачивать mp3-файлы. Но по сути, один и тот же голос, в котором меняют скорость и тембр. В остальном никаких отличий. Не помню как называется, но, кажется в 2003 году в Говорилке его использовали.
Молодец!
В коде выше используется библиотека
fuzzywuzzy
, позволяющая нечётко сравнивать строки, данная библиотека необязательна, но лучше с ней чем без неё.
Можешь ещё попробовать поработать с языковыми моделями, это щас модно :) Например, сравнивать строки, задавая вопрос гигачату:
from gigachat import GigaChat
GIGACHAT_TOKEN = "MTQ....................................1NA=="
s1 = "Что ты умеешь?"
s2 = "Расскажи, что ты можешь делать?"
with GigaChat(credentials=GIGACHAT_TOKEN, verify_ssl_certs=False) as giga:
response = giga.chat(
"На сколько процентов похожи две следующие строки? Сравни по смыслу:\n"
f"1) {s1}\n"
f"2) {s2}\n"
"В ответе напиши только одно число.")
print(response.choices[0].message.content)
п+ишу
??
Спасибо за статью!
Голосовой ассистент на python