Comments 5
Что забавно, я делал подобную вещь примерно год назад. Делал на библиотеке SpeechDelete и отдельно ещё использовал первую попавшуюся нейронку для исправления орфография. SpeechDelete иногда делала большие буквы, когда не надо, не везде ставила запитые и т.д.
Ахахах, прикол) Я сначала делал это через питоновскую библиотеку, вроде эту - работает круто, но не принимает формат аудиофайлов от телеги, нужно конвертировать в wav. Ок, сделал конвертацию через ffmpeg. Если запускать бота на винде то все ок, а вот на линуксовском хостинге уже ffmpeg начинает барагозить. По итогу подумал лучше платить Яндексу по паре десятков копеек и не мучиться.
Так есть же speechkit от яндекса, пример с голосовыми и кругляшками из телеги: https://github.com/olegsvs/yepcock-size-bot/blob/main/stt.py
Да и конвертация в wav работает на линуксе без проблем.
А мемы на сайте скоро будут?
Я так понимаю, что за время, что прошло с написания скрипта Яндекс поменял что-то в своём API? Я смотрю, вижу, например ссылку- https://yandex.cloud/ru/docs/speechkit/quickstart/stt-quickstart-v1
Если не затруднит - не могля бы вы скорректировать ваш код на Гитхаб в соответствии с новыми стандартами Яндекса? А то хочется воспользоваться, но мозгов не хватает понять - что именно исправить, не научен я, простите =)
P.S. Ссылка выше была для коротких файлов, наверное лучше та, что для длинных.
https://yandex.cloud/ru/docs/speechkit/quickstart/stt-quickstart-v2
Использование речевых технологий Яндекса на примере аудиосообщений Telegram или чат-бот для распознавания аудиосообщений