Comments 4
Что забавно, я делал подобную вещь примерно год назад. Делал на библиотеке SpeechDelete и отдельно ещё использовал первую попавшуюся нейронку для исправления орфография. SpeechDelete иногда делала большие буквы, когда не надо, не везде ставила запитые и т.д.
Ахахах, прикол) Я сначала делал это через питоновскую библиотеку, вроде эту - работает круто, но не принимает формат аудиофайлов от телеги, нужно конвертировать в wav. Ок, сделал конвертацию через ffmpeg. Если запускать бота на винде то все ок, а вот на линуксовском хостинге уже ffmpeg начинает барагозить. По итогу подумал лучше платить Яндексу по паре десятков копеек и не мучиться.
Так есть же speechkit от яндекса, пример с голосовыми и кругляшками из телеги: https://github.com/olegsvs/yepcock-size-bot/blob/main/stt.py
Да и конвертация в wav работает на линуксе без проблем.
А мемы на сайте скоро будут?
Использование речевых технологий Яндекса на примере аудиосообщений Telegram или чат-бот для распознавания аудиосообщений