Molot999 Aug 6 2023 at 18:51

Использование речевых технологий Яндекса на примере аудиосообщений Telegram или чат-бот для распознавания аудиосообщений

Easy

7 min

5.2K

Python *

Tutorial

Comments 5

MoonArsenii Aug 6 2023 at 20:26

Что забавно, я делал подобную вещь примерно год назад. Делал на библиотеке SpeechDelete и отдельно ещё использовал первую попавшуюся нейронку для исправления орфография. SpeechDelete иногда делала большие буквы, когда не надо, не везде ставила запитые и т.д.

Molot999 Aug 6 2023 at 20:34

Ахахах, прикол) Я сначала делал это через питоновскую библиотеку, вроде эту - работает круто, но не принимает формат аудиофайлов от телеги, нужно конвертировать в wav. Ок, сделал конвертацию через ffmpeg. Если запускать бота на винде то все ок, а вот на линуксовском хостинге уже ffmpeg начинает барагозить. По итогу подумал лучше платить Яндексу по паре десятков копеек и не мучиться.

oleg-svs Aug 6 2023 at 22:03

Так есть же speechkit от яндекса, пример с голосовыми и кругляшками из телеги: https://github.com/olegsvs/yepcock-size-bot/blob/main/stt.py

Да и конвертация в wav работает на линуксе без проблем.

svdik Aug 6 2023 at 22:02

А мемы на сайте скоро будут?

MAcroS Sep 23 2025 at 16:13

Я так понимаю, что за время, что прошло с написания скрипта Яндекс поменял что-то в своём API? Я смотрю, вижу, например ссылку- https://yandex.cloud/ru/docs/speechkit/quickstart/stt-quickstart-v1
Если не затруднит - не могля бы вы скорректировать ваш код на Гитхаб в соответствии с новыми стандартами Яндекса? А то хочется воспользоваться, но мозгов не хватает понять - что именно исправить, не научен я, простите =)

P.S. Ссылка выше была для коротких файлов, наверное лучше та, что для длинных.
https://yandex.cloud/ru/docs/speechkit/quickstart/stt-quickstart-v2