Как стать автором
Обновить

Сбер запустил в Telegram бота, который переводит аудиофайлы в текстовый вид

Время на прочтение1 мин
Количество просмотров4.8K

Команда SberDevices объявила о запуске бесплатного бота в Telegram для перевода русскоязычных голосовых сообщений в текст. Он работает на основе технологий платформы речевых сервисов SmartSpeech. 

Бот доступен по ссылке здесь. Он может оказаться полезным специалистам, которые работают с аудиозаписями и текстом. Бота также можно использовать в личной переписке и добавлять в групповые чаты.

SmartSpeech Bot поддерживает файлы в форматах MP3, WAV (8-96 кГц), FLAC и OggOpus объёмом до 20 Мб. Голосовое сообщение преобразуется ботом в текст благодаря технологии распознавания речи (Automatic Speech Recognition, ASR) платформы. Она также может применяться бизнесом в интерфейсах голосового ввода, например, на веб-сайтах.

Саму технологию SmartSpeech Сбер позиционирует как платформу речевых сервисов. На сайте проекта компания обещает, что она может фильтровать фоновые шумы, определять эмоциональность речи говорящего, расставлять знаки препинания и определять конец высказывания. Кроме того, в SmartSpeech есть обратная функция, которая позволяет генерировать речь.

Теги:
Хабы:
Всего голосов 8: ↑7 и ↓1+8
Комментарии15

Другие новости

Ближайшие события