
Команда SberDevices объявила о запуске бесплатного бота в Telegram для перевода русскоязычных голосовых сообщений в текст. Он работает на основе технологий платформы речевых сервисов SmartSpeech.
Бот доступен по ссылке здесь. Он может оказаться полезным специалистам, которые работают с аудиозаписями и текстом. Бота также можно использовать в личной переписке и добавлять в групповые чаты.
SmartSpeech Bot поддерживает файлы в форматах MP3, WAV (8-96 кГц), FLAC и OggOpus объёмом до 20 Мб. Голосовое сообщение преобразуется ботом в текст благодаря технологии распознавания речи (Automatic Speech Recognition, ASR) платформы. Она также может применяться бизнесом в интерфейсах голосового ввода, например, на веб-сайтах.
Саму технологию SmartSpeech Сбер позиционирует как платформу речевых сервисов. На сайте проекта компания обещает, что она может фильтровать фоновые шумы, определять эмоциональность речи говорящего, расставлять знаки препинания и определять конец высказывания. Кроме того, в SmartSpeech есть обратная функция, которая позволяет генерировать речь.