Yandex Cloud обновила свой сервис для синтеза и распознавания речи на базе машинного обучения Yandex SpeechKit. Теперь он может при переводе голоса в текст расставлять знаки препинания. Это поможет в тех областях, где с речевыми технологиями человек должен взаимодействовать напрямую. К примеру, в общении с голосовым помощником, автоматическом транскрибировании или формировании субтитров.
Новая функция называется Пунктуатор. Она может работать в реальном времени для сценариев с голосовыми помощниками и при распознавании предзаписанных аудиофайлов. Пунктуатор разработан при помощи двух последовательно работающих моделей машинного обучения. Одна переводит голос в текст, другая расставляет знаки препинания в соответствии с нормами русского языка.
Функция доступна для всех пользователей Yandex SpeechKit и настраивается стандартными средствами в API.
Василий Ершов
Руководитель разработки Yandex SpeechKit
«Мы развиваем сервисы Yandex Cloud, отвечая на запросы наших клиентов, а иногда и предвосхищая их. Многие наши заказчики сегодня используют Yandex SpeechKit для создания голосовых помощников с диалоговым интерфейсом. В таких проектах распознанный машиной текст важно сделать максимально приближенным к тому, как его написал бы реальный собеседник. Пунктуатор решает эту задачу просто».