Comments 13
"... создаём языки...". Может быть, "добавляем"?
Планируется ли сделать синтез речи, либо распознавание для беларуского языка в Yandex SpeechKit?
В Сommon Voice уже почти 1500 часов накопилось.
Я правильно понял что нормализация и для ASR и для TTS у вас сейчас строится на базе нейронке а нее на рулах или у вас какая то комбинация из этих инструментов?
Когда эсперанто добавите?
Это, наверное, прекрасная система.
Только почему никто из техподдержки не может рассказать, как её можно интегрировать в свои сервисы? Например, у меня есть АТС на freePBX16. Продажники готовы продать сервис SpeechKit, я готов купить.
Хочется отметить, что все языки в SpeechKit работают в рамках единой мультиязычной модели. Это возможно во многом благодаря её трансформерной архитектуре.
При добавлении нового языка при этом переучиваете модель на всех данных? Вы как-то балансируете данные чтобы при добавлении нового языка модель не забывала старые?
И еще вопрос, в Яндекс Переводчике есть функция распознания речи, но для узбекского (и казахского) языка эта функция не поддерживается. Планируется добавление распознавания этих языков в переводчик?
При добавлении нового языка при этом переучиваете модель на всех данных? Вы как-то балансируете данные чтобы при добавлении нового языка модель не забывала старые?
Если вкратце, то "да" и "да". Детальнее — уже особенности внутренней кухни :)
Планируется добавление распознавания этих языков в переводчик?
Переводчик — это отдельный не контролируемый нами сервис Яндекса. Сейчас мы скорее не можем повлиять на добавление распознавания на этих языках в сервис перевода. Но мы передали эту идею коллегам, спасибо!
Как мы создаём новые языки в Yandex SpeechKit. Рассказываем на примере узбекского