Pull to refresh

Comments 13

"... создаём языки..." здесь использовали именно в контексте создания синтеза и распознавания под эти языки. Но согласен, без контекста может звучать странно :)

Планируется ли сделать синтез речи, либо распознавание для беларуского языка в Yandex SpeechKit?

В Сommon Voice уже почти 1500 часов накопилось.

Пока что мы при создании синтеза и распознавания под каждый новый язык смотрим на востребованность этого языка для бизнеса. Следите за новостями, в какой-нибудь момент у нас наверняка появятся синтез и распознавание для белорусского языка, но пока без каких-либо сроков

UFO just landed and posted this here

Всё так, размечаются целиком предложения/фразы. Речь скорее шла о нежелательности выбросов на уровне слов. Например, если часть фразы была не размечена или была размечена неправильно

Я правильно понял что нормализация и для ASR и для TTS у вас сейчас строится на базе нейронке а нее на рулах или у вас какая то комбинация из этих инструментов?

Сейчас мы используем скорее их комбинацию. Но правила, которые у нас есть, достаточно простые. И они больше применяются либо для исправления проведения сетки там, где она плохо справляется, либо для сбора данных для обучения той же сетки :)

Не раньше белорусского :)

Это, наверное, прекрасная система.
Только почему никто из техподдержки не может рассказать, как её можно интегрировать в свои сервисы? Например, у меня есть АТС на freePBX16. Продажники готовы продать сервис SpeechKit, я готов купить.

Хочется отметить, что все языки в SpeechKit работают в рамках единой мультиязычной модели. Это возможно во многом благодаря её трансформерной архитектуре.

При добавлении нового языка при этом переучиваете модель на всех данных? Вы как-то балансируете данные чтобы при добавлении нового языка модель не забывала старые?

И еще вопрос, в Яндекс Переводчике есть функция распознания речи, но для узбекского (и казахского) языка эта функция не поддерживается. Планируется добавление распознавания этих языков в переводчик?

При добавлении нового языка при этом переучиваете модель на всех данных? Вы как-то балансируете данные чтобы при добавлении нового языка модель не забывала старые?

Если вкратце, то "да" и "да". Детальнее — уже особенности внутренней кухни :)

Планируется добавление распознавания этих языков в переводчик?

Переводчик — это отдельный не контролируемый нами сервис Яндекса. Сейчас мы скорее не можем повлиять на добавление распознавания на этих языках в сервис перевода. Но мы передали эту идею коллегам, спасибо!

Sign up to leave a comment.