Обновить
13
Владимир Кириченко@vvkiri

Голосовые технологии

6
Подписчики
Отправить сообщение

не, это обычный, просто громко отнормализован

кстати, театральный шепот пробовали писать в сессии с Татьяной

массово записывать и запускать в прод не стали -- он получался ну очень зловещий

ответил тут https://habr.com/ru/company/yandex/blog/593681/#comment_23803169

кратко: Алиса пока слишком привязана к интернету, для нее не синтез - блокер.

но отдельно сделать что-то, что будет бегать на мобильном железе - думаем.

сам мужской голос из читалки -- тоже наш, экспериментируем над "читающим голосом", более пригодным для книг.

читалка пока "приземлена" в приложении, на ранних этапах отселять пока не будем (чтобы не создавать зоопарк приложений), а там посмотрим.

> И хорошо бы, настроить паузы между предложениями и абзацами. Кажется ведь так просто, после точки вставить паузу, после абзаца паузу подлиннее.

ну, базовые паузы там сделаны, но тюнить еще будем, затачиваясь под форматирование. Спасибо.

передал запрос ребятам из устройств и продукта, спасибо

пока что самое ближайшее, что есть - пульт управления громкостью с я.музыки (через смартфон)

https://yandex.ru/support/station-mini/audio.html#audio__music-streaming
надеюсь, будет полезным

не совсем понял, имеется в виду on-device?

пока этого нет, в Алисе это неприменимо, т.к. качество получится пониже, а к вебу Алиса привязана поиском.

но, возможно, сделаем легковесный TTS в каком-то другом продукте)

шепот катился на все колонки и приложение яндекса вечером с 7ого на 8ое, после этого еще несколько часов могло отвечать из кэша.

если после этого колонка не отвечает шепотом -- давайте смотреть (лучше в ЛС).

должно быть именно так.

все записи в статье нормализованы (диапазон колебаний вавки растянут до minmax диапазона возможных значений).

у шепота меньше выбросов, более равномерная громкость по записи, после нормализации такого сигнала энергия звука (сумма квадратов отклонений) будет персептивно больше, чем у речи (у нее более вариативная громкость).

в колонке и приложении громкость отрегулировали так, чтобы шепот звучал тише речи.

спасибо,

действительно, с Пороховской проблема, причем только с некоторыми падежами

подправим в ближайшем релизе

все так

мы сделали базовый механизм, но его нужно продолжать раскармливать данными

примерно, по словарю Зализняка, в русском языке около 20к омографов (и это не считая нововведений, вроде Орбита-орбИта), мы их продолжаем закрывать, набирая новые данные

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность