все записи в статье нормализованы (диапазон колебаний вавки растянут до minmax диапазона возможных значений).
у шепота меньше выбросов, более равномерная громкость по записи, после нормализации такого сигнала энергия звука (сумма квадратов отклонений) будет персептивно больше, чем у речи (у нее более вариативная громкость).
в колонке и приложении громкость отрегулировали так, чтобы шепот звучал тише речи.
мы сделали базовый механизм, но его нужно продолжать раскармливать данными
примерно, по словарю Зализняка, в русском языке около 20к омографов (и это не считая нововведений, вроде Орбита-орбИта), мы их продолжаем закрывать, набирая новые данные
не, это обычный, просто громко отнормализован
кстати, театральный шепот пробовали писать в сессии с Татьяной
массово записывать и запускать в прод не стали -- он получался ну очень зловещий
ответил тут https://habr.com/ru/company/yandex/blog/593681/#comment_23803169
кратко: Алиса пока слишком привязана к интернету, для нее не синтез - блокер.
но отдельно сделать что-то, что будет бегать на мобильном железе - думаем.
сам мужской голос из читалки -- тоже наш, экспериментируем над "читающим голосом", более пригодным для книг.
читалка пока "приземлена" в приложении, на ранних этапах отселять пока не будем (чтобы не создавать зоопарк приложений), а там посмотрим.
> И хорошо бы, настроить паузы между предложениями и абзацами. Кажется ведь так просто, после точки вставить паузу, после абзаца паузу подлиннее.
ну, базовые паузы там сделаны, но тюнить еще будем, затачиваясь под форматирование. Спасибо.
передал запрос ребятам из устройств и продукта, спасибо
пока что самое ближайшее, что есть - пульт управления громкостью с я.музыки (через смартфон)
https://yandex.ru/support/station-mini/audio.html#audio__music-streaming
надеюсь, будет полезным
не совсем понял, имеется в виду on-device?
пока этого нет, в Алисе это неприменимо, т.к. качество получится пониже, а к вебу Алиса привязана поиском.
но, возможно, сделаем легковесный TTS в каком-то другом продукте)
шепот катился на все колонки и приложение яндекса вечером с 7ого на 8ое, после этого еще несколько часов могло отвечать из кэша.
если после этого колонка не отвечает шепотом -- давайте смотреть (лучше в ЛС).
должно быть именно так.
все записи в статье нормализованы (диапазон колебаний вавки растянут до minmax диапазона возможных значений).
у шепота меньше выбросов, более равномерная громкость по записи, после нормализации такого сигнала энергия звука (сумма квадратов отклонений) будет персептивно больше, чем у речи (у нее более вариативная громкость).
в колонке и приложении громкость отрегулировали так, чтобы шепот звучал тише речи.
спасибо,
действительно, с Пороховской проблема, причем только с некоторыми падежами
подправим в ближайшем релизе
все так
мы сделали базовый механизм, но его нужно продолжать раскармливать данными
примерно, по словарю Зализняка, в русском языке около 20к омографов (и это не считая нововведений, вроде Орбита-орбИта), мы их продолжаем закрывать, набирая новые данные