Pull to refresh
-11
0
Send message
Добрый день,

i-векторы не использовали — они не содержат информацию о том, что и как человек говорит, а только о том, кто говорит. Все затевалось для того, чтобы сделать хороший генератор фичей.
Спасибо за комментарий! Динамическое программирование используется во всех вышеперечисленных алгоритмах. К сожалению, объем статьи не позволил включить их подробный пересказ, однако вы можете ознакомиться с ними по предоставленным ссылкам.

Также мы осознанно не обсуждаем нейросетевые решения. Нейросети — другой подход, который в разрезе речевых технологий заслуживает отдельного обсуждения. Было бы интересно их сравнить.

Создатель алгоритма Google (REAPER), David Talkin, известен как автор статьи 1995 года «A robust algorithm for pitch tracking (RAPT)», на которую опирались создатели YAAPT. Мы не видели статьи с подробным описанием REAPER, но алгоритм опирается на ту же функцию Normalized Cross Correlation (NCCF), которая обсуждается выше.
Спасибо за вопрос! На рисунке шкалы не зависимы для спектрограммы и для f0. Поэтому синяя линия не должна накладываться на темные полосы на спектрограмме.

Information

Rating
Does not participate
Registered
Activity