Не обращая внимание на правильность полученных результатов: фильтр Блума справляется с поставленной задачей и практика это доказывает, а остальное не так уж важно. Если нужно улучшить метод, можно использовать методику динамического изменения параметров. Спасибо за перевод.
igmor, с оределением я конечно превзошел сам себя, но не нашел в русской литературе годного разьяснения что это. везде где встречаю «энергию», там это понятие берется чуть ли не как понятие точки в геометрии и потому на обьяснение не дается ни строчки. просто не нашел как выразиться.
Я долго думал что стоило бы пояснить детальнее что такое оконные функции вообще, затем решил что вставлю ссылку, а в последний момент и вовсе забыл об этом. Но совесть моя чиста, ведь тот кто не знает и заинтересовался — лучше пусть почитает лит-ру на эту тему. Но на тему разъяснений — может в следующем посте все будет лучше! спасибо.
В посте в разделе описания каждой из характеристик указывается где она может применяться. На самом деле это самые элементарные характеристики используемые в обработке речи. Они сами по себе ничего не позволяют делать, но они в ходят в основу большинства алгоритмов обработки: среди которых и определение диктора, выделение ключевых слов, распознавании; в основу алгоритмов сжатия, основывающихся на сжатии участка записи речи, которая не несет информации и тд.
Шипящие звуки в плане шума или в плане шипящих в речи?
На шум проверяли и с разной интенсивность. А в речи должно детектироваться как часть речи из-за непродолжительности воздействия.
Примеров даже в сети не очень много, да и то что есть редко выходит за рамки грязного едва-рабочего куска кода. Разработки в этой области мало кто выкладывает, так как зачастую они несут коммерческий интерес. Есть мысли до весны реализовать пару базовых алгоритмов из этой области, в том числе и VAD и, если повезет, несомненно поделюсь примером.
Ну, скажем, VAD ведь нужен не только для средств связи, не так ли? Насколько я знаю, в TeamView используется реализация VAD из-за которой слушать собеседника во время совместной работы сложно. Но сам VAD это подоснова для многих других алгоритмов. В том числе алгоритмов улучшения качества речевых отрезков, распознавания, выделения дикторов. Скажем, это весьма важный алгоритм в области обработки аудио или речи и от качества его реализации сильно зависит итоговый результат комплексной системы.
Да, соглашусь, энергия самого шума критически влияет на работу этих алгоритмов, независимо от того, на каких характеристиках они основаны. Поэтому ищут алгоритмы, которые успешно справляются с шумами разных характеров.
А на счет работы с пересекающимися фреймами — на основе более продолжительного окна времени можно достать больше информации о присутствующем шуме, потому новые кодеки работают на порядок лучше. Но они соответственно сложнее в реализации. Я же для начала решил сделать перевод статьи с довольно простым алгоритмом VAD.
Для студента промо-кода не найдется?
А задачи с этого курса есть? Или после лекций идет чисто теоретический семинар?
Я долго думал что стоило бы пояснить детальнее что такое оконные функции вообще, затем решил что вставлю ссылку, а в последний момент и вовсе забыл об этом. Но совесть моя чиста, ведь тот кто не знает и заинтересовался — лучше пусть почитает лит-ру на эту тему. Но на тему разъяснений — может в следующем посте все будет лучше! спасибо.
На шум проверяли и с разной интенсивность. А в речи должно детектироваться как часть речи из-за непродолжительности воздействия.
А на счет работы с пересекающимися фреймами — на основе более продолжительного окна времени можно достать больше информации о присутствующем шуме, потому новые кодеки работают на порядок лучше. Но они соответственно сложнее в реализации. Я же для начала решил сделать перевод статьи с довольно простым алгоритмом VAD.