Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Я для башкирского языка, имея только 250 часов 860+ человек, используя facebook/wav2vec2-xls-r-300m получил WER=8.5% без LM и WER=4.5% c LM
Так что про самый продвинутый наверное можно поспорить.
одномерную свертку, пакетную нормализацию, ReLU и отсев
-> Conv1D, BatchNormalization, ReLU, Dropout?
Максимально просто о распознавании речи при помощи NeMo