Комментарии 6
Неужто еще кто-то голосом заявки на торги выставляет???
Обученную модель можете выложить? Задача у меня чуть другая, но возможно упростили бы жизнь: надо в мультиках найти тайминги, когда какой персонаж говорит.
Есть такой старенький инструмент https://github.com/google/REAPER который выдает файл с таймингами, где есть речь а где нет.
Узнать где говорят, не сложно. Например можно вот это использовать https://github.com/snakers4/silero-vad
Тут именно понять надо, кто сейчас говорит.
Обученную модель, к сожалению, выложить не могу, к тому же она училась только на телефонных звонках, которые имеют определенную специфику, возможно не подходящую Вам. Но к статье приложена ссылка на пайплайн, с которым можно без труда обучить свою модель на более разнообразных данных. Благо учится она достаточно быстро.
Анализ аудио. Идентификация голоса