GigaAM-CTC по сравнению с Whisper large-v3, почему-то неоправданно много потребляет RAM и VRAM. Для 8,5 минутной аудиозаписи занял всю видео память (20Gb) + 64 Gb RAM. Запускал в WSL локально. Также Whisper ставит все знаки препинания, цифры пишет цифрами, имена, названия и т.п. пишет с большой буквы. Здесь этого совсем нет.
спасибо большое за подробные объяснения )
GigaAM-CTC по сравнению с Whisper large-v3, почему-то неоправданно много потребляет RAM и VRAM. Для 8,5 минутной аудиозаписи занял всю видео память (20Gb) + 64 Gb RAM. Запускал в WSL локально. Также Whisper ставит все знаки препинания, цифры пишет цифрами, имена, названия и т.п. пишет с большой буквы. Здесь этого совсем нет.