Comments 5
Интересная статья. Замеряли только RTF? Как поменялся TTFA (или TTFT)?
Использование: AutoModel(
Я в этом не разбираюсь, но так просто с одним файлом gguf оно чёт не заводится. Ему ещё нужен cosyvoice3.yml, а потом оно ещё что-то просить начинает, я так понимаю все файлы из репы исходной модели.
Да, нужны файлы оригинала, потому что это лишь надстройка (заменяется только LLM-часть).
Скачай базовую модель:
from huggingface_hub import snapshot_download
snapshot_download('FunAudioLLM/Fun-CosyVoice3-0.5B-2512', local_dir='pretrained_models/Fun-CosyVoice3-0.5B')И GGUF положи рядом. При инициализации укажи оба пути:
cosyvoice = AutoModel(
model_dir='pretrained_models/Fun-CosyVoice3-0.5B',
load_llama_cpp=True,
gguf_model_path='pretrained_models/cosyvoice_llm_f16.gguf'
)Sign up to leave a comment.
Как я добавил llama.cpp бэкенд в CosyVoice3 и ускорил инференс в 2.6x