Обновить
2K+
16
Данил Музафаров@muzafarov

DS Engineer

5
Рейтинг
11
Подписчики
Отправить сообщение

Спасибо за комментарий, грамотно и все по делу
Я согласен с вами по каждому пункту, спасибо за уточнение по XTTS-v2

Попробуй Silero посмотреть, они быстрые и работают на CPU

Для английского практически все модели работают с хорошим качеством генерации. Тут лучше уточнить моменты для какой задачи хочешь использовать модель, какие ресурсы есть для этого

Это правда, я тоже проверял QwenTTS для русского языка, при генерации более 300 слов уже начинает проседать качество. Поэтому выход, как ты и говоришь - делить на более мелкие куски.

Вот это полезные ссылки, спасибо!

Может быть недостаточно данных для обучения русских моделей? Просто при генерации английского текста моделями TTS синтезированная речь на слух ложится очень хорошо, при чем я пробовал генерировать через QwenTTS аудио более трех минут и как будто бы качество речи не проседает.


Да, есть такая проблема, но решение тоже есть.
Если столкнешься с такой проблемой, то попробуй ее загуглить. Я встречал репозиторий, где описано как в окружение установить конкретные зависимости для torch и torchaudio, чтобы на этом поколении видеокарт можно было избавиться от такой ошибки.

Стараюсь держать планку)

Понял, спасибо, записал себе

Спасибо!
Если нет возможности локально позапускать модели, то попробуй поработать с Silero, у них есть примеры в google colab, там сможешь попробовать различные модели от них

Добрый день, спасибо большое за такой развернутый комментарий и за рекомендацию, обязательно рассмотрю ее!

Спасибо, очень приятно!
Процесс отладки сложно описывать текстом, поэтому не планировал его освещать.

Скорее всего можно было бы завайбкодить такое, но это бы заняло больше времени на отладку и повторные генерации. Поднимать отдельные MCP через docker compose позволяет отдельно прописывать тулы и как раз там внутри контейнера с конкретным тулом можно пробовать вайбкодить, не навредив всему остальному проекту.

Помог ли такой подход сэкономить время? Я думаю, что помог.

Спасибо вам!

Информация

В рейтинге
1 063-й
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Работает в
Зарегистрирован
Активность

Специализация

Ученый по данным