Обновить
1
0

Пользователь

Отправить сообщение

ну вот вчера я запустил квена в игру Enshrouded и даже настройки графики не понижал, достаточно шустро для тестов, не идеально но и у меня нет ~1600 референсных видео для его обучения.
А так он побегал за персонажа ворота пооткрывал позакрывал что-то купил у нпс, ну для побаловаться нормально, а чтобы и игру запустить и модель с минимальными задержками всё таки нужно разделить на две видеокарты пожалуй

з.ы. Оллама кстати сильно медленнее в этом плане, не знаю почему

Вообще дома можно и Qwen2.5-Vl-7b запустить через Lm Studio у меня например на 3060 спокойно ездит

К сожалению мультимодальность gemma (google) ограничена только LLM и VLM, в качестве tts довольно шустро (и не нагруженно) работают silero, piper(на Rpi запускается без проблем, звучит кстати тоже неплохо) coqui tts(но постоянно пытается произнести точки aka "поинт\поинти\пынта") terra tts (если добавить RUAccent вообще звучит замечательно) А вот что касаемо STT пока подробно вопрос не изучал к сожалению

Вот совпадение, как раз сегодня такой должен прийти, как раз под эти же самые задачи

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность