Пользователь
А как вы добились такой скорости на 12b? Я на 5060 ti 16 gb получил 20-30 ток/с: llama.cpp, скомпелированная из исходников, полностью загружена в VRAM
Не проще ли установить Cherry Studio - без заморочек с докером и всл? Статья мне была интересна, спасибо!
А как вы добились такой скорости на 12b? Я на 5060 ti 16 gb получил 20-30 ток/с: llama.cpp, скомпелированная из исходников, полностью загружена в VRAM
Не проще ли установить Cherry Studio - без заморочек с докером и всл? Статья мне была интересна, спасибо!