Comments 10
Есть Asus NUC у которого процессор двенадцатого поколения Intel и Intel Xe графикой, NPU и 12 ядрами CPU
А много ли выигрыша от запуска на GPU/NPU по сравнению с обычным ollama serve на ЦП? На моих тестах разница была в пределах 30%
На cpu крутятся сервисы, gpu пустой, плюс нагрев проца понижение, а значит вентилятор не шумит. Что до бенчмарка, то там от размера батча зависит и тюнить все надо, настроек вагон, нельзя сказать сходу, нужно описывать, что за модель, размер батча и тп.
"Что-бы"
В дополнение к OVMS ещё можно рассмотреть проект OpenArc
https://github.com/SearchSavior/OpenArc
OVMS это официальная вундервафля от Intel, openarc это самостоятельный, вроде бы даже учебный продукт, от автора, который умеет только часть от OVMS, насколько я понял, спасибо за ссылку. Там ссылки на модели есть на странице продукта, это полезно, спасибо. Сам же проект я использовать не стану при наличии официального и более мощного аналога от производителя. Да и модели я бы сам конвертировал на всякий параноидальный случай :)
Но спасибо за инфу, любопытно.
Личное облако на Proxmox: нейронки, LLM и embedding