User
Почему это нельзя настроить или увидеть, поменять квантование контекста и так далее? Там же наверняка llama.cpp крутится под капотом, легко же настраивается
Почему это нельзя настроить или увидеть, поменять квантование контекста и так далее? Там же наверняка llama.cpp крутится под капотом, легко же настраивается