Pull to refresh
1
Send message

Почему это нельзя настроить или увидеть, поменять квантование контекста и так далее? Там же наверняка llama.cpp крутится под капотом, легко же настраивается

Information

Rating
Does not participate
Registered
Activity