Pull to refresh
113
1264.8

Автоматизирую рутину с LLM.

Send message

Не обязательно. QAD это просто KL-дистилляция вместо CE-файнтюна. Работает с любым форматом квантизации. NVFP4 тут просто контекст, потому что у них железо под это заточено.

Да, unsloth скорее всего первые подхватят. По llama.cpp — там NVFP4 нативно пока нет, но формат не rocket science, добавят если будет спрос.

2

Information

Rating
1-st
Registered
Activity

Specialization

ML разработчик
Средний
Python
PostgreSQL
SQL
LLM
Git
Linux
Docker