Комментарии / Профиль dparp / Хабр

Дмитрий Парпулов @dparp

ML Team Lead в VK

Профиль Публикации 2Комментарии 1Закладки

Quantization Deep Dive, или Введение в современную квантизацию

Спасибо за хорошую подробную статью!

"Авторы QLoRA предлагают учить факторизованные адаптеры и показывают эффективность этого метода." - тут, видимо, описка, это как раз LoRA делает.

У QLoRA три фишки: двойная квантизация (квантизация констант квантизации с первого шага), новый теоретически оптимальный тип данных NF4 и paged optimizer (чтобы не ловить CUDA OOM на длинных батчах)

Посмотреть