Как стать автором
Обновить
6
0
Дмитрий Парпулов @dparp

ML Team Lead в VK

Отправить сообщение

Спасибо за хорошую подробную статью!

"Авторы QLoRA предлагают учить факторизованные адаптеры и показывают эффективность этого метода." - тут, видимо, описка, это как раз LoRA делает.

У QLoRA три фишки: двойная квантизация (квантизация констант квантизации с первого шага), новый теоретически оптимальный тип данных NF4 и paged optimizer (чтобы не ловить CUDA OOM на длинных батчах)

Информация

В рейтинге
Не участвует
Работает в
Дата рождения
Зарегистрирован
Активность