Qwertcoser15 мая в 12:57Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRAУровень сложностиСреднийВремя на прочтение5 минОхват и читатели7.6KМашинное обучение * Алгоритмы * Высоконагруженные системы * Облачные вычисления * Big Data * ОбзорRecovery ModeПереводВсего голосов 5: ↑5 и ↓0+6Добавить в закладки29ПоделитьсяКомментарии0
Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA