Verbasik16 мар в 09:17Законы масштабирования дистилляцииУровень сложностиСреднийВремя на прочтение45 минОхват и читатели3.3KИскусственный интеллектМашинное обучение * ОбзорВсего голосов 4: ↑4 и ↓0+6Добавить в закладки40Комментарии1
Suoriks17 мар в 11:05Можно tldr: Какое соотношение размеров моделей ученик\учитель оптимально для дистиляции?
Законы масштабирования дистилляции