Verbasik 16 мар в 12:17Законы масштабирования дистилляцииУровень сложностиСреднийВремя на прочтение45 минКоличество просмотров4.1KИскусственный интеллектМашинное обучение*ОбзорВсего голосов 4: ↑4 и ↓0+6Добавить в закладки41Комментарии1
Suoriks 17 мар в 14:05Можно tldr: Какое соотношение размеров моделей ученик\учитель оптимально для дистиляции?
Законы масштабирования дистилляции