Verbasik16 мар 2025 в 09:17Законы масштабирования дистилляцииУровень сложностиСреднийВремя на прочтение45 минОхват и читатели3.4KИскусственный интеллектМашинное обучение * ОбзорВсего голосов 4: ↑4 и ↓0+6Добавить в закладки40Комментарии1
Suoriks17 мар 2025 в 11:05Можно tldr: Какое соотношение размеров моделей ученик\учитель оптимально для дистиляции?
Законы масштабирования дистилляции