Комментарии 9
данная техника не является хорошо отработанной на данный моментУже полгода как статьи на медиуме и tds появились. Уже достаточно устоялось.
А что такое tds? Если сайт, то я не могу его найти. Нагуглил только "Trump derangement syndrome".
Скорее всего, имелся ввиду аппендикс медиума. towardsdatascience
Вроде с таким подходом есть всякие проблемы при перекладывании на TensorRT/OpenVino. В этих фреймворках идёт достаточно глубока оптимизация порядка выполнения и структуры выполнения сети на карте. Мне кажется что так оптимизированная сеть может даже дольше работать. Но не уверен.
Пробовали?
Пробовали?
НЛО прилетело и опубликовало эту надпись здесь
> Сбрасываем оставшиеся параметры до их начальных значений, получаем нужную нам подсеть.
А для чего сбрасывать? Разве не будет быстрее дообучить сеть начиная с тех значений, которые остались в подсети после удаления «нулевых»?
А для чего сбрасывать? Разве не будет быстрее дообучить сеть начиная с тех значений, которые остались в подсети после удаления «нулевых»?
Для TF и PyTorch уже очень давно есть монте-карло дистилляторы, которые применяются почти в каждом проекте.
А такое топорное отсечение начали делать еще во времена AlexNet (может еще раньше).
А такое топорное отсечение начали делать еще во времена AlexNet (может еще раньше).
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Снижаем размер ML модели без регистрации и смс