YaphetS717 июл 2020 в 05:22

Deep Learning: как это работает? Часть 3 — архитектуры CNN

6 мин

13K

Искусственный интеллектМашинное обучение *

Комментарии 4

mithdradates 17 июл 2020 в 06:06

Про глубину ResNet не совсем верно, 152 — не максимальная глубина, есть и ResNet-1001. Ну и по-моему стоило бы рассказать про Inception (фактически — дальнейшее развитие GoogleNet), DenseNet, ENet (тут скорее упор в оптимальный размер модели). Пусть даже и не шибко подробно.

YaphetS7 17 июл 2020 в 06:42

Спасибо за комментарий! Насчет глубины ResNet — я опирался на статью, в которой максимальная глубина — 152, но добавить о том, что позднее появились модификации — действительно стоило. Про Inception и другие сети — согласен с Вами, стоило рассказать.

da-nie 17 июл 2020 в 12:35

Вот тут есть подробная реализация всех этапов свёрток простой сети на Си++. Нет там только объединения частей, но это как раз несложно.

buriy 19 июл 2020 в 21:32

>проблема взрывающегося градиента
>Решение очевидно — ограничить значение градиента, в противном случае — уменьшить его значение (нормировать). Такая техника называется «clipping».
Вот только это очень плохое решение… Особенно для ничем не ограниченного ReLU.
Batchnorm намного лучше справляется. (И ещё придумали SELU и другие self-normalizing units.)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий