rawmantique Nov 11 2024 at 12:00

Глубокая оптимизация сверточных нейронных сетей: Анализ методов улучшения модели на примере CIFAR-10

Hard

6 min

2.6K

Machine learning * Artificial Intelligence

Review

Comments 4

Tyiler Nov 11 2024 at 15:20

Batch Normalization после каждого слоя, Dropout с вероятностью 0.2 и оптимизатора Adam

Сколько им лет уже, больше 10, наверно. Неужели ничего нового больше не появилось? я бы почитал о новых техниках лучше.

ENick Nov 12 2024 at 16:34

"Progressive Layer Growth и Pruning оказались полезными для регулировки сложности модели, помогая избежать переобучения". Что скажете, если посмотреть на два последних графика? Там loss train выше loss val и, аналогично, для acc. Я по этим графикам вижу что процесс обучения явно аномальный

ENick Nov 12 2024 at 16:46

"Dropout с вероятностью 0.2". Поясните, что Вы понимаете под вероятностью. Для Dropout нет понятия вероятности. Это доля!!!

"Надеемся, что эта статья поможет вам глубже понять процесс оптимизации CNN и применять его на практике ". Куда уж глубже, дальше некуда

jorik0 Nov 18 2024 at 14:42

Любой дурак сможет обучить модель с точностью 70-80%, Вы бы лучше показали, как точность увеличить до 90%, не говоря уже до идеальных 96,5% по cifar-10