Обновить

Аугментация данных для повышения точности классификации вредоносного ПО с использованием модели CNN

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели6.9K
Всего голосов 1: ↑1 и ↓0+1
Комментарии1

Комментарии 1

При всем уважении, теоретики, как всегда, оторваны от практики. Никогда эта работа не найдет серъезного воплощения в ИТ. Так как в основе ее лежит локальная энтропия. Аналогичные системы уже внедрены в проверочные модули AV (по крайней мере, в один AV), но эффективность очень невысокая, так как идею губят ложные срабатывания (реальные данные малвари и легаси крайне мало отличаются). А их процент высок и при безупречной работе модели — увы, выше входной выборки не прыгнешь. И это не зависит от последующих преобразований, в том числе для аугментации, которая по сути есть искусственное (!) наращение объема данных. Объем вашей выборки в 2000 (и в 11000) файлов совершенно непоказателен, он просто микроскопичен

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации