Pull to refresh
5
0
Абакумов Андрей @Andrewaeva

Специалист по ИБ

Send message
Спасибо за интересный разбор!
До сих пор если спрашивают про веб безопасность, то упоминаю 2 книги
Одна — WAHH упомянута в статье
Вторая — The Tangled Web. Странно, что про нее никто не вспомнил
Скрытый текст

Воу, тут материала наверно на ещё одну статью :)
Если из интересного и кратко, то я был удивлен, что SVM — не выстрелило, а оптимальным количеством units для нейронной сети стало 128. Их увеличение до 256 или 512 только ухудшало модель — почему, загадка.
Пробовал разные алгоритмы градиентного спуска — остановился на Adam.
Ну а самая сложная модель, которую попробовал выглядит примерно так.
Скрытый текст


Размер датасета у нас 1кк легитимных доменов и 800к вредоносных (по 100к на каждое из 8 рассмотренных семейств).
Точность на тестовой выборке
Принципиальное отличие заключается в использовании рекуррентных нейронных сетей, а не простой N-gram модели с использованием линейных классификаторов или решающих деревьев. В конечном итоге использование модели Biderection GRU, в совокупности с механизмом внимания показывают результат, превосходящий модели, построенные только на энтропии, N-gram моделях и моделях, использующих алгоритм TF-IDF.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity