Pull to refresh

Comments 8

Рыбка.
На пятом графике я вижу рыбку!

Заголовок спойлера
image


А вы видите рыбку?
Я вижу половинку сердца с большим рожком мороженного
Принципиальное отличие заключается в использовании рекуррентных нейронных сетей, а не простой N-gram модели с использованием линейных классификаторов или решающих деревьев. В конечном итоге использование модели Biderection GRU, в совокупности с механизмом внимания показывают результат, превосходящий модели, построенные только на энтропии, N-gram моделях и моделях, использующих алгоритм TF-IDF.
Клево! Больше нейросетей! А расскажите какие-нибудь детали про процесс войны за обучение? Что попробовали и не сработало? Как выбирали толщину? Какой размер датесета?
В общем, больше мяса!
Воу, тут материала наверно на ещё одну статью :)
Если из интересного и кратко, то я был удивлен, что SVM — не выстрелило, а оптимальным количеством units для нейронной сети стало 128. Их увеличение до 256 или 512 только ухудшало модель — почему, загадка.
Пробовал разные алгоритмы градиентного спуска — остановился на Adam.
Ну а самая сложная модель, которую попробовал выглядит примерно так.
Скрытый текст


Размер датасета у нас 1кк легитимных доменов и 800к вредоносных (по 100к на каждое из 8 рассмотренных семейств).
А последний график построен по Training Set или по Test Set?
Точность на тестовой выборке
Sign up to leave a comment.