Комментарии 4
А где использовать эту модель?
Конкретно эту нигде. Возможно вы обратили внимание, что у автора даже машины нормальной нет - в память все данные не влезают, а это всего-то несколько тысяч сообщений. Признаки нужно извлекать как-то по другому или хранить более экономно.
Я про другое: допустим, оператор захочет внедрить у себя эту (или аналогичную) систему, но его юрист будет слегка против, т.к. закон "О связи" и подзаконные НПА велят операторам оной доставлять сообщения электросвязи до адресатов (абонентов), не решая за них, что есть спам, а что - долгожданное письмецо от тетушки из Бразилии. Операторы электропочты элегантно решили проблему папкой "Спам", куда они все равно доставляют сомнительное сообщение, лишь высказывая свое мнение о его некошерности (хотя некоторые ходят по тонкому льду, применяя всякие RBL), а SMS либо доставляются абоненту, либо нет...
Модель обнаружения смс-спама: создаем и тестируем