Помню, после первой в своей жизни установки Wordpress (примерно 2007-й год), мне очень понравилась возможность добавлять разного рода плагины в эту CMS. После того, как сайт на Wordpress проиндексировался, через некоторое время начали появляться комментарии, причем несколько странного вида, однотипные, что-то вроде «Пиши еще» и «Автор молодец». Через пару дней я понял, что это спам (совсем зеленый новичок был, да). Сразу же поставил один из рекомендованных плагинов для борьбы со спамом — Akismet. До сих пор я не поменял данный плагин, несмотря на большое количество альтернативных фильтров, появившихся в последнее время. Вчера этот спасательный круг в море спама, если так можно выразиться, отметил своеобразный юбилей: Akismet отсеял 50-миллиардный спам-коммент.
Только в апреле Akismet отсеял 1,8 миллиарда спам-комментов, это примерно 60 миллионов таких комментариев в день, 2,5 миллиона в час, 700 спам-комментов в секунду. Да, это очень большое количество спама, но сервис, разросшийся за прошедшие годы, успешно справляется с нагрузкой.
Стоит отметить, что впервые Akismet появился в 2005 году, 25 октября. Это примерно за месяц до появления WordPress.com (не путать с самой CMS). Сейчас на основе Wordpress работает каждый второй блог, и каждый день прибавляется 50-100 тысяч wordpress-блогов. Понятно, что одна из самых популярных CMS в мире является целью многих злоумышленников, включая спамеров.
Akismet-фильтр работает посредством анализа информации о спам-комментариях, предоставляемых блогами, которые участвуют в системе борьбы со спамом. На основе полученной информации Akismet вырабатывает собственные правила фильтрации нежелательных комментариев. Плагин Akismet по умолчанию ставится с Wordpress, начиная с версии 2.0. Эта же система борется со спамом и в блогах платформы WordPress.com. Есть и возможность использования API, вне Wordpress.
Согласно статистике, предоставленной компанией, 92% комментариев, проверенных Akismet — это спам чистой воды. Точность определения спам-комментариев данным фильтром составляет 99,9% (снова-таки, по данным разработчиков).
Via techcrunch