Как работает АнтиСпам-служба на сервисе email-маркетинга?

В Рунете мы ежедневно и ежечасно сталкиваемся с попытками “проспамить” подписчиков по купленным адресным базам, по базам подписчиков из открытых источников, по, так называемым, “партнерским” базам. Для того, чтобы не было жалоб и все чувствовали себя комфортно в рамках нашего АнтиСпам-соглашения в Печкине была разработана система мониторинга и модерации, которая позволяет нам надежно фильтровать спам-рассылки, отправляемые через наш сервис.
Некапча Mail.Ru – капча, которая не показывается

Вряд ли кто-то сможет разгадать эту капчу :)
Если в двух словах, то Некапча — это сервис интеллектуальной капчи, не требующий от человека прохождения проверки. Естественно, без дополнительной информации сервис не может ничего сказать о пользователе. Откуда же ее взять? Дело в том, что у Mail.Ru более 100 млн пользователей, причем большая часть из них авторизована. А это значит, что с запросом на наши домены передаются сессионные куки, по которым мы определяем пользователя, а затем достаем его профиль, статистику, спам-рейтинг и т.д. Вся эта информация подается на вход алгоритма-классификатора, и на выходе мы получаем предположение о том, кем является пользователь — человеком или спам-ботом.
Как повысить уверенность в том, что кнопка была нажата живым пользователем на сайте и избавиться от капчи?
В этой статье я хотел бы попробовать дать анализ проблемы и способов ее решения и привести пример одного программистского метода, который я успешно использую уже много лет в своих проектах. Кроме того, мне хотелось бы сделать статью интересной для чтения самого широкого круга специалистов.
Последний предлагаемый метод спорный, но судите сами!
Невизуальные методы защиты сайта от спама. Часть 1. Статистика
Часть 1. Что говорит статистика
Невизуальные методы защиты сайта от спама предполагают автоматический анализ поступающих от посетителя данных. Чем больше данных анализируется, тем полнее и точнее может быть определён посетитель и вынесено решение спамер он или нет.
Системы, анализирующие такие данные, как правило, накапливают статистику данных посетителя и вынесенных решений. Вашему вниманию предлагается краткий обзор статистических данных, накопленных нами (сервисом защиты сайтов от спама CleanTalk).
Невизуальные методы защиты сайта от спама. Часть 2. Истинное лицо символов
Часть 2. Истинное лицо символов
Невизуальные методы защиты сайта от спама используют, в частности, анализ переданного текста. Спамеры используют много приёмов, чтобы усложнить такой анализ. Здесь будут показаны примеры одного из них, а именно подстановки символов. Приведённые примеры взяты из реальных данных компании CleanTalk.
Подстановка символов очень проста, но в результате неё могут не работать фильтры по стоп-словам, могут хуже работать байесовские фильтры, а также фильтры с определением языка. Поэтому перед применением этих фильтров имеет смысл вернуть символам их истинное лицо.
Невизуальные методы защиты сайта от спама. Часть 3. Повторы
Часть 3. Повторы подстрок
Как уже говорилось, невизуальные методы защиты сайта от спама используют анализ текста. Один из часто встречающихся сигналов спама — это наличие повторяющихся строк. Как всегда, приведённые примеры взяты из реальных данных компании CleanTalk.
Поиск таких повторов должен быть минимально ресурсоёмким. Лучше, если он будет вызываться после тестов из 1 и 2 частей статьи, которые отсеют явный спам и приведут текст к виду, пригодному для анализа. Здесь я приведу некоторую статистику, а также пример кода.
SpamFireWall — запрет доступа к сайту для спам ботов
Сейчас мы расскажем о новой опции в антиспам-плагинах для CleanTalk, которая позволяет эффективно отражать атаки спамботов на ваш сайт. Опция получила название SpamFireWall(SFW), она блокирует POST- и GET-запросы от наиболее активных спамботов и не дает им загружать сервер.
Какие CMS спамят чаще?
В анализе принимали участие все POST запросы обработанные сервисом, такие как комментарии, регистрации, формы контактов, заказов, обратной связи и другие.
Динамический email :: практическое применение
Концепция "динамический email" представлена в одноимённой статье. Решил поделиться своим опытом использования этого метода защиты от спама.
Лучшие практики для защиты Zimbra OSE от нежелательных почтовых рассылок

Электронная почта на протяжении всего времени своего существования остается основным вектором атаки на предприятия. Злоумышленники используют различные векторы атак на электронную почту, начиная от подбора паролей, и заканчивая мейл-бомбингом. В наших прошлых статьях мы рассказывали о том, как защитить свой почтовый сервер Zimbra OSE от спама, мейл-бомбинга и других атак, направленных на электронную почту предприятия. В этой статье мы соберем все эти материалы воедино и дадим несколько новых советов по защите вашего почтового сервера.
ЧудESA защиты корпоративной почты или внедрение свободных почтовых шлюзов на базе Proxmox Mail Gateway

Средства межсетевого экранирования стали де-факто атрибутом любой сетевой инфраструктуры. Почтовому трафику тоже необходимы средства фильтрации. Поэтому в современных релеях реалях тяжело представить почтовую инфраструктуру организации без почтовых шлюзов (mail gateways).
Настройка SpamAssassin в Carbonio

Несмотря на появление многочисленных мессенджеров, именно рассылка по email на сегодняшний день является наиболее недорогим способом отправки информации, а учитывая то, что электронные письма поддерживают вложения в виде файлов и встраивание HTML-скриптов, именно email крайне часто используется для рассылки спама. Помимо очевидных рисков для информационной безопасности предприятия, спам также создает значительную нагрузку на почтовый сервер, а в случае попадания его в почтовый ящик пользователя, он начинает занимать место в хранилище данных почтового сервера, а деловое письмо может попросту затеряться в бесполезном спаме. Для фильтрации спама в Carbonio используется SpamAssassin - одно из наиболее продвинутых решений для фильтрации почты, однако при неправильной настройке SpamAssassin может принести вред - заблокировать важное письмо или пропустить потенциально опасный email. В данной статье мы расскажем о том, как администратор может настроить SpamAssassin.
Защита почтового сервера Carbonio от перегрузок при помощи Postscreen

Большую часть почтового трафика в интернете сейчас составляют автоматически сгенерированные нежелательные рассылки. До 90% поступающих на популярные почтовые серверы писем могут являться спамом, и если почтовый сервер начнет сканировать каждое из них на вирусы и признаки спама, то очень скоро он окажется перегружен и возникнет риск того, что деловые письма не дойдут до адресатов. Чтобы этого не произошло, входящие письма нужно фильтровать, то есть по косвенным признакам определять подлинные письма от нежелательных. Одним из передовых решений для этого является Postscreen - встроенный в Postfix фильтр для отсеивания автоматически сгенерированных писем. В данной статье мы расскажем о том, как использовать и как настраивать Postscreen, чтобы он работал максимально эффективно и позволял не тратить серверные мощности на обработку нежелательных писем.