Comments 27
Во-первых, практически невозможно определить, решил это робот сам или ему кто-то помог — алгоритмически, обучением модной нейросетки на правильном наборе данных или ручной коррекцией. Только через суд и долгие упорные допросы там сотрудников, причастных к процессу, в надежде, что кто-нибудь сознается (практика так допросов уже есть, заметим, но это явно не то решение, которое можно применять быстро и эффективно).
А построить регрессию и проанализировать факторы? Или хотя попробовать поднять свой почтовый сервер и настроить стандартные проверки? Сразу как всегда злобная корпорация виновата :(
Это намного хуже — вы увидите правду, только правду, ничего кроме правды. Просто не всю правду. Робот так решил. Вы будете довольны.
Особенно, если регулярная рассылка от кандидата один раз из пяти недоходит. Никто ничего не заподозрит, да.
Или хотя попробовать поднять свой почтовый сервер и настроить стандартные проверки?
И что вам это даст, кроме понимания, что антиспам у вас, у гугля и у яндекса работает сильно по-разному?
Это даст вам возможность проверить утверждения гугла о том, что кандидаты сами виноваты. Потому что, скажем, если совпадение с гуглом будет там 50-70%, то это уже повод для кандидатов задуматся.
Если вы поднимите свой почтовый сервер, то совпадение с гуглом у вас заведомо будет хреновым, потому что «стандартные проверки» не работают уже двадцать лет
Стандартные проверки еще как работают. Попробуйте себе отправить письмо без правильных подписей в DNS и посмотрите, как оно моментально улетает в спам практически у всех, в том числе у гугла. Мне кажется, лучше говорить, что используются не только стандартные проверки.
И сравнили, может в самом деле проблемы в настройки DNS или рассылка с какого-нибудь IP с AWS где раньше спамеры резвились.
А то один gmail завели, руки у них там чтоли отсохли чтобы еще чуток поработать.
не работает по принципу «а, ну раз с этого IP — точно в спам»Наверное спамеры прыграют по IP-шникам
Поэтому давайте один gmail проанализируем и хватит.
Вам тестирование хоть пяти, хоть пятидесяти сторонних сервисов каким конкретно образом даст уверенность в том, что Gmail на «Primary» и «Promotions» (это, между прочим, не спам) сортирует потому, что ну вот так получилось, а не потому, что там кто-то Бутиджича в белый список руками занёс?
Наверное спамеры прыграют по IP-шникам
Наверное, двадцать лет назад почта уже фильтровалась не по IP, а байесовскими фильтрами с множественными правилами и весовыми коэффициентами.
И результаты по спаму будут отличаться между двумя любыми сервисами всегда — существенно разные алгоритмы и существенно разные базы для тренировки (особенно у сервисов из разных стран).
Вполне логично, что исследователи смотрели именно Gmail.
Фокс Йовович передаёт привет.
Как минимум уже в прошлом году начал замечать, как Яндекс подкручивает спам-фильтр: письма от живых людей довольно часто улетают в спам, обычным спам-рассылкам от компаний достаточно одного нажатия "Это спам", но не элитным компаниям — Фейсбуку и Твиттеру. Я регулярно отправляю их в спам, но Яндекс ехидно возвращает письма во "Входящие" через пару дней. Недавно была феерия: утренний спам от Твиттера попал во входящие, я отправил его в спам. Через пару часов во входящих оказался дневной спам, отправился следом за утренним. Но вечерний снова оказался во входящих. Я почти уверен, что в Яндекс можно куда-то занести денег, чтобы рассылки обрабатывались по специальным правилам, я не верю, что яндексовские олимпиадники настолько тупые, что не смогли обработать нажатие кнопки "Это спам" десятки раз на одного отправителя. Хотелось бы увидеть расценки, конечно...
Т.е. вы один отправили FB в спам, а в ответ пять тысяч человек сказали, что это не спам.
yandex.ru/support/mail/web/preferences/filters/create-filter.html
Да дофига, сколько там процентов от цифрового отпечатка его устройств и модели поведения?
Слегка портит ценность эксперимента отсутствие 4й колонки в таблице — "/dev/null/" — письма, отправленные, но не дошедшие никуда. Получить такие данные можно было бы контрольным ящиком на собственном сервере без спамфильтра вовсе. Но авторы исходной статьи наверное и не знают, что так можно
Держать свой почтовый сервер и правильно его настроить чтобы исходящаяя почта выглядела идеально для спам фильтров — очень нетривиальная задача
оформить рассылку так чтобы антиспам гугла (яндекса, мейла и сотен других сервисов почты) не отправлял письмо в спам — вторая нетривиальная задача
доказать что гугл имеет политические предпочтения — невозможно без прямых свидетельств, обратное — тоже.
процентов на 95 уверен что проблемы вызваны криворукостью или ленью рассылальшиков
Вот вариант развития событий.
ИМХО странный эксперимент. Если подписаться на рассылку, то письма из рассылки должны иметь один адрес отправителя. Допустим, робот отправляет письмо с этого адреса в спам. Заходим в папку спам, помечаем письмо как "не спам", и после этого, все письма должны приходить без проблем. Если письма всё равно помечаются как спам, это повод обратиться в службу поддержки.
Перевёл адресацию украинской рассылки на домен, управляемый Яндексом. Теперь всё приходит куда надо ) И поди узнай, с кем найдёшь, а с кем потеряешь…
Мне кажется, что просто надо сильно изменить программу, но даже не по информатике, а по ОБЖ. Вместо "вспышки слева" рассказывать про статистику на дорогах (например, сбитые в тёмной одежде без отражателей), про то, что неотмытое средство для мытья посуды убивает печень круче алкоголя, и что отмывается оно плохо и его запах нужен не для уюта, а чтобы по исчезновению понять — отмылось, как искать проводку в стенах и правильно проводить домашний ремонт, т.е. когда лучше звать специалиста, и, наконец, что любой аппаратный продукт может сломаться или испортиться, а тем более работать не так, как вам хочется, для чего есть инструкция, а для почты, например, чёрные и белые списки. Всё-таки способы навредить себе за последние 30 лет огого как изменились. Про то, как правильно не помереть, должны рассказывать родители, но и они обычно многого не знают.
И, например, лекции по кибербезопасности вроде www.interfax.ru/russia/683492 должны быть не новостью дня для Интерфакса (там понятно, что три четверти новости — это Мария Бутина, а не сами лекции, но всё же), а рядовым явлением.
Монополизм сервисов и Net Neutrality — ягодки будут впереди