AnalogBytes28 фев 2020 в 20:54

Монополизм сервисов и Net Neutrality — ягодки будут впереди

3 мин

5.4K

Блог компании AnalogBytes ConferenceIT-компании

+15

Комментарии 27

SirEdvin 28 фев 2020 в 21:46

Во-первых, практически невозможно определить, решил это робот сам или ему кто-то помог — алгоритмически, обучением модной нейросетки на правильном наборе данных или ручной коррекцией. Только через суд и долгие упорные допросы там сотрудников, причастных к процессу, в надежде, что кто-нибудь сознается (практика так допросов уже есть, заметим, но это явно не то решение, которое можно применять быстро и эффективно).

А построить регрессию и проанализировать факторы? Или хотя попробовать поднять свой почтовый сервер и настроить стандартные проверки? Сразу как всегда злобная корпорация виновата :(

Это намного хуже — вы увидите правду, только правду, ничего кроме правды. Просто не всю правду. Робот так решил. Вы будете довольны.

Особенно, если регулярная рассылка от кандидата один раз из пяти недоходит. Никто ничего не заподозрит, да.

AnalogBytes 28 фев 2020 в 21:51

Или хотя попробовать поднять свой почтовый сервер и настроить стандартные проверки?

И что вам это даст, кроме понимания, что антиспам у вас, у гугля и у яндекса работает сильно по-разному?

SirEdvin 29 фев 2020 в 09:41

Это даст вам возможность проверить утверждения гугла о том, что кандидаты сами виноваты. Потому что, скажем, если совпадение с гуглом будет там 50-70%, то это уже повод для кандидатов задуматся.

AnalogBytes 29 фев 2020 в 09:43

Если вы поднимите свой почтовый сервер, то совпадение с гуглом у вас заведомо будет хреновым, потому что «стандартные проверки» не работают уже двадцать лет, а работает обучение антиспама на больших выборках.

SirEdvin 29 фев 2020 в 09:47

Если вы поднимите свой почтовый сервер, то совпадение с гуглом у вас заведомо будет хреновым, потому что «стандартные проверки» не работают уже двадцать лет

Стандартные проверки еще как работают. Попробуйте себе отправить письмо без правильных подписей в DNS и посмотрите, как оно моментально улетает в спам практически у всех, в том числе у гугла. Мне кажется, лучше говорить, что используются не только стандартные проверки.

PeterPP 28 фев 2020 в 22:20

Попробовали бы не один ящик на gmail завести, а ещё на yahoo.com, ms outlook.com, mail.ru, yandex.ru, proton и т.п.

И сравнили, может в самом деле проблемы в настройки DNS или рассылка с какого-нибудь IP с AWS где раньше спамеры резвились.

А то один gmail завели, руки у них там чтоли отсохли чтобы еще чуток поработать.

AnalogBytes 28 фев 2020 в 22:24

Примерно так уже лет двадцать фильтрация почты на серверах не работает по принципу «а, ну раз с этого IP — точно в спам».

PeterPP 28 фев 2020 в 22:26

Поэтому давайте один gmail проанализируем и хватит.

не работает по принципу «а, ну раз с этого IP — точно в спам»

Наверное спамеры прыграют по IP-шникам

AnalogBytes 28 фев 2020 в 22:29

Поэтому давайте один gmail проанализируем и хватит.

Вам тестирование хоть пяти, хоть пятидесяти сторонних сервисов каким конкретно образом даст уверенность в том, что Gmail на «Primary» и «Promotions» (это, между прочим, не спам) сортирует потому, что ну вот так получилось, а не потому, что там кто-то Бутиджича в белый список руками занёс?

Наверное спамеры прыграют по IP-шникам

Наверное, двадцать лет назад почта уже фильтровалась не по IP, а байесовскими фильтрами с множественными правилами и весовыми коэффициентами.

PeterPP 28 фев 2020 в 22:32

Если будет более менее похожие результаты в gmail и yandex, то по крайней мере можно говорить о том это не злобный план гугла пропихнуть гомосека в президенты.

AnalogBytes 28 фев 2020 в 22:34

В Яндексе вообще нет автоматического разделения писем по категориям, например.

И результаты по спаму будут отличаться между двумя любыми сервисами всегда — существенно разные алгоритмы и существенно разные базы для тренировки (особенно у сервисов из разных стран).

Politura 29 фев 2020 в 02:42

В США Gmail один из самых популярных — 53% пользователей, ближайший к нему Yahoo — 18% пользователей: blog.shuttlecloud.com/the-most-popular-email-providers-in-the-u-s-a
Вполне логично, что исследователи смотрели именно Gmail.

rzerda 29 фев 2020 в 02:18

Фокс Йовович передаёт привет.

pyrk2142 29 фев 2020 в 00:17

Как минимум уже в прошлом году начал замечать, как Яндекс подкручивает спам-фильтр: письма от живых людей довольно часто улетают в спам, обычным спам-рассылкам от компаний достаточно одного нажатия "Это спам", но не элитным компаниям — Фейсбуку и Твиттеру. Я регулярно отправляю их в спам, но Яндекс ехидно возвращает письма во "Входящие" через пару дней. Недавно была феерия: утренний спам от Твиттера попал во входящие, я отправил его в спам. Через пару часов во входящих оказался дневной спам, отправился следом за утренним. Но вечерний снова оказался во входящих. Я почти уверен, что в Яндекс можно куда-то занести денег, чтобы рассылки обрабатывались по специальным правилам, я не верю, что яндексовские олимпиадники настолько тупые, что не смогли обработать нажатие кнопки "Это спам" десятки раз на одного отправителя. Хотелось бы увидеть расценки, конечно...

AnalogBytes 29 фев 2020 в 07:58

Скорее просто коллегиальные действия пользователей превалируют над индивидуальными, а надолго запоминать предпочтения конкретного пользователя даже не пытаются, ибо слишком дофига ресурсов на такое уйдёт.

Т.е. вы один отправили FB в спам, а в ответ пять тысяч человек сказали, что это не спам.

janatem 29 фев 2020 в 12:45

Вообще-то я ожидал от кнопки «это спам» несколько иное действие. Да, понятно, что она должна слегка влиять на какие-то весовые коэффициенты глобальных (то есть, затрагивающих всех пользователей) алгоритмов фильтрации, но я бы ожидал, что для конкретно моего ящика это возымеет гораздо больший эффект, вплоть до полного бана писем с данного адреса или домена.

VerdOrr 29 фев 2020 в 17:15

Для «конкретно своего ящика» вы можете сделать все что угодно. Подробнее тут —

yandex.ru/support/mail/web/preferences/filters/create-filter.html

nikolayv81 29 фев 2020 в 21:25

Да дофига, сколько там процентов от цифрового отпечатка его устройств и модели поведения?

legolegs 29 фев 2020 в 08:51

Слегка портит ценность эксперимента отсутствие 4й колонки в таблице — "/dev/null/" — письма, отправленные, но не дошедшие никуда. Получить такие данные можно было бы контрольным ящиком на собственном сервере без спамфильтра вовсе. Но авторы исходной статьи наверное и не знают, что так можно

nikolayv81 29 фев 2020 в 21:28

Меня в этом вопросе заинтересовала последняя строчка(других знакомых фамилий не увидел, кроме Блумберга, но там хорошо бы понимать с какого адреса они уходили) интересно было бы узнать, а отправлял ли что-то его "штаб".

bvbr 29 фев 2020 в 20:54

без анализа самих писем — это профанация

Держать свой почтовый сервер и правильно его настроить чтобы исходящаяя почта выглядела идеально для спам фильтров — очень нетривиальная задача

оформить рассылку так чтобы антиспам гугла (яндекса, мейла и сотен других сервисов почты) не отправлял письмо в спам — вторая нетривиальная задача

доказать что гугл имеет политические предпочтения — невозможно без прямых свидетельств, обратное — тоже.

процентов на 95 уверен что проблемы вызваны криворукостью или ленью рассылальшиков

trueMoRoZ 1 мар 2020 в 05:22

«Homo deus. Краткая история будущего» Юваль Ной Харари.
Вот вариант развития событий.

AnalogBytes 1 мар 2020 в 08:17

Вот только Харари — неумный громогласный популист. В одном ряду с Черниговской, Даймондом, Курпатовым и т.п.

bugdesigner 1 мар 2020 в 06:21

ИМХО странный эксперимент. Если подписаться на рассылку, то письма из рассылки должны иметь один адрес отправителя. Допустим, робот отправляет письмо с этого адреса в спам. Заходим в папку спам, помечаем письмо как "не спам", и после этого, все письма должны приходить без проблем. Если письма всё равно помечаются как спам, это повод обратиться в службу поддержки.

sdudnik 1 мар 2020 в 08:16

На одном из моих адресов почты — он управляется провайдером довольно известного хостинга — стоит антиспам от Касперского. Так вот, он отправляет (вернее, отправлял) в спам все письма на украинском языке. Даже если все антиспам-фильтры отключить.
Перевёл адресацию украинской рассылки на домен, управляемый Яндексом. Теперь всё приходит куда надо ) И поди узнай, с кем найдёшь, а с кем потеряешь…

Gryphon88 3 мар 2020 в 10:28

Мне кажется, что просто надо сильно изменить программу, но даже не по информатике, а по ОБЖ. Вместо "вспышки слева" рассказывать про статистику на дорогах (например, сбитые в тёмной одежде без отражателей), про то, что неотмытое средство для мытья посуды убивает печень круче алкоголя, и что отмывается оно плохо и его запах нужен не для уюта, а чтобы по исчезновению понять — отмылось, как искать проводку в стенах и правильно проводить домашний ремонт, т.е. когда лучше звать специалиста, и, наконец, что любой аппаратный продукт может сломаться или испортиться, а тем более работать не так, как вам хочется, для чего есть инструкция, а для почты, например, чёрные и белые списки. Всё-таки способы навредить себе за последние 30 лет огого как изменились. Про то, как правильно не помереть, должны рассказывать родители, но и они обычно многого не знают.

AnalogBytes 3 мар 2020 в 10:30

Да.

И, например, лекции по кибербезопасности вроде www.interfax.ru/russia/683492 должны быть не новостью дня для Интерфакса (там понятно, что три четверти новости — это Мария Бутина, а не сами лекции, но всё же), а рядовым явлением.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий