Комментарии / Профиль Ashmanov / Хабр

Игорь Ашманов@Ashmanov^{read⁠-⁠only}

Пользователь

Как работает антифродовая система Google: отчет Тужилина

Ashmanov 27 июл 2006 в 06:24

Тег к статье тоже поправьте. Да и лучше, мне кажется, брать короткие теги - просто "фрод". Иначе объединяться с другими статьями и находиться будет реже.

Как работает антифродовая система Google: отчет Тужилина

Ashmanov 27 июл 2006 в 06:24

Веб 2.0 прикончит частную жизнь

Ashmanov 24 июл 2006 в 13:55

Верно.
Мы тут прикидывали, пора ли уже Билайну и МТСу писать на жёсткие диски все разговоры или нет. Получается, что это недорого, примерно десятки терабайт в год, и где-то года полтора-два они, получается, уже пишут.
Слушать ничьих раговоров, конечно, никто не будет, пока Имярек не захочет в президенты или ещё куда. Тогда его разговоры чиста по мабиле можно будет и поднять из архива.

Такая была мысль. Но опытные люди из компетентных организаций выражают сомнение. Логика примерно такая: например, Билайн в многом заграничная организация, израильская. Если сама будет что-то там писать, голову оторвут, а если, наоборот, дать приказ писать - может не послушаться и поднимет крик. Ну, не знаю.

Веб 2.0 прикончит частную жизнь

Ashmanov 23 июл 2006 в 17:57

Павлик, а вы ведь неспроста детское пороно заменили на "порно со зверюшками", верно?
А то аргументировать неудобно, так ведь?

Поясню ещё раз про сбор данных. Это иллюзия, что в самом сборе данных ничего плохого нет. Неспроста именно сбор данных пытаются регламентировать законами. Простой пример. Если вы возьмёте кредит на машину во Внешторгбанке и будете отдавать его неаккуратно, с задержками, понравится ли вам, что через три года Вам откажутся продать квартиру по ипотеке в Альфа-банке, потому что они уже объединили свои базы? Или резко повысят процент?
А между прочим, трудно будет винить банк - он просто минимизирует риски. К моменту использования данных мотивы у банка уже вполне респектабельные.

Насчёт данных и пристрастий есть ещё один пример - это чтение ваших личных писем. Ну почему, казалось бы, этого нельзя делать? Не пишите ничего постыдного, вот и всё.

Дело в том, что когда данные уже собраны, все мыслимые и немыслимые злоупотребления с ними будут гарантированно допущены. Потому что работать с ними будут бесконтрольно, либо корыстные люди, либо просто идиоты, будут утечки, копирование, продажа на чёрном рынке.
Как с той записью "проверялся на накротики, не обнаружено". Пройдя через пятые руки, потеряв изначальную модальность, соотнесение с остальными данными и обстановкой их сбора, эта запись может при неудачном стечении обстоятельств или чьей-то злой воле разрушить вашу жизнь.

Веб 2.0 прикончит частную жизнь

Ashmanov 23 июл 2006 в 16:04

Вы меня и не задели. Мне просто кажется неправильным свысока делать комментарии вроде "паранойя" или "добро пожаловать в реальный мир", при том, что идёт обсуждение вполне реальных проблем.

Что касается "атомарного" маркетинга, вплоть до уровня конкретного человка, то нет сомнений, что это будет сделано. Проблема в том, хорошо ли будет жить в таком мире. Мы с Вами пока ещё не столкнулись хотя бы с кредитной историей и как она может испортить жизнь. Нам трудно пока судить - на себе не испытывали.

А вот Вам ещё история из реального мира: на конференции PC Forum 2004 в Фениксе, штат Аризона, я столкнулся с тридцатилетним немцем, занимающимся антивирусами и криптованием. Он в юности учился в Каанаде в университете. Одновременно получил права пилота. Однажды во время тренировочного полёта его Сессну посадили на полицейский аэродром с целью проверки на перевозку наркотиков. Накротиков не нашли, но сделали в БД запись - "проверялся". Потом недавно канадцы объединили полицейские базы с базами США. Теперь он приезжает в аэоропорты США и Канады минимум за 4 часа до вылета, иначе пропустит рейс. Его ВСЕГДА 2-3 часа трясут - полностью раздевают, вскрывают подмётки и так далее.
То есть абсолютно невиновный и даже непричастный парень получил проблему на всю жизнь. Возможно, ему где-то не дали контракт, кредит или визу по той же причине, только не сказали, ну и так далее.

Да, это полицейская история, казалось бы.
А представьте себе ровно такую же маркетинговую запись Гугла "интересовался детским порно", которая возникнет из-за случайного щелчка мышью по пропущенному Гуглем же спамерскому письму...

Веб 2.0 прикончит частную жизнь

Ashmanov 23 июл 2006 в 08:03

Господа, по-моему, вам сказать нечего. Но хочется выглядеть умно.
Обратите ваше драгоценное внимание на тот факт что обсуждаемая статья была именно про это - сбор персональных данных для маркетинга.

Вы что хотите сказать - что их не собирают? Что их собирают с самыми чистыми намерениями? Что есть фиксированные и строго соблюдаемые правовые нормы для такого сбора данных?
Что это не следует обсуждать?

Ну, а выкрики типа "такова эпоха" имеют простое объяснение - это дешёвый способ философствовать. Просто вам хочется чувствовать себя таким знатоком жизни, с приставкой сверху к нам, истерикам. Ну-ну.
А какова эпоха? Чем она уж так отличается, что нам надо именно сейчас привыкать жить в вашем нехорошем "реальном мире"?
Расскажите подробнее. А то, знаете, этой фразе лет, наверно, примерно тысяч пять.

Веб 2.0 прикончит частную жизнь

Ashmanov 22 июл 2006 в 06:32

Гугл прикончит частую жизнь ещё раньше. Вот смотрите - у него сотни миллионов пользователей. Он видит, что они ищут и куда переходят. Уже показывает им рекламу. Есть News.Google.com. Там десятки миллионов пользователей. Гугл видит, что они читают. Теперь есть и Gmail. Там тоже будут десятки миллионов со временем. Известно, что они пишут друг другу. Уже показыают рекламу по тексту писем. Дальше будут и новые массовые сервисы, которые покрывают другие виды активности - обмен мгновенными сообщениями и т.п.

Теперь предположим, что вы совершенно уникальный человек, таких - один на миллион. В России таких всего 100 или 200. Пусть Гугл через лет пять охватит полмиллиарда-миллиард интернет-пользователей. Тогда мера вашей уникальности для Гугла такова: вас таких на самом деле примерно 1000 пользователей, которые ходят по сети одинаково, имеют очень близкие интересы, пишут про одно и то же, ищут одно и то же, кликают по одной и той же рекламе. А Гугл все группки от 500, скажем, обсчитал за годы исследований.

Как только вы или ваш близнец по этой 1000 входит в сеть, Гугл уже всё знает про ваши привычки. По тому, как и куда вы заходите, что пишете, он сразу отнёс вас в вашу тысячу. Ему не надо знать именно вас лично - он весь полк ваших уникальных близнецов уже обсчитал заранее. И по первому же отрезку сегодняшней траектории по Интернету распознал. Ну и влил рекламы по самое не хочу - рекламы, от которой у вас нет сил отказаться - она пошита индивидуально под вас. Или настучал куда следует, если эта тысяча криминально-подозрительная или политически некорректная.

Графический спам забивает каналы связи

Ashmanov 21 июл 2006 в 15:22

Вот Аня обнаружилась в мобильнике и сказала, что для этого отчёта именно процент графики не считали, а на глаз и по ощущениям 4-5%, но точно не 10%.

Графический спам забивает каналы связи

Ashmanov 21 июл 2006 в 15:15

Я-то не подсчитываю. Мы отдали Спамтест Касперским.
Там наши же люди, они подсчитывают (а именно начальник антиспам-лаборатории Аня Власова).
Вот их последний отчёт по спаму в Рунете:
http://www.spamtest.ru/document?pubid=19…
Там, однако, нет именно цифры про %% графического спама. А спросить смогу через две недели - Аня напоследок выпустила отчёт и уехала в отпуск.

Microsoft создала систему для автоматической нейтрализации дорвеев

Ashmanov 21 июл 2006 в 08:09

Вообще-то в статье речь про спам в поисковиках в принципе.
Сейчас у поисковиков главная головная боль - не блоги. А сами дорвеи.
Блоги - просто один из способов их раскрутки, но далеко не единственный.

Их делают в промышленных масштабах, они составляют 10-30% выдачи в зависимости от популярности темы. Таким образом в западном Интернете воруется поисковый трафик у Гугла и перепродаётся тому же Гуглу через его же AdSense. Или Увертюре (то есть Яхе).
Обороты этой социальной сети дорвеев сравнимы с заработками поисковиков, скажем в России - 10-20 миллионов долларов (по неофициальной оценке Яндекса).
Одна из основных идей - клоакинг, то есть показ разного контента боту поисковика и посетителю. Условно говоря, создают страницу на пару месяцев, дают Гуглу заиндексировать, а потом быстро заливают нечто другое и показывают контекстную рекламу.

Микрософт, как я понимаю смысл статьи, сделал специального бота, который пытается различить дорвеи,а потом их выкидывают из основного индекса поисковика MSN.

Это, конечно, новость, но не революционная. У Гугла такой бот, безусловно, есть. И у Яндекса он есть уже два года, называется "Хитробот". Там идёт настоящая технологическая война, придумываются разнообразные приёмы показать хитроботам не то, что увидит белковый посетитель. А владельцы поисковиков стараются в свою очередь замаскировать хитроботов, чтобы их не распознал как таковых алгоритм клоакинга дорвея.

Графический спам забивает каналы связи

Ashmanov 21 июл 2006 в 05:43

"Часто" не является критерием. Если этих писем в общем потоке спама всего 10%, как говорит Шура Козлов, и если спамфильтр пропускает к пользователю из всего спама 5%, допустим (то есть уровень детекции 95%), то вполне возможно, что при этом все пропущенные письма будут графическими. И тогда они-то и есть главная проблема на этот момент.

Насчёт утверждения статьи, что впервые этот графический спам появился якобы в третьем квартале 2005, не понимаю, откуда это взяли.
Впервые он появился в Рунете летом 2003 года. Мы как раз тогда только что установили Спамтест на Mail.ru (в мае 2003) и это была реакция спамеров на резкое падение уровня доставки спама до получателя. Mail.ru тогда был основной мишенью. Яндекс был им менее интересен, хотя там спам тоже, в общем, доходил до ящиков.

Спамтест давал тогда как раз где-то 93-95% детекции, то есть спама стало доходить меньше в 20 раз, это резко снизило отклик и спамеры сразу завозились. В июне-июле развернулась настоящая технологическая война, с очень быстрым нанесением ударов.
Они начали сначала слать письма с подменами русских букв на похожую латиницу (графикой), потом кусочно-графические письма (часть букв графикой), потом отдельные слова графикой, потом картинки целиком, все одинаковые, потом модифицированные картинки, все разные. Ну и другие приёмы, не текстовые, тоже применялись.

Тутубалин в июне-июле могучим усилием создал механизм нескольких нечётких графических сигнатур для Спамтеста и проблему мы закрыли. Осенью спамеры ещё подёргались чуть-чуть и бросили это направление. Мы их фактически заставили пойти по другому пути.
Этим же летом проиграл технологическую борьбу ЦАА и навсегда слился в отходы.

Потом ещё в 2004 году появились картинки с этаким муарчиком на фоне, но тоже не очень получилось, мы быстро научились его игнорировать при отождествленнии писем между собой.

Сейчас они придумали кое-что новое, но главное - у них появились мощности, позволяющие сильно модифицировать каждую картинку. В 2003-2004 это было слишком накладно по производительности. А сейчас они, очевидно, модифицируют не на своих серверах, а на ботнетах, а там мощности сколько хошь.

И все еще без бизнес-плана

Ashmanov 19 июл 2006 в 11:26

А что тут такого особо рискового и нехорошего?
Компания имеет огромную аудиторию. Это - деньги. Как их прям вот щас собрать, вопрос другой, но они там пишут, что разрабатывают средства рекламы.

Сейчас вообще инвесторы очень хотят контекстную видео-рекламу, то есть рекламу в видео и IP-TV, дают любые деньги под такие стартапы. Так что я не думаю, что инвесторы YouTube сильно напрягаются. В конце концов всегда можно продать проект Гуглю или другому крупняку. Если этого не сделано, значит, перспективы самостоятельного бизнеса лучше.

Человек vs Машина: не уподобляться, а сопротивляться

Ashmanov 11 июл 2006 в 17:44

А что, RAM - это на жёстком диске?

1 2 ...

39 40