Как стать автором
Обновить

Комментарии 52

Если окажется что мой провайдер барыжит моими логами — он перестанет быть моим провайдером в кратчайшие сроки.
Только вот вряд ли об этом станет известно :-)
Не ваши логи :) А логи провайдера. К тому же логи продаваемые американскими ISP обезличены.
И тем не менее я против. Я исхожу из того, что любой кто купит мои логи решит узнать куда я ходил и это может привести этого человека к серьёзной умственной травме. Я не хочу травмировать людей ;)
А откуда он узнает что это ваши логи ? :) Насколько я понимаю там объемы явно не один пользователь, а скорее за тысячи. После чего их обрабатывают выявляя наиболее популярные сайты, а так же url. :)
Популярные сайты выявляют с помощью счетчиков, а эти логи покупают, видимо, для того, чтобы потом таргетировать рекламу индивидуально под этих пользователей, зная, куда они ходили.
Рекламу под каких пользователей??? Для пользователя User1, User2 и User3???
Конечно.

Вы думаете, рекламодателю важно, как Вас зовут или какой у Вас ник? Нет, ему важно, что Вы искали в последнее время в сети и какие посещали сайты.

Если это не для индивидуальной рекламы, то зачем вообще делить трафик на юзеров?
…чтобы потом таргетировать рекламу индивидуально под этих пользователей…

Как маркетологи определят что это за ником User237623 стоит Вася Иванов, который живет на улице Бобруйской.

Или они будут рассылать листовки по Москве, со слоганом, "User237623, который 10 марта 3 раза заходил на Яндекс и четыре раза Slashdot! Только для тебя и только один день!"


Нет, я не думаю что рекламодателю, который покупает логи важно как меня зовут. Точнее может и важно, но эта информация ему не доступна.

зачем вообще делить трафик на юзеров
Затем что, голые урлы, в массе своей могут показать общую статистику, статистику по запросам к какому-нибудь серверу в разное время суток. Но они не по ним нельзя определить пристрастия и возможности пользователей.
Ну все зависит от того, может ли тот же Google, сопоставив информацию из этих логов со своими логами, определить, что юзер с ником X в gmail является User237623 в логах провайдера.

Если может (технически мне это оценить сложно, наверное, Вам виднее), то информация из лога про User237623 добавится ко всей истории юзера X из gmail, и реклама, показываемая в Gmail этому юзеру, будет учитывать его серфинг вне учетной записи Google.

Если же Google такого не может, то информация по отдельным юзерам все равно полезна. Например, по ней можно вычислять что-то вроде "среднего" поведения юзера, то есть, например, то, какие ссылки в поисковой выдаче он кликает первыми при данном запросе, и т.п.
Насчет гугла, если реклама все равно показывается, то на мой взгляд проще сделать страничку с интересами, которые отметит пользователь (там такое по-моему уже реализовано), и которая ему будет потенциально интересна. Проще спросить напрямую, чем ненавящево для пользователя определить круг его интересов.

то информация по отдельным юзерам все равно полезна.
Только не переходя на оффлайновых людей. Я это и пытался вам это объяснить.
1) Почитайте про рекламу гробов и про развитие бесплатных сервисов и Вы поймете, что спросить напрямую не проще и не эффективнее, чем получить информацию из логов данного пользователя, а тем более из внешних логов.
Вы так любите заходить на страничку интересов из Вашей почты. Я бы не зашел туда ни разу.

2) А я разве говорил про оффлайновых людей? Я листовки у метро перестал брать лет эдак 5 назад...
1) Да нет, я не пойму даже прочитав про рекламу гробов и развитие бесплатных сервисов. Не спрашивая человека, получить ответы на интересующие вопросы - предел мечтаний не только для маркетологов. Только мне кажется что в данном конкретном случае это слишком надумано, сложно и бесперспективно.

2) Нет, вы не говорили про оффлайновых людей.

Ну все зависит от того, может ли тот же Google, сопоставив информацию из этих логов со своими логами, определить, что юзер с ником X в gmail является User237623 в логах провайдера.

Зачем? Это довольно трудоемкая операция. И тратить такое количество ресурсов на такую ерунду никто не будет. Логи используются не для определения индивидуального таргетинга, а для определения общих тенденций. В связи с чем требуется бооольшое число пользователей. А при таком объеме никто ни с кем пользователей не сопоставляет.

PS Завязывайте страдать параноейей. Через логи никто этого делать не будет они слишком обезличены.
Так уж и обезличены?
Имея логи провайдера на руках в большинстве случаев можно понять кому они принадлежат.
Пример:
1. Работа с on-line магазином, ты указываешь свою реальную фамилию и адрес для доставки, попадет ли эта информация в логи зависит только от разработчика движка магазина.
2. Работа с сервисами интернет тот же gmail. Сначала в логах определяется логин юзера, потом ищется через поисковую систему страницы на которых пользователь указывает свой ящик. Это может быть форум или блог или резюме, да все что угодно.

Так что я считаю что по логам можно установить личность человека, особенно если человек активно работает в нете.

1. Работа с on-line магазином, ты указываешь свою реальную фамилию и адрес для доставки, попадет ли эта информация в логи зависит только от разработчика движка магазина.

Большая часть движков не генерирует персонализированые URL. К тому же если у магазина используется протокол SSL для работы (а у большей части используется), то логов по URL не будет.


2. Работа с сервисами интернет тот же gmail. Сначала в логах определяется логин юзера, потом ищется через поисковую систему страницы на которых пользователь указывает свой ящик. Это может быть форум или блог или резюме, да все что угодно.

Авторизация у Gmail проходит через ssl. Если не проходит через ssl, то да вероятность есть, но в любом случае она довольно мала.
Продолжу спор:
Провайдеру не составляет особых трудностей логировать не только стандартную работу пользователей: время, IP, URL, количество байт и т.д., но и расширенную: все заголовки протокола HTTP, например. Как быть в этом случае, ведь SSL еще не повсеместен?
Вы объем этих данных себе представляете? А стоимость оборудования? У буржуев я еще поверю что что-то подобное стоит. Но вот у нас... сомнительно.
>Вы объем этих данных себе представляете?
3-10% от объема входящего к пользователю трафика. Это еще что, иногда провайдерам приходится хранить полные дампы всего трафика прошедшего через их оборудования.
Хорошо, а теперь еще представьте какие мощности надо иметь учитывая, что объемы явно будут больше 1 террабайта.
Приблизительно 70 гигабайтов. :)
Относительно террабайта? :)
дорогой генацвале!
если страничку http://genacvale.habrahabr.ru/ 70% заходов делает User237623
если еще сделать такую аналитику по 40 сраницам
то можно составить точный портрет

а если прочитать данные на этих страницах
genacvale drnk ivan moscow rostov-on-don
и привести дату рождения в соответствие с физическим адресом модема
то опубликовать ФИО не проблема
анекдот из прошлого века

ЗАКАЗ ПИЦЦЫ ПО ТЕЛЕФОНУ

Металлический голос электронного оператора УАТС: “Спасибо за звонок в нашу службу заказа пиццы по телефону”.
Клиент: “Привет, я хочу сделать срочный заказ”.
Оператор: “Продиктуйте, пожалуйста, ваш номер персональной идентификации”.
Клиент: “6102049998-45-54610”.
Оператор: “Спасибо, господин Иван Иванович Иванов. Вы проживаете в Москве по ул. Строителей, д.1, корп.1, кв.11, а работаете в компании ITUnion по адресу..... Дома у вас номер телефона 1111111, на работе - 222222222, а номер сотового - 333333333. Вы позвонили с домашнего телефона, поэтому хотите заказать пиццу домой?”
Клиент: “Да, я сейчас дома. А откуда вы знаете все эти телефонные номера?”
Оператор: “Мы подключены к Государственной справочной системе”.
Клиент: “Ладно, есть у вас мясная пицца с грибами?”
Оператор: “Нам кажется, вам она не подойдет”.
Клиент: “Почему?”
Оператор: “По данным Министерства здравоохранения, у вас высокое кровяное давление и повышенный уровень холестерина в крови”.
Клиент: “Ладно, а что мне можно?”
Оператор: “Мы уверены, что вам понравится соево-йогуртная пицца”.
Клиент: “С чего бы это вдруг?”
Оператор: “На прошлой неделе вы заказали в Интернет-магазине книгу рецептов соевой диеты, а в прошлом месяце купили йогуртницу”.
Клиент: “Ладно, и сколько стоит эта пицца?”
Оператор: “Вы сейчас дома вместе с женой и двумя детьми, поэтому нужно заказать две большие пиццы, которые будут стоить 600 руб”.
Клиент: “Идет, плачу по кредитке, запишите номер”.
Оператор: “По информации от вашего банка у вас перерасход счета, поэтому нужно заплатить наличными”.
Клиент: “Хорошо, что успел снять немного денег в банкомате”.
Оператор: “По сведениям из банкомата и данным о ваших предыдущих покупках, вы не сможете оплатить доставку пиццы на дом, но вы можете сами забрать свой заказ”.
Клиент: “Идет, продиктуйте адрес, и я подъеду на машине через полчаса”.
Оператор: “Лучше воспользоваться велосипедом, ведь вы не продлили полис обязательного страхования, поэтому не имеете права водить свой
автомобиль”.
Клиент: “@#%/$@? #! Совсем забыл”.
Оператор: “Вам нужно следить за своей речью, ведь еще не закончился срок административного взыскания за нецензурную брань в метро, которую зафиксировала система слежения”.
Клиент: (сопит в трубку).
Оператор: “Прекрасно, ваш заказ принят и будет готов через полчаса. Что-нибудь еще?”
Клиент: “Ничего, но ваша реклама обещала к каждой пицце бесплатную бутылку Пепси”.
Оператор: “Сожалеем, но инструкция Пенсионного фонда запрещает предоставление этого напитка диабетикам”...


это адаптированый и плохой перевод с английского
найду хороший перевод - опубликую
нашел хорошй

http://www.habrahabr.ru/blog/translation…
Супер :)))) Прям какой-то 2084... :)))
1984

:-)))

http://www.lib.ru/ORWELL/r1984.txt

У партии две цели: завоевать весь земной шар и навсегда уничтожить
возможность независимой мысли. Поэтому она озабочена двумя проблемами.
Первая — как вопреки желанию человека узнать, что он думает, и вторая --
как за несколько секунд, без предупреждения, убить несколько сот миллионов
человек.
;-))))))))))))
Вот я про нее и говорил, только применительно к 2084 году.
Глубокоуважаемый, Шерлок Холмс aka bird2gt... :)))

Хоть я и ничего не понял из ваших изысканий, но, наверное, у вас большой потенциал. Вы не в бегуне, случайно, работаете ;)
Наверняка, вы понимаете как это сделать. Значит вам и карты в руки. Маркетинговых компаний у нас много, а за границей еще больше... :)

Я кажется ни словом не обмолвился о том что чего-то такого идентифицирующего сделать нельзя.
:-)
ни в каком бегуне я не работаю и вообще я заграничный
:-)
бегуну это будет удобно в том случае что если вы смотрите рекламу продажа б/у машин
то тур на сейшелы вам показывать не надо, а египет в самый раз
виагру и элитное жилье вам рекламировать не надо, а клубы и экстремальный отдых надо
это т.н. "портрет" пользователя
это их и покупают и анализируют чтоб лучше окучивать целевую аудиторию


но когда ваши логи купит какой-нить обидившийся на ваше замечание юзер каког-нить форума
и идентифицирует вас и начнет всячески "доставать"
это будет нехорошо
Как то все это очень за уши притянуто. Все равно это достаточно сложно сделать. И не стоит оно того.
А человек захотевший достать кого-то по интернету… это что-то типа виртуальной разборки :-))))))) Жуть. Не… Я так себе и представил этого хулигана!!! :)))))))))))
виртуальные разборки - это виртуальные
но их легко, гораздо легче чем вам кажется, перевести в реальные

http://forum.ixbt.com/topic.cgi?id=15:47…
Нда, грустно, однако. Но идиотов везде хватает.
Я исхожу из того, что мои логи совершенны и прекрасны. Это качество не позволит выпустить их из внимания и как следствие приведёт исследователя к желанию просмотреть все сайты которые я посетил. А в результате — реанимация и очень долгое восстановление. Психика многих людей сейчас не в состоянии справится с такой нагрузкой ;)
Мне кажется, это осуществимо.

Если у меня на сайте зарегистрирован пользователь, я знаю его профиль и могу отследить когда он ко мне приходит. После достаточно длительного наблюдения я могу сравнить время посещения с логами провайдера и с большой долей вероятности установить, что UserXXXXX — это мой клиент Вася Пупкин.

А что дальше делать — это уже от моей фантазии зависит.
Потребуется очень большая выборка за довольно большой промежуток времени. К тому же надо будет делать поправки на по времени.
Достаточно просто.
Если пользователь часто заходит на den-rad.habrahabr.ru, den-rad.livejournal.com, del.icio.us/den_rad , то не нужно быть Шерлоком Холмсом, чтобы понять что это за пользователь.
Интересный сценарий может быть. Некая фирма занимающаяся защитой авторских прав скупает подряд логи у ISP. Затем по логам находит факт передачи контрафакта и уже официально приходит к ISP с предъявой - ваш IP, сдавайте пользователя.
Потом письмо к пользователю с требованием оплатить ущерб, иначе суд.
В Германии похоже все больше и больше людей таким образом берут на понт, да и в России тихо тоже начинают - http://torrents.ru/forum/viewforum.php?f…

Некая фирма занимающаяся защитой авторских прав скупает подряд логи у ISP. Затем по логам находит факт передачи контрафакта и уже официально приходит к ISP с предъявой - ваш IP, сдавайте пользователя.

Каким образом? Если мы рассматриваем случай без прозрачного прокси и разбор по netflow, то максимум можно установить, что пользователь ходил на варезные сайты и потребил столько то трафика. В случае p2p вы можете только зарегистрировать, что пользователь обращался на трекер. Доказать при этом по логам, что пользователь скачивал контрафакт довольно сложно.
Согласен, что весь фопрос в факте передачи контрафакта. Не даром многие трекеры запрещают именовать файлы торрента, явно указывающие на содержимое. Так что тут уже вопрос проворности компании или ее наглости в попытках "взять на понт".
В netflow вообще-то видно только ip-адреса, порты, количество трафика и время ;)
Эта инфа скупается для маркетинговых исследований.
Допустим, купил ты логи 100 юзеров из какого-либо района и у тебя уже более-ли менне репрезентативная выборка, позволяющая определить где наиболее эффективно размещать рекламу.
Мы против такого бизнеса.
Простите, «мы» — это кто? :)
Мы это Я :)
А чем он собственно не нравится?
Если у провайдера 10 млн пользователей, по тому куда они ходили - можно определить их интересы и пр. пр. пр. Получается объемный пласт "потенциальных потребителей рекламы", интересы которой известны. Можно делать выводы и размешать рекламу на сайте провайдера, либо вкладывать буклеты в письма со счетами.
А вот в свободное от работы время, программисты маркетинговых компаний, занимающиеся анализом серфинга американских граждан кропят доносы в ФБР, выискивая пользователей обменивающихся порнухой и mp3 файлами.
Как только начнут в глобальных масштабах отслеживать p2p сети, тут же появятся p2p сети работающие с использованием шифрования. И все собственно.
Неудачно написал про программистов :)
Другими словами, втайне от публики такие сделки могут проворачиваться каждый день, а в России уж тем более.

А откуда такая уверенность?
Потому что в России даже базы данных налогоплательщиков на улицах продают, то есть приватность считается меньшей ценностью, чем в тех же США.
Такая статистика позволяет выявлять закономерности в поведении пользователей. Кроме георгафического существует еще и поведенческий таргетинг, который прогнозирует действия пользователей.
Конституция РФ статья 21 ч.2:
Каждый имеет право на тайну переписки, телефонных переговоров, почтовых, телеграфных и иных сообщений. Ограничение этого права допускается только на основании судебного решения.
Конституция РФ статья 24 ч.1:
Сбор, хранение, использование и распространение информации о частной жизни лица без его согласия не допускаются.

УК РФ ст.138 ч.1-2:
1. Нарушение тайны переписки, телефонных переговоров, почтовых, телеграфных или иных сообщений граждан - наказывается штрафом в размере до восьмидесяти тысяч рублей или в размере заработной платы или иного дохода осужденного за период до шести месяцев, либо обязательными работами на срок от ста двадцати до ста восьмидесяти часов, либо исправительными работами на срок до одного года.
2. То же деяние, совершенное лицом с использованием своего служебного положения или специальных технических средств, предназначенных для негласного получения информации, - наказывается штрафом в размере от ста тысяч до трехсот тысяч рублей или в размере заработной платы или иного дохода осужденного за период от одного года до двух лет, либо лишением права занимать определенные должности или заниматься определенной деятельностью на срок от двух до пяти лет, либо обязательными работами на срок от ста восьмидесяти до двухсот сорока часов, либо арестом на срок от двух до четырех месяцев.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории