Анализ поисковых логов пользователей AOL выдаёт десятки маньяков

    На сайте AOLPsycho каждая история поисковых запросов пользователей AOL изложена в хронологическом порядке. Указывается точное время осуществления запроса и адрес сайта, по которому был осуществлен переход.

    Вообще-то, открытие информации компанией AOL было сделано в исследовательских целях. До них не сразу дошло, что они сделали что-то не так. Но данный факт мгновенно получил широкий резонанс в блогосфере, и вскоре компания AOL признала свою ошибку и удалила файл с сервера. Впрочем, было уже поздно. Файл размером 439 МБ просочился в интернет, так что сейчас его можно свободно скачать сразу из нескольких источников.

    Спустя несколько дней в интернете появился очень интересный сайт под названием AOLPsycho. На этом сайте все желающие могут провести анализ поисковой истории любого человека из базы данных, а также посмотреть список самых популярных персонажей. Выборка поисковых запросов за три месяца дает отличную почву для изучения. Количество проанализированных пользователей растет с каждым днем: сегодня их уже 324.

    Конечно, по поисковым запросам нельзя назвать имя человека. Каждый пользователь обозначен безличным номером ID. Однако поисковая история каждого из них говорит сама за себя. Некоторые вещи вызывают настоящий шок. Вы можете вызвать на экран поисковую историю случайного пользователя, и спустя несколько минут обязательно наткнетесь на какого-нибудь маньяка. Просто поразительно, как много тайных желаний, комплексов и удивительных «бзиков» скрывается в голове каждого человека.

    Путем анализа поисковых запросов уже вычислили одного педофила, а также молодую девушку, помешанную на казино. Еще один пользователь ищет секс с кошкой. А этот — настоящий фанат Гарри Поттера. Что характерно, имя Гарри Поттера в поисковом запросе сопровождается терминами вроде «секс», «хентаи», «манга», «порно», «упражнения для пениса» и проч.

    Если вам смешно, то подумайте, что точно такой же анализ можно провести по каждому из нас. Зайдите в свою собственную историю поисковых запросов и представьте, что вы посторонний человек. Вы будете поражены, как много информации вы можете о себе узнать.

    Утечка данных с AOL и анализ поисковой истории — это очень интересный случай, который наглядно демонстрирует, насколько уязвимой является приватность каждого из нас. Анализ поисковых запросов позволяет многое сказать о человеке: что его интересует в жизни, какого его финансовое состояние, его планы на ближайшее будущее и многое другое.

    Комментарии 22

      0
      Поправьте ссылку, она ведет не на историю поисковых запросов.

      Правильная ссылка: http://www.google.com/searchhistory/?hl=…
        +1
        Нужно всё-таки кое-что прояснить по поводу второй части статьи с пафосом "мы все под колпаком!!!":

        а) Это излюбленный приём маньяков: "вот смотрите, я такой же, как вы! Если возьмутся за меня, это угрожает всем вам". Нет, не угрожает.
        Я лично за свою историю запросов спокоен, и думаю, что большинство обычных людей - тоже. Ну и смотрите на здоровье. Могу даже почту показать, за исключением разве что обсуждения текущих контрактов.

        б) Все, кто вводит запросы в поисковики, понимают или должны понимать, что они имеют дело с частными компаниями, которые ничего им не обязаны. Например, Яндекс не является госучреждением и ничего никому не должен. Единственное место, где он ограничен законом - это почта (тайна переписки), ну и наверно, Яндекс.Деньги.

        в) История запросов - вообще не относится к так называемым персональным данным, на раскрытие и распространение которых есть ограничения в законе. В нашей стране это - точно не персональные данные, так же как и в большинстве западных стран, насколько мне известно.

        Так что AOL "сделала что-то не то" исключительно с точки зрения пиара, может быть.
        Да ещё при том, что пользователй по сути никто не раскрыл, они на самом-то деле анонимны.
          0
          Отсюда мораль: :)

          1. Поисковикам не надо отдавать куки. Особенно тем, кто кроме собственно поиска предлагает кучу других сервисов, как Гугль, например. Впрочем, это очевидно и банально.

          2. "Подглядывать за подглядывающими" гораздо интереснее.

          "Путем анализа поисковых запросов уже вычислили одного педофила, а также молодую девушку, помешанную на казино. Еще один пользователь ищет секс с кошкой. А этот — настоящий фанат Гарри Поттера."

          Что ж, ссылки любезно предоставлены, смотрим:

          - "педофил". 1044 запроса, среди них один "preteen nude pics" и один "pre teen porn pics" (и два "48year old women sex pics" :) ). Гы... Учитывая с десяток запросов типа "jesus pics" в разных вариациях, логичнее было бы предположить, что он скорее иисусо-, а не педо- фил. Но автор почему-то уверен: "вычислили педофила".

          - "помешанная на казино". 86 запросов, офигительно обширная статистика для такого вывода. :) "free casino game download", "spirit mountian casino",
          "oregon casinos", "spirit mountian casino human resources": итого, если не учитывать варианты и дубликаты -- 4 запроса. Учитывая идущий следом запрос "human resources salem oregon" можно предположить, что она ищет в казино работу, но автор почему-то предпочел сделать вывод о "помешанности".

          - "секс с кошкой". 128 запросов. "how does a virgin vagina look", "how to have sex for the first time", "why do i ejaculate so fast", "is my penes big for the age of 17 teen", "how to make a girl fill good without sex", "sex position", "how to make a woman happy" -- в общем, весьма любознательный молодой человек попался. :) Но автор почему-то обратил внимание только на "how to have sex with a cat".

          - "фанат Гарри Поттера". 89 запросов за 3 месяца. Хентайного Гарри Поттера товаришчь искал из них 4 дня (подряд). Если это фанат, то какой-то очень уж кратковременный. Кстати, у этого чувака история запросов самая забавная из всех. :)

          В общем, не знаю как там на самом деле обстоят дела у авторов этих запросов, а вот автор статьи кое-какие из своих "тараканов" продемонстрировал весьма откровенно. ;)
            0
            Я тоже пробежался тут же по педофилу - удивился - откуда это взяли. Как обычно - выдутый из пальца сайт, там еще и в угоду фанам веб2.0 сделаны RSS, камменты и теги.
              0
              Гм... А как надо было? Назло веб2.0 НЕ делать RSS, комменты и теги?
                0
                Ключевая фраза - выдутый из пальца сайт. Не туда глядишь.
                  0
                  Ну естественно, не вытекающий из законов мироздания. Кто-то утверждал обратное?
                    0
                    Чагой? 0_0
                0
                Сволочи, да как они посмели угождать фанам веб 2.0! ))
                  0
                  Почему же сволочи, я просто подчеркиваю невысокую ценность сайта. Которую попытались компенсировать модными фишками.
                    0
                    На сайт ежедневно приходят 1 000 человек и развлекаются. В чем "невысокая ценность"?
                      0
                      А откуда данные о том, что развлекаются? У меня на дорвеи приходит несколько тысяч человек. Но я не утверждаю, что развлекаются.
                        0
                        Читают логи, расставляют теги для интересных находок, обсуждают в комментах найденное, следят за обновлениями через RSS. Больше 10% повторных визитов.
                          0
                            0
                            Убедил.
                              0
                              А на чем писан опиум для народа - теги, камменты, фиды?
                                0
                                На рельсах.
                    0
                    1. Думаете, зажимание куков спасет от сбора информации поисковиками? Можно же отслеживать посетителей по хосту и прокси-серверу, не обязательно используя стандартные реализации сессий.
                      0
                      При динамическом ip, да от крупного dial-up провайдера -- спасет.
                        0
                        В таком случае, речь явно не о панацее.
                    0
                    Запросы - ценная информация для психоаналитика.
                    Потом, по истории запросов неосторожного политика можно завалить (правда, видимо, пока только у них :)
                      0
                      Ага... Вот сегодня написала жена одного политика, попросила убрать его логи.

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое