Кто следит за нами?

    Big brother
    На Хабре уже было несколько статей про “Do Not Track”-инициативу, принятую крупнейшими интернет-компаниями, которая позволяет указывать, что вы не хотите быть отслеживаемыми на сайтах, если вы включите опцию DNT в браузере.
    В числе компаний, поддерживающих эту инициативу:
    • Facebook
    • Twitter
    • Linkedin
    • Pinterest
    • Google
    • Yahoo
    • Bing

    … и многие другие.
    Я задался вопросом — как в цифрах выглядит это “слежение” за нами?
    Включим здоровую долю паранойи и фантазии и посчитаем!

    Кому и зачем нужно следить ?

    Прежде всего заинтересованы рекламные сети, поисковики, аналитические службы, социальные сети. Имея информацию о посещенных вами страницах, поисковых запросах, характеристиках вашего клиентского устройства, ваше гео- положение, поло-возрастную информацию из социальных сетей, можно давать более релевантную рекламу, что повышает CTR, а соответственно прибыль рекламных сетей, полезно для рекламодателей и более приятно для посетителя веб-сайта. Поисковики начинают лучше понимать к какой предметной области относятся запросы, а аналитические службы начинают выдавать демографические данные по посетителям сайтов, позволяя точнее понять их предпочтения.
    Получается отслеживание выгодно всем? Да, но не всем нравится, что о их посещениях интернета службы знают больше чем жена, например.

    А что в цифрах ?

    Обычно для слежения используется подключение стороннего javascript, вот их и посчитаем.
    Для начала получим список доменов, которые посещали. Для этого я написал простейшее расширение для Chrome, которое выдает список посещенных сайтов (список доменов).
    Для подсчета я сделал на коленке (php+twig+mongodb+twitter bootstrap) за пару вечеров сервис, который проходит по списку данных ему сайтов, и определяет на каких сайтах, какие сторонние яваскрипты подключены.
    Мой результат — за мной следят на 126 из 174 сайтах.
    В результате учитываются только сторонние скрипты, потому собственные системы слежения крупных порталов не учитываются. Также используется достаточно простой поиск подключения яваскриптов, потому обфусцированные подключения также не учитываются.

    Как защититься от отслеживания

    1. Декларативные методы, когда вы просто объявляете, что не хотите, чтобы за вами следили — например, DNT или настройки конфиденциальности отдельных сервисов. Упираются в вопрос доверия и честного имени следящих компаний.
    2. Активные методы — режим “инкогнито” на сайтах, использование расширений типа AdBlock, Ghostery, периодическая чистка кукисов, отсутствие в социальных сетях.
    Это действует, но уменьшит доход вебмастеров, на чьих сайтах не покажут вам рекламу, или уменьшит релевантость и CTR показанных объявлений. Вам их не жалко?
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 8

      +1
      Хмм. Этот комментарий возможно будет Вам интересен: habrahabr.ru/post/116730/#comment_3789301
        +1
        Спасибо, но меня журналюги учили, что тему нужно всегда логически завершать (закрывать) — у вас же она открытой осталась (только технические аспекты рассмотрели).

        ИМХО не хватает подглавы примерно с таким заголовком: "Какие могут быть последствия такой слежки?", лично я бы ответил примерно вот так.
          0
          Статья конечно интересная, но эта тема поднималась на хабре не раз.
          Наверно я больше технарь, чем журналист, к сожалению.
          Меня интересуют конкретные цифры и проценты — «кто» и «сколько», потому я сделал инструмент и поделился им с вами. Думаю, это одна из причин почему статья не так интересна читателям, и почему сливают карму :) Надо было наверно проработать более ализаровский вариант.

          –1
          Для подсчета я сделал на коленке (php+twig+mongodb+twitter bootstrap) за пару вечеров сервис, который проходит по списку данных ему сайтов
          Twig и Bootstrap теперь используются даже для написания паука, проходящего по списку сайтов — это успех!
            0
            Нужно же быть на пике моды. Странно, почему Ruby on Rails в ход не пошли.
              0
              Очевидно для Twig и Bootstrap использовались для написания фронтенда.
              0
              У меня, допустим в броузере стоит автоочистка всего кеша, кукисов и прочих временных файлов по закрытии броузера. помогает не ловить косяки при тесте web-проекта
                +1
                Судя по тому, что в большинстве отслеживающих ресурсов есть слово google, становится погятно почему rtb траффик гугла самый богатый на данные пользователей.
                Хотя опасения про жену весьма дискуссионны, так как порядочные трекеры всегда делают «обезличивание» данных.

                Only users with full accounts can post comments. Log in, please.