Уникальные пользователи на самом деле не уникальные пользователи

    image

    Доброго времени суток, уважаемые Хабравчане! Считаете ли вы метрику уникальный пользователь или посетитель репрезентативной в Google Analytics или Яндекс Метрике? Я — нет. Более того, я убеждён, что значение количества посетителей на основе этих данных не имеет никакой значимости по следующим причинам:

    1. У большинства интернет пользователей несколько устройств и еще больше браузеров. Не всегда системам аналитики удается идентифицировать конкретного пользоватея.
    2. Мобильные приложения вроде Facebook, Twitter, VK, Telegram и др. имеют свой собственный webView на базе основного браузера в ОС. Куки никак не синхронизируются.
    3. Обилие клиентов для путешествия по интернету уже было упомянуто, но к ним стоит добавить всеразличные плагины и утилиты с VPN и блокировщиками рекламы.
    4. TNS утверждает, что на 1 человека в месяц приходится около 12 уникальных пользователей.


    5. Плюс ко всему аналитики компании Imperva Incapsula проанализировала более 16,7 млрд визитов на 100 тысяч случайно выбранных доменов и пришли к выводу, что на ботов пришлось почти 52% интернет-трафика в 2016 году.



    Хочу подчеркнуть, что я говорю о нерепрезентативности уникальных посетителей до их идентификации после авторизации и попадения в конверсионную воронку. Очевидно, что там уже задействуются User ID, IDFA и browser fingerprint технология в целом.

    Суть поста проста — данные в отличии от интерпретации данных не лгут, будьте бдительны.

    Большое спасибо за внимание.
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 22

      +1
      1. Пруфы?
      2. Хорошие боты это какие? А плохие?
        0
        Пардон, забыл поставить ссылку на VC. А там уже есть ссылки на сам отчёт.
          +1

          что метрика, что аналитика — позволяют отсечь поисковых ботов из данных. также идентифицируют кросс-девайсы и т.п. (тестировал на себе и знакомых)
          часть вредных ботов отсекаем на хостере по фильтру импортных IP
          часть отсекаем вручную через .htaccess отлавливая взломщиков. Большая часть IP-адресов принадлежит China
          Так что нет, не поверю, что из 11 пользователей — 1 настоящий :-)
          Но за опасения спасибо)

            0
            Про ботов я не просто так упомянул лишь в 5 пункте. Кросс-устрйственность — спорный момент. Конечно у гигантов вроде Яндекса или Гугла мощнейшие аналитические системы и огромное количество данных, по которым они научились определять людей. Но если вы зайдете с десктопа и потом скажем откроете ссылку в Телеграме на этот же сайт — то будет 2 уника.

            Часть там часть тут, в любом случае боты (как 5 пункт) влияют на нерепрезентативность этой метрики.

            Про TNS — это всё таки TNS и их панельная выборка.
        0
        Мобильные приложения вроде Facebook, Twitter, VK, Telegram и др. имеют свой собственный webView на базе основного браузера в ОС. Куки никак не синхронизируются.

        Это вы с чего так решили? У меня Android 6.0.1 с Chrome по-умолчанию. Зашёл в Хроме на заведомо непосещаемый с телефона сайт, авторизовался, скинул себе ссылку в телеграм, открыл её через телеграм weview, всё в порядке — я авторизован.

        Куки как минимум уже давно синхронизируются с webview.
          0
          У меня яблоко. Если я авторизован в Twitter в Safari, то да, я буду авторизован на нём же и в Telegram. Но я не буду авторизован в Twitter через webView от Facebook. Также важно то, что я могу пользоваться Firefox а не «нативным» Safari и тогда у меня вообще ничего не синхронизируется.
            0
            Ну это лишь один из кейсов. Я вам продемонстрировал обратный.

            У вас же этот пункт выведен вторым в списке. А список якобы доказывает ваше одиозное утверждение.
              0
              Так какая разница? Даже если это только айфоны и только кейс с Firefox — это уже будет в моём списке и это уже размывает точность метрики. И почему якобы?
                0
                Действительно, то, что у вас айфон и Firefox — доказывает размытие метрики в 12 раз.
                  0
                  Не нахожу продуктивным продолжать с вами диалог.
              0
              WebView WebView рознь.
              Есть старинный UIWebView и новый WKWebView.
              UIWebView ни с чем не синхронизируется, а WKWebView — это как бы окно Safari внутри вашего приложения, со всеми куками, контент-блокерами, историей посещения и т.п.
              Видимо, Facebook до сих пор использует UIWebView.

              Но сути это не меняет — хабр я читаю на рабочем компьютере, на домашнем, на лэптопе, на планшете, на телефоне, на двух последних как раз как в Safari, так и в WKWebView внутри Feedly.
              Если я не залогинен, я могу считаться пятью уникальными пользователями в день.
                0
                5 != 12
                И вы из тех, у кого почти максимум устройств.

                12 — это прямо сильнейший перегиб. На деле не думаю, что даже до 3 коэффициент дотянет.
                  0
                  5 — это только в день. Иногда я читаю Хабр на планшете жены или мамы, иногда мне надоедают тормоза Файрфокса и я использую Хром, иногда мне надоедает однообразная таргетинговая реклама и я очищаю куки и сохранённые данные в браузере.
                  Так что в месяц может и 12 наберётся.

                  А ещё я знаю людей, которые всегда пользуются режимом инкогнито в браузере — они будут считаться уникальными при каждом заходе на сайт?

                  Но мне коэффициент 3 тоже кажется реалистичным — дом, работа, телефон.
                    0
                    Работа 1.
                    Телефон 1.
                    Дом 0,5. Вы же не один дома пользуетесь устройством наверняка.

                    Это если вы гик.

                    По факту же основной коммерческий трафик (а считать обычно важно именно его) — это не гики. Это домохозяйки, это офисный планктон, который говорит спасибо за совет «попробуйте выключить и снова включить» и т.д.

                    Масштаб «проблемы» сильно приукрашен. Для жёлтой прессы сойдёт, но не Хабр же, право.
                      0
                      Любой личный пример не будет репрезентативным, конечно, но у многих моих знакомых, далеко не гиков, которым периодически приходится устанавливать драйвера на сканер, удалять левые плагины и панели из браузера и советовать попробовать выключить и снова включить, похожая ситуация: общий семейный лэптоп для хранения фоточек и скачивания фильмов, игровой компьютер ребёнка/отца, планшет у каждого ребёнка и у отца семейства, плюс, конечно же, смартфон на каждого члена семьи.

                      Не знаю, получится ли в итоге по 12 уников на человека, но по 2-3 устройства набирается.

                      Ах да, даже у моей восьмидесятидвухлетней бабушки в сибирской деревне есть смартфон и компьютер — она на почту ходила, чтобы ей воцап и скайп установили :)
            +1
            я таки не понял, какую метрику вместо
            уникальный пользователь или посетитель
            , предоставляемую аналитиками, вы предлагаете использовать как более репрезентативную и имеющею большую или более правильную значимость?
              0
              Хиты/просмотры страниц или просто сессии. В своём мышлении искоренил понимание уника, как действительно уникального посетитетеля. Считаю это не профессиональным для человека связанного со статистикой.
                0
                Так вы делите на 12 и вот вам уники. Такая же у вас логика? Ну и больше половины это боты — ещё на пополам делим.
                  0
                  Данные TNS были только по России это раз. Ботов половина всего, сколько из них учитывается/не учитывается системами аналитики совершенно иное число.
                  0

                  Человек, профессионально связанный со статистикой, должен понимать, что лучше всего использовать метрику, максимально приближенную к тому, что хочется оценить. Если вам нужно оценить динамику аудитории в человеках, то лучший выбор — смотреть на "уникальных посетителей", так как это чаще всего наилучшее приближение. Делая, конечно, скидку на то, что это != человек. Также имеет значение рассматриваемый период. За сутки значение будет намного ближе к "людям", чем за месяц. Смотреть на "хиты" в целом довольно бессмысленно, тк современные сайты даже за одну загрузку могут сгенерировать множество хитов. Это больше технический показатель, чем продуктовый. Визиты (сессии) тоже не хуже и не лучше, чем посетители, просто могут помочь оценить другие показатели: кол-во сессий на человека, длину сессии, и т.д.
                  Разные метрики в системах аналитики придуманы не просто так, хоть и все они несовершенны.
                  Кстати, оценить количество "посетителей на человека" можете, если у вас залогиновый сервис: посчитайте количество посетителей метрики на каждый логин

                0
                Согласен с остальными, отношение 1/12 не выглядит реалистичным. (С исследованием я не ознакомился, говорю о своих ощущениях).

                Давайте возьмем связку уник/посещение. При презентации данных клиенту или начальнику мы всегда говорим о паре этих параметров. Если принять за истину утверждения данной статьи, то получается, что некий процент параметра «посещение» зашит в параметре «уник». Получается, должен быть некий коэффициент. У нас он есть — 1/12. То есть на
                И вот мой вопрос. Можем ли мы говорить о релевантности связки уник/посещение, если возьмем 8,3% уников из статистики, а остальное приплюсуем в посещаемость?
                  0
                  Аналогичная проблема при построении аналитики по цепочке касаний до конверсии, сталкиваемся с проблемой когда конверсия через прямой заход и данные о прошлых визитах отсутствуют.

                  Only users with full accounts can post comments. Log in, please.