Какие метрики Google Analytics провоцируют неверные решения

  • Tutorial
Google Analytics и Яндекс.Метрика — большие системы. Их интерфейсы изменяются медленно. И за время работы систем аналитики накопились инструменты, которыми сейчас пользоваться нельзя. Команда rick.ai коллекционирует ошибки аналитики и рассказывает, как легко настроить аналитику против себя.

Почему круговую диаграмму «Новые и вернувшиеся» интерпретируют неправильно?


Команды оценивают долю вернувшихся пользователей по диаграмме «Новые и вернувшиеся». Если вернувшихся пользователей много, не нужно усиливать или запускать ремаркетинг и ретаргетинг, оптимизировать email-рассылки.



Глядя на диаграмму, маркетинг и продакты видят, что 42,2% пользователей возвращаются повторно. А значит, переключать силы команды на работу над возвращением на сайт не надо. Простой понятный вывод.

На диаграме написано new visitors — новые посетители/пользователи. На самом деле, это не пользователи. Этот график построен по сессиям.

Google Analytics считает сессии, а не пользователей


Пользователи систем аналитики, ожидают, что системы умеют все на свете. Это не так.
Я.Метрика и Google Analytics активно развиваются и изменяются. Посмотрите, например, API ChangeLog. Многие вещи, от которых ожидают корректной работы, морально устарели хотя не будут убраны из интерфейса еще пару лет.

У GA есть стандартный инструмент — GA dev tools Query Explorer. Весь интерфейс GA работает поверх их API. Мы можем формировать запросы и они будут показывать те же самые цифры, которые показываются в интерфейсе.

Посмотрим на поведение пользователя с идентификатором 1000046758.1506757751.
Эти двадцать цифр — ga_clientID, уникальный идентификатор пользователя. Запись этого идентификатора в одну из переменных пользователя custom dimension позволяет посмотреть, что происходит внутри гугла, и работать с raw data. Без доступа к raw data понять, что происходит, практически невозможно.

image

30 сентября у пользователя 100…751 было 2 сессии: одна записалась в New visitors, другая — в Returning visitors. В первую сессию пользователь — новый. Во вторую — вернувшийся.

Когда ga запускает новые сессии, можно прочитать в справке:
Один пользователь может выполнить несколько сеансов [сессий], которые могут произойти за один день, неделю, месяц или год. Новый сеанс может начаться только после того, как будет закончен предыдущий, а заканчивается он в следующих случаях:

По времени:
· через 30 минут бездействия
· в полночь.

В случае смены кампании:
· если пользователь перешел на сайт по объявлению одной кампании, покинул его, а затем снова посетил, но уже по объявлению другой кампании.

image


Посмотрим в GA dev tools Query Explorer, что произошло с пользователем 100…751.



В 10:49 человек зашел с гугл-органики, в 10:50 сделал какое-то действие, 10:50 вернулся из канала cardstandart.ru. Платежный шлюз переопределился, как реферральная ссылка. Источник изменился. И запустилась новая сессия.

Число сессий на пользователя — случайная величина.
И это от вас не зависит


Разработчики подключат новый шлюз, нужно будет строить автолинковщик, делать кроссдоменное отслеживание. Но все равно ошибки останутся. К тому же пользователь может отвлечься на письмо или на звонок. Может возникнуть ошибка хрома и так далее.

Реальную картинку возвращаемости можно посмотреть в графике, который называется Когортный анализ. На самом деле, это не когортный анализ, а как раз retention.

image

В этом графике мы видим, что за неделю на сайт вернулись 6,27% пользователей.

image

За месяц на сайт вернулись только 8,99% пользователей. А не 42,2%, как показывает диаграмма Новые и вернувшиеся. Выводы маркетолога и продакта меняются на противоположные: «На сайт возвращается мало пользователей, необходимо оптимизировать email-рассылки, активнее работать с ремаркетингом и ретаргетингом.»

Расчет аналитики по сессиям неизбежно влечет ошибки в выводах, и в конечном счете, — в решениях. Потому что на сайте покупают, регистрируются и платят не сессии, а пользователи. Чтобы считать реальных пользователей и делать правильные выводы, используйте user-based аналитику.
Поделиться публикацией
Комментарии 14
    –1
    Ну и зачем писать про очевидные очевидности? Тут собрались те, кто в этих нюансах способен разобраться. Ну давайте ещё справку гугла перепечатывать. Стыдно для CEO такое писать.
      0
      Но так же есть тут те, кто разбираются, но объяснить не могут. Тем более с примерами.
      Скину-ка я ссылочку нашему маркетологу.
        0
        Так можно буквально про любую статью на хабре написать.
          0
          Вам очевидности, а для кого-то нет. Стоит значок же «Tutorial»
            0
            Мне как разработчику очевидно, что если написано 40% вернувшихся пользователей, это значит 40% пользователей совершили повторный заход на сайт. Про Когортный а
              0
              Про Когортный анализ я могу и не подозревать.
              (Комментарий не полный отправил, сначала написал, потом передумал писать и нажал на отправить)
            0

            Если при наличии digital-marketing в компании, выводы о возвратах делаются только по этой диаграмме — ее ждут проблемы посерьёзнее, чем потеря лидов от ремаркетинга)
            А если нет, копнув чуть дальше, математика про 40% быстро вызовет сомнения и заставит перенастроить стандартные представления.

              0
              > Ну и зачем писать про очевидные очевидности?
              Это первая базовая статья из серии статей, уходить на глубину без базовых и не самых известных вещей будет сложно. Например, из-за эффекта выше GA из коробки неверно определяет конверсии, неверно рассчитывает цели, неправильно дает конверсию в разбивке по посадочным страницам.

              Мне сложно судить по всей аудитории хабра, но существенная часть участников конференций GoAnalytics, iMetrics и комьюнити аналитиков и маркетологов не очень хорошо представляет внутренности GA (я часто на выступлениях эти вещи рассказываю).

              Для многих не очевидно, что если на графике написано «пользователи», то речь идет о сессиях и визитах. А те кто это знает, часто не имеют ссылок под руками, чтобы аргументировано показать, как GA работает на самом деле.

              Будет круто, если комьюнити в комментариях приведет примеры частотных ошибок и заблуждений пользователей аналитики.
                0
                Продолжайте, пожалуйста. Интересно будет почитать.
                0
                Смотрел вашу лекцию www.youtube.com/watch?v=JWe_EnNIqbk&feature=youtu.be все по делу и без воды, круто, спасибо.
                  0
                  Возможно raw data? С предложенным подходом, насколько я знаю, есть проблема: если уникальных пользователей больше 100К, все пользователи после этого числа попадут в other support.google.com/analytics/answer/1009671?hl=en
                    0
                    Хм, да нет, выгружаем терабайтами raw data с ga_clientID, проблем нет особых
                      0
                      Так не в объёме данных дело, а в числе уникальных пользователей пользующихся сайтом в течение некоторого временного интервала (как описано по ссылке). Опять же, ошибки при выгрузке не будет, проблема проявляется иначе: часть данных записана на один и тот же идентификатор пользователя (что-то вроде other или 0, не помню точно что апи возвращает). Если конечно у вас не платный аккаунт в ga
                    0

                    Не знаю кому здесь вещи очевидные, но мне глаза открыли — спасибо, теперь понял куда смотреть

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое