Часть 1. Вступление.
Часть 2. Сбор данных.
Часть 3. Базовые метрики.
Часть 4. От статистики к аналитике
Продолжим наше путешествие в мир веб-аналитики. В прошлой части мы наконец вплотную занялись анализом статистики и получением информации из собираемых данных. Оказалось, что мы можем отследить поведение пользователя, но не причины этого поведения. А для того, чтобы стимулировать желательные поступки и предотвращать нежелательные, нужно знать именно причину этих поступков.
Каким же образом опытные аналитики “залезают в голову” пользователю, имея лишь усредненные данные по сайту? Никакой магии. Они проводят процедуры, которые разбирают эти авгиевы конюшни:
— Сегментируют данные: разделяют всех пользователей на группы исходя из определенных критериев и рассматривают поведение не всех пользователей, а каждой из этих групп в отдельности.
— Строят предположения и проверяют их: выискивают вероятные объяснения для сложившейся ситуации и пытаются повлиять на ситуацию исходя из этих предположений, наблюдая за результатом.
«Не сегментировать данные — это преступление против человечности»
Авинаш Кошик
Усреднение — это то, чего нужно бояться больше всего. Можно, конечно, суммировать статистику от пользователей, пришедших с рекламных объявлений, со статистикой от случайных посетителей; складывать посещения изо всех городов и стран; рассматривать «среднюю температуру по больнице, включая морг», как в популярном анекдоте. Однако, в таком случае полезных данных вы получите минимум, и выводы, которые вы из них сделаете, скорее всего, будут неправильными.
Перед началом работы забудьте, пожалуйста, всё, что вы знаете о своих пользователях. Вам предстоит анализировать беспристрастные данные статистики, и две вещи могут помешать вам: попытки использовать свои собственные суждения о пользователях и желание создать «усредненный портрет» для всей вашей аудитории. Все наоборот: чем больше разных портретов, разных групп вы увидите, тем больше вы узнаете о том, как угодить каждой из этих групп.
Сегментация возможна по любым параметрам, которые система веб-аналитики запоминает при показе страницы. Например:
— По региону
— По адресам сайтов, с которых пришел пользователь
— Для тех, кто увидел ваш сайт в поисковике — по запросу, который помог ему найти его
— Для тех, кто пришел с рекламного объявления — по объявлениям и рекламным площадкам
— По первой увиденной пользователем странице
— По техническим возможностям компьютера и интернет-соединения пользователя
— По тому, приходил ли пользователь на ваш сайт ранее
— По действиям пользователя на сайте.
Вот простой пример того, как работает сегментация.
Вы — владелец интернет-магазина, и вас, конечно же, волнует, каким образом можно увеличить его прибыльность. Вы заходите на Google Analytics и видите следующую картину:
Это усредненные данные по всем пользователям. Они могут представлять интерес только в динамике — их колебания являются сигналом о том, что ситуация поменялась и надо провести дополнительное расследование. Но настоящие откровения ждут нас дальше, в глубине, там, где данные сегментированы по всем возможным параметрам.
Зайдем, например, в раздел «Содержание». В нём удобно пользоваться пунктом «Содержание по заголовкам», так как в списке сразу же понятно (если на сайте корректные теги title), о какой странице идёт речь:
Мы только что сегментировали посещения по страницам, которые открывали пользователи. Здесь интересного уже больше. Мы можем увидеть:
— Какие страницы посещают чаще всего (Просмотры страниц)
— На каких чаще всего задерживаются (Средняя длительность просмотра страницы)
— Сколько процентов посетителей, начавших просмотр сайта с этой страницы, не перешли на другую, а сразу закрыли сайт (Показатель отказов)
— Сколько процентов посетителей закончили просмотр сайта на этой странице (% выходов).
Обратите внимание, что точность подсчета параметра зависит от количества собранных данных. Например, показав страницу 10 раз и получив 2 отказа, мы не можем с точностью утверждать, что показатель отказов составляет 20%: собрав больше статистики, мы сможем уточнить результат, и реальная цифра сможет отказаться как 10%, так и 30%. В качестве первого приближения можно считать, что колебания значения составляют плюс-минус корень из измеряемой величины. Так что, например, колебания посещаемости от 90 до 110 пользователей не говорят о системном изменении величины. Системные изменения иногда видны на глазок, но на это не стоит полагаться; для точных измерений, поскольку обычные системы статистики не позволяют строить линии тренда, можно либо загрузить статистику в Excel, либо брать большие интервалы измерений. Более точную формулу для подсчета достоверности данных я приведу позже.
С этим связана одна проблема, которая мешает пользоваться Google Analytics: при попытке отсортировать страницы по показателям наверх выходят самые непопулярные:
Понятно, почему это происходит, но эти данные бесполезны: у них нулевая точность. В зависимости от количества страниц, ключевых слов или других сегментов бороться с этим можно по-разному, я, честно говоря, не знаю метода лучше, чем экспортировать таблицу с сортировкой по убыванию показов в Excel, затем отрезать от нее «длинный хвост» и сортировать по другим полям.
Понятно, зачем это нужно: особый интерес представляют те сегменты, для которых один из этих параметров необычен: заметно больше или меньше значения для остальных сегментов. Обычно это происходит по следующим причинам:
— Отличие в трафике: пользователи, которые представляют данный сегмент, отличаются от других. Например, для интернет-магазина, работающего только на Москву, посетители из Екатеринбурга будут нецелевыми, и для них будет больше отказов, меньше достижения целей и ниже глубина просмотра.
— Отличия в качестве страниц. Если страница прячет от пользователя свое содержимое и не помогает ему понять, что можно сделать на сайте, не убеждает его в том, что нужно идти дальше, пользователь с большей вероятностью будет потерян для сайта. На западе persuasion design — целая дисциплина, но об этом позже.
— То, о чем многие забывают, пытаясь упростить модель взаимодействия пользователя с сайтом — соответствие целей пользователя, зашедшего на страницу, и содержания страницы. Типичной ошибкой подобного рода является использование главной страницы сайта в качестве входной (landing page) для рекламных кампаний. Кликнув по рекламному объявлению, сулящему скидку на определенный товар, пользователь может оказаться на главной странице большого магазина. В этом случае велика вероятность того, что он не захочет или не сможет найти то, что уже ожидал увидеть. Подобная ошибка происходит и тогда, когда в попытках заманить больше посетителей рекламодатель пишет на баннере «скидка 25%!», а на входной странице сайта «забывает» о своем предложении.
Рассуждая в этих трех категориях, можно создавать гипотезы и проверять их, увеличивая важные для сайта показатели.
В следующих частях мы поговорим о составлении плана анализа, построении предположений на основе статистики по каждому из основных параметров и их проверке.
Часть 2. Сбор данных.
Часть 3. Базовые метрики.
Часть 4. От статистики к аналитике
Продолжим наше путешествие в мир веб-аналитики. В прошлой части мы наконец вплотную занялись анализом статистики и получением информации из собираемых данных. Оказалось, что мы можем отследить поведение пользователя, но не причины этого поведения. А для того, чтобы стимулировать желательные поступки и предотвращать нежелательные, нужно знать именно причину этих поступков.
Каким же образом опытные аналитики “залезают в голову” пользователю, имея лишь усредненные данные по сайту? Никакой магии. Они проводят процедуры, которые разбирают эти авгиевы конюшни:
— Сегментируют данные: разделяют всех пользователей на группы исходя из определенных критериев и рассматривают поведение не всех пользователей, а каждой из этих групп в отдельности.
— Строят предположения и проверяют их: выискивают вероятные объяснения для сложившейся ситуации и пытаются повлиять на ситуацию исходя из этих предположений, наблюдая за результатом.
Сегментация данных
«Не сегментировать данные — это преступление против человечности»
Авинаш Кошик
Усреднение — это то, чего нужно бояться больше всего. Можно, конечно, суммировать статистику от пользователей, пришедших с рекламных объявлений, со статистикой от случайных посетителей; складывать посещения изо всех городов и стран; рассматривать «среднюю температуру по больнице, включая морг», как в популярном анекдоте. Однако, в таком случае полезных данных вы получите минимум, и выводы, которые вы из них сделаете, скорее всего, будут неправильными.
Перед началом работы забудьте, пожалуйста, всё, что вы знаете о своих пользователях. Вам предстоит анализировать беспристрастные данные статистики, и две вещи могут помешать вам: попытки использовать свои собственные суждения о пользователях и желание создать «усредненный портрет» для всей вашей аудитории. Все наоборот: чем больше разных портретов, разных групп вы увидите, тем больше вы узнаете о том, как угодить каждой из этих групп.
Сегментация возможна по любым параметрам, которые система веб-аналитики запоминает при показе страницы. Например:
— По региону
— По адресам сайтов, с которых пришел пользователь
— Для тех, кто увидел ваш сайт в поисковике — по запросу, который помог ему найти его
— Для тех, кто пришел с рекламного объявления — по объявлениям и рекламным площадкам
— По первой увиденной пользователем странице
— По техническим возможностям компьютера и интернет-соединения пользователя
— По тому, приходил ли пользователь на ваш сайт ранее
— По действиям пользователя на сайте.
Вот простой пример того, как работает сегментация.
Вы — владелец интернет-магазина, и вас, конечно же, волнует, каким образом можно увеличить его прибыльность. Вы заходите на Google Analytics и видите следующую картину:
Это усредненные данные по всем пользователям. Они могут представлять интерес только в динамике — их колебания являются сигналом о том, что ситуация поменялась и надо провести дополнительное расследование. Но настоящие откровения ждут нас дальше, в глубине, там, где данные сегментированы по всем возможным параметрам.
Зайдем, например, в раздел «Содержание». В нём удобно пользоваться пунктом «Содержание по заголовкам», так как в списке сразу же понятно (если на сайте корректные теги title), о какой странице идёт речь:
Мы только что сегментировали посещения по страницам, которые открывали пользователи. Здесь интересного уже больше. Мы можем увидеть:
— Какие страницы посещают чаще всего (Просмотры страниц)
— На каких чаще всего задерживаются (Средняя длительность просмотра страницы)
— Сколько процентов посетителей, начавших просмотр сайта с этой страницы, не перешли на другую, а сразу закрыли сайт (Показатель отказов)
— Сколько процентов посетителей закончили просмотр сайта на этой странице (% выходов).
Обратите внимание, что точность подсчета параметра зависит от количества собранных данных. Например, показав страницу 10 раз и получив 2 отказа, мы не можем с точностью утверждать, что показатель отказов составляет 20%: собрав больше статистики, мы сможем уточнить результат, и реальная цифра сможет отказаться как 10%, так и 30%. В качестве первого приближения можно считать, что колебания значения составляют плюс-минус корень из измеряемой величины. Так что, например, колебания посещаемости от 90 до 110 пользователей не говорят о системном изменении величины. Системные изменения иногда видны на глазок, но на это не стоит полагаться; для точных измерений, поскольку обычные системы статистики не позволяют строить линии тренда, можно либо загрузить статистику в Excel, либо брать большие интервалы измерений. Более точную формулу для подсчета достоверности данных я приведу позже.
С этим связана одна проблема, которая мешает пользоваться Google Analytics: при попытке отсортировать страницы по показателям наверх выходят самые непопулярные:
Понятно, почему это происходит, но эти данные бесполезны: у них нулевая точность. В зависимости от количества страниц, ключевых слов или других сегментов бороться с этим можно по-разному, я, честно говоря, не знаю метода лучше, чем экспортировать таблицу с сортировкой по убыванию показов в Excel, затем отрезать от нее «длинный хвост» и сортировать по другим полям.
Понятно, зачем это нужно: особый интерес представляют те сегменты, для которых один из этих параметров необычен: заметно больше или меньше значения для остальных сегментов. Обычно это происходит по следующим причинам:
— Отличие в трафике: пользователи, которые представляют данный сегмент, отличаются от других. Например, для интернет-магазина, работающего только на Москву, посетители из Екатеринбурга будут нецелевыми, и для них будет больше отказов, меньше достижения целей и ниже глубина просмотра.
— Отличия в качестве страниц. Если страница прячет от пользователя свое содержимое и не помогает ему понять, что можно сделать на сайте, не убеждает его в том, что нужно идти дальше, пользователь с большей вероятностью будет потерян для сайта. На западе persuasion design — целая дисциплина, но об этом позже.
— То, о чем многие забывают, пытаясь упростить модель взаимодействия пользователя с сайтом — соответствие целей пользователя, зашедшего на страницу, и содержания страницы. Типичной ошибкой подобного рода является использование главной страницы сайта в качестве входной (landing page) для рекламных кампаний. Кликнув по рекламному объявлению, сулящему скидку на определенный товар, пользователь может оказаться на главной странице большого магазина. В этом случае велика вероятность того, что он не захочет или не сможет найти то, что уже ожидал увидеть. Подобная ошибка происходит и тогда, когда в попытках заманить больше посетителей рекламодатель пишет на баннере «скидка 25%!», а на входной странице сайта «забывает» о своем предложении.
Рассуждая в этих трех категориях, можно создавать гипотезы и проверять их, увеличивая важные для сайта показатели.
В следующих частях мы поговорим о составлении плана анализа, построении предположений на основе статистики по каждому из основных параметров и их проверке.