Перевод книги «Using Google Analytics with R» (Michal Brys)

  • Tutorial
Электронная книга «Using Google Analytics with R» (Michal Brys) представляет собой практическое руководство по анализу данных из Google Analytics в R. Написана дата-сайентистом в 2014 году, но ничуть не теряет своей актуальности и сегодня.

image


В настоящее время мы плаваем в «озере данных» (data lake). Только если вы знаете, как использовать эти данные, вы останетесь на поверхности. Первым шагом является регулярная проверка стандартных отчетов в инструменте веб-аналитики (Google Analytics).

Но чтобы оставаться конкурентоспособным, нужно нечто большее. Все говорят о сборе данных. Но только некоторые знают, что делать с данными после их сбора. Я постараюсь описать этот процесс и дать вам несколько идей, как работать с данными из Google Analytics, используя R.

R — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU. Был разработан сотрудниками статистического факультета Оклендского университета Россом Айхэкой (Ross Ihaka) и Робертом Джентлменом (Robert Gentleman).

image

Основные преимущества языка R:

  • бесплатный;
  • доступно множество библиотек для различных статистических вычислений;
  • актуальный список пакетов. Множество учебных материалов (учебные пособия, MOOCs, блоги) доступно бесплатно в интернете;
  • имеет большое сообщество специалистов (русскоязычное пока маленькое);
  • готов к запуску на разных платформах (Windows, Mac, Unix). Версия для установки сервера также доступна;
  • быстрый, поскольку работает в режиме вычислений в памяти.

Автор материала работает в интернет-индустрии с 2009 года, является экспертом в области веб-аналитики в электронной коммерции, особенно с использованием Google Analytics и Google Tag Manager, а также состоит в группе разработчиков Google в Кракове (Польша).

image

Благодаря этой книге я познакомился с R. Она написана для маркетологов, которые работали с Google Analytics и знают основные метрики, включенные в этот инструмент, и знают веб-интерфейс.

В книге используется R Studio (свободная среда разработки программного обеспечения с открытым исходным кодом для языка программирования R), а также различные пакеты, такие как: googleAnalyticsR, googleAuthR, RGoogleAnalytics, ggplot2, plotly, tidyverse, forecast, reshape2.

image

Содержание книги:

  • Вступление
  • Зачем?
  • О Google Analytics
  • Про R
  • Об авторе
  • Подготовка среды
  • Источники данных
  • Создание аккаунта Google Analytics
  • Получение учетных данных для Google Analytics API
  • Установка счетчика Google Analytics на веб-сайт
  • Установка R Studio
  • Первые шаги
  • Введение в R
  • Связь с Google Analytics
  • Пакет googleAnalyticsR
  • Импорт и экспорт данных в .CSV
  • Хранилище кодов
  • Разведочный анализ данных (EDA)
  • Визуализация данных в R
  • Тепловая карта трафика (Traffic Heatmap)
  • Сравнение устройств
  • Машинное обучение
  • Кластеризация (метод k-средних)
  • Построение отчетов
  • Введение в R Markdown
  • Создание отчета
  • Дополнительный анализ
  • Обнаружение аномалий
  • Прогнозирование
  • Ресурсы (блоги, документация, онлайн тренинги, книги)

Скачать книгу в формате .pdf

Поскольку книга была написана в 2014 году, некоторые вещи за последние 5 лет претерпели изменения. Например, обновился код Google Analytics (gtag.js), изменен интерфейс cloud.google.com, некоторые команды в библиотеках R. В процессе перевода я сам проверял код, запускал программы, и там, где было необходимо, вносил корректировки. Поэтому данные из оригинальной книги могут несколько отличаться от моего перевода.

Если нашли ошибки и есть замечания по переводу, пишите мне на почту ya.osipenkov@icloud.com. С благодарностями тоже можно =)
Поделиться публикацией

Комментарии 5

    –1
    Основные преимущества языка R:

    бесплатный;

    улыбнуло, но тут претензия к автору оригинала

    скриншот
    а вот отсутствие перевода этой важной части — претензия к переводу. Автор оригинала честно говорит о минусах языка/среды, хотя и не о всех минусах конечно же.

    0
    Спасибо за перевод

    На странице 53 в коде запроса данных есть опечатка

    gadata <- google_analytics(ga_id,
    data_range=c(“2016-01-01”,”2016-06-30”),
    metrics = "sessions",
    dimensions = с(“dayOfWeek”,"date"),
    max = 5000)


    Во второй строке параметр должен быть date_range вместо data_range
      +1
      Спасибо большое за уведомление! Там не только на 53 странице, там 8 таких результатов с data_range. Ссылка обновил, исправил на date_range

    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

    Самое читаемое