Наbra Analytics Tools: аудитория хабов

    Исследуем аудиторию

    Перед каждым автором на Хабре встает вопрос: «В какие же хабы разместить статью»? Безусловно, ответ прежде всего зависит от темы. С другой стороны, многие статьи достаточно широкого профиля и приходится тщательно выбирать в какие три хаба написать. Сам Хабр такого инструментария для анализа не предоставляет. А что делают обитатели хабра, когда инструмент нужен, а его нет? Они его пишут!

    Тогда же мне пришла мысль, что неплохо было бы иметь простой визуализатор, который бы выдавал простую статистику по хабам и их совместной аудитории, например вот так:



    По картинке сразу видно, насколько пересекаются читатели различных хабов и имеет ли смысл заменить какие-либо из них.

    Представим, что мы хотим написать в хаб медиа и рассчитываем, а не стоит ли разместить статью в хаб Статистика в IT? Для того чтобы рассчитать целесообразность, необходимо найти пересечение аудитории хабов:



    Мы видим, что, фактически, подавляющее количество читателей хабов видит статьи и там и там, а это хороший сигнал о том, что возможно стоить рассмотреть имеющиеся альтернативы.

    Общее применение


    Зачем еще может понадобиться такой инструмент? (Автор не нашел лучшего аналога для слова tool.) Допустим, что вы представитель какой-либо компании и хотите посмотреть как много читателей определенного хаба подписались на корпоративный блог после написания статьи. Например вы собираетесь написать Проверка фреймворка Qt 5 и хотите посмотреть сколько человек из хаба Qt подписались на корпоративный блог PVS студии, тогда решение построить две диаграммы «до» и «после» следующего вида (тут приводится только «после»):



    Если по графику общая тенденция не слишком видна, то наш tool должен также предоставлять текстовую информацию о пересечении, в духе:
    57% of pvs-studio(company) intersects with qt_software

    И хаб, и корпоративный блог

    Есть на Хабре такие компании, у которых присутствует и корпоративный блог, и собственно хаб, посвященный компании. Например у Яндекса: блог и хаб. Аудитория блога 11к, а хаба 85к, а значит казалось бы зачем размещать в корпоративном блоге, если уже поместили в хаб? Наверняка читатели блога и хаб читают, при соотношении-то 1 к 8 по читателям. Проверим же эту догадку:



    Как можно заметить, примерно половина читателей корпоративного блога не читают общий хаб, а значит размещать в оба хаба имеет смысл.

    Общий и технический блог

    А бывает и такое, что есть общий хаб, например, Вконтакте и технический хаб Вконтакте API и встает вопрос, а имеет ли смысл постить в оба? Не будет ли аудитория второго полностью входить в первую? И это несложно проверить!

    Комментарии 22

      +7
      А хабы данного поста были проверены тулзой? Интересно увидеть диаграмму. Я просто слепой жук.
        +4
        Спасибо, отличная идея, было бы круто прикрутить к этому веб-интерфейс.
          0
          Как отсеиваются «мертвые» читатели?
            +1
            Пока никак, а есть идеи как их отсеять?
              +2
              Может, по дате последних комментариев?
                +4
                Некоторые активно читают, но почти не комментируют
                  +2
                  Тогда уж лучше по дате последнего входа. Я, например, не очень люблю комментарии писать, но читаю очень много статей. Почти каждый день, как минимум, просматриваю статьи из «Лучшее за 24 часа».
                    0
                    Ничего, скоро втянетесь. :)
                    Ваш последний интервал между комментариями был 15 дней. Для фильтра вполне можно взять порог в 20 или даже 30 дней.
                    Зато отсеются боты разного рода, расширения в браузерах и т.д.
                      0
                      Я например очень редко что-либо комментирую, но читаю каждый день. В основном вместо комментариев — живое общение о статье на кухне в офисе, что-то типа: «А ты читал сегодня о ХХХ на хабре?...»

                      Это к тому, что пользователь может активно читать, но ничего не комментировать.
                    +1
                    Ещё можно по дате последнего добавления в избранное — по крайней мере часть пассивных читателей жмёт на звёздочки.
                +1
                Было бы интересно увидеть статистику просмотров топиков в зависимости от даты и времени их публикации. Когда лучше публиковать топик, во вторник днём, когда все листают хабр на работе, или в субботу утром, чтобы все, кто проводит выходные в интернете, увидели?)
                  0
                  Ок, добавил в todo-лист.
                    0
                    У меня возникло ощущение, что в предобеденное время понедельника-вторника. Все с работы на Хабр ползут) Но интересна объективная статистика. Хотя не получим мы эти данные. Непонятно за какое время набралась статистика. Может основная толпа вообще через неделю статью посмотрела.
                      0
                      думаю, что тут можно сделать две вещи:
                      • Простое исследование в ретроспективе: с каким результатом закончили статьи по дате публикации (день недели, время суток и тд)
                      • Сложное исследование: у нас будет монитор из конца статьи (к разработке которого, я медленно, но верно подбираюсь) и тогда можно будет получить объективную статистику просмотров статей во времени — это существенно сложнее

                      Первое я думаю, можно сделать прямо сейчас, а для второго нужно будет сначала написать и протестировать монитор статей, а потом с месяц (минимум) собирать данные.
                        0
                        Второе более ценно, но само исследование зло) Это примерно как разработать уверенный предсказатель чего-то важного. Пока вы пассивно им пользуетесь — все нормально. Как только он становится доступен многим — он сам начинает вносить сильные искажения в статистику с положительной обратной связью. Это как навигаторы и пробки. Сами навигаторы, установленные на большинстве машин начинают провоцировать пробки, пытаясь провести людей «огородами» в объезд пробок.
                          +1
                          Да, этакое само-сбывающееся пророчество. Но даже у самых больших по количеству просмотров статей показатели существенно ниже аудитории хабра (где-то на порядок) т.е. фактически тот кто прочитал — тому и плюшки.
                          +1
                          Хочу монитор статей. Я вот тут описывал уже свои хотелки. Сложностей мало, но для постов компании отличная тулза была бы. А там со временем и статистика соберется.
                      0
                      Было бы интересно увидеть для заданной компании, в каких хабах состоят участники блога компании.
                        0
                        Это описано вот в этой статье и к ней же прилагает тул:
                        habrahabr.ru/post/221087/
                          0
                          Предполагаю, вас вот эта гистограмма интересует (по оси Y процент читателей вашего блога, которые читаю хаб по Х):

                            0
                            Да, но вот проблема
                            Запустил утилиту следующим образом
                            hubs.exe -a veeam --max 1000>list.txt

                            В полученном файле было 365 хабов, однако там не оказалось хаба «Виртуализация» (virtulization). Вместе с тем, это хаб, в который мы постоянно пишем, да и вторая Ваша утилита
                            venn.exe -d virtualization veeam
                            показывает, что пересечение 174 человека (70% подписчиков блога).

                            Хаб виртуализации отдельно обновил, но не помогло.

                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                      Самое читаемое