Анализ публикаций на Хабрахабре за 2017 год. Статистика, полезные находки и рейтинги



    Подходит к концу 2017 год. Пришло время подвести некоторые итоги. Каким был этот год на Хабрахабре? Чтобы ответить на этот вопрос мы, в Cloud4Y, решили собрать статистику по всем публикациям за прошедший с начала года период. В этой статье мы расскажем о том, что показалось нам наиболее интересным.

    С 1 января по 18:00 22 декабря 2017 года на Хабрахабре было опубликовано 10684 поста, которые посмотрели около 123 миллионов раз! Мы не включили в счёт 46 мегапостов и публикации, которые были скрыты или перенесены на Geektimes. В среднем в месяц публиковалось около 900 постов, а рекордным стал март.



    Соотношение публикаций между корпоративными и личными блогами хабровчан за анализируемый период составило 51,7% к 48,3%. Доля публикаций в блогах компаний была наименьшей в январе. Это объясняется долгими новогодними каникулами. Самым «корпоративным» стал май.



    В среднем публикация в 2017 году набирала 11500 просмотров и рейтинг +20. На один «средний» пост нашлось 70 пользователей, добавивших его в «Избранное», и 30 комментариев для его обсуждения. Посты из личных блогов лидируют по количеству просмотров (+10%), добавлению в «Избранное» (+22%) и количеству комментариев (+48%).



    Медианные значения: просмотры 7400, рейтинг 14, добавление «В избранное» 45, комментарии 12.

    На графике ниже показано количество просмотров для постов, которые отсортированы по дате публикации. То есть, например, от 0 до 500 — это самое начало года или 500 первых публикаций. Как видно, публикации стабильно набирают «свои» просмотры и систематически появляются «аномально» интересные публикации с 50000+ просмотрами.



    Плотность распределения публикаций за год укладывается в логнормальное распределение, что объясняется системой голосования Хабрахабра. Об этом мы подробнее писали тут и тут.



    ТОП 15 статей 2017 года по количеству просмотров


    1. Как «пробить» человека в Интернет: используем операторы Google и логику — Количество просмотров 331000
    2. Linux-2017: самые перспективные дистрибутивы — Количество просмотров 264000
    3. Что такое блокчейн и зачем он нужен — Количество просмотров 203000
    4. Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas — Количество просмотров 195000
    5. Bash-скрипты: начало — Количество просмотров 181000
    6. Ещё немного про телефоны Xiaomi и борьбу с ними. Updated — Количество просмотров 180000
    7. Что такое UX/UI дизайн на самом деле? — Количество просмотров 170000
    8. Автономный способ обхода DPI и эффективный способ обхода блокировок сайтов по IP-адресу — Количество просмотров 166000
    9. Анонимность в Tor: что нельзя делать — Количество просмотров 152000
    10. Как узнать баланс чужой банковской карты, зная её номер? — Количество просмотров 152000
    11. Путешествие за бугор и обратно: как не надо устраиваться работать за рубежом — Количество просмотров 152000
    12. Шесть мифов о блокчейне и Биткойне, или Почему это не такая уж эффективная технология — Количество просмотров 146000
    13. Взлом Wi-Fi — Количество просмотров 142000
    14. Украина подверглась самой крупной в истории кибератаке вирусом Petya — Количество просмотров 141000
    15. [UPDATED + Комментарии] Сначала они воруют, а когда ты побеждаешь, то тебя убивают — Количество просмотров 139000

    ТОП 15 статей 2017 года по рейтингу


    1. [UPDATED + Комментарии] Сначала они воруют, а когда ты побеждаешь, то тебя убивают — Рейтинг 506
    2. Путешествие за бугор и обратно: как не надо устраиваться работать за рубежом — Рейтинг 392
    3. Каково это — быть разработчиком в России, когда тебе сорок — Рейтинг 323
    4. Новогодний пост добра — Рейтинг 302
    5. Часть 2. Сначала они воруют, а когда ты побеждаешь, то тебя убивают — Рейтинг 295
    6. Вы уволили самого талантливого сотрудника. Надеюсь, теперь вы довольны — Рейтинг 290
    7. Как накрутить рейтинг на Хабре и уйти незамеченным — Рейтинг 285
    8. Не виноватая я. Он сам пришел — Рейтинг 277
    9. Доделал игру, работающую на видеокарте — Рейтинг 265
    10. Разработка на скорости 450 слов в минуту — Рейтинг 253
    11. Вы — не Google — Рейтинг 246
    12. Из хирурга в разработчики: как в 40 лет сменить профессию? — Рейтинг 239
    13. Про Гауди — разработчика из девятнадцатого века, добившегося всего, чего может добиться разработчик — Рейтинг 222
    14. Уязвимость ВКонтакте: отправляем сообщение с кодом восстановления страницы на чужой номер — Рейтинг 217
    15. Четыре типажа программистов — Рейтинг 216

    ТОП 5 публикаций, вызвавших наибольший резонанс




    1. UNIX-подобные системы содержат кучу костылей. Крах «философии UNIX» — Рейтинг +139 при 158 минусах
    2. «Hello, (real) world!» на php в 2017 году — Рейтинг +173 при 87 минусах
    3. Отчет о хакатоне команды Навального — Рейтинг +113 при 91 минусах
    4. Ответ на публикацию «Из хирурга в разработчики: как в 40 лет сменить профессию?» или почему я не люблю заказные статьи — Рейтинг +149 при 73 минусах
    5. IDEA пора закапывать? — Рейтинг +175 при 60 минусах

    *Рассчитали мы этот ТОП по формуле = (Кол-во минусов/кол-во плюсов)*Итоговый рейтинг, чтобы выделить публикации с наибольшей долей минусов среди самых рейтинговых

    ТОП 15 по добавлению в Избранное


    1. Как «пробить» человека в Интернет: используем операторы Google и логику — добавили в Избранное 1484
    2. Самые полезные приёмы работы в командной строке Linux — добавили в Избранное 1479
    3. Bash-скрипты: начало — добавили в Избранное 1252
    4. Магия SSH — добавили в Избранное 1183
    5. Объясняем современный JavaScript динозавру — добавили в Избранное 1183
    6. +500 бесплатных инструментов для запуска вашего стартапа в 2017 году — добавили в Избранное 1138
    7. Шаблоны проектирования с человеческим лицом — добавили в Избранное 1056
    8. Автономный способ обхода DPI и эффективный способ обхода блокировок сайтов по IP-адресу — добавили в Избранное 996
    9. Как понять, что происходит на сервере — добавили в Избранное 961
    10. Взлом Wi-Fi — добавили в Избранное 921
    11. 33 способа ускорить ваш фронтенд в 2017 году — добавили в Избранное 859
    12. Дюжина приемов в Linux, которые действительно сэкономят уйму времени — добавили в Избранное 856
    13. Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas — добавили в Избранное 852
    14. Деловая переписка на английском языке: фразы и советы — добавили в Избранное 847
    15. Как я использую git — добавили в Избранное 841

    Самые обсуждаемые посты 2017 года


    1. Путешествие за бугор и обратно: как не надо устраиваться работать за рубежом — Комментариев оставлено 1225
    2. Необразованная молодёжь. Ответ бизнеса — Комментариев оставлено 1108
    3. Необразованная молодёжь — Комментариев оставлено 839
    4. Социнжиниринг в военной пропаганде — Комментариев оставлено 798
    5. Каково это — быть разработчиком в России, когда тебе сорок — Комментариев оставлено 765
    6. Нет, у меня нет сторонних проектов, чтобы вам показать — Комментариев оставлено 755
    7. Отчет о хакатоне команды Навального — Комментариев оставлено 744
    8. Программисты не могут написать алгоритмы без помощи: ещё раз про интервью — Комментариев оставлено 741
    9. Эти токсичные, токсичные собеседования — Комментариев оставлено 720
    10. UNIX-подобные системы содержат кучу костылей. Крах «философии UNIX» — Комментариев оставлено 699
    11. JavaScript как явление — Комментариев оставлено 687
    12. [UPDATED + Комментарии] Сначала они воруют, а когда ты побеждаешь, то тебя убивают — Комментариев оставлено 676
    13. Почему программисты не получают работу: четыре страшилки — Комментариев оставлено 675
    14. Назови мне свою зарплату, и я скажу кто ты — Комментариев оставлено 662
    15. JavaScript как мыслевирус — Комментариев оставлено 646

    Переводы, обучающие материалы, Recovery mode и Песочница


    14,3% публикаций были отмечены тегом «Перевод». Такие публикации собирали в среднем на 48% больше просмотров, на 73% лучше добавлялись читателями в «Избранное», собирали на 4 комментария больше и получали на +7 выше рейтинг.



    Лучшими переводами стали (по рейтингу):


    1. Вы уволили самого талантливого сотрудника. Надеюсь, теперь вы довольны — Рейтинг 290
    2. Разработка на скорости 450 слов в минуту — Рейтинг 253
    3. Вы — не Google — Рейтинг 246
    4. «Магическая константа» 0x5f3759df — Рейтинг 208
    5. Объясняем современный JavaScript динозавру — Рейтинг 168
    6. Реализация «Тетриса» в игре «Жизнь» — Рейтинг 166
    7. Нет, у меня нет сторонних проектов, чтобы вам показать — Рейтинг 164
    8. Защищаем сайт с помощью ZIP-бомб — Рейтинг 153
    9. 24-ядерный CPU, а я не могу сдвинуть курсор — Рейтинг 152
    10. Попиксельная заливка экрана в Wolfenstein 3D — Рейтинг 150

    Tutorial


    Обучающие материалы занимали около 10% от всех публикаций в 2017. Конечно, из любой хорошей публикации всегда можно получить полезные знания, но в анализе нами учитывались только посты, отмеченные тегом Tutorial.



    ТОП-10 Обучающих статей 2017 года


    1. Мастер-класс «Почему Стив Джобс любил шрифты» (Алексей Каптерев) — Рейтинг 192
    2. Как фрилансеру открыть фирму в Латвии и какие преимущества это дает — Рейтинг 127
    3. Запускаем GSM-сеть у себя дома — Рейтинг 119
    4. Оптическое выравнивание и пользовательские интерфейсы — Рейтинг 95
    5. Тюнинг сетевого стека Linux для ленивых — Рейтинг 94
    6. Как «пробить» человека в Интернет: используем операторы Google и логику — Рейтинг 88
    7. Руководство начинающего программиста графических шейдеров — Рейтинг 86
    8. Разработка персонажей для игры «Аллоды Онлайн» — Рейтинг 85
    9. Планетарный ландшафт — Рейтинг 82
    10. Как я создавал прибыльный глобальный SaaS проект, от разработки до продаж — Рейтинг 81

    Recovery Mode


    3,7% постов были опубликованы в Recovery Mode. Подобные публикации обладают более низкими показателями популярности.



    Мы выбрали ТОП5 публикаций, авторы которых лучше всех воспользовались шансом вернуться в ряды захабренных.

    1. «Доктор Веб»: портал gosuslugi.ru скомпрометирован и может начать заражать посетителей или красть информацию — Рейтинг 157
    2. Как проектируют ненастоящие программисты — Рейтинг 107
    3. Тернистый путь Hello World — Рейтинг 74
    4. Ростелеком: чужие счета — это не спам — Рейтинг 72
    5. Angular vs. React vs. Vue: Сравнение 2017 — Рейтинг 56

    Песочница


    1277 статей были отобраны в 2017 в «Песочнице» и опубликованы в основной ленте. Публикации, получившие приглашение, в среднем находятся «на равных» с другими постами на Хабре.



    1. Не виноватая я. Он сам пришел — Рейтинг 277
    2. Из хирурга в разработчики: как в 40 лет сменить профессию? — Рейтинг 239
    3. Уязвимость ВКонтакте: отправляем сообщение с кодом восстановления страницы на чужой номер — Рейтинг 217
    4. Назови мне свою зарплату, и я скажу кто ты — Рейтинг 177
    5. Ответ на публикацию «Из хирурга в разработчики: как в 40 лет сменить профессию?» или почему я не люблю заказные статьи — Рейтинг 149
    6. Начальник, хочу работать из дома — Рейтинг 143
    7. Разработка прибыльной Android игры двумя школьниками — Рейтинг 129
    8. Стоимость недвижимости на тепловых картах — Рейтинг 122
    9. Сага о Гольфстриме и уровне ИБ в крупной охранной фирме — Рейтинг 121
    10. Обратная сторона Agile — Рейтинг 118

    Лучшие комментарии


    Каким должен может быть комментарий, который наберет более 70 «плюсов» от хабровчан? Наверное, он должен выражать мнение большой части читателей, а главное делать это ёмко. Мы собрали ТОП-10 комментариев по их рейтингу:

    1. habrahabr.ru/post/319332/#comment_10007362 — Рейтинг 86
    2. habrahabr.ru/post/321652/#comment_10065422 — Рейтинг 161
    3. habrahabr.ru/post/321652/#comment_10065924 — Рейтинг 74
    4. habrahabr.ru/company/vkontakte/blog/324722/#comment_10134050 — Рейтинг 72
    5. habrahabr.ru/post/326284/#comment_10167628 — Рейтинг 73
    6. habrahabr.ru/post/335010/#comment_10347364 — Рейтинг 103
    7. habrahabr.ru/post/339908/#comment_10467980 — Рейтинг 75
    8. habrahabr.ru/post/342168/#comment_10516420 — Рейтинг 73
    9. habrahabr.ru/post/336092/#comment_10374942 — Рейтинг 71
    10. habrahabr.ru/company/flant/blog/330750/#comment_10261302 — Рейтинг 71

    Хабы лидеры


    В течение года публикации размещались в 320 хабах. Не все хабы одинаково популярны, но чтобы разместить 80% процентов публикаций потребовалось около 90 наиболее популярных хабов, т.е. тематика — очень разнообразная. Топ-10 хабов включает в себя 26% публикаций 2017 года.



    Также было любопытно знать, имеет ли влияние количество выбранных хабов на популярность статьи. Так как компании дополнительно добавляют свои публикации в хаб «Блог компании ХХХ» (разных таких в 2017 было 444), то сравнивать мы решили только статьи в личных блогах Хабровчан. Нам пришлось неслабо «прокачать» свой Excel, но результат показался нам интересным.



    Как мы видим – начиная с 2 хабов, прирост просмотров очень слабый. Хотя и на уровне статистической погрешности, несколько иная ситуация для корпоративных блогов. Максимальное число просмотров в среднем собирают статьи с 1 дополнительным хабом. Возможно это результат того, что большая часть постов в корпоративных блогах заполняется хабами «под завязку», а более интересные публикации – узко тематические.



    Работать с таким большим и интересным массивов данных можно ещё долго. Дабы знать меру, мы решили остановиться на этом. Если Вас интересует какая-либо зависимость показателей или статистика, оставьте комментарий, по возможности постараемся рассчитать и опубликовать.

    Желаем, чтобы 2018 год подарил хабаровчанам увлекательный и яркий опыт, о котором, надеемся, будут написаны не менее интересные статьи.

    Cloud4Y

    88,11

    #1 Корпоративный облачный провайдер

    Поделиться публикацией
    Комментарии 34
      +2
      Классный обзор, всё интересно и познавательно. А не поделитесь, чем парсили — своя разработка или что-то коммерческое?
        +3
        Воспользовались готовым решением, подошёл бы любой парсер, собирающий код страниц по списку ссылок. На Хабре все публикации имеют хотя бы ссылку типа habrahabr.ru/post/четное_число
        Далее обрабатывали в основном в Excel. Основная часть собранных для анализа данных доступна для скачивания в нашей группе в VK
          0

          Прямо всегда с чётным числом?

            +1
            Хороший вопрос! Нашлось habrahabr.ru/post/1 как на машине времени переместился;)
            Начиналось с нечетных, сейчас идут только четные.
              +5
              До разделения с Geektimes был обычный автоинкремент, теперь чётные на хабре, нечётные — там.
        +7
        более 50% корпоративных блогов. В целом спасибо за подборку.
          0
          2592 автора писали статьи только в личные блоги, 1175 авторов только в корпоративные и 67 как в личные блоги, так и в блоги компаний.

          Компании берут частотой и периодичностью. Не каждая статья по рабочей обязанности и расписанию получается, так сказать, «от чистого сердца», но авторы постов корпоративных блогов стараются находить баланс интересов читателей и бизнеса.

          Интересно, что для 67 авторов, размещающих посты и в личных и в корп блогах, средние показатели для статей примерно равные, но чуть лучше при публикации не в блоге компании.
          +7
          Из 15 постов в топе только 3 по теме хабрахабра.
            +6

            Пользуясь случаем, передаю привет маме:
            мама, привет, я в годовом топе хабра, видишь?! :)

              +3
              В среднем публикация в 2017 году набирала 11500 просмотров и рейтинг +20.


              Можете назвать медианные значения для этих параметров? Ведь когда речь идёт о рейтингах, интереснее не средние, а медианные значения.
                +6
                Медианные значения:
                Просмотры 7400,
                Рейтинг 14,
                «В избранное» 45,
                Комментарии 12.
                  0
                  Спасибо!
                    +1

                    Добавьте их в пост, плиз. Медианы (срединные значения) важнее средних тут, конечно.

                  +2
                  Напрашивается лайфхак:

                  1. Написать интересную статью под псевдонимом на другом языке, опубликуй в мало-мальски интересном источнике
                  2. Перевести и опубликовать на Хабре/GT под своим именем
                  3.…
                  4. PROFIT!
                    +3
                    Не так.
                    1. Написать интересную статью
                    2. Опубликовать под любым именем
                    Этого достаточно.

                    Переводчик выбирает из нескольких статей-кандидатов, этот предварительный личный выбор и то, что у статьи уже есть какой-то успех в оригинальном источнике добавляет шансов переводу на Хабре. Хотя не всегда аудитория «там» и «тут» реагирует одинаково.
                    0
                    Хорошая статистика, но по-моему не хватает самой важной — это соотношение публикаций содержащих код к публикациям без программного кода. Многие наверное заметили, что публикаций на хабре, как-либо рассматривающих программный код стало существенно меньше а их качество — хуже (да и все мы помним разделение на потоки «администрирование», «управление» и т.д.). Разделять публикации на те или другие вполне просто — нужно всего-лишь искать в них вхождение < code />.
                      0
                      Вместо тега <code> на Хабре чаще используются специализированные для конкретного языка <source lang="cpp">.
                      Кстати, таким же образом можно выделить статьи с математическими формулами по присутствию $$display$$ и $inline$.
                      0
                      Реквестирую такую же, но про гт
                        +3
                        Может я и извращенец, но хотелось бы и антирейтинг увидеть — самые заминусованные статьи, комментарии, авторы.
                          +16
                          Была такая мысль. На негативном опыте можно многому научиться. Если не заминусуют этот мой комментарий — опубликуем.
                            0
                            Добрый день, скажите пожалуйста какие вы сервисы и программы использовали для создания статьи. Особенно интересны графики, спасибо.
                              0
                              Все графики построены в Excel 2013
                          +1
                          Раз уж разговор о статистике, личная просьба, подсчитать процент статей с названиями начинающими со слова «Как». Хочу проверить свои ощущения, что не менее чем каждая десятая статья является «Как-статьей» подбешивает уже. И, кстати, интересно сравнить хабр и гиктаймс, ставлю на то что на хабре «как-фактор» меньше.
                            +1
                            ТОП-7 первых слов в публикациях 2017
                            Как 904
                            Дайджест 134
                            Что 126
                            Почему 94
                            Создание 75
                            Обзор 72
                            Разработка 58
                              0
                              С 1 января по 18:00 22 декабря 2017 года на Хабрахабре было опубликовано 10684 поста
                              Итого «как-фактор» хабра: 8.46% :)
                            0
                            Промах
                              +1
                              Вот так я спустя лет 8 чтения Хабра узнал, что здесь есть избранное (закладки) :)
                                0

                                Интересная статистика, но логичней было бы все же публиковать ее уже после нового года, т.к. 2017 еще не закончился :)

                                  0
                                  Еще бы стату по ЯП. Интересно узнать что в тренде среди хаброжителей.
                                    0
                                    жабаскрипт, к гадалке не ходи
                                    +1
                                    Некоторые статьи, опубликованные во второй половине 2017, могут просто не успеть набрать просмотров, а в 2018 они уже не будут учитываться?
                                      0
                                      Изображение в начале публикации шикарное!
                                        0
                                        Лучшие комментарии
                                        1 и 2 место перепутаны?
                                          0
                                          конкретно в этом ТОП нет сортировки

                                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                        Самое читаемое