Хабрарейтинг 2019: статистика и рейтинг авторов за 2019 год

    Привет Хабр.

    В первой части была рассмотрена некоторая статистика и опубликован рейтинг статей этого сайта. Во второй части будут рассмотрены другие статистические закономерности этого года, которые мне показались интересными, а также будет опубликован рейтинг авторов за этот, 2019 год.



    Первая часть рассчитана на читателей сайта, эта будет более интересна авторам, но и остальные надеюсь, найдут что-нибудь полезное — статьи авторов, попавших в рейтинг, определенно имеет смысл прочитать.

    Продолжение под катом.

    Как уже говорилось в первой части, рейтинг не является официальным, так что если я что-то пропустил — пишите, исправлю.

    Общая информация


    Еще раз напомню, что за этот, 2019 год, на сайт было выложено примерно 19тыс статей. График распределения количества статей по дням года я уже приводил, но для полноты выложу еще раз:



    Для читателей и писателей Хабра наверно общеизвестно, что каждая статья может принадлежать к нескольким хабам (например «Программирование» и «Python»), и чем более популярные хабы будут выбраны, тем больше людей смогут прочитать статью. Несложно отсортировать хабы по суммарному количеству просмотров за этот год:



    Для меня до сих пор загадка, почему на первом месте по просмотрам «Информационная безопасность» — вроде тема достаточно сложная и специфическая. Но видимо, основную массу просмотров набирают популярные статьи про мошенников или банки, а вовсе не что-то специализированное типа генерации сертификатов или особенностей открытых и закрытых ключей. Но что есть то есть. По остальным хабам думаю, все из названий и так очевидно.

    По хабам можно насобирать много разной интересной статистики, например сравнить популярность языков программирования на Хабре в течении этого года:



    А вот так было 10 лет назад, в далеком 2009 году:



    Забавно, но Python тогда уже был, но хаб «Net» опережал его по популярности, много публикаций было по PHP, да и C++ был еще вполне в тренде.

    И раз уж речь зашла о хабах, нельзя не вспомнить одно из нововведений Хабра этого года — отказ от geektimes и перевод всех хабов GT в не-профильные. Теперь уже можно подвести окончательные итоги того, сказалось ли это на числе публикаций.



    Можно с уверенностью сказать, что число публикаций раздела Geektimes точно не сократилось, а в целом, с осени даже стало расти.

    А вот последнее, и совсем свежее нововведение Хабра — невозможность ставить оценки статьи, не читая её. С одной стороны, это выглядит логичным, с другой, увы, это сократило и так невысокое среднее число баллов за статью:



    В общем, если +30 баллов «порога» было набрать и так непросто, то теперь еще сложнее. Я и сам бывало, ставил плюсы за статьи той тематики которая мне интересна, не читая, просто чтобы мотивировать авторов больше писать на эту тему, теперь такой возможности нет.

    Раз уж речь зашла об оценках, еще несколько статистических закономерностей. Все 18тыс статей, опубликованные за год, можно сгруппировать по дням недели:



    Нетрудно видеть, что в будние дни публикуется в 2-3 раза больше материалов. Это неудивительно, если посмотреть на самый первый график статьи — там четко видна недельная периодичность. Но более интересно то, что статьи, публикуемые в выходные, в среднем набирают больше просмотров:



    И последний момент, который мне не очень понятен — распределение соотношения «плюсов» и «минусов» по дням недели:



    Нетрудно видеть, что в выходные дни статьи минусуются статистически больше — соотношение плюсов и минусов примерно 1:6 против 1:7.5 в рабочие дни. С чем это связано, я не знаю, а возможно, что это просто случайное совпадение — например, несколько «горячих» статей, набравших много плюсов и минусов, могло быть опубликовано в выходные, и это внесло вклад в средние значения.

    Кстати, какие рейтинги набирали статьи Хабра в этом году? Ответ на гистограмме (по горизонтали рейтинг, по вертикали количество):



    Основной пик рейтинга приходится на значение +12, ну а средний диапазон лежит в пределах +5..+30. Для сравнения, картинка за 2018г под спойлером.
    Рейтинги за 2018


    Тут мы видим еще одно нововведение 2019 года: на сайте стали допускаться отрицательные рейтинги, раньше такие статьи видимо просто удалялись. Я сначала подумал, что у меня где-то ошибка, но действительно, вот пример статьи с рейтингом -47.

    Не буду больше мучать читателей графиками, а перейду к рейтингу авторов. Всех, кто попал в рейтинг, поздравляю, опять же повторюсь, если я кого-то пропустил — пишите в личные сообщения, исправлю.

    Примечание: во всех рейтингах, где используются средние значения, я рассматривал тех авторов, кто написал более 12 статей в год, это эмпирическое значение, чтобы «среднее» было действительно более-менее усредненным. Это же относится к значениям кармы или числа подписчиков — все же это рейтинг за 2019 год, и те у кого в этом году было мало статей, в него не попали, даже если их карма выше.

    Рейтинг 2019


    Топ авторов по количеству статей

    Эти люди, наверное те, кто работает для Хабра full-time, делая не менее 1 публикации в день.

    marks — 683 публикации, 7601231 просмотр, 5855 добавлений в закладки
    alizar — 509 публикации, 7916905 просмотров, 7541 добавление в закладки
    SLY_G — 311 публикаций, 4909300 просмотров, 18069 добавлений в закладки
    denis-19 — 300 публикаций, 2885265 просмотров, 2689 добавлений в закладки
    ru_vds — 267 публикации, 4130700 просмотров, 31394 добавления в закладки
    PatientZero — 248 публикаций, 3721300 просмотров, 24635 добавлений в закладки
    AnnieBronson — 255 публикации, 1622580 просмотров, 886 добавлений в закладки
    maybe_elf — 250 публикаций, 1678652 просмотра, 901 добавление в закладки
    MaxRokatansky — 224 публикаций, 1264623 просмотра, 13391 добавление в закладки
    m1rko — 222 публикаций, 4988000 просмотров, 27239 добавлений в закладки

    Эти авторы в сумме создали за этот год 3187 публикаций, или почти 20% статей (каждую 5ю!) на Хабре. Благодаря им работает этот сайт и мы все здесь общаемся, за что можно сказать отдельное спасибо. Отдельно отмечу AnnieBronson, это наверное единственная женщина, попавшая в топ технического, по сути, сайта (правка — в личке подсказали, что maybe_elf тоже, впрочем, из ника это было неочевидно;).

    Топ авторов по среднему числу голосов за статьи

    fillpackart — 15 публикаций, 77520 просмотров, +160/-30
    3Dvideo — 8 публикаций, 44112 просмотров, +158/-0.1 (*)
    Boomburum — 19 публикаций, 16963 просмотра, +138/-10.4
    Milfgard — 32 публикации, 39846 просмотров, +134.37/-4.5
    gjf — 15 публикаций, 46366 просмотров, +114.0/-9.7
    AlexeyNadezhin — 21 публикация, 49390 просмотров, +100/-1.9
    jar_ohty — 15 публикаций, 48180 просмотров, +91.9/-1.6
    steanlab — 18 публикаций, 28611 просмотров, +79.7/-2.8
    lozga — 32 публикации, 27937 просмотров, +68.5/-2.0
    AloneCoder — 31 публикация, 25332 просмотра, +65.9/-5.0
    pronskiy — 21 публикация, 13604 просмотра, +58/-1.09

    (*) Здесь, как и далее, где берутся средние значения, я рассматривал только тех авторов, кто написал более 12 статей за год. В качестве исключения добавлен автор 3Dvideo, его статьи этого заслуживают.

    Топ по количеству подписчиков

    Milfgard — 3033 подписчика
    nmivan — 2478 подписчиков
    SLY_G — 1830 подписчиков
    PatientZero — 1799 подписчиков
    alexzfort — 1689 подписчиков
    alizar — 1483 подписчика
    m1rko — 1201 подписчик
    lozga — 1077 подписчиков
    ru_vds — 924 подписчика
    MagisterLudi — 829 подписчиков

    Топ по среднему количеству комментариев на статью

    fillpackart — 15 публикаций, 273 комментария
    Boomburum — 19 публикаций, 257 комментариев
    Tzimie — 20 публикаций, 216 комментариев
    gjf — 15 публикаций, 182 комментария
    Milfgard — 32 публикации, 166 комментариев
    jar_ohty — 15 публикаций, 140 комментариев
    mikejum — 17 публикаций, 140 комментариев
    aik — 18 публикаций, 140 комментариев
    lozga — 32 публикации, 137 комментариев
    3Dvideo — 8 публикаций, 134 комментария
    steanlab — 18 публикаций, 119 комментариев
    EgorKotkin — 21 публикация, 115 комментариев

    Топ по среднему числу просмотров за статью

    fillpackart — 15 публикаций, 77520 просмотров
    AlexeyNadezhin — 21 публикация, 49390 просмотров
    jar_ohty — 15 публикаций, 48180 просмотров
    gjf — 15 публикаций, 46366 просмотров
    3Dvideo — 8 публикаций, 44112 просмотров
    Milfgard — 32 публикации, 39846 просмотров
    @moikrug — 19 публикаций, 29947 просмотров
    steanlab — 18 публикаций, 28611 просмотров
    lozga — 32 публикации, 27937 просмотров
    AloneCoder — 31 публикация, 25332 просмотра
    Tzimie — 20 публикаций, 25215 просмотро
    aik — 18 публикаций, 21194 просмотра
    f15 — 26 публикаций, 21657 просмотров

    Топ по карме

    Milfgard — карма 1505.0, 31 публикация
    m1rko — карма 1098.0, 220 публикаций
    PatientZero — карма 1033.0, 248 публикаций
    Boomburum — карма 924.0, 18 публикаций
    alizar — карма 850.0, 502 публикации
    lozga — карма 767.0, 31 публикация
    SLY_G — карма 484.0, 306 публикаций
    Andrey2008 — карма 476.0, 33 публикации
    AlexeyNadezhin — карма 475.0, 21 публикация
    gjf — карма 461.0, 15 публикаций

    И последний, топ по среднему числу добавлений в закладки на статью

    Syurmakov — 19 публикаций, 236 добавлений в закладки
    fillpackart — 15 публикаций, 207 добавлений в закладки
    3Dvideo — 8 публикаций, 190 добавлений в закладки
    steanlab — 18 публикаций, 182 добавления в закладки
    AloneCoder — 31 публикация, 178 добавлений в закладки
    rishat_edison — 31 публикация, 162 добавления в закладки
    gjf — 15 публикаций, 155 добавлений в закладки
    Milfgard — 32 публикации, 142 добавления в закладки
    fokus-lop — 39 публикаций, 126 добавлений в закладки
    hisbvdis — 16 публикаций, 123 добавления в закладки
    m1rko — 222 публикации, 122 добавления в закладки
    Saygin — 14 публикаций, 120 добавлений в закладки
    germn — 37 публикаций, 119 добавлений в закладки
    jar_ohty — 15 публикаций, 117 добавлений в закладки

    Отдельно, вне основного рейтинга, я решил выделить Топ по самым необычным темам. Сюда я занес тех, кто опубликовал более-менее нетипичные для Хабра статьи с весьма высоким рейтингом.

    В него попадают:
    amartology — 4 публикации, 42550 просмотров на статью — статьи по разработке микросхем
    Bedal — 2 публикации, 60349 просмотров на статью — статьи по авиации
    eugeneb0 — 6 публикаций, 47416 просмотров на статью — цикл статей «Цивилизация Пружин»
    steanlab — 18 публикаций, 28611 просмотров на статью — статьи по химии
    3Dvideo — 8 публикаций, 44112 просмотров на статью — статьи про видео и кино

    На этом все, поздравляю всех, попавших в рейтинг, ну и остальных конечно, тоже.

    Если в каком-то из рейтингов авторов > 10, значит данные были обновлены, а я обещал никого из списка не удалять.

    Поскольку выпуск предновогодний, никаких «антирейтингов» не будет, всем только положительные эмоции.

    Заключение


    Заключения не будет.

    Всем читателям приятного чтения, надеюсь, здесь приведено достаточно ссылок на интересных авторов, ну а всем авторам желаю новых творческих успехов в следующем году.

    Комментарии 52

      +2
      У топ авторов наверное какая-то материальная мотивация имеется?
      Там же в основном переводы и новости. Просто так тратить на это время изо дня в день вряд ли кто захочет.
      Вот бы работать — это интересно.
        +3

        У редакторов / авторов Хабра — зарплата. У обычных пользователей есть только поощрение — ППА. Ну и, возможно, донаты от других пользователей

          +1
          Много же еще других пользователей сообщества, которые рассказывают о своей работе и им это приносит самоудовлетворение.
            0

            Естественно. Иначе бы никто ничего не писал вообще. Публикация должна приносить удовольствие самому автору, иначе это достаточно заметно. Но я отвечал на вопрос про "материальную мотивацию"

            +5
            Последние мои статьи просмотрело 175 000 человек (по данным Хабра). Ни копейки доната не получено.
              0

              На самом деле, было бы очень интересно, если бы авторы, статьи которых набирают высокие рейтинги, поделились информацией о донатах. Но это достаточно непросто. Может, когда-нибудь, я попробую исследовать этот вопрос

                +2
                Ну, я может не самый релевантный автор, но у меня рублей 40 за всё время надонатилось

                Другой вопрос, что я не для денег пишу, и ППА не пользуюсь
                  +3
                  Я заработал 8 рублей :)
                    +3
                    Написал три статьи, средний рейтинг 191 (уверенно выше всех людей в списке), среднее число просмотров 56к (второй был бы в списке), доната не получил никакого.
                      0

                      Ну, блин, мне кажется, что одни только вебмани — не есть гут… :/

                      +2
                      За мои шахматные статьи про мат слоном и конём получил 2 раза донат.
                      За «Метод TWIX» — 100 рублей.
                      За «Треугольники Делетана» что-то вроде 17 рублей (точно не помню).
                      Оба раза высылали на Яндекс-Деньги.

                      Хоть суммы и небольшие, спасибо приславшим, было приятно.
                        +1
                        OMG, оказывается можно к статьям донат прикручивать.
                          0
                          Ну вот, пара авторов уже отметились. Как и ожидалось, функция не самая востребованная — постоянно ей не пользуются даже те, кто кричал «дайте нам возможность донатить», ну и она «непрогнозируемая» для автора (в отличие от той же ППА). Но в целом я надеюсь, что авторы не только для денег пишут (что подтверждают сообщения в том числе в этой ветке).
                            0
                            Но в целом я надеюсь, что авторы не только для денег пишут (что подтверждают сообщения в том числе в этой ветке)

                            И да и нет.

                            Можно написать что-то интересное и не очень трудозатратное забесплатно чтобы поделиться с читателями, с другой стороны, есть довольно много тем где 20% вдохновения и 80% рутины, и писать/оформлять все это забесплатно желания никакого нет.
                              0
                              Не для денег конечно. Если писать столько, чтобы ППА могла стать «для денег», проще и удобнее как-то устроиться в Хабр копирайтером)

                              Но ППА — это нормальная дополнительная мотивация все же садиться и доделывать лежащие в черновиках заготовки.
                                +1
                                Не очень нормальная, учитывая то, что права на текст переходят ТМ. Лично я не готов отдавать права за такие деньги.
                                  0
                                  Это каждый решает для себя. Меня, например, такая ситуация вполне устраивает, я получаю больше выгоды от доступа к широкой аудитории, чем теряю от того, что ТМ получает права на текст. А если я решу, например, книгу написать по материалам статей, то во-первых, все равно надо будет все рерайтить, а во-вторых, есть подозрение, что с ТМ на этот счет можно будет как-то договориться.
                                    0
                                    Безусловно, каждый решает сам. Я статьи пишу крайне регулярно, и почти весь код и текст публикую под WTFPL. Не вижу ни малейшего резона отдавать права ТМ вместо отдачи в public domain. Поэтому ППА для меня вообще не мотивация.
                                      0
                                      права, подозреваю, нужны, что бы оплаченную статью нельзя было потребовать удалить с сайта.
                                        0

                                        Возможно, но для этого не обязательно отдавать права полностью.

                                          0
                                          А что мне мешает прямо сейчас пойти и удалить текст из любой своей статьи? Учитывая, что 90+ процентов просмотра статьи приходятся на первые двое суток, не думаю, что трафик хабра от этого как-то пострадает)
                                            0
                                            а что помешает им её восстановить? )
                                              0
                                              У них, что, система версий стоит, при каждом нажатии на опубликовать?
                                                0
                                                Это точно не у меня надо спрашивать. Но историю правки комментов вроде ведут, чтоб не было финтов в духе: оскорбил матом и стёр через минуту.
                                                  0
                                                  Но историю правки комментов вроде ведут, чтоб не было финтов в духе: оскорбил матом и стёр через минуту.
                                                  Ну, мне тоже было интересно. Мало ли, может и знаете, вот и задал вопрос.
                                                    +1
                                                    Слушайте, я помню раньше были какие-то терки по поводу того, что модераторы правили статьи так, как авторам не нравилось и вроде вплоть до откатов к предыдущим своим правкам, если автор настаивал и менял опять. С учетом, что я не настоящий писатель тут (в отличие от вас), то точнее не смогу ответить…
                                                      0
                                                      Слушайте, я помню раньше были какие-то терки по поводу того, что модераторы правили статьи так, как авторам не нравилось и вроде вплоть до откатов к предыдущим своим правкам, если автор настаивал и менял опять.
                                                      Хм, я такого не застал. Но, не удивлюсь, что таки хранятся все статьи отдельно, предположу, что есть какой-то внутренний репозиторий. Это было бы логично.
                                                      С учетом, что я не настоящий писатель тут (в отличие от вас)
                                                      Ахаха, вот это вы пошутили. Я, писатель. Позорище, а не писатель ).
                                                0
                                                То, что они об этом не узнают сразу. Вы же вот не узнали, что я только что на целых пять секунд удалял одну из своих статей)
                                                  +1
                                                  То, что они об этом не узнают сразу.
                                                  Уверены? ) Простая проверка во время сего вашего действия и опа, куда надо ушел сигнал.
                                    0
                                    Отлично там всё прогнозируется :)

                                    Не получил ни копейки в пожертвованиях. При этом у меня каждая вторая статья имеет 50+ рейтинг, и ППА при этом даёт тот же ноль, потому что (в моём случае) совершенно несерьёзно ей пользваться.
                                  +2
                                  Эта статья напомнила о желании задонатить за цикл «цивилизации пружин», однако там кнопки не нашел… Есть идеи «почему так» и «что с этим делать»?
                                    +3
                                    Тут просто, кнопка доната является добровольной для каждого автора.
                                +1
                                Там же в основном переводы и новости.

                                Для меня основная проблема, что большей частью эти переводы и новости суть мусорные. И такой контент по личным ощущениям последнее время занимает как минимум 70-80% Хабра. Особенно доставила последняя истерия с NGNIX, когда 3 из 4 новых статей тут были про эту ситуацию и по сути не несли какой либо полезной информации.

                                +2
                                … если +30 баллов «порога» было набрать и так непросто, то теперь еще сложнее. Я и сам бывало, ставил плюсы за статьи той тематики которая мне интересна, не читая, просто чтобы мотивировать авторов больше писать статей на эту тему...
                                Чтобы еще больше ставить им плюсов не читая, чтобы они еще больше…
                                  +5
                                  Пример простой: я вижу в ленте статью, например «Руководство по использованию pandas для анализа больших наборов данных», знаю что эта тема актуальная и полезная, ставлю плюс чтобы поддержать автора. Не вижу в этом ничего плохого. Статью я при этом могу и не читать, т.к. эту тему знаю сам :)
                                    +3
                                    Да, кейс понятен и он даже жизненный, но противоречит другому кейсу — ставить оценку статье только за качество материала. Ну или тогда две оценки придется ставить: одна «до» — за статью по важной теме, другая «после» — за качество материала. Тогда в первом случае разрешить только "+". Почему бы и нет. Как я где-то уже писал, что для аудитории Хабра чем заковыристее — тем лучше.

                                    Или, что еще лучше, оценка «до» — это плюс в карму. А оценка «после» — это "+-" за статью, или "+-" в карму.
                                      0
                                      Я в тексте и написал, что с одной стороны логично что теперь нельзя оценить статью не читая. Я в принципе с этим и не спорю. С другой стороны, при и так невысоком среднем числе голосов за статьи (из гистограммы видно что пик на +12), еще большее снижание числа проголосовавших явно не на пользу авторам, и явно не приведет к росту числа интересных публикаций на сайте («горячие» темы и так в топах, а вот разделов типа «программирование» это особенно касается).

                                      Но посмотрим, тут надо статистику за больший период набрать, месяца 2-3.
                                        +1
                                        А вот здесь бы я предложил создать два рейтинга Популярное/Читаемое — один для технических хабов, и второй для всех остальных (ну или как-то так). А то действительно, сейчас статья с намеком политоты перебивает любую про реальное программирование.
                                          0
                                          А что если это «логичное» нововведение поможет «переградуировать» рейтинг? Ну типа там «раньше считалось, что +30 это уже хорошо», а сейчас под «хорошо» станет +10, с последующей корректировкой той же ППА? Ну как пример. Хотя я смотрю за рейтингом постов и он прям не сильно просел )
                                            0
                                            А что если это «логичное» нововведение поможет «переградуировать» рейтинг? Ну типа там «раньше считалось, что +30 это уже хорошо», а сейчас под «хорошо» станет +10
                                            Мне кажется, такой переход повышает относительную погрешность оценки.
                                        +2

                                        Только качество статьи может быть настолько плохим, что лучше бы автор не писал её.

                                      +1
                                      Графики по сравнению популярности языков программирования, честно говоря, сложновоспринимаемы. Достаточно было бы баров с данными усредненными за год.
                                        +1
                                        Бар проще, но цель была посмотреть в динамике, поэтому выбран stacked plot. Лучше надписи прямо внутри сделать, но не разобрался, можно ли это реализовать с matplotlib.
                                          0
                                          Ничто не мешает дополнить один график другим. Мне, лично, динамика ни о чем не говорит и не интересна. А читать среднее по уже приведенному графику, как я уже сказал, неудобно.
                                            0
                                            Да, вариантов много разных.

                                            Несколькими сообщениями ниже данные по популярности языков программирования я привел в текстовом виде: habr.com/ru/post/480034/#comment_21016444
                                        0
                                        Для меня до сих пор загадка, почему на первом месте по просмотрам «Информационная безопасность»


                                        А для нас до сих пор, загадка, почему «личный состав» ТМ считает ИБ хромой кобылой.
                                        Видимо редакторы/менеджеры уже стареют, кругозор сужается. А мир динамичен и проблемы ИБ уже вышли на фронт всего IT.
                                        Но даже в аналитике по зарплатам «моего круга» до сих пор все ИБ специальности (пентестеры, аналитики, форенсика, аудиторы и т.д.) идут как «администраторы безопасности»
                                          0

                                          Было бы интересно увидеть топ языков habr edition.

                                            +3
                                            Топ-10 хабов по числу публикаций выглядит так:
                                              javascript 894
                                              python 722
                                              java 483
                                              net 405
                                              cpp 378
                                              csharp 331
                                              php 256
                                              reactjs 208
                                              html5 183
                                              css 166
                                            
                                            0

                                            Теперь с нетерпением жду антирейтинг.

                                              0
                                              И раз уж речь зашла о хабах, нельзя не вспомнить одно из нововведений Хабра этого года — отказ от geektimes и перевод всех хабов GT в не-профильные. Теперь уже можно подвести окончательные итоги того, сказалось ли это на числе публикаций.

                                              Можно с уверенностью сказать, что число публикаций раздела Geektimes точно не сократилось, а в целом, с осени даже стало расти

                                              Вопрос. Это с учетом новостей или без? Потому что это похоже на то, что не упало за счет того, что были новости. Хабы космонавтика и транспорт — очень сильно просели, особенно статьи.
                                                +1
                                                Да, это вместе с новостями.
                                                  +1
                                                  Добавлю, космонавтика действительно просела, если новости убрать:

                                                  1-2019 21
                                                  2-2019 27
                                                  3-2019 15
                                                  4-2019 32
                                                  5-2019 20
                                                  6-2019 21
                                                  7-2019 13
                                                  8-2019 13
                                                  9-2019 7
                                                  10-2019 14
                                                  11-2019 10
                                                  12-2019 5

                                                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                Самое читаемое