Pull to refresh

Хабр умирает?

Habr
Я люблю писать тексты по мотивам проектов, которыми занимаюсь. За последний год я разместил на Хабре больше 20 постов. Меня постоянно удивляло, как мало толковых комментариев удаётся здесь получить. Просмотров много, а комментариев мало и большинство не по делу. Недавно я начал замечать, натыкаясь на старинные посты за 2012, 2013 годы, что в них обсуждение, как будто, более содержательное. Решил проверить это количественно. Скачал инфу по всем постам за все годы и построил несколько простых графиков. То что я увидел меня удивило и даже немного испугало. Решил разместить наблюдения здесь, чтобы проверить правильные ли я делаю выводы и всё ли учёл.

Для всех опубликованных на Хабре постов я собрал даты публикаций, число просмотров, число лайков и дислайков, число звёздочек и комментариев, список хабов и названия блогов компаний. В ходе прокачки узнал, что число плюсиков и минусиков может быть дробным и даже отрицательным, пост может быть опубликовал в блоги нескольких компаний и может не иметь автора. Если что, таблицу можно скачать из репозитория: github.com/alexanderkuk/analyze-habr/blob/master/data/posts.csv



Первым делом я посмотрел как менялось общее число постов со временем. Оно перестало расти в 2013 и немного падает с 2014, что уже немного тревожно:



Потом я построил такой же график для суммарного числа просмотров и испугался. С 2014 оно упало в 3.5 раза:


Это серьёзное утверждение, поэтому я решил свериться с Similarweb.

Они дают только оценки, но в 2014, 2015 тренд тоже явно отрицательный:



Отношение комментариев к числу просмотров во времени выглядит интересно. С 2008 оно падает, а в середине 2012 ступенькой практически исчезает.



Доля лайков ведёт себя также:



Кстати отношение лайков и дислайков почти не меняется. Минусов всегда примерно 25% от плюсов:



Доля звёздочек ведёт себя интересно. Почему-то в последнее время плавно растёт. Почему так?



Короче говоря, в середине 2012 что-то случилось. Может быть, кто-то знает ответ из истории? Я тогда Хабром не пользовался и поэтому попробовать найти разгадку в данных.

Во-первых, заметил, что ступенькой поменялось среднее число хабов, в которые одновременно размещались посты. Видимо, подняли лимиты?



Во-вторых, что важнее, появились блоги компаний:



Неужели это они оказали такое влияние?

Кстати, число просмотров у постов компаний, которое всё время потихоньку росло, последнее время тоже падает. Это самое пугающее:



Доли лайков, звёздочек и комментариев у обычных постов и у постов компаний почти не отличаются. Это тоже неожиданно, я думал коммерческие посты хуже принимают:



Ещё я думал, что, может быть, ситуация хуже в хабах, в которые пишу, а в других нормально комментируют. Да, действительно в big data и data mining комментов поменьше, но незначительно.



Короче, действительно, всё так плохо?

Если что, все выкладки в репозитории github.com/alexanderkuk/analyze-habr/blob/master/notes.ipynb

Апдейт: все графики, в которых фигурирует число просмотров до 2012 года — неправильные. Смотри habrahabr.ru/post/278325/#comment_8788985
Tags:
Hubs:
Total votes 331: ↑311 and ↓20 +291
Views 107K
Comments Comments 802