Pull to refresh

Хабростатистика, часть 2 — опровержение с графиками

Entertaining tasks
Вчера я публиковал статью на тему того, когда лучше публиковаться на хабре. С тех пор мой паук собрал статистику за весь 2015 год, и картинка немного изменилась. Так же я построил несколько графиков, и в целом картина прояснилась. Осторожно, трафик!

Сначала посмотрим статистику отдельно по каждому дню:

Обозначения на графиках такие:
  1. Quantity — количество опубликованных в это время статей
  2. Comments — среднее количество оставленных комментариев
  3. Views — среднее количество набранных просмотров
  4. Rate — средний набранный рейтинг


Понедельник выглядит так:



Вторник:



Среда:



Четверг:



Пятница:



Суббота:



Воскресенье:



Ну и наконец самое вкусное — сборная солянка за всю неделю:



Придётся признать — полученная статистика несколько противоречит мнению, которое я высказал в первой статье. Действительно, как упоминали некоторые комментаторы, лучше всего публиковаться в субботу и воскресенье в 5 часов утра, когда конкуренция с вашей статьёй минимальна.

Или нет?

А давайте посмотрим выборки по получившимся пикам:
Для начала — 6 утра субботы.

SELECT * FROM posts WHERE WEEKDAY(created)+1=6 AND HOUR(created)=6

Результат:
id created rate comments views
255509 2015-04-11 06:28:00 50 104 74000
250557 2015-02-14 06:21:00 6 19 23000
238363 2014-09-27 06:14:00 63 29 56000
233533 2014-08-16 06:08:00 49 95 52000
228751 2014-07-05 06:58:00 82 70 38000
223149 2014-05-17 06:32:00 134 89 70000


Затем — в воскресенье в 6 утра.
SELECT * FROM posts WHERE WEEKDAY(created)+1=7 AND HOUR(created)=6

id created rate comments views
276249 2016-01-31 06:05:00 73 21 52000
269005 2015-10-18 06:03:00 34 25 19000
256617 2015-04-26 06:14:00 56 116 74000
253711 2015-03-22 06:56:00 30 25 39000
246785 2015-01-04 06:42:00 122 113 169000
238379 2014-09-28 06:28:00 20 33 28000
232009 2014-08-03 06:00:00 24 20 51000


Вот так. Довольно очевидно, что единичные посты делают нашу статистику. И, хотя я не могу не признать, что некоторое влияние время публикации всё же оказывает — оно не стоит того, чтобы даже задумываться об этом.

А смотреть графики — очень опасно. Графики дают ложные иллюзии понимания и некорректные предпосылки. Поэтому жизненно важно всего понимать, какие данные и по какой причине лежат под вашими графиками. Иначе всё, что вы построите и сделаете, будет иметь под собой примерно
такую основу.

Tags:
Hubs:
Total votes 17: ↑12 and ↓5 +7
Views 5K
Comments Comments 5