Хабростатистика, часть 2 — опровержение с графиками

Оригинал поста на хабре

Вчера я публиковал статью на тему того, когда лучше публиковаться на хабре. С тех пор мой паук собрал статистику за весь 2015 год, и картинка немного изменилась. Так же я построил несколько графиков, и в целом картина прояснилась. Осторожно, трафик!

Сначала посмотрим статистику отдельно по каждому дню:

Обозначения на графиках такие:

  1. Quantity - количество опубликованных в это время статей
  2. Comments - среднее количество оставленных комментариев
  3. Views - среднее количество набранных просмотров
  4. Rate - средний набранный рейтинг

Понедельник выглядит так:

Вторник:

Среда:

Четверг:

Пятница:

Суббота:

Воскресенье:

Ну и наконец самое вкусное - сборная солянка за всю неделю:

Придётся признать - полученная статистика несколько противоречит мнению, которое я высказал в первой статье. Действительно, как упоминали некоторые комментаторы, лучше всего публиковаться в субботу и воскресенье в 5 часов утра, когда конкуренция с вашей статьёй минимальна.

Или нет?

А давайте посмотрим выборки по получившимся пикам: Для начала - 6 утра субботы.

SELECT * FROM posts WHERE WEEKDAY(created)+1=6 AND HOUR(created)=6 Результат:
idcreatedratecommentsviews
255509 2015-04-11 06:28:00 50 104 74000
250557 2015-02-14 06:21:00 6 19 23000
238363 2014-09-27 06:14:00 63 29 56000
233533 2014-08-16 06:08:00 49 95 52000
228751 2014-07-05 06:58:00 82 70 38000
223149 2014-05-17 06:32:00 134 89 70000

Затем - в воскресенье в 6 утра.

SELECT * FROM posts WHERE WEEKDAY(created)+1=7 AND HOUR(created)=6
idcreatedratecommentsviews
276249 2016-01-31 06:05:00 73 21 52000
269005 2015-10-18 06:03:00 34 25 19000
256617 2015-04-26 06:14:00 56 116 74000
253711 2015-03-22 06:56:00 30 25 39000
246785 2015-01-04 06:42:00 122 113 169000
238379 2014-09-28 06:28:00 20 33 28000
232009 2014-08-03 06:00:00 24 20 51000

Вот так. Довольно очевидно, что единичные посты делают нашу статистику. И, хотя я не могу не признать, что некоторое влияние время публикации всё же оказывает - оно не стоит того, чтобы даже задумываться об этом.

А смотреть графики - очень опасно. Графики дают ложные иллюзии понимания и некорректные предпосылки. Поэтому жизненно важно всего понимать, какие данные и по какой причине лежат под вашими графиками. Иначе всё, что вы построите и сделаете, будет иметь под собой примерно такую основу.