ХаброСтатистика — в какое время лучше публиковать статью на хабре?

Оригинал поста на хабре

Астрологи объявили месяц статистики, и пожалуй я присоединюсь на сегодня к авторам статистических статей.

Наверняка вы задумывались - когда лучше публиковать статью? В выходные, чтобы её внимательно читали? В пятницу, чтобы у всех было хорошее настроение? В понедельник, когда после выходных все выползают читать хабр? А может быть, лучше выбрать время обеденного перерыва? Сразу оговорюсь, что данный вопрос имеет значение не только для хабра - примерно то же самое можно сказать про почти любые публикации, если нету какой-то совсем суровой конкретики. У меня есть своя гипотеза, о ней я расскажу в конце статьи.

Конечно, этот вопрос уже задавали. И отвечали. И рисовали статистику. Много статистики! Так зачем ещё одна статья на эту тему? А вот зачем. Почти нигде не учитывается, что следует принимать во внимание одновременно и время публикации и день недели. С очевидностью, утро понедельника имеет кардинальные отличия от утра воскресенья. Так же никто не учитывал праздники. А так же многие брали в качестве даты публикации поста дату первого комментария, чтобы не возиться с преобразованием. А если статья опубликована в какое-то нестандартное время, когда люди спят, то комментарии там могут появиться очень нескоро…

Я честно старался найти кем-то уже приготовленную статистику, но увы - часть была непригодна, часть ссылок стухла, остальные были непригодны из-за сбора заведомо некорректной информации. Так что вперёд - писать свой велосипед. Код приводить не буду (очевидно же), кому интересно - может посмотреть на github, там же можно скачать сгенерированную базу (сейчас примерно за полгода, потом будет больше).

Скачали, распарсили, залили в базу. Молодцы. Смотрим. Сейчас откроется истина - когда же нужно публиковаться, чтобы было много просмотров, комментариев, рос рейтинг и бегали пони по лужайке. Для начала посмотрим, когда же можно получить больше всего рейтинга.

SELECT CEIL(AVG(rate)) AS avg_rate, COUNT(id) AS quantity, CEIL(AVG(comments)) AS avg_comments, CEIL(AVG(views)) AS avg_views, WEEKDAY(created)+1 AS DAY, HOUR(created) AS HOUR FROM posts WHERE DATE_FORMAT(created, '%m-%d') NOT IN (SELECT `date` FROM holidays) AND rate > 0 AND comments > 0 GROUP BY WEEKDAY(created), HOUR(created) ORDER BY AVG(rate) DESC Пояснение: исключаем из выборки праздничные дни и посты, у которых рейтинг и количество комментариев не больше нуля.

барабанная дробь

Табличка результатов

avg_ratequantityavg_commentsavg_viewsdayhour
149 2 295 58000 2 1
91 1 21 52000 7 6
86 3 83 42334 3 4
81 4 96 49500 2 6
75 3 135 26334 5 5
68 19 15 14316 1 0
67 3 80 30334 7 9
65 5 61 24000 6 22
64 5 78 33600 4 2
63 13 56 19693 6 16
55 3 30 24334 6 9
55 4 25 23000 1 7
51 12 80 15000 3 1
49 6 58 26500 5 3
47 16 40 15407 1 19
44 9 35 23223 3 23
43 10 61 16900 2 7
43 7 20 8660 7 3
42 7 27 23000 5 1
42 10 32 23700 6 14
41 2 10 24500 6 4
41 12 37 18584 1 1
41 15 11 17934 7 22
40 6 62 24667 2 22
40 3 70 16000 7 7
39 13 41 23154 5 0
38 5 21 17000 6 3
38 16 53 18813 7 16
38 6 41 18167 5 2
37 6 39 18500 7 2
37 10 26 22800 3 0
36 16 32 15750 7 15
36 3 26 21000 6 5
35 5 29 12200 3 3
35 9 34 13112 7 14
35 12 17 19834 7 17
34 8 17 15675 6 18
34 28 24 22000 4 17
33 59 28 17323 3 11
33 6 28 18334 6 19
33 8 35 18542 6 13
32 14 18 18715 7 23
32 5 74 15600 7 12
32 19 17 17737 4 19
32 37 24 16649 3 18
32 7 24 21429 3 7
31 1 4 13000 3 6
31 17 28 16530 4 22
31 4 19 15500 6 10
31 17 27 20236 2 20
31 12 12 8622 1 23
31 13 21 16077 1 8
30 5 26 19400 5 22
30 8 30 19125 6 0
30 48 21 14917 3 14
30 23 23 15566 2 18
30 41 18 16854 3 15
29 3 18 8667 7 11
29 11 67 15910 1 20
29 2 11 6000 6 23
29 15 33 16667 4 20
29 8 21 16500 7 21
29 8 22 24750 4 3
29 5 43 21000 5 4
29 60 16 12500 1 13
29 11 28 17273 3 2
29 12 26 12500 3 21
29 48 23 11855 1 9
28 23 26 13044 3 19
28 34 27 14824 4 10
28 12 25 14584 4 7
28 47 28 15979 2 15
28 45 27 18489 5 13
28 26 23 13462 4 9
28 8 14 18250 6 21
28 62 27 14203 3 12
27 6 14 13834 1 2
27 3 25 15000 7 10
27 58 20 13242 2 11
27 39 29 14231 2 16
27 2 44 7500 4 5
27 47 21 13362 4 16
27 39 18 15565 5 15
27 61 21 15558 1 12
27 51 22 12311 4 13
27 11 37 15546 5 20
27 6 84 9167 4 8
27 19 20 12632 5 17
26 11 25 15637 5 8
26 22 24 13773 4 18
26 37 23 11621 1 17
26 26 19 12731 2 19
26 45 20 15200 2 10
26 7 23 18143 5 7
26 48 20 13521 5 10
26 8 13 7625 6 15
26 8 12 10000 1 3
26 60 22 13550 3 13
26 2 25 14000 6 2
26 54 25 11630 1 15
26 23 21 13740 5 19
26 11 26 15273 7 13
26 11 18 12819 5 21
26 48 17 10792 1 16
25 7 13 14429 6 11
25 7 20 18143 5 23
25 58 15 14121 5 11
25 32 17 11407 3 17
25 64 21 11500 4 11
25 5 62 13000 2 0
25 3 20 12000 6 8
25 49 21 14959 5 16
25 59 18 11085 4 15
25 54 18 11667 1 10
25 25 32 12773 1 18
24 8 15 13750 1 22
24 25 34 14480 5 18
24 3 17 14334 7 0
24 51 21 12687 3 10
24 74 24 13227 1 11
24 44 16 10877 1 14
23 2 6 7000 6 7
23 47 12 12469 4 14
23 5 18 10800 2 3
23 34 17 10098 5 14
23 10 31 14300 6 12
23 2 22 6000 2 5
23 3 30 10667 5 6
23 51 17 11059 5 12
23 30 20 11267 2 17
22 38 11 10079 2 9
22 11 19 14455 7 19
22 47 25 11915 3 16
22 4 16 10500 4 23
22 13 14 9231 2 21
22 10 26 12400 1 21
22 82 18 12342 2 12
22 5 24 13400 6 1
21 64 17 13250 4 12
21 6 14 11334 2 4
21 9 16 7445 3 8
21 4 17 11500 1 5
21 16 12 10625 2 8
20 1 13 2000 7 4
20 2 8 7500 3 5
20 67 18 10598 2 13
20 13 13 9924 7 18
20 7 19 10858 2 2
20 45 13 10600 2 14
20 12 23 10167 4 0
19 7 14 13143 6 17
19 3 9 7000 6 20
19 10 14 9200 4 21
19 24 16 9959 5 9
18 4 5 10500 4 6
18 15 20 8267 3 20
18 3 6 6667 7 1
17 4 4 6000 4 1
17 2 23 10000 4 4
17 29 13 6823 3 9
16 12 10 8000 2 23
15 6 8 8500 3 22
13 10 8 7100 7 20
13 5 26 5200 1 4
6 1 4 2000 1 6

Срочное известие! Лучшие результаты по рейтингу даёт публикация во вторник в час ночи! И ни в коем случае не публикуйтесь в понедельник в 4 или 6 утра - ваш пост будет обречён!

Класс. Теперь давайте посмотрим, когда лучше публиковаться, чтобы получить больше комментариев. Табличку всовывать не буду, очень много HTML кода - просто скажу, что час ночи вторника опять лидирует, а хуже всего - четверг час ночи и среда шесть утра. По просмотрам - лучше во вторник в час ночи, хуже в понедельник в 6 утра.

Что же это за время такое волшебное - вторник час ночи? Может быть, те кто “в теме” только в это время и публикуются? Давайте проверим:

SELECT * FROM posts WHERE WEEKDAY(created)+1=2 AND HOUR(created)=1 Ответ уже для многих очевиден:
idcreatedratecommentsviews
273403 2016-01-19 01:59:00 26 28 34000
269577 2015-10-27 01:19:00 272 561 82000

Отсюда сделаем логичные выводы по тому, когда лучше всего публиковать статью. Простите, ещё один спойлер - для тех, кто невнимательный и сразу решил открыть выводы. Рекомендую ещё раз подумать над вопросом перед тем, как раскрывать спойлер.

Если ещё немного подумать и поковырять различные варианты выборки - становится понятно, что любой “полезный выход” никак не зависит от времени публикации статьи. В любой день и час статья может получить количество рейтинга, просмотров и комментариев, зависящее исключительно от её качества. Моя собственная гипотеза подтвердилась.

Лучше всего публиковать статью - тогда, когда у вас готова хорошая, интересная и красивая статья. С любовью, ваш Капитан.

P.S. Автор отлично осознаёт огромное количество погрех в этом исследовании, и оно претендует скорее на шутку, чем на статистику. Но в шутке есть намёк. Недаром на Тостере на полном серьёзе задавали вопрос и отвечали про лучшее время публикации. Коллеги, пишите качественные тексты и не волнуйтесь более ни о чём.

P.S.2. Судя по мгновенно прилетевшим минусам, открывшие действительно считали, что сейчас им расскажут лучшее время публикации статьи. Что ещё раз показывает, что вопрос и данный ответ - очень актуальны.

На самом деле, ещё есть вопрос того, как зависит рейтинг статьи от её охвата аудитории - но это довольно очевидная тема, да и не относится к тому, что мы хотели выяснить именно в этом топике.

Всем спасибо, всем хороших статей! Встречаемся здесь же, в то самое оптимальное время, которые мы с вами выявили.

UPD. Продолжение и частичное опровержение этой статьи - во второй части.