Обнаружил мощный статистический потенциал «ВКонтакте» и получил ответ на давно интересующий вопрос. Дело в том, что среди моих друзей примерно половина родилась в декабре и меня это беспокоило.
Disclaimer:
1) на серьезное исследование не претендует;
2) мне есть чем заняться);
3) может не в тему, но не знаю куда, подскажите.
Важно: по данным на ноябрь 2007 — делал давно.
(Если кому лень пересчитывать — столбики расставлены в порядке месяцев рождения. То есть «Апрель» — «Январь», «Май» — «Февраль»)
Анализ
1. Во-первых, распределение неравномерно. И это, пожалуй, самый важный вывод. Разница между максимумом и минимумом — 20% от среднего. При таком объеме данных это никак нельзя объяснить случайностью.
2. Летом — больше, зимой — меньше. Апрель — пик.
Гипотезы:
1) Высказана идея о том, что реально это провал на зимних месяцах, а все остальное равномерно. Выпадает май, потому что «Кто в мае женится, всю жизнь мается». Эту же гипотезу подтверждает максимум в августе.
2) Вторая идея о том, что вообще есть два пика: один размазанный летний, второй — острый весенний. Причем он не в марте, потому что в марте у нас еще в основном холодно.
3. Есть еще подозрение, что апрельский пик — на самом деле артефакт «Контакта». Люди, которым лень выбирать месяц, выберут первый — то есть январь. Ну в общем дальше можете сами отнять нужное количество месяцев.
Disclaimer:
1) на серьезное исследование не претендует;
2) мне есть чем заняться);
3) может не в тему, но не знаю куда, подскажите.
Важно: по данным на ноябрь 2007 — делал давно.
(Если кому лень пересчитывать — столбики расставлены в порядке месяцев рождения. То есть «Апрель» — «Январь», «Май» — «Февраль»)
Анализ
1. Во-первых, распределение неравномерно. И это, пожалуй, самый важный вывод. Разница между максимумом и минимумом — 20% от среднего. При таком объеме данных это никак нельзя объяснить случайностью.
2. Летом — больше, зимой — меньше. Апрель — пик.
Гипотезы:
1) Высказана идея о том, что реально это провал на зимних месяцах, а все остальное равномерно. Выпадает май, потому что «Кто в мае женится, всю жизнь мается». Эту же гипотезу подтверждает максимум в августе.
2) Вторая идея о том, что вообще есть два пика: один размазанный летний, второй — острый весенний. Причем он не в марте, потому что в марте у нас еще в основном холодно.
3. Есть еще подозрение, что апрельский пик — на самом деле артефакт «Контакта». Люди, которым лень выбирать месяц, выберут первый — то есть январь. Ну в общем дальше можете сами отнять нужное количество месяцев.