От делать нечего решил собрать статистику хабра.
Статистика может быть не совсем отражать действительность, т.к. из 199к статей лишь 75к были открытыми, остальные удалены\скрыты в черновик\доступ к публикации закрыт.
Можно предположить, что большая часть отсутствующих статей заминусована.
Собственно, сами данные:
Среднее количество постов в год:
![](https://habrastorage.org/r/w1560/getpro/habr/post_images/4c0/45a/50f/4c045a50fb737ab1c7483fd457b9adf9.png)
Средние кол. во. комментариев в постах по годам:
![](https://habrastorage.org/r/w1560/getpro/habr/post_images/135/c94/b88/135c94b887b7ed0fbc5911662a98389d.png)
За все время: 46.
Средняя оценка постах по годам:
![](https://habrastorage.org/r/w1560/getpro/habr/post_images/13e/91e/416/13e91e4166b0db19ae9b50baae2fce19.png)
Средняя оценка за все время: 31.
Статистика может быть не совсем отражать действительность, т.к. из 199к статей лишь 75к были открытыми, остальные удалены\скрыты в черновик\доступ к публикации закрыт.
Можно предположить, что большая часть отсутствующих статей заминусована.
Собственно, сами данные:
Среднее количество постов в год:
![](https://habrastorage.org/getpro/habr/post_images/4c0/45a/50f/4c045a50fb737ab1c7483fd457b9adf9.png)
Средние кол. во. комментариев в постах по годам:
![](https://habrastorage.org/getpro/habr/post_images/135/c94/b88/135c94b887b7ed0fbc5911662a98389d.png)
За все время: 46.
Средняя оценка постах по годам:
![](https://habrastorage.org/getpro/habr/post_images/13e/91e/416/13e91e4166b0db19ae9b50baae2fce19.png)
Средняя оценка за все время: 31.
Чем собрал данные
Использовал 3 самописные программы, скачать тут (C#)
habrDownloader — для скачивания всех топиков. (неочищенного хтмл кода страниц накачалось на 16 гигов)
habrExtracter — парсер скачанного и перевод в понятный вид
habrAnaliser — анализ полученной информации и составление статистики
На выходе последней получил это:
![](https://habrastorage.org/r/w1560/getpro/habr/post_images/1ec/3fd/e7f/1ec3fde7f326034b03008843db12bec7.png)
habrDownloader — для скачивания всех топиков. (неочищенного хтмл кода страниц накачалось на 16 гигов)
habrExtracter — парсер скачанного и перевод в понятный вид
habrAnaliser — анализ полученной информации и составление статистики
На выходе последней получил это:
![](https://habrastorage.org/getpro/habr/post_images/1ec/3fd/e7f/1ec3fde7f326034b03008843db12bec7.png)