О Хабрахабре, статистике и тортах

    Лирическое отступление


    Здравствуйте!
    Однажды темным зимним вечером мне было нечего делать и я убивал время чтением любимого Хабрахабра. В коментах в очередной раз проскочила фраза о том, что Хабр, дескать, уже не торт.

    Статистика, статистика и еще раз статистика


    Мне стало интересно, можно ли как-нибуть оценить качество статей на Хабре численно и будет ли видно по полученной оценке, как оно менялось со временем, или же, на самом деле, все эти комментарии не более чем брюзжание о том, что раньше и трава была зеленее? Дело было вечером и делать было нечего, поэтому я взял волю в кулак и написал простенького бота, который неспеша перекопал почти 2800 страниц главной Хабра и собрал статистику по захабренным статьям с момента открытия Хабра и по 31 декабря 2009 года.
    Традиционная картинка для привлечения внимания, график количества статей по месяцам:



    Тематика


    Самая первая мысль, которая пришла мне в голову — проверить то, как изменилось тематическое наполнение Хабра за время его существования. Как извесно, блоги на Хабрахабре поделены на категории, с которыми можно ознакомиться здесь. Для начала я попробовал посчитать количество статей для каждой категории по годам (в статистике по месяцам слишком много шума, поэтому пришлось от нее отказаться). К сожалению, не у всех блогов проставлена категория, для таких она помечена как «n/a».


    Более наглядно эти же данные можно представить в виде круговых диаграм:




    Очевиден позитивный трэнд — на Хабре уменьшилось количество оффтопика и стало больше профильного контента. Очень вырос процент программирования. А вот железо, о котором бытует мнение, что его стало больше в последнее время, на самом деле практически не выросло — хотя, возможно, усилиями того же Бумбурума качество статей о железе все же поднялось.

    Оценки


    Как же изменилось качество сферической статьи в вакууме главной страницы Хабра за время его существования? Первое, что приходит в голову — это посчитать среднюю оценку такой статьи. Следующий график илюстрирует такую оценку по месяцах:

    Пик, который мы видим в августе 2008 года — это ни что иное, как запуск СуперХабра и введение инвайтов.

    Комментарии


    Еще один интересный показатель — среднее количество комментариев к статье:

    Все предсказуемо: в отличие от статей, комментарии могут оставлять все зарегистрированые пользователи, поэтому введение инвайтов приостановило рост этого показателя. Среднее количество комментариев хорошо отражает размер активной аудитории Хабра. Ах да, пик слева — единственная статья в июле 2006 года, которую до сих пор комментируют — ведь она самая-самая первая.

    Холиворы


    Один из самых интересных вопросов, которые я задавал себе перед тем, как приступить к этой статье — это то, действительно ли на Хабре в последнее время стало больше спорных топиков, которые вызывают у читателей бурю эмоций и желание избить собеседников? Как вообще можно оценить такой показатель? После долгих раздумий я решил, что с определенной погрешностью этот показатель можно проиллюстрировать с помощью отношения количества негативных оценок статьи к общему количеству оценок. Итак, «спорной» я назвал статью, у которой количество «минусов» составляет более трети от общего количества оценок. На следующем графике красной линией показаны спорные статьи, а синей — все:

    Видно довольно плохо, давайте попробуем посчитать относительное количество спорных статей от общего числа:

    Вот здесь уже видно лучше: количество спорных статей растет и сейчас уже почти достигло максимума, который наблюдался перед вводом инвайтов (тогда по Хабру ходили слухи о ботнете, который минусовал неугодные и плюсует угодные его создателю статьи). Введение инвайтов и новых правил затормозило этот процесс, но ненадолго. Это наверное единственный тревожный звонок, который я увидел, проанализировав собранные данные.

    Выводы


    Вполне очевидно, что всю жизнь Хабра можно поделить на две части — в августе 2008 года, с введением нового движка и правил, проект повзрослел и стабилизировался. 2009 год был первым годом взрослой жизни этого проекта и он его прожил просто прекрасно: росло и количество и качество статей, не говоря уже о посещаемости.
    Однако, не все так гладко в датском королевстве — нужно что-то делать со статьями, которые минусуют просто потому, что в них упоминают о теме, которая не нравится фанату какой-нибуть технологии или же наоборот плюсуют потому, что там говорится о священной корове фаната. Концепция скрытых статей для подписчиков блога ИМХО себя не оправдывает. Впрочем, ответы на вопросы «кто виноват?» и «что делать?» выходят далеко за границы этой статьи и на этом я остановлюсь. Единственное замечание — новым рулевым Хабра надо будет серьезно подумать над этим вопросом.

    Пост Скриптум


    Если у читателя возникнут какие-либо идеи о том, как еще можно проанализировать собранные данные — напишите мне, я с удовольствием выслушаю их.
    Поделиться публикацией

    Комментарии 111

    • НЛО прилетело и опубликовало эту надпись здесь
        +3
        Да, я понимаю, но для того что бы устранить эту зависимость нужно иметь, например, статистику посещаемости зарегистрированных пользователей — а она если и есть, то только у администрации.
          0
          «новым рулевым Хабра надо будет серьезно подумать над этим вопросом».

          Я не совсем в теме, Хабр снова меняет руководство? Или под новыми рулевыми подразумеваются не такие уж новые?
      +8
      Оценка статьи, даже средняя, сильно зависит от количества оценивающих.
      Было бы круто посмотреть, как все это дело соотносится с размерами аудитории хабра за то же время.
        +3
        Увы, таких данных у меня нет :(
          0
          Но можно попробовать собрать тех, кто засветился в комментариях ;)
          Правда, там будет часто прилетать НЛО и удалять их, поэтому статистика будет неполной.
          Хотя можно посчитать количество удаленных комментариев к общему количеству (общее за определенный периуд) и на соответствующий индекс увеличить «засветившееся» население.
            +2
            количество комментаторов != количеству активной аудитории. многие просто читают и ставят оценки.
              +1
              Тоже верно.
              Но можно ли назвать активной аудиторией ту, что просто ставит оценки? Ведь истина рождается в споре? (это так, к слову. Ведь за последний период будет собрана такая же статистика)

              В крайнем случае можно и данное количество подкорректировать:
              Если собрать статистику за последние месяца (по комментариям), то мы получим коэффициент активности по комментариям (общее число нам же известно).
              Правда, в какую сторону данный коэффициент изменит нам статистику сложно сказать (а погрешность у него будет).
                0
                Ну если вам так хочется, то вот:
                  0
                  Извините, случайно отправил не то:
                  13.66 КБ
                  www.ljplus.ru/img4/m/a/mace_ua/trends_avg_mark_to_comments.png
                  Отношение средней оценки к среднему количеству комментариев.
                    0
                    впрочем, конечно это не то — надо количество разных юзеров, засветившихся в комментариях. автоматическая уборка плохих комментариев НЛО все портит, да и парсить все комментарии всех статей — это долго и сложно.
                      0
                      Согласен, это долго будет.
                      Но с другой стороны очень хороший график. Сразу показывает, что после ввода системы инвайтов активность сильно возросла.
          +5
          В научной среде существует такое понятие как перекрестное опыление — когда пара научных руководителей оппонируют работы друг друга (их аспирантов имеется в виду). ВАК сильно за этим делом следит и составляет подробные списки к чьим работам нужно присматриваться более подробно.

          Было бы интересно посмотреть, как много хаброюзеров организуют замкнутые экосистемы с плюсованием статей друг-друга, к сожалению (или к счастью), нам не доступна информация о плюсующих/минусующих +)
            +13
            Для меня статистикой стало, то что первый год на хабре из рсс я сохранял по две три статьи и потом по несколько раз их перечитывал делая выводы и заметки, теперь же за два три дня и одна статья такая попадается, многие стали слишком профильными, что в принципе нормально, а многие имеют лишь громкий заголовок.
            К тому же создается впечатление, что раньше на Хабр писал люди которым было чем поделиться, сейчас это больше топики вопросы в попытке собрать нужную информацию.
              +3
              Было бы интересно узнать соотношение копипасты с оригинальным контентом, если это вообще возможно.
                +1
                Тут главное трафик. И да ТИЦ и пузомерки уже не ныжны
                Например, опубликовав новость постоссылкой про собрание Линукс пользователей в Москве )
                За два дня я получил чуть больше 1000 хостов с хабра.

                А смысл?
                Уник контент скажу Вам чесно, даёт гораздо больше…
                Вот только контента мало… кругом рерайт =(
                0
                Я всегда говорил «Хабр — Мекка для программиста.» :)
                  +5
                  Хабр это место для мыслящих людей
                  И для тех кто умеет фильтровать информацию
                  Вот Вы читаете газету и Вам всё нравится?
                  Не нравится пройдите мимо. Нравится или есть, что добавить… оставляйте коммент
                    –1
                    Я сказал что-то абсурдное?
                    Лично знаю несколько человек которые так и считают, включая меня.
                    Да и данная статистика яркое тому подтверждение.
                      +1
                      «Я сказал что-то абсурдное?»
                      а я это утверждаю?
                        –1
                        Простите, тогда не понимаю почему Вы ответили этим именно на мой комментарий.
                          –2
                          А почему Вы делаете утверждение?
                          «Я всегда говорил «Хабр — Мекка для программиста.» :) „
                            –2
                            Потому что так считаю.
                            Думаю каждый TI-шник, чтоб не отставать от жизни, должен по крайней мере следить за этим ресурсом, а желательно ещё и набираться здесь новых знаний.
                            Кажется наше с Вами обсуждение идёт в никуда.
                              –2
                              «Думаю каждый TI-шник, чтоб не отставать от жизни, должен по крайней мере следить за этим ресурсом, а желательно ещё и набираться здесь новых знаний.»
                              А причём тут программист?

                              И, да
                              «Кажется наше с Вами обсуждение идёт в никуда. „
                              Хотя, Вы даже троллить в рамках правил не умеете…
                                –3
                                А вот тут вы уже перегибаете палку.
                                Перечитайте всё заново, причем начиная с графиков.
                                  –1
                                  «А вот тут вы уже перегибаете палку.»
                                  Нет, данные хорошие. Мне как маркетологу интересные, вот только Вам не нравится =(
                                  И Вы считаете, что
                                  " Я всегда говорил «Хабр — Мекка для программиста.» :) "
                        +1
                        В целом, да. На хабре большинство заметок про php, потом про .NET. Очень мало про Python/Ruby, еще много меньше про С/С++, Java, Perl. Про остальные языки молчу. Дык откуда ж «мекка»? Или вы считаете, что это нечто под названием «php» — это венец эволюции и оно определяющее в понятии «программист»?
                          0
                          Так вот в том-то и дело. Вот таких вот «программистов» и «мекка». :-/
                    –2
                    По собственным ощущениям в 2009 году начался спад в качестве контента к началу осени, но вот уже примерно как месяц стало появляться всё больше адекватных статей.
                      +4
                      забавно такие вещи читать от людей без постов
                        +12
                        А зачем писать?

                        Если реально толковое, так оно подавляющему большинству местной публики нах не надо.
                        Классика
                        habrahabr.ru/blogs/infosecurity/80842/#comment_2387143

                        Они даже не поймут о чем написано и зачем это надо.
                        Им или подавай про йух или на пальцах перепевы мануалов, на которые восторженные отклики «в мемориз». Мануалы — это же так скучно, а буууукафф там… А тут тебе разжевали и в ротик положили. Думать не надо, ну и не умеют.

                        Положительных эмоций от написания действительно хорошей статьи получить практически нереально, вот и не пишут, и не будут.

                        Школота, оно ведь не только фконтакте. Забавно читать профиль какойнить. Г.р. типа 1989, работаю на руководящих должностях, гы. Детка хоть бы понимало, что такое руководящая должность :-)

                        Естественно карма у таких чудес под сотку. С какго перпука она у них такая думаю очевидно.

                        Дрочеры они ведь не только на адалте, но и на хабре.
                          +1
                          Нашли на кого сослацца =)
                          Это от самый чел, от которого меня ещё в фиде (до 2000ных) мутило =) И да, да он обещал веб 2нольный фидонет.
                            +2
                            Откровенно говоря пофигу было на кого ссылаться. За йух он ведь плюсов наполучал :-)

                            И всем было пох кто он.

                            А в разработке он далеко не самый здесь безмозглый.
                            Несет не туда.

                            А Вы уверены, что знаете где оно туда?

                            Я нет.
                              0
                              «Откровенно говоря пофигу было на кого ссылаться. За йух он ведь плюсов наполучал :-)»
                              дак главное попасть в струю =) А =сы и -сы роли не играют.

                              «А в разработке он далеко не самый здесь безмозглый.»
                              наверное, но я не видел его проектов (хм, своих бы разрабов уволил на… фезенте пусть бы работали… 2 месяца банальную задачу закрыть не могут… но это пусть дир. решает =))
                                –2
                                «А Вы уверены, что знаете где оно туда?»
                                таки да =) или бы сейчас не имел пассивный доход и почти сто интернет проектов
                                + пару сообществ типа welinux.ru у себя за плечами
                                  –2
                                  Если
                                  упс выразился не точно
                                  Пора спать =) с 6 утра не сплю, сейчас 8 54
                              +4
                              «Естественно карма у таких чудес под сотку. С какго перпука она у них такая думаю очевидно.»
                              ой ли? пакажите…
                                –2
                                Хакнуть хабр для этого нужно.
                                Это конечно не проблема. Вот только неправильно оно по моему.
                                  +3
                                  «Хакнуть хабр для этого нужно.»
                                  Чувствую Вы опять пытаетесь показать, то да! Вы свой в тусофке.
                                    –1
                                    Нет.

                                    Просто данные из базы для этого нужны.
                                    А я не в тусовке.

                                    С логикой у вас похоже проблемы :-)
                                      +2
                                      «С логикой у вас похоже проблемы :-) „
                                      Да, а ещё проблемы стем чтобы экспертно высказываться по вопросам в которых не разбираюсь (но этому я у Вас научился)
                                +1
                                «Школота, оно ведь не только фконтакте. Забавно читать профиль какойнить. Г.р. типа 1989, работаю на руководящих должностях, гы. Детка хоть бы понимало, что такое руководящая должность :-)»
                                Судя по комментам Вы тоже программист =) и что?
                                  –1
                                  «Дрочеры они ведь не только на адалте, но и на хабре. „
                                  Это Вы из личного опыта?
                                    +7
                                    что вы имеете против 89 года рождения? :) школота это не возраст и место учебы это состояние души, многие и после университета остаются школотой.
                                      +1
                                      Думаю, он к тому, что для того, чтобы эффективно управлять большим количеством людей недостаточно быть просто умным, должен быть какой-то жизненный опыт, который в 20 лет невозможно иметь по обьективным причинам. Я не могу не согласится с этим, и судя по тому, что в президенты можно баллотироваться с 35 лет, такая точка зрения весьма популярна.
                                        +1
                                        то-то самые успешные стратапы сделаны молодыми… да и должности бывают разные.
                                      +1
                                      Вы и мицгол и правы и не правы. Статья про прагин jQuery — младшая группа детского сада, написанная чер пойми как, с редким полезным словом среди сплошной воды. Написанная в превосходной степени относительно объекта обсуждения. Если бы она попала на главную, уже через пол года половина сайтов в рунете могли использовать этот плагин совершенно не к месту, потому что о нем так прекрасно написали на крупнейшем it ресурсе страны.

                                      Про йух вы правы, простое хулиганье.

                                      Я минусонул оба топика, когда они появились.

                                      Проблема не в том, что мало хороших топиков до главной добираются, проблема в том, что много плохих.
                                      +7
                                      Не нужно быть поваром, чтобы оценить качество омлета.
                                        –1
                                        Никогда не понимал людей паразитирующих на чужих знаниях.
                                        Хотя… у меня как у интернет-маркетолога благодаря таким персонажам постоянный поток клиентов.
                                          +1
                                          каждый прав по-своему, если все люди будут правильные, представляете, что будет?
                                            +1
                                            нет, но будет интереснее + да, меня достала тенденция на хабре в стиле:
                                            аааа… всё придумано до нас!
                                              +1
                                              >Пора спать =) с 6 утра не сплю, сейчас 8 54

                                              Сходите поспите. Это без стеба.
                                              И на свежую голову перечитайте, в том числе и то что сами написали :-)

                                                  –1
                                                  Ага

                                                  Вы еще это упустили, для пущего понта
                                                  habrahabr.ru/company/yandex/blog/77718/#comment_2266590
                                                  :-)

                                                  Только вот что я вам скажу детка
                                                  >но это пусть дир. решает =))

                                                  За вас всегда решать будут

                                                  Потому что вы что то делаете «почему»

                                                  А я в отличие от вас «зачем» и получаю то что мне нужно. И если я что то пишу то либо так постебаться, либо пощупать в сравнении маркетинг MS vs Yandex к примеру.
                                                  Yandex со счетом 5:0 сливает :-)

                                                  Я конечно понимаю, мозольки больные у вас, а я наступил. Ну чтож так заводится то :-)
                                                    –2
                                                    «Только вот что я вам скажу детка»
                                                    хамить не нужно.

                                                    «А я в отличие от вас «зачем» и получаю то что мне нужно.»
                                                    да? И сидите на маминой шее… на да да =)

                                                    «И если я что то пишу то либо так постебаться»
                                                    + 1 мелкий троль =)

                                                    «Я конечно понимаю, мозольки больные у вас, а я наступил. Ну чтож так заводится то :-) „
                                                    Креведко =) Учись троллить =)
                                                      +1
                                                      >И сидите на маминой шее… на да да =)

                                                      Моя мама за пенсией не ходит.
                                                      Не для того она меня растила.

                                                        +1
                                                        А теперь посмотрите во что вы превратили топик.
                                                          +3
                                                          :-(
                                                          Засрали
                                                            +4
                                                            Вот именно это в чистом виде и есть одна из главных причин деградации качества публикаций на хабре.

                                                            Подобный тред есть практически в любой серьезной статье и очень мало статей с качественным обсуждением.

                                                            Год назад, очень часто, в обсуждениях было намного больше полезной, нетривиальной и важной информации, чем в самой статье. Это при том что статьи были в целом сильнее чем сейчас.
                                                            Теперь это исключение.

                                                            А писать, что бы нарваться на кучу некомпетентной фигни, не так много отважных.
                                                              –6
                                                              «Вот именно это в чистом виде и есть одна из главных причин деградации качества публикаций на хабре.»
                                                              Это Вы про свой пустой, коммент да?

                                                              «Подобный тред есть практически в любой серьезной статье и очень мало статей с качественным обсуждением.»
                                                              Хорошая попытка получить +

                                                              НО Вы сами начали писать ерунду.

                                                              «А писать, что бы нарваться на кучу некомпетентной фигни, не так много отважных. „
                                                              Почему не компетентной? Наоборот =)

                                                              А Вот маленькие тролли типа Вас всё портят.
                                              0
                                              паразитирующих? если бы небыло людей которым эти знания нужны то не было бы и смысла писать эти статьи. Большинство статей (не только на хабре, но и вообще в русской блого сфере) это перевод или краткий сумари с западного источника, а иногда просто статья «сегодня такого-то числа обновился „блаблабла“ в нем нового „бла“ „бла“ „бла“ », так же бывают статьи «а сейчас мы все дружно почитаем ман (таких вещей я сам много написал)», или же «зацените какую багу я на яндексе откапал». Ну а есть статьи которые написаны вполне по теме и их интересно читать. Вообщем писатеи паразитируют на чужих знаниях еще чаще.
                                        +2
                                        Еще, думаю, в рамках данных подсчетов надо было проверить соотношение захабренного/отхабренного. Так оценим уже качественно сам хабранарод.
                                          +1
                                          отхабренное имеют ИМХО соовсем не адеваты или те, кто пытаются получить явную выгоду с сообщества
                                            0
                                            Ну я как раз о том и говорю, насколько больше/меньше таких стало по отношению к нормальным.
                                              +1
                                              возможно, нет времени смотреть отхареббыные…
                                              Есть ещё работа, личная жизнь и проекты
                                            0
                                            да, кстати, это идея. но на этот раз надо собирать дополнительную статистику и за пару часов час тут уже не уложишся… я подумаю над этим.
                                            0
                                            Оптимально было бы ввести рекомендательную систему, на подобие last.fm. Если я заминусовал статью, то в след раз, подобные статьи не будут попадаться мне в ленту, и наоборот, если кто-то с такими же интересами как и я (голосовал подобно мне) плюсует статью с пока ещё малым рейтингом, она появляется у меня в ленте.
                                              +1
                                              А теперь добавьте человеческий фактор =)))
                                              И Вы будете читать даже то, что Вам не интересно
                                                +1
                                                Так хабралента есть уже (ссылка вверху страницы почти под аватаром). Не то разве?
                                                  0
                                                  спасибо за наводку, только полноценно пользоваться я ей не могу, так как нет возможности голосовать, лучше бы разрешили, но не учитывали мой голос в рейтинге
                                                • НЛО прилетело и опубликовало эту надпись здесь
                                                  +6
                                                  Количество контента по программированию растёт. Это радует :)
                                                    0
                                                    Отличная работа. Статистику в реальном времени, кстати, было бы интересно сделать одним из разделов Хабра. Благодаря ей новички, пришедшие сюда, сразу бы могли оценить то, что здесь творится.
                                                      +2
                                                      Собственно основная претензия к хабру очень тяжело визуализируется, это общее падение «уровня подготовки» читателей. Читателям желтой прессы тоже очень нравятся и скандалы из жизни «звезд», и прочие «интриги-расследования», были бы у них механизмы — только бы такие темы и висели в их «зажелтопрессенном».Так что рост общей оценки постов и должен расти.
                                                      В этом-то и беда, что Хабра, что телефидения с газетами. Публике нравится, журналисты выдают. «Писатели пописывают — читатели почитывают» Замкнутый круг.
                                                        +1
                                                        habrahabr.ru/blogs/statistics/80948/#comment_2393244 это, сюда.

                                                        Жалко нельзя… хотябы первые 10 сек
                                                        коммент редактировать или убивать
                                                          +1
                                                          Вы совершенно правы, сильнейшее падение «уровня подготовки»! Из-за этого сайт наполняется некачественным контентом и всякой лажей. Плюсуют и выводят на главную такие статьи те же самые низкоподготовленные пользователи. Из-за это, именно из-за этого, так как сильных и качественных статей все меньше по соотношению к общему числу, сильные авторы перестают писать. То же самое было и с serverfault, да в общем этому подвержены все проекты, ориентированные на массовую аудиторию. Как с этим бороться… имхо платные подписки и оплата авторам за статьи. Как в журналах. Тем самым будет несколько премодераций статей, начиная от исчезновения статей-новостей кончая описанием книг о гарри поттере и новых чудо-ручек. К тому же, от себя лично добавлю, что мне не интересны описания общедоступного железа, которые я и так могу прочитать на ixbt (как пример), бумбурум пишет статьи с красивыми картинками, но уж никак не технические, а целенаправленно для неподготовленной аудитории. Подведу итог: хабр перестал быть высококвалифицированным и подметить что-то новое трудно, одна стал более популярным, те техническо-популярный сайт, а раньше технический.
                                                            0
                                                            Из-за это, именно из-за этого, так как сильных и качественных статей все меньше по соотношению к общему числу, сильные авторы перестают писать. [...] Как с этим бороться…
                                                            Можно ещё подумать о том, как несколько приостановить приток «некачественных» авторов. Например, отредактировать систему инвайтов. Как вариант, аннулировать все неиспользованные инвайты, и далее давать инвайты только за хорошие авторские статьи (не ссылки, не копипасты, а именно свои грамотные технические статьи).
                                                            И за 50 плюсов к коментарию инвайт не давать. Ведь если присмотреться, подавляющее большинство комментов, набравших 50+, это просто шутки, юмор, ирония, подколы и прочие гыгы-комменты. Ну пускай это увеличивает рейтинг, но инвайт в большинстве случаев там давать не за что, ибо они даже не по профильной теме.
                                                            Также можно повысить порог баллов для попадания статьина главную. По крайней мере для непрофильных статей (хотя как их точно формально выделить?).
                                                          +1
                                                          «Читателям желтой прессы тоже очень нравятся и скандалы из жизни «звезд»»
                                                          Для этого есть РОЕМ, не?
                                                            0
                                                            Практика СМИ показывает, что ЭТОГО никогда много не бывает :-/
                                                              +1
                                                              да, у каждой коммерческой информации есть своя группа потребителей
                                                                –2
                                                                В выборе между «думать» и «пялиться на сиськи» любой человек всегда выберет сиськи.
                                                            +1
                                                            На графиках нет раздела «блог бурумбурума». Неверные данные у вас. :D
                                                              0
                                                              статистику по авторам я постараюсь опубликовать при возможности ;)
                                                                0
                                                                Забавно, но «Железо и гаджеты» выросло с 0 до 8% :)))
                                                              0
                                                              Мне кажется что нужно дополнить формулу 30% «минусов» для оценки степени холиварности. Нужно множить ещё на количество голосов. Если это в теме 20 оценок, и 7 оценок будет с минусом, — вряд ли можно сказать что это холивар, просто кто-то кого-то заминусовал за мат. Соответственно, домножив здесь на 20, а в настоящем холиваре, где сотни оценок, на их число, мы внесём коррективу в общую статистику, и циферки, наверняка изменятся…
                                                              Такое хотелось бы посмотреть.
                                                                0
                                                                Мне кажется что нужно дополнить формулу 30% «минусов» для оценки степени холиварности. Нужно множить ещё на количество голосов.
                                                                По моим наблюдениям основной критерий холиварности — это более 500 комментариев к посту.
                                                                0
                                                                Да тут я видел парни конспекты лекций перепечатывают, какое тут качество. :(
                                                                  0
                                                                  «А вот железо, о котором бытует мнение, что его стало больше в последнее время, на самом деле практически не выросло»
                                                                  В процентном соотношении может быть это и так, но ведь в количественном — выросло, т.к. число статей все-таки увеличивается, не так ли?
                                                                    0
                                                                    ну да, но это нормальный процесс — остальные категории тоже выросли в абсолютных показателях.
                                                                    0
                                                                    Уточните плиз, где можно посмотреть соотношение + и – для статей? Наверное, я тормоз, но вижу только итоговый балл. Но несколько раз слышал, что можно и увидеть, сколько было оценок разного знака.
                                                                      +1
                                                                      Курсор на цифру наведите
                                                                        +1
                                                                        всплывающая подсказка на оценке ;)
                                                                      • НЛО прилетело и опубликовало эту надпись здесь
                                                                          0
                                                                          Еще полно наглого копипаста с новостных лент.
                                                                          На первый раз надо прощать а потом банить
                                                                          +1
                                                                          Ещё интереснее наблюдать вспышки интересов пользователей хабрахабра. В каждом месяце можно вполне найти 2-3 темы/новости которые вызывают всплеск постов или посты которые собирают большое количество комментариев. Например в январе 2009 три дня хабр обсуждал проблемы с ICQ:
                                                                          Screen_shot_2010-01-17_at_21.38.44.png - Picamatic - upload your images

                                                                            +2
                                                                            >«Первое, что приходит в голову — это посчитать среднюю оценку такой статьи.»

                                                                            Есть правда, есть ложь, а есть статистика…

                                                                            На мой взгляд проблемы подсчета в том, что учитываются абсолютные, а не относительные показатели. Выкладки было бы более правильно представлять учитывая аудиторию Хабра — если нет данных о посещении хабра зарегистрированными пользователями, можно было бы учитывать хотя бы _количество_ зарегистрированных пользователей. Для этого надо было бы написать бота, который бы пролистал юзверей всех, и выдернул из профилей даты регистрации.
                                                                            И потом, имея на руках количество «голосующих юзверей» юзверей, можно было бы учитывать _реальный_ рейтинг статей, так как подавляющее большинство юзверей чаще плюсуют топики, чем минусуют. То есть если топик хороший — его плюсанут, если равнодушный/неинтересный топик — мимо него просто пройдут, не трогая.
                                                                              +2
                                                                              это уже запланировано в следующей статье ;)
                                                                              0
                                                                              Действительно графики в статье коррелируются с ростом числа зарегистрированных пользователей. Надо бы это все поделить на количество пользователей на тот момент. И получить например данные на сколько средний юзер начинал больше или меньше плюсовать, минусовать, сколько флеймит и т.п.

                                                                              Кстати если вы будете использовать рейтинг хабра то там есть не все юзеры а только те которые участвуют в рейтинге, а есть которые не участвуют. И их данные просто так не поучить. Их профили надо будет наверно собирать отдельно из комментариев.
                                                                                0
                                                                                Что-то мне подсказывает, что количество таких юзеров исчезающе мало по сравнению с общим количеством.
                                                                                  0
                                                                                  Я как то собирал данные по всем пользователям из рейтинга и в рейтинге только половина :) Если верить верить тому что написано написано справа по середине
                                                                                  Статистика всего пользователей: 52047
                                                                                  В рейтинге я насчитал 24049 юзера т.е. 46%
                                                                                  И несколько раз видел юзеров которые не участвуют в рейтинге. Прямо так и написано в профиле) Вот их и надо где-то найти)
                                                                                    0
                                                                                    Но можно же имея данные о дате регистрации половины юзеров, подкорректировать это число с учетом всех.

                                                                                    P.S. Интересно, а как перестать участвовать в рейтинге хабралюдей?
                                                                                      0
                                                                                      Возможно те люди просто отхабренные но половина для них слишком много.
                                                                                      • НЛО прилетело и опубликовало эту надпись здесь
                                                                                          +1
                                                                                          Похоже на правду.
                                                                                          Помню как минимум 1 пользователя, который не участвовал в рейтинге — так сейчас он немного в + задался, сразу и в рейтинг попал.
                                                                                  0
                                                                                  Не увидел самого главного — вашего вердикта. Хабр все-таки торт?
                                                                                    +1
                                                                                    Я решил, что будет лучше, если каждый сам даст себе ответ на этот вопрос :)
                                                                                    0
                                                                                    Статья какбе говорит нам, что хабр торт.
                                                                                      0
                                                                                      А откровенно слабые статьи, которые почему-то набирают очки и попадают на главную, мне говорят совсем об обратном.
                                                                                    • НЛО прилетело и опубликовало эту надпись здесь

                                                                                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                                      Самое читаемое