Как стать автором
Обновить

Комментарии 40

Под «кланами» ожидал увидеть анализ распределения кармы внутри самих кланов силами их же участников и влияние кланов на карму других пользователей Хабра. Но предполагаю, что эти данные недоступны в API. Данные в статье и без того интересные, правда для начала надо понять как они могут пригодиться)
Вот увидеть бы анализ от самого Хабрахабра. У них-то данных побольше будет)
Можно что-нибудь такое ожидать, deniskin, Shoohurt? :)
Мы с огромным интересом читаем, изучаем и складываем все подобные аналитические публикации + делаем некоторые срезы сами. Другой вопрос, что извлечь пользу из всех этих данных сложнее, чем их собрать. Так что если и выложим что-то подобное, то только когда найдем этим данным достойное применение.
Был опыт комментирования одного околополитического проекта. Все кто высказывал сомнение в проекте, нахватали охапку минусов. Это первое. Второе, и оно подтверждает первое — журналисты в пабликах пишут, что написание статьи на Хабре нужно снабжать поддержкой местных пользователей. Так что, применение — борьба с манипуляцией кармой и рейтингом.
Интересно, а применим ли здесь опыт других площадок (e.g., reddit) против «бригадного голосования»? Или этим вопросом никто особо не занимался?
Судя по участившимся, на мой взгляд, статьям о самом Хабре, развивающееся Хабрасообщество начинает формулировать «Я-концепцию» :)
Было бы интересно узнать, каким Хабр видит своё «Я-идеальное».
Коллективный разум начинает задаваться вопросом «кто я» и пытается найти на него ответ.
>> Судя по участившимся, на мой взгляд, статьям о самом Хабре, развивающееся Хабрасообщество начинает формулировать «Я-концепцию»

Больше похоже на барахтанье человека, сброшенного в реку, но не умеющего плавать.

>> Было бы интересно узнать, каким Хабр видит своё «Я-идеальное».

Хабр определённо был ближе к идеалу в период до разделения на три ресурса и кармического ограбления.
В геополитической матрице заметна диагональ землячества.
  1. Интересен график статистической активности юзера на Хабре(число сообщений и комментариев) от числа минусов ему в карму и в коментарии, налицо явная зависимость и избыточное использование её хабре. Явно видная в активности новичков, стухающих после пары-тройки статей.

  2. Пожелание: Логично бы давать ограниченный месячный кредит минусов(независимый от кармы, ибо интересна общая активность, а не активность самых активных). При превышении кредита минусы вычитаются из собственной кармы проставляющего, к примеру одна единичка собственной кармы за два проставленных минуса, тогда бы отсутствовала огульная незадумчивая простановка оных

  3. Возможно на Хабрахабр нужен снова объединяющий топ-дайжест наиболее интересных статей: из Хабрахабр, Мегамозг, Geektimes,
    Поскольку и посещаемость упала и бегать по нескольким ресурсам менее удобно
Возможно на Хабрахабр нужен снова объединяющий топ-дайжест наиболее интересных статей
tmfeed.ru/#/posts/top/daily?
Хабрахабр, Мегамозг, Geektimes, — ссылки вверху, по ним намного легче перейти чем искать в закладках эту ссылку (хотя вставил её в закладки, спасибо)
Имелось ввиду данный топ аналогично хотя бы в левом-правом сайдбаре, именно переход по перекресным ссылкам и носил бы объединяющую роль.
2. Данный топ: tmfeed.ru/#/posts/top/daily — невзрачный, можно было б при наведении выдавать всплывающее окно типичного начала темки с картинками(до ката). Само название тем редко в полноте отражает содержание, а вот авторский текст до ката именно максимально желает привлечь под кат и раскрывает направление
Хабрахабр, Мегамозг, Geektimes, — ссылки вверху, по ним намного легче перейти чем искать в закладках эту ссылку (хотя вставил её в закладки, спасибо)
Ссылка на TM Feed тоже сверху, слева от ссылки «Хабрахабр».
2. Данный топ: tmfeed.ru/#/posts/top/daily — невзрачный, можно было б при наведении выдавать всплывающее окно типичного начала темки с картинками(до ката).
Ну, видимо, там такой формат. Что же, повод делать более ёмкие заголовки.
Видимо я еще не привык к разделению,
Удобнее, как мне кажется, это псевдоразделение можно было бы сделать тремя горизонтальными слайдерами на единой странице: Хабрахабр, Мегамозг, Geektimes, в которых темы бы прокручивались горизонтально по наведению на правый левый край, значительно сократилось число переходов с ожиданием прогрузки-рендинга и прокруток мышью
А нет статистики получения инвайтов по годам?
Есть подозрение, что новые хабраюзеры перестали появляться вместе со спадом в рейтинге после отделения ГТ и банов. "Лучшие публикации" обрываются на рейтинге 162, но там всего 25 статей от 2015 года и ни одной от 2016.
На странице пользователя есть дата приглашения, но я её не извлекал. Но мне кажется что статистика будет примерно такой (из косвенных соображений):
2008 — 0.5K
2009 — 4.5K
2010 — 6K
2011 — 4K
2012 — 2K
2013 — 1.5K
2014 — 1K
2015 — 0.7K
А почему не выложить все данные на github? Например, список всех "физических" пользователей вполне себе полезный датасет.
А я выложил. По ссылке в статье есть файл karma.txt, в котором следующие поля: NAME; KARMA; COUNTRY; REGION; CITY; FIRST_DATE; LAST_DATE; INVITED_BY; INVITED. Если кто-то хочет распарсить ещё другой информации, как и сказал, могу выслать архив с html-ками.
А, ок! Почему-то подумал, что по какой-то причине часть собранных данных "только по запросу", что показалось странным.
Есть ещё список из 530K пользователей, в котором over-много read-only. Могу и его выложить.
Надо же, только на прошлой неделе ходил по длинной цепочке приглашенных и думал, что еще никто не выкладывал подобный анализ..
Список подписчиков я нашел по ссылке
habrahabr.ru/users/mkot/subscription/followers
так что он есть.
теперь давай заимпрувим алгоритм — заходим на эту страницу и смотрим какой респонс присылает сервер.
так рекурсивно обходим подписчиков.
точки входа нарезать статьи и авторов по страницам по новее постарше.
Далее фильтруем на свежак. То есть тех кто оставил комментарий в 2016 году. Хотя бы комментарий.
Вот теперь переделываем кластеризацию хабрабабр-юзеров и ищем самые часто упоминаемые слова в каждом кластере.
Лучше даже в ближнем круге по центроиду. Тупой map/reduce анализ терминов.
Дальше еще круче. Допустим, некий кластер упоминает некую компания А или еще какую бяку — значит это мафия компании А
например.
В жж была такая проблема резкий всплеск рекламный статей от кластера юзеров. Эта та же проблема в обратную сторону — берем всплеск слова на хабре и ищем какой кластер зарядил и возможно находим промоутеров.
С таким заголовком ожидал ещё одного графика: количество хабракотов в каждом клане.
Главный вывод, который я сделал из этих данных.
Инвайты — инструмент, работающий на этапе первоначального роста аудитории ресурса. В дальнейшем его значение постепенно сходит к нулю.
Да, я забыл об этом написать в статье, но мне такая же мысль в голову пришла, когда писал.
Приглашение — один из инструментов пресловутой саморегуляции, обеспечивающий (пусть и не идеально) однородность и адекватность аудитории. На мой взгляд, этот инструмент работает на любом этапе, просто по мере роста численности аудитории механизм "расшатывается", вследствие чего однородность и адекватность несколько разбавляется. Это можно назвать проблемой, да, но я бы не сказал, что значение приглашений при этом сводится к нулю.
При всём этом какой-то внутренней войны кланов на Хабре или влияния некоторого хабровского клана на внешний мир как-то не видно. Т.е. люди из "клана", вероятно, общаются и следят на публикациями друг друга, но такого чтобы "сегодня в 15:00 клан davekeinz захватил хаб Python, выдавив оттуда давно засевший там клан kukutz. В данный момент по заявлениям пресс-службы последнего происходит перегруппировка сил с целью контр-атаки. Возможен временный альянс с кланом XaocCPS, за что ему обещано 10 инвайтов и поддержка пяти следующих статей голосованием и комментариями. Мы следим за развитием событий." — такого нету (а жаль!).
Когда я получил инвайт на старом, ныне почившем аккаунте (года 3 назад), примерно так и было. Мне писали какие-то личности с предложением подкинуть кармы и дальнейшего «крышевания» в обмен на плюсование или сливание тех, на кого укажут. Подполье прям.
Прямое нарушение правил, между прочим..
В самом начале даже была тема в Q&A, где делились кармой.
Новость о разделении Хабра:
«Сегодня Администрация сделала предложение, от которого сообщество не смогло отказаться.»
такого нету (а жаль!) и слава богу!
Огонь!
Попытка — не пытка: mkot, может выложите саму БД, чтобы мы тоже поисследовали? :))
А чо, раньше не были?
хабр любит статьи о хабре)
Прикольно, что я оказался в двух топах, хотя пригласил только alrusdi, который пригласил только 3-х человек, каждый из которых вообще никого не пригласил. То есть, от меня отпочковалось только 4 "потомка".

Дело в том, что мой инвайт для alrusdi был для него повторным (его в своё время переводили в readonly и я позвал его на сайт снова). А впервые его пригласил mudhoney, который действительно стоит на вершине второй по величине сетевой пирамиды. Собственно, с ним я и соседствую на одной строчке в этих рейтингах.

Благодаря тому, что и я и mudhoney пригласили на сайт одного и того же человека, вес mudhoney присвоился и мне.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации