Проблема в том, что на хабре нет ни единого места, где есть список пользователей, который бы не изменялся от запроса к запросу.
Я собирал пользователей отсюда, надеясь на то что это наиболее постоянное место. Но тем не менее, с каждым новым проходом по всем страницам, я получал новых пользователей. При контрольной сборке таких проходов было три.
Вероятно вам не повезло, и вы оказались в числе тех, кто не попался ни разу, уж извините.
Я предполагаю что все дело в кеше Хабра. Я запускаю скрипт в 5 потоков, которые собирают пользователей, начиная с 1, 300, 600, 900 и 1200 страниц рейтинга. Как только происходит какое-то событие, например кому-то карму подняли, то весь рейтинг перестраивается и пользователь, который должен был вот-вот попасть под скан, переходит на страницу, которая у меня отмечена как просканированная.
Чтобы собрать идеально всех, необходимо чтобы вся система «замерла» на момент сканирования, но это ведь невозможно.
Дело в том, что тут никто не говорил о проблемах быть другом. Цель приблуды — это разнообразие и интересность, эксклюзивность если так можно выразиться данного подхода.
Система, на которую я дал ссылку, занимается только тем, что отдает готовые картинки. Система, при помощи которой я рисовал графы, позволяет менять очень много параметров, стрелки же потому и разноцветные, что я так указал.
Я не знаю, буду ли обновлять эти картинки чтобы выверять цветовые комбинации и т.п. Разве что хабра-программисты сделают мне гейт с view из sql с теми данными которые я собираю пару часов :-)
разве они складываются исключительно из голосования?
и разве не может попасть в любимые авторы человек, за топики которого и него самого — ни разу не голосовал?
Давайте так: вы примите во внимание что информация о цвете ссылок только из этого блока. А как именно он строится известно только хабра-менеджерам и хабра-программистам.
Тогда если Вы не можете утверждать о том, что там упомянуты исключительно по принципу голосвания — думаю стоит изменить формулировку в более свободную сторону — нежели
— Чем краснее стрелка тем больше пользователь голосовал за посты человека, к которому она направлена.
— «показывает лишь пользователей, которые голосовали за посты исследуемого»
иначе — лично у меня складывается двоякое впечатление о графах.
Да Вы садист, так над Хабром издеваться — 400000 запросов! Такие штуки по запросу индивидуально для пользователей должны делаться на лету, с кешированием.
а я как то визуализировал своих френдов из контактов, с помощью шарпа и graphvis, вот можно взглянуть hybridization.ru/wp-content/uploads/friends.gif (1.6 мб)
А так — прикольная штука ) надо подумать о том, как бы расположить стрелки равномерно вокруг круга, иначе, где-то пусто, а где-то — густо. Ну и возможно, как-то сделать так, чтобы длинна стрелок тоже что-то означала ;) например, чем юзер больше голосует за автора, тем он к нему ближе :)
Хабра-раскопки: Дружба