Pull to refresh

Comments 10

Не понятен посыл топика.
Есть формула расчёта PR, есть куча неквантифицируемых данных. Алгоритм работает со значительным усреднением, вы хотите идеала? :) Среди графа в 100млрд связей? :)

«С учетом сказанного, данная проблематика относится, по-видимому, к развивающейся ныне области Dynamic network analysis. » Вы уж простите, но подобная фраза из разряда — «для того, чтобы было». Анализ взаимосвязей знания и совокупностей знаний — давняя проблема человека, сейчас он применяет численных, переборные методы, но они, к сожалению (или к счастью) не показывают даже приблизительной картины.
seo-шнигэ такие сеошнигэ, всегда ищут смысл там, где его очень мало.
Я просто нахожу задачу интересной, направление перспективным, а готового решения не вижу. Есть готовая формула для PageRank, но топик и посвящен проблематичности её прямого применения. И кстати я не сеошнег ни разу )
А готового решения нет, все алгоритмы подсчёта популярности наталкиваются на человеческий фактор. Что и показывает опыт применения PageRank от Брина и Пейджа (спам, линкфермы, продажа ссылок).
Ну не сразу же наталкиваются. Сеошники появились позже на фоне популярности поисковых сервисов. Вот и здесь то же; я предвижу популярность ранжирования людей не меньшую, чем ранжирование сайтов, и да, на этой волне тоже появятся свои оптимизаторы. Но это проблема завтрашнего дня. Сегодняшняя проблема — как PeopleRank посчитать. Хотя бы для начала в идеальных условиях отсутствия сеошников.
Нет, seo-шники были всегда, кто-то и в 19 веке ссылался на учёного типа Петрика и говорил — знаешь что он там «лабает»? Это мир перевернёт, ну и.т.д.
Есть модифицированные алгоритмы взвешенного PageRank'а. Согласование весов, конечно, тоже задача. Кстати, по пункту 3 — обратнопропорциональная раздача ранков еще не означает их взвешенности, это просто свойство алгоритма, как мне кажется.

Есть еще другие метрики для графов: центральность, коэффициент кластеризации. Для орграфов тут вообще еще есть над чем думать. Можно намутить много всего :)
По пункту 3 вы наверное правы. Просто хотел сказать, что в гугломатрице записано больше информации, чем в просто в adjacency matrix, и она сродни информации о весах.

Насчет других метрик тоже согласен, но с их применением вроде нет проблем. Бери как говорится да считай. Единственная проблема, что объем вычислений говорят пропорционален кубу от количества узлов сети )) Но думается совсем всех считать необязательно. Как говорил один гуглер, большое значение имеет только топ. Конечный рейтинг людей думаю должен быть суммой разных центральностей. И прочих факторов, если конечно эти дополнительные факторы не будут уже учтены в разнородности сети.
Там одинаковое количество информации: из adjacency можно получить гугломатрицу проведя итерации pagerank'а.

Чтобы получить топ иногда надо просчитать весь граф :)
Грубыми сравнительно дешевыми методами считаем всех, а потом более точными и затратными считаем все более и более топовых.

Про adjacency не соображу сразу что за итерации, может можно одно из другого получить. Но суть сказанного это вроде не меняет?
Sign up to leave a comment.

Articles