VRus Apr 24 2011 at 18:08

Проблемы обобщения PageRank

4 min

2.1K

Comments 10

ofiginuri Apr 24 2011 at 18:20

Не понятен посыл топика.
Есть формула расчёта PR, есть куча неквантифицируемых данных. Алгоритм работает со значительным усреднением, вы хотите идеала? :) Среди графа в 100млрд связей? :)

«С учетом сказанного, данная проблематика относится, по-видимому, к развивающейся ныне области Dynamic network analysis. » Вы уж простите, но подобная фраза из разряда — «для того, чтобы было». Анализ взаимосвязей знания и совокупностей знаний — давняя проблема человека, сейчас он применяет численных, переборные методы, но они, к сожалению (или к счастью) не показывают даже приблизительной картины.

ofiginuri Apr 24 2011 at 18:21

seo-шнигэ такие сеошнигэ, всегда ищут смысл там, где его очень мало.

-2

VRus Apr 24 2011 at 18:25

Я просто нахожу задачу интересной, направление перспективным, а готового решения не вижу. Есть готовая формула для PageRank, но топик и посвящен проблематичности её прямого применения. И кстати я не сеошнег ни разу )

ofiginuri Apr 24 2011 at 18:30

А готового решения нет, все алгоритмы подсчёта популярности наталкиваются на человеческий фактор. Что и показывает опыт применения PageRank от Брина и Пейджа (спам, линкфермы, продажа ссылок).

VRus Apr 24 2011 at 18:36

Ну не сразу же наталкиваются. Сеошники появились позже на фоне популярности поисковых сервисов. Вот и здесь то же; я предвижу популярность ранжирования людей не меньшую, чем ранжирование сайтов, и да, на этой волне тоже появятся свои оптимизаторы. Но это проблема завтрашнего дня. Сегодняшняя проблема — как PeopleRank посчитать. Хотя бы для начала в идеальных условиях отсутствия сеошников.

ofiginuri Apr 24 2011 at 19:20

Нет, seo-шники были всегда, кто-то и в 19 веке ссылался на учёного типа Петрика и говорил — знаешь что он там «лабает»? Это мир перевернёт, ну и.т.д.

RomanL Apr 24 2011 at 18:56

Есть модифицированные алгоритмы взвешенного PageRank'а. Согласование весов, конечно, тоже задача. Кстати, по пункту 3 — обратнопропорциональная раздача ранков еще не означает их взвешенности, это просто свойство алгоритма, как мне кажется.

Есть еще другие метрики для графов: центральность, коэффициент кластеризации. Для орграфов тут вообще еще есть над чем думать. Можно намутить много всего :)

VRus Apr 24 2011 at 19:20

По пункту 3 вы наверное правы. Просто хотел сказать, что в гугломатрице записано больше информации, чем в просто в adjacency matrix, и она сродни информации о весах.

Насчет других метрик тоже согласен, но с их применением вроде нет проблем. Бери как говорится да считай. Единственная проблема, что объем вычислений говорят пропорционален кубу от количества узлов сети )) Но думается совсем всех считать необязательно. Как говорил один гуглер, большое значение имеет только топ. Конечный рейтинг людей думаю должен быть суммой разных центральностей. И прочих факторов, если конечно эти дополнительные факторы не будут уже учтены в разнородности сети.

RomanL Apr 24 2011 at 19:42

Там одинаковое количество информации: из adjacency можно получить гугломатрицу проведя итерации pagerank'а.

Чтобы получить топ иногда надо просчитать весь граф :)

VRus Apr 24 2011 at 21:11

Грубыми сравнительно дешевыми методами считаем всех, а потом более точными и затратными считаем все более и более топовых.

Про adjacency не соображу сразу что за итерации, может можно одно из другого получить. Но суть сказанного это вроде не меняет?

Show the best of all time