kal1sha Jan 26 2010 at 20:39

Рекомендации друзей для социальных сетей

2 min

1.8K

PHP*

+20

Comments 46

Zzet Jan 26 2010 at 20:54

Также подходит для сайтов знакомств )

0lympian Jan 26 2010 at 21:34

Есть теория, что в знакомствах наоборот, интересен антипод (ну наверное не во всех, но как минимум в некоторых отношениях) :D

Lite Jan 27 2010 at 10:40

Это насчёт пола? Популярная теория. :)

v_k Jan 27 2010 at 13:01

тогда число, наибольшее по модулю и будет решением.

akalend Jan 28 2010 at 02:49

алгоритм сваха

UFO landed and left these words here

Ferroman Jan 26 2010 at 21:51

июль?

HDg Jan 26 2010 at 22:12

Анализ данных скорее

dizzyman Jan 27 2010 at 10:33

Матан = Математический анализ

HDg Jan 27 2010 at 10:35

Та вы что!!! У нас на примате (конечно же) такого предмета не было :(

З.Ы. Матан и анализ данных — немного разные вещи

akalend Jan 28 2010 at 02:50

это Статистический анализ, иногда упрощенно Статистика.
а матан — Математический Анализ.
разделяй и властвуй!

deniamnet Jan 29 2010 at 15:05

видимо, Вы не знаете, что такое матан

dizzyman Jan 29 2010 at 23:25

Это вы мне? Странно, а я вроде даже такие лекции посещал… специальность 230105, 2 семестр.

dizzyman Jan 29 2010 at 23:30

P.S.: Я, не в коем случае, не утверждаю что написанное в посте относится к математическому анализу :)

AlphaLight Jan 27 2010 at 10:39

Математическая статистика, курс то ли 2, то ли 3 :)

TuKTeeK Jan 26 2010 at 21:41

Осталось интересы с циферками сопоставить.

kal1sha Jan 26 2010 at 21:42

а что сложного?

SmartT Jan 27 2010 at 16:44

ага, как раз такой сервис уже делаю))) hrumm.ru

Megazoll Jan 26 2010 at 21:45

Наверное, блог «Социальные сети» подойдет лучше.

kal1sha Jan 26 2010 at 21:46

код на php

HDg Jan 26 2010 at 22:13

та хоть на brainfuck
тематика-то то у него про социальные сети

kal1sha Jan 26 2010 at 22:24

Этот алгоритм применяют в экономике, биологии и во многих других областях.

Megazoll Jan 28 2010 at 09:30

Тема поста «Рекомендации друзей для социальных сетей», не думаю что это применяется в биологии или где-то еще.

akalend Jan 28 2010 at 21:32

имеется ввиду не тема, а математические (статистические) методы. А, область их приложения может быть сколь угодно широка (как страна моя родная).

UFO landed and left these words here

akalend Jan 28 2010 at 02:53

согласен, в соцсетях на ура пойдет!
но все равно приятно,
что статистический анализ хоть кто-то на практике применяет.

necromant2005 Jan 26 2010 at 21:51

Сложность алгоритма какая? O(n^2)
намного инетресснее где сложность алгорима максимально стремится хотя бы к O(n)

kal1sha Jan 26 2010 at 21:54

не встречал линейную асимптотику

necromant2005 Jan 26 2010 at 21:57

Просто не вижу смысла в реалтизации алгоритмов с сложностью O(n^2) и выше. Чисто для интереса не более. Приболее менее приемлемом числе n — это займет часы.

kal1sha Jan 26 2010 at 22:02

если хранить многие значение для формулы в полях, то можно его сделать O(n)

maeris Jan 27 2010 at 19:13

Пруфкод алгоритмы линейной сложности в студию, это неочевидно. Крупный проект ваш алгоритм уже не потянет.

И да, засуньте вы содержимое этих циклов в один/два (с препроцессингом), у них же пределы одни и те же. Понять ваши намерения в момент, когда вы создали массивы со степенями и произведениями, я вообще не понял.

Хабраюзерам, которые сейчас радостно минуснут, напомню одну истину. Если бы ученым приходилось доказывать неверность каждой неверной идеи, мы бы дальше паровых машин не ушли бы никогда. До тех пор, пока критикующие не заходят за рамки здоровой критики, автор должен отстаивать точку зрения.

maeris Jan 27 2010 at 19:18

Понять свои намерения, когда я писал этот семантически опасный коммент, я не понял. Мда.

TolicH Jan 26 2010 at 21:55

Забавно, нам в любом случае надо считать для всех N пользователей «похожих» на них. Видимо есть какие-то методы, позволяющие не перебирать всех остальных N для каждого, было бы интересно узнать.

kal1sha Jan 26 2010 at 22:05

1. не все будут ей пользоваться, кто не хочет их и не используем
2. пусть пользователь сам настраивает кто ему надо и с какими интересами
3. если думать, можно много придумать :)

lenis2000 Jan 27 2010 at 10:13

Думаю, что эти методы заключаются в какой-то кластеризации, то есть, разделении пользователей сперва на группы по интересам (это также задача статистики).

Затем к пользователям из одного кластера уже можно применять более сложные и вычислительно затратные методы, чтобы получить более точные рекомендации.

clamps Jan 27 2010 at 11:41

Рекомендую отличную книгу по данной тематике.

multik Jan 27 2010 at 12:05

спасибо за ссылку на книгу.

UFO landed and left these words here

akalend Jan 28 2010 at 03:01

тут выбор невелик: Энтропия регрессии:
либо сложность алгоритма, либо малоэффективный обсчет.
вообще-то все численные алгоритмы можно преспокойно обсчитать в бэдграундовом процессе, даже на отдельном сервере используя С++ и пара миллионов пользователей не будет пределом
а РНР использовать фронтэндом, для чего он впрочем и предназначен.

xyz Jan 27 2010 at 08:25

Также ето коофициент кореляции, кажется

kal1sha Jan 27 2010 at 08:33

да

lazycoder Jan 27 2010 at 09:58

Замечательная статья, но «тем более вероятнее» — так не говорят, либо более вероятно, либо просто вероятнее, если не изменяет память. Да здравствует русский язык!

Ino Jan 27 2010 at 10:11

А при близости к -1 можно рекомендовать врагов.

lenis2000 Jan 27 2010 at 10:14

Может, это не враги, а наоборот, человеку бывает интересно пообщаться с новыми людьми… Технарям с филологами, и так далее :)

v_k Jan 27 2010 at 13:13

а по какой формуле высчитывать рейтинг, имея эти данные?

akalend Jan 28 2010 at 22:26

а, вообще метод расчета очень похож на формирование матрицы расстояний в многомерном пространстве.
расчитываем расстояния меджу точками (критерии предпочтений).
Какие точки ближе всего, те — наши Друзья :)