kal1sha Jan 26 2010 at 17:39

Рекомендации друзей для социальных сетей

2 min

1.8K

PHP *

+20

Comments 46

Zzet Jan 26 2010 at 17:54

Также подходит для сайтов знакомств )

0lympian Jan 26 2010 at 18:34

Есть теория, что в знакомствах наоборот, интересен антипод (ну наверное не во всех, но как минимум в некоторых отношениях) :D

Lite Jan 27 2010 at 07:40

Это насчёт пола? Популярная теория. :)

v_k Jan 27 2010 at 10:01

тогда число, наибольшее по модулю и будет решением.

akalend Jan 27 2010 at 23:49

алгоритм сваха

UFO landed and left these words here

Ferroman Jan 26 2010 at 18:51

июль?

HDg Jan 26 2010 at 19:12

Анализ данных скорее

dizzyman Jan 27 2010 at 07:33

Матан = Математический анализ

HDg Jan 27 2010 at 07:35

Та вы что!!! У нас на примате (конечно же) такого предмета не было :(

З.Ы. Матан и анализ данных — немного разные вещи

akalend Jan 27 2010 at 23:50

это Статистический анализ, иногда упрощенно Статистика.
а матан — Математический Анализ.
разделяй и властвуй!

deniamnet Jan 29 2010 at 12:05

видимо, Вы не знаете, что такое матан

dizzyman Jan 29 2010 at 20:25

Это вы мне? Странно, а я вроде даже такие лекции посещал… специальность 230105, 2 семестр.

dizzyman Jan 29 2010 at 20:30

P.S.: Я, не в коем случае, не утверждаю что написанное в посте относится к математическому анализу :)

AlphaLight Jan 27 2010 at 07:39

Математическая статистика, курс то ли 2, то ли 3 :)

TuKTeeK Jan 26 2010 at 18:41

Осталось интересы с циферками сопоставить.

kal1sha Jan 26 2010 at 18:42

а что сложного?

SmartT Jan 27 2010 at 13:44

ага, как раз такой сервис уже делаю))) hrumm.ru

Megazoll Jan 26 2010 at 18:45

Наверное, блог «Социальные сети» подойдет лучше.

kal1sha Jan 26 2010 at 18:46

код на php

HDg Jan 26 2010 at 19:13

та хоть на brainfuck
тематика-то то у него про социальные сети

kal1sha Jan 26 2010 at 19:24

Этот алгоритм применяют в экономике, биологии и во многих других областях.

Megazoll Jan 28 2010 at 06:30

Тема поста «Рекомендации друзей для социальных сетей», не думаю что это применяется в биологии или где-то еще.

akalend Jan 28 2010 at 18:32

имеется ввиду не тема, а математические (статистические) методы. А, область их приложения может быть сколь угодно широка (как страна моя родная).

UFO landed and left these words here

akalend Jan 27 2010 at 23:53

согласен, в соцсетях на ура пойдет!
но все равно приятно,
что статистический анализ хоть кто-то на практике применяет.

necromant2005 Jan 26 2010 at 18:51

Сложность алгоритма какая? O(n^2)
намного инетресснее где сложность алгорима максимально стремится хотя бы к O(n)

kal1sha Jan 26 2010 at 18:54

не встречал линейную асимптотику

necromant2005 Jan 26 2010 at 18:57

Просто не вижу смысла в реалтизации алгоритмов с сложностью O(n^2) и выше. Чисто для интереса не более. Приболее менее приемлемом числе n — это займет часы.

kal1sha Jan 26 2010 at 19:02

если хранить многие значение для формулы в полях, то можно его сделать O(n)

maeris Jan 27 2010 at 16:13

Пруфкод алгоритмы линейной сложности в студию, это неочевидно. Крупный проект ваш алгоритм уже не потянет.

И да, засуньте вы содержимое этих циклов в один/два (с препроцессингом), у них же пределы одни и те же. Понять ваши намерения в момент, когда вы создали массивы со степенями и произведениями, я вообще не понял.

Хабраюзерам, которые сейчас радостно минуснут, напомню одну истину. Если бы ученым приходилось доказывать неверность каждой неверной идеи, мы бы дальше паровых машин не ушли бы никогда. До тех пор, пока критикующие не заходят за рамки здоровой критики, автор должен отстаивать точку зрения.

maeris Jan 27 2010 at 16:18

Понять свои намерения, когда я писал этот семантически опасный коммент, я не понял. Мда.

TolicH Jan 26 2010 at 18:55

Забавно, нам в любом случае надо считать для всех N пользователей «похожих» на них. Видимо есть какие-то методы, позволяющие не перебирать всех остальных N для каждого, было бы интересно узнать.

kal1sha Jan 26 2010 at 19:05

1. не все будут ей пользоваться, кто не хочет их и не используем
2. пусть пользователь сам настраивает кто ему надо и с какими интересами
3. если думать, можно много придумать :)

lenis2000 Jan 27 2010 at 07:13

Думаю, что эти методы заключаются в какой-то кластеризации, то есть, разделении пользователей сперва на группы по интересам (это также задача статистики).

Затем к пользователям из одного кластера уже можно применять более сложные и вычислительно затратные методы, чтобы получить более точные рекомендации.

clamps Jan 27 2010 at 08:41

Рекомендую отличную книгу по данной тематике.

multik Jan 27 2010 at 09:05

спасибо за ссылку на книгу.

UFO landed and left these words here

akalend Jan 28 2010 at 00:01

тут выбор невелик: Энтропия регрессии:
либо сложность алгоритма, либо малоэффективный обсчет.
вообще-то все численные алгоритмы можно преспокойно обсчитать в бэдграундовом процессе, даже на отдельном сервере используя С++ и пара миллионов пользователей не будет пределом
а РНР использовать фронтэндом, для чего он впрочем и предназначен.

xyz Jan 27 2010 at 05:25

Также ето коофициент кореляции, кажется

kal1sha Jan 27 2010 at 05:33

да

lazycoder Jan 27 2010 at 06:58

Замечательная статья, но «тем более вероятнее» — так не говорят, либо более вероятно, либо просто вероятнее, если не изменяет память. Да здравствует русский язык!

Ino Jan 27 2010 at 07:11

А при близости к -1 можно рекомендовать врагов.

lenis2000 Jan 27 2010 at 07:14

Может, это не враги, а наоборот, человеку бывает интересно пообщаться с новыми людьми… Технарям с филологами, и так далее :)

v_k Jan 27 2010 at 10:13

а по какой формуле высчитывать рейтинг, имея эти данные?

akalend Jan 28 2010 at 19:26

а, вообще метод расчета очень похож на формирование матрицы расстояний в многомерном пространстве.
расчитываем расстояния меджу точками (критерии предпочтений).
Какие точки ближе всего, те — наши Друзья :)