kal1sha26 янв 2010 в 17:39

Рекомендации друзей для социальных сетей

2 мин

1.8K

PHP *

+20

Комментарии 46

Zzet 26 янв 2010 в 17:54

Также подходит для сайтов знакомств )

0lympian 26 янв 2010 в 18:34

Есть теория, что в знакомствах наоборот, интересен антипод (ну наверное не во всех, но как минимум в некоторых отношениях) :D

Lite 27 янв 2010 в 07:40

Это насчёт пола? Популярная теория. :)

v_k 27 янв 2010 в 10:01

тогда число, наибольшее по модулю и будет решением.

akalend 27 янв 2010 в 23:49

алгоритм сваха

НЛО прилетело и опубликовало эту надпись здесь

Ferroman 26 янв 2010 в 18:51

июль?

HDg 26 янв 2010 в 19:12

Анализ данных скорее

dizzyman 27 янв 2010 в 07:33

Матан = Математический анализ

HDg 27 янв 2010 в 07:35

Та вы что!!! У нас на примате (конечно же) такого предмета не было :(

З.Ы. Матан и анализ данных — немного разные вещи

akalend 27 янв 2010 в 23:50

это Статистический анализ, иногда упрощенно Статистика.
а матан — Математический Анализ.
разделяй и властвуй!

deniamnet 29 янв 2010 в 12:05

видимо, Вы не знаете, что такое матан

dizzyman 29 янв 2010 в 20:25

Это вы мне? Странно, а я вроде даже такие лекции посещал… специальность 230105, 2 семестр.

dizzyman 29 янв 2010 в 20:30

P.S.: Я, не в коем случае, не утверждаю что написанное в посте относится к математическому анализу :)

AlphaLight 27 янв 2010 в 07:39

Математическая статистика, курс то ли 2, то ли 3 :)

TuKTeeK 26 янв 2010 в 18:41

Осталось интересы с циферками сопоставить.

kal1sha 26 янв 2010 в 18:42

а что сложного?

SmartT 27 янв 2010 в 13:44

ага, как раз такой сервис уже делаю))) hrumm.ru

Megazoll 26 янв 2010 в 18:45

Наверное, блог «Социальные сети» подойдет лучше.

kal1sha 26 янв 2010 в 18:46

код на php

HDg 26 янв 2010 в 19:13

та хоть на brainfuck
тематика-то то у него про социальные сети

kal1sha 26 янв 2010 в 19:24

Этот алгоритм применяют в экономике, биологии и во многих других областях.

Megazoll 28 янв 2010 в 06:30

Тема поста «Рекомендации друзей для социальных сетей», не думаю что это применяется в биологии или где-то еще.

akalend 28 янв 2010 в 18:32

имеется ввиду не тема, а математические (статистические) методы. А, область их приложения может быть сколь угодно широка (как страна моя родная).

НЛО прилетело и опубликовало эту надпись здесь

akalend 27 янв 2010 в 23:53

согласен, в соцсетях на ура пойдет!
но все равно приятно,
что статистический анализ хоть кто-то на практике применяет.

necromant2005 26 янв 2010 в 18:51

Сложность алгоритма какая? O(n^2)
намного инетресснее где сложность алгорима максимально стремится хотя бы к O(n)

kal1sha 26 янв 2010 в 18:54

не встречал линейную асимптотику

necromant2005 26 янв 2010 в 18:57

Просто не вижу смысла в реалтизации алгоритмов с сложностью O(n^2) и выше. Чисто для интереса не более. Приболее менее приемлемом числе n — это займет часы.

kal1sha 26 янв 2010 в 19:02

если хранить многие значение для формулы в полях, то можно его сделать O(n)

maeris 27 янв 2010 в 16:13

Пруфкод алгоритмы линейной сложности в студию, это неочевидно. Крупный проект ваш алгоритм уже не потянет.

И да, засуньте вы содержимое этих циклов в один/два (с препроцессингом), у них же пределы одни и те же. Понять ваши намерения в момент, когда вы создали массивы со степенями и произведениями, я вообще не понял.

Хабраюзерам, которые сейчас радостно минуснут, напомню одну истину. Если бы ученым приходилось доказывать неверность каждой неверной идеи, мы бы дальше паровых машин не ушли бы никогда. До тех пор, пока критикующие не заходят за рамки здоровой критики, автор должен отстаивать точку зрения.

maeris 27 янв 2010 в 16:18

Понять свои намерения, когда я писал этот семантически опасный коммент, я не понял. Мда.

TolicH 26 янв 2010 в 18:55

Забавно, нам в любом случае надо считать для всех N пользователей «похожих» на них. Видимо есть какие-то методы, позволяющие не перебирать всех остальных N для каждого, было бы интересно узнать.

kal1sha 26 янв 2010 в 19:05

1. не все будут ей пользоваться, кто не хочет их и не используем
2. пусть пользователь сам настраивает кто ему надо и с какими интересами
3. если думать, можно много придумать :)

lenis2000 27 янв 2010 в 07:13

Думаю, что эти методы заключаются в какой-то кластеризации, то есть, разделении пользователей сперва на группы по интересам (это также задача статистики).

Затем к пользователям из одного кластера уже можно применять более сложные и вычислительно затратные методы, чтобы получить более точные рекомендации.

clamps 27 янв 2010 в 08:41

Рекомендую отличную книгу по данной тематике.

multik 27 янв 2010 в 09:05

спасибо за ссылку на книгу.

НЛО прилетело и опубликовало эту надпись здесь

akalend 28 янв 2010 в 00:01

тут выбор невелик: Энтропия регрессии:
либо сложность алгоритма, либо малоэффективный обсчет.
вообще-то все численные алгоритмы можно преспокойно обсчитать в бэдграундовом процессе, даже на отдельном сервере используя С++ и пара миллионов пользователей не будет пределом
а РНР использовать фронтэндом, для чего он впрочем и предназначен.

xyz 27 янв 2010 в 05:25

Также ето коофициент кореляции, кажется

kal1sha 27 янв 2010 в 05:33

да

lazycoder 27 янв 2010 в 06:58

Замечательная статья, но «тем более вероятнее» — так не говорят, либо более вероятно, либо просто вероятнее, если не изменяет память. Да здравствует русский язык!

Ino 27 янв 2010 в 07:11

А при близости к -1 можно рекомендовать врагов.

lenis2000 27 янв 2010 в 07:14

Может, это не враги, а наоборот, человеку бывает интересно пообщаться с новыми людьми… Технарям с филологами, и так далее :)

v_k 27 янв 2010 в 10:13

а по какой формуле высчитывать рейтинг, имея эти данные?

akalend 28 янв 2010 в 19:26

а, вообще метод расчета очень похож на формирование матрицы расстояний в многомерном пространстве.
расчитываем расстояния меджу точками (критерии предпочтений).
Какие точки ближе всего, те — наши Друзья :)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий