Как стать автором
Обновить

Комментарии 46

Также подходит для сайтов знакомств )
Есть теория, что в знакомствах наоборот, интересен антипод (ну наверное не во всех, но как минимум в некоторых отношениях) :D
Это насчёт пола? Популярная теория. :)
тогда число, наибольшее по модулю и будет решением.
алгоритм сваха
НЛО прилетело и опубликовало эту надпись здесь
июль?
Анализ данных скорее
Матан = Математический анализ
Та вы что!!! У нас на примате (конечно же) такого предмета не было :(

З.Ы. Матан и анализ данных — немного разные вещи
это Статистический анализ, иногда упрощенно Статистика.
а матан — Математический Анализ.
разделяй и властвуй!
видимо, Вы не знаете, что такое матан
P.S.: Я, не в коем случае, не утверждаю что написанное в посте относится к математическому анализу :)
Математическая статистика, курс то ли 2, то ли 3 :)
Осталось интересы с циферками сопоставить.
а что сложного?
ага, как раз такой сервис уже делаю))) hrumm.ru
Наверное, блог «Социальные сети» подойдет лучше.
код на php
та хоть на brainfuck
тематика-то то у него про социальные сети
Этот алгоритм применяют в экономике, биологии и во многих других областях.
Тема поста «Рекомендации друзей для социальных сетей», не думаю что это применяется в биологии или где-то еще.
имеется ввиду не тема, а математические (статистические) методы. А, область их приложения может быть сколь угодно широка (как страна моя родная).
НЛО прилетело и опубликовало эту надпись здесь
согласен, в соцсетях на ура пойдет!
но все равно приятно,
что статистический анализ хоть кто-то на практике применяет.
Сложность алгоритма какая? O(n^2)
намного инетресснее где сложность алгорима максимально стремится хотя бы к O(n)
не встречал линейную асимптотику
Просто не вижу смысла в реалтизации алгоритмов с сложностью O(n^2) и выше. Чисто для интереса не более. Приболее менее приемлемом числе n — это займет часы.
если хранить многие значение для формулы в полях, то можно его сделать O(n)
Пруфкод алгоритмы линейной сложности в студию, это неочевидно. Крупный проект ваш алгоритм уже не потянет.

И да, засуньте вы содержимое этих циклов в один/два (с препроцессингом), у них же пределы одни и те же. Понять ваши намерения в момент, когда вы создали массивы со степенями и произведениями, я вообще не понял.

Хабраюзерам, которые сейчас радостно минуснут, напомню одну истину. Если бы ученым приходилось доказывать неверность каждой неверной идеи, мы бы дальше паровых машин не ушли бы никогда. До тех пор, пока критикующие не заходят за рамки здоровой критики, автор должен отстаивать точку зрения.
Понять свои намерения, когда я писал этот семантически опасный коммент, я не понял. Мда.
Забавно, нам в любом случае надо считать для всех N пользователей «похожих» на них. Видимо есть какие-то методы, позволяющие не перебирать всех остальных N для каждого, было бы интересно узнать.
1. не все будут ей пользоваться, кто не хочет их и не используем
2. пусть пользователь сам настраивает кто ему надо и с какими интересами
3. если думать, можно много придумать :)
Думаю, что эти методы заключаются в какой-то кластеризации, то есть, разделении пользователей сперва на группы по интересам (это также задача статистики).

Затем к пользователям из одного кластера уже можно применять более сложные и вычислительно затратные методы, чтобы получить более точные рекомендации.
Рекомендую отличную книгу по данной тематике.
спасибо за ссылку на книгу.
НЛО прилетело и опубликовало эту надпись здесь
тут выбор невелик: Энтропия регрессии:
либо сложность алгоритма, либо малоэффективный обсчет.
вообще-то все численные алгоритмы можно преспокойно обсчитать в бэдграундовом процессе, даже на отдельном сервере используя С++ и пара миллионов пользователей не будет пределом
а РНР использовать фронтэндом, для чего он впрочем и предназначен.
Также ето коофициент кореляции, кажется
да
Замечательная статья, но «тем более вероятнее» — так не говорят, либо более вероятно, либо просто вероятнее, если не изменяет память. Да здравствует русский язык!
А при близости к -1 можно рекомендовать врагов.
Может, это не враги, а наоборот, человеку бывает интересно пообщаться с новыми людьми… Технарям с филологами, и так далее :)
а по какой формуле высчитывать рейтинг, имея эти данные?
а, вообще метод расчета очень похож на формирование матрицы расстояний в многомерном пространстве.
расчитываем расстояния меджу точками (критерии предпочтений).
Какие точки ближе всего, те — наши Друзья :)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории