Pull to refresh

Про социальный поиск без картинок

Reading time 2 min
Views 1.6K
В чем идея?

Обработать ссылки, выданные поисковиком на предмет упоминания в социальных сетях, приложить немного математики и выстроить их в несколько ином порядке чем предлагает гугл. В основе изначально лежал алгоритм по которому высчитывает свои тренды reddit.com. На самом деле алгоритм достаточно заезжен и многократно описан, но в то же время реально работающий. Проблем состояла в том, что он основан на плюсах и минусах, а у нас изначально только плюсы, то есть мы обладаем только лайками и твитами. Поэтому минусы я заменил количеством посетителей сайта. Идея, если сильно утрировать, примерно та же: количество посетителей минус лайки и чем меньше полученная цифра тем выше ее статус.


За основу взял поисковую выдачу Google и Bing. В качестве социальной составляющей Facebook и Twitter (хотелось бы больше участников, но у других что то совсем плохо с API). В качестве количества посетителей API Alexa.

Далее берем упомянутую выше формулу и прогоняем каждую полученную ссылку с поисковика через нее:

image

Глупо было бы не использовать алгоритмы ранжирования непосредственно самих поисковиков. Поэтому полученный результат еще поделил на поисковый коэффициент который высчитывается предельно просто:

google+bing

Далее следует просто отсортировать полученные результаты и вывести на пользователя (я решил выводить только первые 15 результатов)

За вечер закодил, запустил, посмотрел и решил, что это должны увидеть и за пределами localhost. В принципе результаты в какой то мере были ожидаемы. Я всегда догадывался, что SEO не останавливается на достигнутом, но что лайки могут внести такой диссонанс в выдачу я не ожидал.

Так что же получилось?

Получилось то, что ожидалось и хотелось получить. То есть, если вы ищите квартиру в Москве, то и там и там вы увидите риэлторские канторы. Но в первом случае впереди будут те в которых чаще упоминается недвижимость, а во втором случае те на которые больше лайков и твитов. Результаты с публичными личностями тоже воодушевляют, негатив народ явно любит больше.

Результаты работы можно увидеть на mfrscc.appspot.com. Предвкушая вопрос сразу отвечу эти буквы ни чего не значат. Просто при регистрации домена случайным образом были набраны 5 букв и к счастью домен оказался свободен.

С какими проблемами вы можете столкнутся?

Возможны баги, эксепшены и перебои(тормоза) с хостингом. В IE не работает. Ну и сами понимает, что работает гораздо медленней гугла по понятным причинам.

За лайки отдельная благодарность.
Tags:
Hubs:
+29
Comments 22
Comments Comments 22

Articles