В чем идея?

Обработать ссылки, выданные поисковиком на предмет упоминания в социальных сетях, приложить немного математики и выстроить их в несколько ином порядке чем предлагает гугл. В основе изначально лежал алгоритм по которому высчитывает свои тренды reddit.com. На самом деле алгоритм достаточно заезжен и многократно описан, но в то же время реально работающий. Проблем состояла в том, что он основан на плюсах и минусах, а у нас изначально только плюсы, то есть мы обладаем только лайками и твитами. Поэтому минусы я заменил количеством посетителей сайта. Идея, если сильно утрировать, примерно та же: количество посетителей минус лайки и чем меньше полученная цифра тем выше ее статус.


За основу взял поисковую выдачу Google и Bing. В качестве социальной составляющей Facebook и Twitter (хотелось бы больше участников, но у других что то совсем плохо с API). В качестве количества посетителей API Alexa.

Далее берем упомянутую выше формулу и прогоняем каждую полученную ссылку с поисковика через нее:

image

Глупо было бы не использовать алгоритмы ранжирования непосредственно самих поисковиков. Поэтому полученный результат еще поделил на поисковый коэффициент который высчитывается предельно просто:

google+bing

Далее следует просто отсортировать полученные результаты и вывести на пользователя (я решил выводить только первые 15 результатов)

За вечер закодил, запустил, посмотрел и решил, что это должны увидеть и за пределами localhost. В принципе результаты в какой то мере были ожидаемы. Я всегда догадывался, что SEO не останавливается на достигнутом, но что лайки могут внести такой диссонанс в выдачу я не ожидал.

Так что же получилось?

Получилось то, что ожидалось и хотелось получить. То есть, если вы ищите квартиру в Москве, то и там и там вы увидите риэлторские канторы. Но в первом случае впереди будут те в которых чаще упоминается недвижимость, а во втором случае те на которые больше лайков и твитов. Результаты с публичными личностями тоже воодушевляют, нег��тив народ явно любит больше.

Результаты работы можно увидеть на mfrscc.appspot.com. Предвкушая вопрос сразу отвечу эти буквы ни чего не значат. Просто при регистрации домена случайным образом были набраны 5 букв и к счастью домен оказался свободен.

С какими проблемами вы можете столкнутся?

Возможны баги, эксепшены и перебои(тормоза) с хостингом. В IE не работает. Ну и сами понимает, что работает гораздо медленней гугла по понятным причинам.

За лайки отдельная благодарность.