Pull to refresh
  • by relevance
  • by date
  • by rating

Google не выгоден идеальный поиск?

Lumber room
Такая вот странная мысль родилась. Дело в том, что основной продукт, то за что Google получает деньги, это не поиск, а контекстная реклама.

А если поиск будет идеальным, то кто же тогда будет пользоваться контекстной рекламой?
Total votes 16: ↑11 and ↓5 +6
Views 210
Comments 72

Ссылка — о, сколько в этом слове чудном…

Lumber room
Оптимизаторы знают как важны входящие (референтные?) ссылки (inbound links) для успешной маркетинговой кампании в сети. Не говоря уж о том, что ссылки на ваш сайт — это основа рейтинга от Google.

Читать дальше →
Total votes 6: ↑2 and ↓4 -2
Views 225
Comments 2

Поисковые системы, что-то новенькое

Search engines *
Представляю вашему вниманию мини обзор по найденным мною на этой неделе поисковым системам. Наиболее интересные и полезные с моей точки зрения (но я могу ошибаться) поисковики попали в этот список.


Поисковик по вину. Поисковик предлагает жителям америки здесь же на сайте и купить коллекционное вино. Интерес для меня: посмотреть на рекомендации, почитать, узнать сколько гипотетически бутылка того или иного вина может стоить, что стоит пить, а что нет :) Иногда эти знания важны особенно на томных аристократически интеллектуальных вечерах www.snooth.com

Читать дальше →
Total votes 15: ↑14 and ↓1 +13
Views 1.3K
Comments 11

Sphinx??

Website development *
Думаю многим из вас приходилось когда-либо сталкиваться с прикручиванием поиска, на сайте. Вот и мне по работе, пришлось этим заняться.

В поисках поискового движка, так понял, лидирующие места занимают Lucene и Sphinx.

Но требования следующие (норма):
  • Стабильная работа с русским языком
  • Морфология («гитара» <-> «гитары» <-> «гитар»)
  • Быстродействие
  • Возможность индексировать PG, MySQL и файлы (.html)
  • PHP-API, установка на любом *nix дистрибутиве (FreeBSD, Ubuntu Server)


Выпал случай, поставил Sphinx, настроил (вроде как О_о), проиндексировал базу с каталогом товаров. (включена stemm_enru морфология).

Сортировка по релевантности, жму: «гитара fender», и из БД в первую очередь же он мне выводит струны для гитары фендер, потом уже сами гитары, а должно быть наоборот. Не понимаю, в чем дело, и что за Weight и как их настраивать.

Читал мануал на сайте разработчика, но всё там как то слишком сложно описано, либо я лох)

В общем, уважаемые, помогите пожалуйста разобраться.
Total votes 36: ↑24 and ↓12 +12
Views 3.2K
Comments 64

Amaznode

Interfaces *

Amaznode — это поисковый движок, который не только ищет нужные вам товары на Amazon, но и представляет все похожие товары в виде дерева с ветвями-связями между схожими товарами. Например:


Весьма оригинальный способ представления информации.
Total votes 14: ↑10 and ↓4 +6
Views 550
Comments 8

FF plugin: hot keys для поисковиков

Lumber room
В очередной раз тыкая мышкой в результаты выдачи гугла, поймал себя на мысли, что мне было бы удобней открывать страницы из выдачи с использованием цифровых клавиш, т.е. «1» — первая страница, «2» — вторая и т.д.

Поиск существующих решений не 100% удовлетворения, поэтому решил написать такой небольшой плагинчик сам. Хочу представить то, что получилось, на ваш суд. Может кому пригодится :).
Читать дальше →
Total votes 8: ↑6 and ↓2 +4
Views 214
Comments 7

Вероятно, Apple делает свой поисковик

IT-companies
Западные СМИ сегодня начали активно обсуждать возможность создания компанией Apple своего поисковика.

Первым был TechCrunch (с их статьи всё и началось).
Потом подтянулись CNet news,
ZDNet,
The Washington Post,
AppleInsider,
Search Engine Journal
и еще несколько десятков других изданий.

Что вы думаете на эту тему?
Total votes 8: ↑3 and ↓5 -2
Views 186
Comments 4

Microsoft тестирует новый поиск

Lumber room
image

Kumo — по-японски «облако» и «паук».
А также это кодовое название нового поискового движка Майкрософта, который вчера стал доступен в корпоративной сети для тестирования всеми желающими этого сотрудниками…

Читать немного больше
Total votes 17: ↑11 and ↓6 +5
Views 174
Comments 8

Sphinx и MSsql: проблемы… (fixed: уже нет проблем;-)

Sphinx *
Вчера мы пытались настроить работу между Sphinx и MSsql, начали возникать непонятки)
Версия ПО: Sphinx 0.9.9-rc2
ОС: Windows 2003 Server Standard Edition x86 SP2
БД: MSSQL Server 2008 Enterprise x86 SP1
У используемой базы Collation — Cyrillic_General_CI_AS

С основными настройками и с запуском самого сервиса проблем не возникло.
Читать дальше →
Total votes 2: ↑1 and ↓1 0
Views 2.7K
Comments 7

Математическая поисковая система Uniquation

Self Promo
Mы только что открыли α-тестирование проекта Uniquation. Это математическая поисковая система, которая ищет решения среди уравнений, равенств и прочих математических объектов, размещенных в интернете. На текущем этапе развития её можно мыслить как развивающуюся CAS (wiki). Помимо этого поста про неё можно прочитать в нашей презентации.

image


Читать дальше →
Total votes 100: ↑85 and ↓15 +70
Views 1.7K
Comments 55

google life search

Search engines *
Вчера Гугл анонсировал Живой поиск

Итак, что это и как этим пользоваться? Стал ли поиск более релевантным и удобным для пользователей? Как на него попасть, куда вводить запрос, чтобы видеть живые результаты?

Алгоритм еще обкатывается и пока полноценно работает только для англоязычных запросов. Вы вводите интересующий запрос и видите в результах поиска в середине страницы секцию Latest result for “ваш запрос”. Можете попробовать ввести свой запрос тут.

Например, запрос Obama. Примерно в середине страницы виден блок Последних результатов, которые обновляются в режиме реального времени.

image

Новые результаты по запросу Obama постоянно обновляются и добавляются к результатам поиска. Если эта «бегущая строка» раздражает, можно приостановить, кликнув на “Pause”, но полностью убрать «живой поиск» из результатов нельзя.
Читать дальше →
Total votes 20: ↑8 and ↓12 -4
Views 652
Comments 4

Математическая поисковая система с визуальным вводом формул

Self Promo
Почти полгода назад я написал на хабре статью о проекте математической поисковой системы uniquation.ru. Тогда была получена конструктивная критика, которая помогла улучшить проект.

С тех пор проект претерпел множество изменений, главное из которых — визуальный ввод формул — теперь, чтобы найти информацию о каком либо математическом объекте, необязательно знать его представление в формате TeX.



Под катом рассказ об изменениях, технологиях и влиянии хабра
Total votes 101: ↑89 and ↓12 +77
Views 1.5K
Comments 38

Wolframalpha + Wikipedia = Galois/Wiki

Self Promo
Представьте себе Maple, Maxima или Mathematica, в которой правила работы являются энциклопедическими статьями, и, наоборот, энциклопедию, пополняя которую, вы улучшаете работу системы компьютерной алгебры. Эта идея лежит в основе Galois/Wiki (Галуа/Вики) — математической энциклопедии с интеллектуальным поиском.

image
Читать дальше →
Total votes 53: ↑50 and ↓3 +47
Views 785
Comments 16

Отчет с конференции Lucene Revolution

Search engines *
В начале октября мне удалось побывать на конференции Lucene Revolution, которая проходила в городе-герое Бостоне. Эта конференция была посвящена открытым поисковым технологиям Apache Lucene и Apache Solr. Мне кажется, что на хабре в частности и в рунете в целом этим технологиям уделяется незаслуженно мало внимания. Давайте исправим это упущение.

Читать дальше →
Total votes 41: ↑38 and ↓3 +35
Views 3.6K
Comments 10

Google обвиняет Bing в копировании его поисковой выдачи

IT-companies
Translation


Можно сказать, что Bing извлекает урок из соревнования, но похоже, что он извлекает и чужие поисковые результаты. Представитель Google Амит Сингхал утверждает это, предоставив результаты своей любопытной (если не сказать «очень хитроумной») проверки. Вот как она работает: найди такой запрос, по которому ни в одном поисковике ничего не находится, вручную добавь в Google «страницу-приманку» в качестве результата для этого запроса, затем заставь около 20 сотрудников Google провести поиск и кликнуть по этому результату, используя Internet Explorer с включенными функцией Suggested Sites и тулбаром Bing. Через две недели, по словам Сингхала, достаточное количество (примерно 7-9) из 100 «приманок» повляются и в Bing. Включая результаты диких запросов вроде «mbrzxpgjys», «hiybbprqag» и «indoswiftjobinproduction».

Означает ли это, что Bing «жульничает», как утверждает Сингхал? Эксперимент проводился с включенными тулбаром Bing и/или функцией Suggested Search, а про них прямо сообщается, что они собирают данные для улучшения результатов поиска. И на популярные запросы, в отличие от редких, Bing выдает собственные результаты. Microsoft не ворует приватную информацию, но не является ли это нечестным приемом? Мы думаем, что над этим еще поломают копья.
Total votes 157: ↑133 and ↓24 +109
Views 1.2K
Comments 108

Использование библиотеки для полнотекстового поиска Xapian в Python

Python *
Sandbox
Сегодня, в эпоху Web 2.0, когда контента на сайтах становится все больше и больше, перед разработчиками встает задача реализации полнотекстового поиска.

Вариантов немного:
  • использовать виджеты от разработчиков поисковых систем (Google, Яндекс, etc): легко внедрить, привычный для пользователя интерфейс, поддержка морфологии, исправление слов по словарю, возможно более быстрая индексация сайта поисковыми системами, но, как правило ограниченные возможности по настройке и неизбежное запаздывание индексации;
  • использовать встроенные в СУБД средства (например FULLTEXT-индекс для MySQL): достаточно легко внедрить, актуальный поисковый индекс, полный контроль над настройкой и внешним видом, но, чаще всего очень низкая производительность на больших объемах данных, отсутствие учета морфологии, либо, в худшем случае, полное отсутствие подобных средств в СУБД;
  • использовать отдельную библиотеку/систему полнотекствого поиска.

Третий вариант кажется самым лучшим, ведь он сочетает достоинства двух других вариантов. Правда и здесь не обошлось без недостатков — библиотека требует установки, иногда даже запуска демона (например Sphinx), что может быть неприемлемо.

Решений существует масса, у каждого есть свои достоинства и недостатки. Я бы хотел подробнее остановиться на относительно малоизвестной библиотеке Xapian.
Читать дальше →
Total votes 50: ↑43 and ↓7 +36
Views 8.4K
Comments 19

[Перевод] Теперь поиск Twitter ещё в 3 раза быстрее

High performance *
Sandbox
Мне всегда был интересен Ruby-on-Rails (RoR) и Twitter как яркий представитель платформы на этом framework. 6 апреля этого года в блоге команды Twitter появилась запись о полной смене поисковой платформы с RoR на Java. Под катом перевод о том, как это было.

Я готов жить с этим!
Total votes 63: ↑53 and ↓10 +43
Views 2.8K
Comments 36

Быстрый полнотекстовый поиск ElasticSearch

Website development *
Sandbox
image
При разработке высоконагруженных сайтов или корпоративных систем частенько возникает проблема с разработкой быстрого и удобного поискового движка. Ниже перечислены наиболее важные, на мой взгляд, требования к такому движку:

  • Скорость
  • Простота установки и настройки
  • Цена (желательно бесплатно и с открытым кодом)
  • Обмен информацией в формате JSON (по HTTP)
  • Масштабируемость (возможность распределения на несколько серверов)
  • Индексация в режиме реального времени
  • Multi-tenancy (гибкость в настройках под индивидуального пользователя)
  • Возможность переноса системы в облако

Хочу рассказать вам о новом поисковом движке Elasticsearch, который полностью удовлетворяет всем этим требованиям. В статье будет краткое описание, ссылка на авторитетную презентацию, а также описание установки и работы с ним.
Читать дальше →
Total votes 69: ↑63 and ↓6 +57
Views 210K
Comments 61

Сервис поиска русскоязычных книг для Kindle

Gadgets
Kindle
После того как у меня появился Kindle 3 стала проблема наполнения его книгами на всем нам понятном русском языке. Сама книжка поддерживает кириллицу с коробки, но вот русской раскладки в ней не предусмотрено. Отличная возможность пользоваться встроенным в книгу браузером частично страдает из-за отсутствия русской раскладки.

Конечно, возможно использовать хаки прошивки для локализации устройства, но это не всегда удобно, так как при обновлении прошивки эти хаки придется откатывать назад, вдобавок мы можем потерять гарантию. Подключать же постоянно через USB книгу проводом тоже не удобно, ведь зачем же в конце концов в ней WiFi и 3G? Выходом из сложившейся ситуации может стать русифицированная экранная клавиатура.

За один вечер была найдена подходящая экранная клавиатура написанная на JavaScript и оптимизирована под экран Kindle. Зарегистрировано доменное имя kin3lib.ru для нашего проекта. Сервис перебрасывает поисковый запрос набранный на виртуальной клавиатуре в библиотеку Флибуста, где можно спокойно закачать затем книгу в ее родной mobi формат. В дальнейшем можно реализовать выбор библиотек на которых производить поиск, но, к сожалению, я нашел только одну, которая позволяет скачивать книги в формате mobi. Если кто знает еще такие библиотеки пишите мне.

Мне будет приятно выслушать мнения хабравчан о таком сервисе, а также кто и каким образом решает данную проблему.
Total votes 52: ↑47 and ↓5 +42
Views 14K
Comments 29

Поисковая система номер один в мире по мнению Google

Lumber room
Тренировал распознаватель голоса Chrome своими запросами, и по запросу Search Google выдал довольно любопытную картину:

Bing-же считает поисковиком номер один братский Yahoo!, хотя при этом ставит Google выше себя :)
Видать сильно прижали антимонопольщики, что поисковики ставят себя в собственном поиске ниже конкурентов.
Читать дальше →
Total votes 94: ↑43 and ↓51 -8
Views 352
Comments 8
1