mstarrr Feb 8 2012 at 06:48

Презентация: «Sphinx — полнотекстовый поиск на сайте, просто и доступно»

4 min

21K

Sphinx *

Comments 12

mstarrr Feb 8 2012 at 06:50

Конструктивная и не очень критика — приветствуется очень. Надеюсь на помощь ИТ сообщества!

1nd1go Feb 8 2012 at 08:04

Sphinx бесспорно выглядит многообещающе, но если попользоваться поиском на хабре, то он себя полностью дискредитирует. Я сейчас прямо пример не приведу, но уверен, что поиск по словам содержащимся в статье даст не совсем ожидаемые результаты, если %username% попробует. Скажем так, гуглопоиском по забру пользоваться эффективнее.

В связи с этим вопрос — это дело в настройках или просто все печально?

mstarrr Feb 8 2012 at 08:34

Это все дело в настройках. У гуггл конечно все намного круче чем на хабре.

oleg_alligator Feb 8 2012 at 08:19

Сфинкс подойдет в качестве поискового движка по обширной базе документов различного формата: pdf, txt и т.д.? Или есть более удобоваримые решения на рынке?

mstarrr Feb 8 2012 at 08:35

Подойдет, по-моему лучшего решения и не придумаешь.

RaveNoX Feb 8 2012 at 14:47

тут скорее лучше solr подойдёт, т.к.:
> Rich Document Parsing and Indexing (PDF, Word, HTML, etc) using Apache Tika
lucene.apache.org/solr/features.html

YaroslavVorozhko Apr 18 2012 at 09:57

Sphinx не умеет разбирать pdf, txt и т.д. Решение будет написать парсер и скормить через xmlpipe.

Bodigrim Feb 8 2012 at 11:04

Имеется таблица в MySQL c кучей полей, по одному из них требуется производить полнотекстовый поиск в лоб типа WHERE forsearch LIKE '%keyword%'. И forsearch, и keyword представляют собой мешанину из цифр и букв без пробелов и прочего логического деления Ускорит ли использование Sphinx работу или в таком простейшем случае нет смысла?

mstarrr Feb 8 2012 at 11:05

Надо тестить: при разном кол-ве данных и разных запросах. так в лоб и не ответишь.

Bodigrim Feb 8 2012 at 13:29

Проверил, на синтетическом тесте выигрыш в 70 раз. Неожиданно; не думал, что Sphinx так круто ускорит выборку.

mstarrr Feb 8 2012 at 13:30

А то!

mstarrr Feb 8 2012 at 11:05

Надо тестить: при разном кол-ве данных и разных запросах. так в лоб и не ответишь.