Comments 12
Конструктивная и не очень критика — приветствуется очень. Надеюсь на помощь ИТ сообщества!
Sphinx бесспорно выглядит многообещающе, но если попользоваться поиском на хабре, то он себя полностью дискредитирует. Я сейчас прямо пример не приведу, но уверен, что поиск по словам содержащимся в статье даст не совсем ожидаемые результаты, если %username% попробует. Скажем так, гуглопоиском по забру пользоваться эффективнее.
В связи с этим вопрос — это дело в настройках или просто все печально?
В связи с этим вопрос — это дело в настройках или просто все печально?
Сфинкс подойдет в качестве поискового движка по обширной базе документов различного формата: pdf, txt и т.д.? Или есть более удобоваримые решения на рынке?
Подойдет, по-моему лучшего решения и не придумаешь.
тут скорее лучше solr подойдёт, т.к.:
> Rich Document Parsing and Indexing (PDF, Word, HTML, etc) using Apache Tika
lucene.apache.org/solr/features.html
> Rich Document Parsing and Indexing (PDF, Word, HTML, etc) using Apache Tika
lucene.apache.org/solr/features.html
Sphinx не умеет разбирать pdf, txt и т.д. Решение будет написать парсер и скормить через xmlpipe.
Имеется таблица в MySQL c кучей полей, по одному из них требуется производить полнотекстовый поиск в лоб типа WHERE forsearch LIKE '%keyword%'. И forsearch, и keyword представляют собой мешанину из цифр и букв без пробелов и прочего логического деления Ускорит ли использование Sphinx работу или в таком простейшем случае нет смысла?
Надо тестить: при разном кол-ве данных и разных запросах. так в лоб и не ответишь.
Sign up to leave a comment.
Презентация: «Sphinx — полнотекстовый поиск на сайте, просто и доступно»