Посоветуйте систему полнотекстового поиска

    Гуглил, нашел много разных вариантов, но ни один не удовлетворял простым условиям:
    — Легкость установки. Простота настройки (не более 4х часов с момента начала чтения документации).
    — Поддержка русской морфологии. Как плюс — английской.
    — Возможность индексации по Веб.
    — Выдача результатов по релевантности. Хорошая ранжировка по релевантности

    Risearch.org — хорошая, полная версия на Перле и платая. MnogoSearch — очень громоздкая в настройке, мне столько опций не нужно. В ряде других вариантов — простые стеммеры, либо вообще отсутсвие любой поддержки русского языка. Ладно, пусть будет даже стеммер, но у результатов должна быть высокая релевантность.
    Поделиться публикацией

    Комментарии 20

      +2
      может
      http://company.yandex.ru/technology/products/Yandex-Server/features.xml
        0
        Не понимаю почему минусуют комментарий... Вполне адекватная система и удовлетворяет условиям необходимым...
        0
        Lucene пробовали?
          0
          Да, мы тоже пользуемся Lucene, и вполне хватает.
            0
            Мы в общем-то не пользуемся пока ;) Да и не будем, по всей видимости.
            А вот сменится «мы» — тогда и посмотрим ;)
          +2
          Sphinx получше будет. Но опять таки охарактеризуйте задачи, какой индекс требуется, монолит или нет, на каких языках искать, как часто обновлять индекс и тд ит д итд :)
            0
            Есть 300+ статических файлов. Индекс изменяться не будет никогда. Нужен поиск на русском с подсветкой результатов в тексте... Что посоветуете?
            • НЛО прилетело и опубликовало эту надпись здесь
              • НЛО прилетело и опубликовало эту надпись здесь
                  0
                  Да, по сайту...
            +1
            Прочитайте доклад по системам полнотекстового поиска на MySQL в MySQL Performance Blog (там есть сравнение производительности в поиске, индексации и др. аспектах), а там уже выберете по своим требованиям. Я склоняюсь к использованию Sphinx.
              0
              В данный момент использую уже упомянутый выше Sphinx. Хотел рекомендовать Ferret, но мне неизвестны реализации для PHP...
                0
                в Zend_Framework есть компонент на РНР, это порт Apache Lucene (который на java)
                в ezCompenents которые в SVN и будут 2008.1 версией, есть компонент Search, который тоже на основе Lucene
                у них же есть отдельный компонент (вроде и плагин к их CMS и самостоятельное приложение) - ezFind
                есть еще варианты на Java - Nutch.

                Shinx это самое лучшее решение (обещают в разработке уже плагин для поиска по блогу на MT и WP) но требует все же рута и прав на установку софта, также есть версия в виде стораджа для таблиц в MySQL
                  +1
                  > но требует все же рута

                  Sphinx таки *НЕ* требует рута, отлично работает и из-под обычного пользователя.

                  Но нужен шелл доступ, да.
                    0
                    да, извинясь, так и есть - сел писать про него статью, увидел :)
                  0
                  у Risearch есть версия на чистом PHP
                  http://risearch.org/rus/risearch_php/ind…
                    0
                    Сфинкс рулит. Учитывая отзывчивость автора">href="http://shodan.habra..., любой вопрос можно решить очень быстро.
                      0
                      Я имел в виду посмотреть профиль shodan
                      0
                      Есть еще такая штука. Использую на своих сайтах. Этот вариант не требует дополнительного ПО, работает на любом хостинге. На практике (используется для поиска по форумам) у пользователей нареканий не выхывает. Да еще и поддерживает подсветку в найденном.
                        0
                        Пардон, не сработал HTML-тег О_о. Вот ссылка на штуку: http://valera.ws/2007.09.05~morpho_search_in_mysql/

                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                      Самое читаемое