Pull to refresh

Comments 7

Неплохая штука. Но мне вот больше Lucene по нраву — не надо держать отдельный демон, всё интегрировано в двиг сайта.
А в какой движок она интегрирована?
Демон здесь — один из вариантов. Можно и напрямую работать с индексом. Просто демон дает несколько лучший результат скорости поиска.
Ну, Lucene работает, фактически, в том же режиме демона, но одном контексте процесса вместе с движком сайта, то есть, нет ненужных затрат на IPC и перенастройку хостинга.
мы используем ElasticSearch. тоже очень простой, но весьма быстрый.
Движок на сях мне как-то ближе по духу :)
Но что больше всего подкупает в Hyper Estraier — это то, что я на беглое изучение, установку, тестирование потратил ужасно мало времени. Убедился в приемлемости полученного результата и уже готов внедрять в работу. Возможно через неделю он уже будет стоять и работать.
Такого быстрого «въезда» у меня не было ни с одним из рассматриваемых ранее поисковиков — ht/Dig, Lucene, Sphinx.
Вообще стиль «упаковки» продуктов и оформления документации ребятами из FalLabs очень подкупает. Просто, функционально, понятно. Смотрю на свой пост и понимаю, что он пустой. но так получается, что особо описывать-разжевывать то и нечего, любой желающий может сам взять, быстро поставить и попробовать.
первый вариант, командная строка — 6 часов, почти минута в минуту;

Сейчас прогнал тест на базе одного из проектов. Lucene на моём ноуте индекс (оптимизированный) для 196682 комментариев (мускуль утверждает, что они у него весят 146 МБ) строит примерно три минуты. Выгрузка из мускуля порциями по 200. Сейчас посмотрю, может, где накосячил и оно не всё прогружает, не может быть такой разницы.
Вау, я, оказывается, в мускул упёрся, он 90% проца жрал. Переставил на индексацию по 5000 и оно перемололо это дело за 47 секунд.
Процессор Intel® Core(TM)2 Duo CPU P9300 @ 2.26GHz, 4 гигабайта памяти, индекс отожрал 35 метров.
Sign up to leave a comment.

Articles