Как стать автором
Обновить

Комментарии 3

На самом деле в Elastic c русской морфологией сейчас беда.


Упомянутый плагин analysis-morphology от Игоря Мотова не поддерживает Elastic версий 6 и 7. Последнее, что я находил — это сборка под 6.6.1 сделанная каким-то энтузиастом. Под другие версии (даже 6.x.x) она не работает.


Вместо него в оф. документации предлагается использовать морфологию на основе hunspell-словарей.


Ну и в принципе все работает, но:


  • Индексация в несколько раз медленнее, чем с russian_morphology.
  • Обрабатывается только то, что есть в словаре.

Например, с "мама мыла раму" hunspell справится, а вот с "Бармаглотом" уже нет.


В отличие от russian_morphology:


Варкалось. Хливкие шорьки пырялись по наве.
▼▼▼
варкаться хливкий шорек пыряться по нав

На форуме вот советуют самому словари заполнять.

… не работает.

Можно «починить» — внутри архива плагина в текстовом файле написана поддерживаемая версия эластика. Если её поменять, то всё волшебным образом вновь начинает работать. По крайней мере на 6.x мы так делали, а на 7ке не проверяли.
upd: коллеги меня поправляют, что с какой-то из версий 6.x просто редактирования текстового файла не хватало, надо было менять структуру папок, для еще более поздних версий приходилось уже пересобирать плагин из исходников, а для 7.x всё окончательно сломалось.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий