Статьи / Профиль gtkek / Хабр

Глеб Типсин @gtkek

Software Engineer

Профиль Публикации 3Комментарии 1Закладки 4

gtkek 28 сен 2023 в 15:48

Основы полнотекстового поиска в ElasticSearch. Часть третья

Средний

4 мин

Блог компании SM LabПоисковые технологии*IT-инфраструктура*NoSQL*

FAQ

Это третья и заключительная статья из цикла, в которой рассмотрим стандартную модель ранжирования документов в Elasticsearch.

После того как определено множество документов, которые удовлетворяют параметрам полнотекстового запроса, Elasticsearch рассчитывает метрику релевантности для каждого найденного документа. По значению метрики набор документов сортируется и отдается потребителю.

В Elasticsearch существует несколько моделей ранжирования документов. По умолчанию используется Okapi BM25.

+16

gtkek 31 авг 2023 в 14:20

Основы полнотекстового поиска в ElasticSearch. Часть вторая

Средний

9 мин

15K

Блог компании SM LabПоисковые технологии*IT-инфраструктура*NoSQL*

FAQ

✏️ Технотекст 2023

Это вторая статья из цикла. В первой части я рассказывал про самые базовые понятия Elasticsearch. В этом же посте разберем устройство анализа текста и немного пощупаем полнотекстовый поиск.

Несколько слов про анализ текста

Анализ текста — процесс преобразования оригинального текста в структурированный формат, оптимизированный под эффективное хранение и быстрый поиск.

Мы уже познакомились с некоторыми типами Elasticsearch, но в этом разделе будем рассматривать только два — keyword и text. Тип text анализируется для полнотекстового поиска. Тип keyword преимущественно остается без изменений для точного поиска, сортировки и агрегации.

+26

gtkek 24 авг 2023 в 14:32

Основы полнотекстового поиска в ElasticSearch. Часть первая

Средний

5 мин

19K

Блог компании SM LabПоисковые технологии*IT-инфраструктура*NoSQL*Поисковая оптимизация*

FAQ

Привет! Меня зовут Глеб, я разработчик команды продукта «Сервис персонализации» в SM Lab. В цикле из трех постов я расскажу про основы полнотекстового поиска в Elasticsearch.

Данный цикл статей предназначен для всех, но будет особенно актуальным для тех читателей, кто только начинает свое знакомство с Elasticsearch. Я надеюсь, каждый из вас найдет что-то полезное для себя.

В первой части обсудим самые базовые понятия Elasticsearch. Во второй части разберем механизмы анализа текста и полнотекстового поиска. В заключительной части взглянем на стандартную модель ранжирования документов в Elasticsearch.

Итак, начнём с самых базовых понятий.

+21