sergbe 15 апр в 12:54

Рецензия на книгу «Elasticsearch в действии, 2-е издание»

Простой

8 мин

2.4K

Блог компании SSP SOFTУчебный процесс в ITЧитальный залПрофессиональная литература*Поисковые технологии*

Обзор

Книга Elasticsearch в действии. Второе издание — это подробный (~650 страниц в русском переводе) путеводитель по созданию масштабируемых поисковых систем на базе Elasticsearch. Второе обновленное издание знакомит с архитектурой, API и реальными сценариями применения Elasticsearch — от полнотекстового поиска до визуализации данных и машинного обучения. Книга — отличный выбор для начинающих разработчиков, но наверняка может быть полезна и для практикующих специалистов.

***

Начнем рецензию со ссылки на страницу книги «Elasticsearch в действии, 2-е издание» на сайте издательства БХВ. На все книги по компьютерным технологиям от издательств «БХВ Петербург», «Alist» и «Фолиант» доступен промокод SSPSOFT на скидку 25% как подарок читателям Хабра от нашего блога.

Немного о месте рецензируемой книги в таймлайн Elasticsearch

Elasticsearch – это распределенный поисковый и аналитический движок на базе Apache Lucene. Вскоре после выпуска в 2010 году, Elasticsearch стал, пожалуй, самым популярным поисковым движком и обычно используется для таких задач как анализ биг-дата, но также для обработки логов, полнотекстового поиска в системах ecommerce, в интеллектуальных системах безопасности, для бизнес-аналитики и мониторинга текущих процессов.

2010 год: Первая версия Elasticsearch была создана Шэем Баноном (Shay Banon).
2012: Основана компания Elastic, началась коммерциализация проекта.
2015: Вышла версия 2.x — с улучшенной безопасностью и поддержкой новых типов данных.
2017: Версия 5.x (объединение номеров версий всех компонентов Elastic Stack). Введен Ingest Node, улучшена производительность.
2018: Версия 6.x — оптимизация хранения, новый движок репликации.
2019: Версия 7.x — переход на Java REST API, удаление типов (_type), более тесная интеграция с Kibana и Beats.
2021: Elastic меняет лицензию с Apache 2.0 на SSPL, чтобы ограничить использование кода крупными облачными провайдерами (в первую очередь AWS). В ответ появляется форк OpenSearch от Amazon.
2021–2025: Развитие ветки 7.x → 8.x. В версии 8 добавлены:
- Безопасность включена "по умолчанию"
- Упрощенный запуск (Elastic Agent вместо Logstash/Beats)
- Новые API и улучшения в машинном обучении.
- Поддержка vector search, semantic search, hybrid search — важный шаг в сторону AI/ML и LLM-поиска
Апрель 2025: на момент написания рецензии — последняя версия 8.17.4. Скачать последнюю версию можно отсюда.

Целевая аудитория книги

Основная целевая аудитория книги – это ИТ-специалисты, которые непосредственно работают с поисковыми решениями и аналитикой данных. В частности, книга будет полезна:

Разработчикам приложений, которым необходимо интегрировать полнотекстовый поиск и аналитические возможности Elasticsearch.
Администраторам и системным инженерам, отвечающим за развертывание, настройку и оптимизацию кластеров Elasticsearch, а также за обеспечение отказоустойчивости и безопасности инфраструктуры.
Архитекторам систем и DevOps-инженерам, участвующим в проектировании масштабируемых и высоконагруженных систем, где требуется эффективный поиск и анализ данных.
Инженерам по данным и аналитикам, заинтересованным в построении конвейеров обработки информации, объединении данных и визуализации с помощью Elastic Stack.

В сравнении с первым изданием Elasticsearch in Action, вышедшей в 2015 году, добавлен раздел, посвященный генеративному ИИ и современным методам поиска, что показывает интеграцию новых технологических трендов. Обновлены главы по агрегациям, индексации, анализу и администрированию, которые теперь учитывают изменения API. Практические примеры теперь охватывают более сложные сценарии работы, включая обработку больших объемов данных, вопросы векторного поиска (хотя подробное описание этой технологии остается излишне кратким) и инструменты безопасности.

Об авторе книги Elasticsearch в действии, 2-е издание

Мадхусудхан Конда (Madhusudhan Konda) работает в должности Software Engineer в Elasticsearch Labs. Это подразделение компании Elasticsearch B.V., занимающееся генеративным ИИ, встраиванием моделей и исследованиями в области возможностей повторного ранжирования.

https://www.elastic.co/search-labs/author/madhusudhan-konda

О своей деятельности автор рассказывает на своей странице на Amazon:

«С появлением новых технологий буквально каждую минуту и минимумом временем на их изучение я обнаружил, что нужны деловые, „только по существу книги“ по техническим предметам. Моя цель — предоставить такие книги, простые, прямолинейные и основанные на примерах! Книги, которые вы должны прочесть за несколько часов или за день или два!

Как автор, я начал свой путь написания книг с публикации Just Spring, первой книги по теме Spring Framework. Книга была хорошо принята и вдохновила меня писать больше.

Сегодня я Java‑разработчик, работающий в Лондоне, в основном в инвестиционных банках и финансовых организациях. Начав как программист C / C++, я быстро освоил Java во время обучения в магистратуре IIT Kharagpur, Индия. Я сразу же влюбился в этот язык и больше не оглядывался назад. Мне нравится писать книги, технические статьи, обзоры и, конечно, выступать на семинарах/вебинарах».

Аннотации к главам книги Elasticsearch в действии, 2-е издание

Давайте пройдемся по оглавлению «Elasticsearch в действии, 2-е издание» и посмотрим на аннотации к каждой главе книги:

Глава 1. Краткий обзор

Глава знакомит с понятием поисковой системы, отличиями структурированных и неструктурированных данных, подходами к поиску в базах данных и поисковых движках. Представлены основные игроки рынка (включая Elasticsearch), сценарии его применения, компоненты Elastic Stack и краткий обзор современных тенденций, включая генеративный ИИ.

Глава полезна как вводная часть для разработчика, впервые сталкивающегося с задачами поиска и архитектурой Elasticsearch.

Глава 2. Начало работы с Elasticsearch

Читатель получает практический опыт загрузки, индексирования и извлечения данных. Демонстрируется работа с API, полнотекстовым поиском, запросами по ключевым словам, логическими операциями и агрегациями. В качестве примера используется книжный онлайн-магазин.

Глава полезна всем, кто хочет быстро перейти от теории к практике и освоить основы работы с API Elasticsearch.

Глава 3. Архитектура

Подробно разбираются внутренние компоненты Elasticsearch: документы, индексы, потоки данных, шарды, кластеры, инвертированные индексы и алгоритмы релевантности. Объясняется, как обеспечивается масштабируемость и маршрутизация запросов.

Материал главы помогает разработчикам понять, как устроена система изнутри и как масштабировать решения на ее основе.

Глава 4. Маппинг

Объясняется, как Elasticsearch определяет и управляет типами данных. Показано отличие динамического и явного маппинга, описаны базовые и продвинутые типы данных, включая nested, geo и join-поля.

Глава необходима для корректного проектирования схемы данных, предотвращения ошибок при индексировании и оптимизации поиска.

Глава 5. Работа с документами

Описаны все аспекты жизненного цикла документа: индексация, извлечение, обновление, удаление. Отдельное внимание уделено работе с bulk-операциями и повторной индексации, включая использование скриптов.

Здесь будет польза для разработчиков и администраторов, которым нужно эффективно управлять данными в Elasticsearch.

Глава 6. Операции при индексации

Эта глава охватывает создание, удаление и управление индексами. Рассматриваются автоматическое и явное создание индексов, шаблоны и псевдонимы, сбор статистики, ротация, сжатие, а также жизненный цикл индексов (ILM). Показано, как минимизировать простой и автоматизировать работу с данными.

Глава полезна для DevOps- и SRE-специалистов, администрирующих индексы и обеспечивающих устойчивую эксплуатацию кластера.

Глава 7. Анализ текста

Раскрывается механизм анализа текста в Elasticsearch. Рассматриваются встроенные и настраиваемые анализаторы, токенайзеры, фильтры символов и токенов, включая примеры настройки и тестирования. Показано, как влияет анализ на индексацию и поиск.
Глава важна для тех, кто работает с полнотекстовым поиском, мультиязычными данными и сложными пользовательскими запросами.

Глава 8. Введение в основы поиска

Здесь объясняется, как устроен механизм поиска: от простого запроса до работы с Query DSL. Рассматриваются структура поискового запроса и ответа, параметры пагинации, подсветка, сортировка, фильтрация и способы повышения релевантности.
Глава дает основу для понимания, как формировать и отлаживать поисковые запросы в реальных проектах.

Глава 9. Поиск по ключевым словам

Разбираются точные запросы по ключевым словам без анализа: term, terms, ids, exists, range, wildcard, prefix, fuzzy. Даются примеры и приемы оптимизации, включая ускорение поиска по префиксу.

Материал главы поможет в реализации фильтрации, навигационного поиска и других сценариев, где критична точность совпадений.

Глава 10. Полнотекстовый поиск

Глава фокусируется на полнотекстовых запросах: от match и match_phrase до query_string и simple_query_string. Объясняется работа с нечеткими запросами, фразами, несколькими полями и приоритетами. Примеры демонстрируют, как учитывать ошибки и вариации пользовательских запросов.

Здесь польза для разработчиков поисковых интерфейсов, которым требуется гибкость и устойчивость к пользовательским ошибкам.

Глава 11. Составные запросы

Изучаются составные и логические запросы с использованием bool, must, should, must_not, filter, а также запросы dis_max, function_score и pinned. Рассматриваются методы повышения релевантности, присвоение имен запросам и комбинирование условий.
Глава пригодится для тех, кто строит сложные сценарии поиска, комбинирующие разные условия и приоритеты.

Глава 12. Продвинутый поиск

Глава охватывает геопоиск (geo_point, geo_shape, geo_distance), запросы span, работу с расстоянием (distance_feature) и поиск по схожести (more_like_this). Даются редкие, но мощные инструменты для специализированных случаев.

Будет полезна разработчикам, создающим локализованные сервисы, контекстные рекомендации или сложные фильтрации.

Глава 13. Агрегация

Рассматриваются все виды агрегаций: метрические, гистограммы, terms, конвейерные и иерархические агрегаты. Примеры показывают, как объединить поиск с аналитикой, агрегировать данные во временных рядах и сегментах.

Глава предназначена для аналитиков и разработчиков BI-интерфейсов, использующих Elasticsearch как платформу для сводной аналитики.

Глава 14. Администрирование

Затрагиваются масштабирование кластеров, выбор размера шардов, работа с снапшотами, конфигурация JVM, логирование, кворум, предотвращение split-brain и управление мастер-узлами. Даются практические советы по стабильности и отказоустойчивости.

Материал главы будет маст хэв для инженеров, обеспечивающих отказоустойчивую эксплуатацию и стабильную работу крупных инсталляций.

Глава 15. Производительность и решение проблем

Освещаются проблемы скорости поиска, индексации и нестабильных кластеров. Даются советы по моделированию данных, обновлению, пакетной индексации, мониторингу состояния кластера и настройке автоматических выключателей.

Глава поможет избежать типичных узких мест и стабилизировать работу системы в условиях нагрузки.

Приложение А. Установка ПО

Описана установка Elasticsearch и Kibana на Windows, macOS и через Docker. Рассматриваются команды запуска, тестирования, подключение через cURL, работа с Docker Compose.

Приложение Б. Конвейер приема данных

Рассматривается архитектура ingest-процессов, включая предобработку данных и загрузку PDF-файлов с использованием ingest-конвейеров и плагинов.

Приложение В. Настройка клиентов

Показан пример настройки Java-клиента: подключение, инициализация, создание индекса, отправка и поиск документов. Описана история разработки клиентов и работа с Maven/Gradle.

Заключение

Книга «Elasticsearch в действии, 2-е издание» представляет обновленное руководство по работе с одной из самых мощных и гибких поисковых платформ Это полезное и полноценное практическое пособие, охватывающее современные подходы к полнотекстовому поиску, аналитике и построению высоконагруженных систем.

Автор логично подошел к раскрытию архитектуры Elasticsearch, рассказал про ключевые API, расширенные возможности агрегации, а также актуальные направления — от геопоиска до векторного поиска и применения ML-инструментов.

Рекомендуем ознакомиться с подробным русским оглавлением книги на сайте издательства БХВ, чтобы оценить ее структуру и глубину проработки тем. Оригинальное оглавление и пробные главы на англ.яз. доступны на сайте Manning Publications Co. Чтобы увидеть это англоязычное оглавление, проскрольте вниз страницу с описанием книги.

Если вы занимаетесь поисковыми системами, аналитикой данных или строите масштабируемые приложения с применением Elastic Stack, эта книга станет отличным дополнением к вашему профессиональному арсеналу и, вероятно, одним из самых полезных источников на вашем книжном столе.

Немного HR-рекламы от нашего блога: мы занимаемся заказной разработкой ПО и будем рады получить резюме специалистов, готовых работать оффлайн в Москве и Томске, а также удаленно из любой точки России. Текущие вакансии на нашей странице на hh.ru. Если вашей специальности нет в списке вакансий, не стесняйтесь прислать нам резюме — в SSP SOFT новые позиции открываются регулярно. Резюме можно направить в Telegram или на почту job@ssp-soft.com.

Успехов в изучении и практическом применении Elasticsearch в ваших проектах!

Теги:

Хабы: