Pull to refresh

4 простых способа оптимизировать объём индексов в Elasticsearch

Level of difficulty Medium
Reading time 11 min
Views 1.5K
Usetech corporate blog System administration *
Tutorial

Всем привет! Меня зовут Данила, я выполняю роль SR-инженера в Usetech. В этой статье я бы хотел рассказать о 4-х способах, которые помогут сократить объём ваших индексов в Elasticsearch.

Прежде всего статья будет полезна начинающим специалистам по администрированию ELK стека, администраторам систем мониторинга, разработчикам, внедряющим ELK стек у себя на проекте. 

Работая над мониторингом в одном из проектов мы столкнулись с тем, что временной промежуток, за который мы имеем возможность хранить данные, для нас недостаточен, т.к. хотелось иметь возможность сравнивать работу системы за больший период времени.

Мы видели 2 пути решения проблемы:

Читать далее
Total votes 6: ↑6 and ↓0 +6
Comments 2

Публичные данные 1,2 млрд пользователей были обнаружены на открытом Elasticsearch-сервере

Reading time 3 min
Views 12K
Information Security *Search engines *Social networks and communities


Согласно информации издания Wired, специалисты в области информационной безопасности Винни Троя (Vinny Troia) и Боб Дьяченко (Bob Diachenko) обнаружили в сети открытый Elasticsearch-сервер, содержащий 1,2 млрд записей общим размером четыре терабайта. Сервер был расположен на площадке Google Cloud Service (у него был IP-адрес 35.199.58.125).
Читать дальше →
Total votes 21: ↑20 and ↓1 +19
Comments 14

Elastic меняет лицензии Elasticsearch и Kibana c Apache 2.0 на SSPL

Reading time 2 min
Views 13K
Open source *Software IT-companies


14 января 2021 года Elastic объявила об изменении правил лицензирования своих продуктов. Новые версии платформы поиска, анализа и хранения данных Elasticsearch и web-интерфейса Kibana будут распространяться под несвободной лицензией SSPL 1.0 (Server Side Public License). Ранее они были под лицензией Apache 2.0.
Читать дальше →
Total votes 15: ↑13 and ↓2 +11
Comments 25

Amazon объявила о запуске форков Elasticsearch и Kibana

Reading time 2 min
Views 5.3K
Open source *Amazon Web Services *Software

На прошлой неделе Elastic объявила, что изменит свою стратегию лицензирования программного обеспечения и не будет выпускать новые версии Elasticsearch и Kibana под лицензией Apache, версия 2.0 (ALv2). AWS заявила, что предпримет шаги для создания и поддержки форков Elasticsearch и Kibana.

Читать далее
Total votes 13: ↑4 and ↓9 -5
Comments 8

В сети был обнаружен зарубежный сервер Elasticsearch с базой СМС-сообщений, якобы, с номера 900, сейчас данные стерты

Reading time 2 min
Views 19K
Information Security *Legislation in IT IT-companies


По информации телеграм-канал «Утечки иформации», в сети Интернет с 12 июня 2021 года находится в открытом доступе сервер Elasticsearch, в индексе которого содержатся СМС-сообщения, предположительно, отправленные с номера 900.

Комментарий от «Сбера» для Хабра: «компания провела проверку и выяснила, что это фейковые данные и они не имеют отношения к клиентам банка».
Читать дальше →
Total votes 26: ↑25 and ↓1 +24
Comments 19

Amazon переименовала Elasticsearch Service в OpenSearch Service

Reading time 2 min
Views 2.3K
API *Legislation in IT IT-companies

Компания Amazon Web Services (AWS) выполнила обязательства и переименовала форк Amazon Elasticsearch Service в Amazon OpenSearch Service, поскольку ранее AWS и Elasticsearch BV поссорились из-за лицензирования программного обеспечения с открытым исходным кодом Elasticsearch.

Напомним, Amazon запустила сервис аналитики и мониторинга в 2015 году, что привело к конкуренции с Elasticsearch BV, компании, созданной для коммерциализации проекта.

Elasticsearch BV получила публичный статус в 2018 году. Годом позже AWS фактически заново создал проект Elasticsearch, выпустив собственную версию программного обеспечения под названием Open Distro for Elasticsearch.

В ответ на это Elasticsearch BV подала иск на Amazon из-за неправомерного использования копирайта. Судебные разбирательства все еще не завершены.

В январе 2021 года генеральный директор и соучредитель Elasticsearch BV Шей Бэнон объявил, что проекты ElasticSearch и Kibana откажутся от лицензии Apache 2.0 с открытым исходным кодом в пользу Elastic и общедоступной серверной лицензии без открытого исходного кода (SSPL).

Читать далее
Total votes 10: ↑10 and ↓0 +10
Comments 0

Arenadata выпустила новый продукт на базе Elasticsearch

Reading time 2 min
Views 1.5K
Arenadata corporate blog Open source *Big Data *Data storages *Data Engineering *

Компания Arenadata завершила финальное тестирование нового продукта на базе технологии Elasticsearch — Arenadata LogSearch 1.0. (ADLS). Это один из первых продуктов на российском рынке, который обеспечивает быстрый доступ к технологии Elasticsearch и возможность работать с ней в гетерогенной ИТ-инфраструктуре (bare-metal, clouds, multi-clouds). 

Arenadata LogSearch — это масштабируемая отказоустойчивая система, предназначенная для анализа и полнотекстового поиска. Технология Elasticsearch была разработана для полнотекстового поиска на базе библиотеки Apache Lucene. Основной функциональной особенностью библиотеки является обеспечение масштабируемой и высокоскоростной индексации данных (создание объектов внутри базы данных, соответствующих определённым критериям поиска). Подобные системы особенно актуальны, когда необходим поиск по сложным запросам: поиск фраз, включающих разные части речи или поиск по географическим координатам.

Читать далее
Total votes 5: ↑4 and ↓1 +3
Comments 4

Эксперты обнаружили сервер Elasticsearch с содержимым СМС-сообщений от сервисов и банков, включая «Тинькофф» и «Озон»

Reading time 2 min
Views 61K
Information Security *Finance in IT IT-companies


По информации телеграм-канала «Утечки иформации», в сети Интернет с 1 апреля 2022 года находится в открытом доступе сервер Elasticsearch, в индексе которого содержатся СМС-сообщения от различных российских и зарубежных сервисов и банков.
Читать дальше →
Total votes 31: ↑30 and ↓1 +29
Comments 125

Приглашаем на Search meetup от СберМегаМаркет

Reading time 1 min
Views 434
СберМегаМаркет corporate blog Search engines *Go *Development for e-commerce *

Приглашаем на Search meetup от СберМегаМаркет

Первый митап от команды разработки СберМегаМаркета! Соберемся в офлайне и онлайне и обсудим поисковые технологии.

Событие состоится в гибридном формате, встречаемся в пространстве Старт Хаб на Красном Октябре.Если вы не сможете приехать очно — ждем вас в онлайне (этот вариант можно выбрать при регистрации и мы пришлём вам ссылку и напоминание). 

Чтобы посетить событие, нужно зарегистрироваться

Читать далее
Rating 0
Comments 0

В сеть утекли данные миллионов пользователей Bean VPN

Reading time 2 min
Views 2.9K
Decentralized networks *Information Security *Network technologies *

Исследователи безопасности из Cybernews обнаружили, что поставщик услуг бесплатной виртуальной частной сети Bean VPN слил личную информацию о миллионах своих пользователей. Они нашли в сети базу данных с более чем 18 ГБ журналов подключений, созданных приложением.

Читать далее
Total votes 2: ↑2 and ↓0 +2
Comments 0

5 докладов на митапе в Ульяновске: Consistent Hash, Go, оперативная память и не только (с трансляцией)

Reading time 1 min
Views 498
Skyeng corporate blog PHP *Programming *Community management *

Привет! В эту субботу (2 июля) в 10:00 по Москве ульяновский чат соберется на второй митап. Первый митап прошел в октябре 2020 года, поэтому грядет по-настоящему большое событие для местного сообщества.

Трансляцию митапа можно будет найти на нашем канале и на канале ulskPHP. А если вы в Ульяновске или рядом — еще можно зарегистрироваться на оффлайн.

В программе 5 докладов:

Читать далее
Total votes 5: ↑5 and ↓0 +5
Comments 0

Из бесплатного VPN-сервиса Airplane Accelerates в Китае слили базу данных пользователей на 5,7 млн записей

Reading time 2 min
Views 2.2K
Information Security *IT-companies

В Китае из бесплатного VPN-сервиса Airplane Accelerates слили базу данных пользователей на 5,7 млн записей. База содержит IP-адреса, домены, идентификаторы и временные метки пользователей. Об этом заявляет портал Cybernews. Специалисты по кибербезопасности обнаружили 7 июля 2022 года в свободном доступе экземпляр ElasticSearch. Он содержал журнал VPN-подключений весом 626 ГБ.

Читать далее
Total votes 11: ↑11 and ↓0 +11
Comments 7

Представляем curator-opensearch: инструмент с открытым кодом для работы с индексами в OpenSearch

Reading time 2 min
Views 1.1K
Флант corporate blog System administration *Database Administration *DevOps *

Менеджер индексов Curator позволяет создавать, удалять и отключать индексы Elasticsearch, а также создавать и удалять снапшоты. Оригинальный Curator хорошо работает с OpenDistro, однако наша попытка использовать его с поисковой системой OpenSearch провалилась: оказалось, что Curator ее не поддерживает. Поэтому мы создали curator-opensearch — форк Curator’а, адаптированный для OpenSearch.

Читать далее
Total votes 25: ↑25 and ↓0 +25
Comments 4

Manticore Search 6

Reading time 4 min
Views 635
Search engines *Open source *C++ *Sphinx *Database Administration *

Сегодня мы рады объявить, что Manticore Search 6.0.0 наконец вышел! Мы потратили на его создание более полугода, вложили огромное количество сил и написали более 80 000 строк кода.

Читать далее
Total votes 7: ↑7 and ↓0 +7
Comments 2

Данные Elasticsearch-сервера оператора связи «Авантелеком», включая логи общения с клиентами, оказались открыты всем

Reading time 1 min
Views 1.5K
Information Security *IT Infrastructure *Network technologies *Cloud services *IT-companies
16 марта 2023 года данные Elasticsearch-сервера оператора связи «Авантелеком», включая номера телефонов клиентов и логи общения сотрудников компаний с техподдержкой, оказались доступны всем пользователям.
Читать дальше →
Total votes 3: ↑3 and ↓0 +3
Comments 2

Полнотекстовый поиск в Grails

Reading time 4 min
Views 3.2K
Groovy & Grails *
Подключить полнотекстовый поиск в Grails — задача довольно легкая. Для этого используется плагин Searchable, который делает все сущности Grails-приложения индексируемыми. Searchable позволяет абстрагировать весь процесс индексирования и поиска. При этом сам плагин использует библиотеку Compass, которая следит за тем, чтобы при изменении объекта (т.е. при сохранении в БД) он автоматически переиндексировался. Сам по себе Compass по сути является довольно мощным средством «поискового ORM»:
Читать дальше →
Total votes 6: ↑6 and ↓0 +6
Comments 0

Быстрый полнотекстовый поиск ElasticSearch

Reading time 6 min
Views 215K
Website development *
Sandbox
image
При разработке высоконагруженных сайтов или корпоративных систем частенько возникает проблема с разработкой быстрого и удобного поискового движка. Ниже перечислены наиболее важные, на мой взгляд, требования к такому движку:

  • Скорость
  • Простота установки и настройки
  • Цена (желательно бесплатно и с открытым кодом)
  • Обмен информацией в формате JSON (по HTTP)
  • Масштабируемость (возможность распределения на несколько серверов)
  • Индексация в режиме реального времени
  • Multi-tenancy (гибкость в настройках под индивидуального пользователя)
  • Возможность переноса системы в облако

Хочу рассказать вам о новом поисковом движке Elasticsearch, который полностью удовлетворяет всем этим требованиям. В статье будет краткое описание, ссылка на авторитетную презентацию, а также описание установки и работы с ним.
Читать дальше →
Total votes 69: ↑63 and ↓6 +57
Comments 61

NoName Podcast S04E05

Reading time 1 min
Views 932
Self Promo

Вместо вступления


Подкаст вышел с опозданием, поскольку мы ждали, когда мне вернут микрофон. На момент записи его так и не отдали, поэтому меня слышно не очень хорошо, выводы сделали, своих ошибок повторять не будем.
Таинственный образом с хабра пропал «подкаст», поэтому слушайте нас на rpod-е.
Читать дальше →
Total votes 33: ↑29 and ↓4 +25
Comments 1

Просмотр архивных логов apache c помощью Logstash+Elastisearch+Kibanа

Reading time 4 min
Views 46K
System administration **nix *Apache *
Tutorial
Recovery mode
Приветствую.

Нет так давно передо мной встала задача пробежаться по старым логам apache. Надо было сделать выборку по нескольким IP адресам, отыскать некоторые аномалии и попытки SQL-injection'ов. Логов было не так много, порядка миллиона строк и можно было спокойно всё сделать стандартным набором grap-awk-uniq-wc итд.

Поскольку я уже какое-то (больше года) время пользуюсь связкой Logstash-Elasticsearch-Kibana для анализа-просмотра всевозможных логов, то решил ей воспользоваться и в данной ситуации.

Краткое описание основных компонентов системы.

Logstash — бесплатная open-source программа на java для сбора и нормализации логов. Может принимать логи либо с локальных файлов, либо через tcp/udp порты. На момент написания статьи, разных входных (input) фильтров насчитывается 26. Есть даже входной модуль, для сбора сообщений из twitter'а или irc.

Elasticsearch — бесплатный open-source поисковый сервер основанный на Apache Lucene. Быстрый, легко настраиваемый и очень масштабируемый.

Kibana — веб-интерфейс написанный на ruby, для отображения данных из Elasticsearch. Простая настройка, но множество функций — поиск, графики, stream.

Читать дальше →
Total votes 15: ↑14 and ↓1 +13
Comments 25

Github полностью переработал поиск

Reading time 1 min
Views 17K
Website development *Git *Version control systems *


В среду, 23 января, Github запустил новый, значительно переработанный и улучшенный поиск кода, репозиториев и разработчиков. Теперь инфраструктуру обеспечивает кластер серверов ElasticSearch, который индексирует весь добавляемый код на лету, заметно переработан интерфейс, и, самое главное, есть много функциональных улучшений.
Читать дальше →
Total votes 66: ↑60 and ↓6 +54
Comments 19