s_batalov11 мая 2021 в 07:38

Как мы работаем с логами (сбор, хранение, анализ при помощи Graylog)

12 мин

177K

Блог компании ITSOFTСистемное администрирование * Серверное администрирование * Визуализация данных * Софт

Туториал

Комментарии 21

amarao 11 мая 2021 в 07:38

loki?

s_batalov 11 мая 2021 в 08:55

Добрый день!
Технология довольно свежая, мы ее в сравнение не брали.
Спасибо за информацию, по возможности рассмотрим и такой вариант.

lordleto 11 мая 2021 в 15:08

Локи немного другой. Если нужен анализ/поиск логов то ES проще чем регулярки и т.п. в Локи. Если логи отражают прежде всего метрики работы приложения, то Локи хорош.

iwram 11 мая 2021 в 10:14

Мы тоже долго выбирали между ELK и Graylog. Но почему то после того как запустили все на ELK использовать Graylog расхотелось. По вхождениям в graylog на момент тестов нельзя напрямую слать логи в elasticsearch, только через gelf (или то что в админке, udp syslog например).

По масштабированию с graylog тоже не так как с ELK - читал, пробовал - монго и какие то еще дополнительные телодвижения, бросил. Если есть elasticsearch, то пусть в чистом виде будет, есть kibana, которая подключается к elasticsearch, что еще надо. Когда возрастут нагрузки, рано или поздно поменяете решение.

s_batalov 11 мая 2021 в 16:07

В случае если потребуется масштабироваться — вы правы, ELK больше подходит. Но у нас сейчас такой задачи не стоит.
У нас основное — syslog и логи веб-серверов, пока это основной функционал, для которого Graylog достаточно. Да и elasticsearch в нем присутствует.

chemistmail 11 мая 2021 в 19:12

Что ELK что Grailog в плане масштабирования по факту одинаковы. Оба решения используют elastic для хранения. Имея опыт использования обоих решений в конфигурациях порядка 60к сообщений в секунду предпочитаю graylog. По ресурсам они по факту кушают практически одинаково, GELF в использовании на порядок проще чем регексы для ELK.
В graylog подкупает простота и всеядность коллектора логов. Хотя на вкус и цвет все фломастеры разные. )

vitaly_il1 11 мая 2021 в 17:05

По сравнению с ELK ресурсоемкость значительно ниже.

Логи же все равно хранятся в Elastic, то есть требуются те же ресурсы IMHO.

chupasaurus 11 мая 2021 в 18:45

Если используется Logstash, то он сам не против занять много ресурсов, если ingest в ES — то основной удар по CPU, но без аггрегаций и прочих ML незаметно.

vitaly_il1 12 мая 2021 в 03:48

Logstash совсем не обязателен, так что я все-таки не могу понять как Greylog может быть «легче».

SlavikF 11 мая 2021 в 17:37

Пару лет назад я пробовал Graylog.
Помню тогда упёрся в то, что для Graylog уж как-то жутко неудобно настраивать отсылко логов с клиентских систем.

Например для ELK — я ставлю FileBeats & MetricBeats, несколько строчек в конфиге — и всё.

А для Graylog надо было разбираться с их хитрыми протоколоми, которые я тогда не осилил.

Планируется ли продолжение о том, как настраивать отсылку логов с клиентов?

tubecleaner 12 мая 2021 в 05:28

Вообще, статья похоже на перевод «родной» инструкции по установке и имеет ценность, близкую к 0.
Касаемо вашего вопроса: даже версия 2, которая стояла у нас несколько лет, уже могла принимать почти любые форматы сообщений. Буквально только что перешел на 4-ю версию. У нее есть система управления агентами, которая работает с *Beat.

s_batalov 12 мая 2021 в 07:51

Добрый день!

Да, это как раз будут примеры использования во второй части, она выйдет совсем скоро)

EvgeniiR 16 мая 2021 в 20:30

Например для ELK — я ставлю FileBeats & MetricBeats, несколько строчек в конфиге — и всё.
А для Graylog надо было разбираться с их хитрыми протоколоми, которые я тогда не осилил.

Как простой вариант — засылать логи через filebeat, направив его на graylog с target=logstash, парочку лишних полей, которые требует logstash, можно почистить простеньким процессором в грейлоге, чтобы не мешались

astronom1 12 мая 2021 в 05:38

Graylog умеет обрабатывать логи, в которых записи идут блоками?
Например:
18/01/2021 12:20:10 Начало операции А
18/01/2021 12:21:15 Переход к операции Б
18/01/2021 12:22:20 Завершение операции Б
18/01/2021 12:23:10 Аварийное завершение операции А
И, надо, например, подсчитать, сколько таких аварийных блоков в логе за день

tubecleaner 12 мая 2021 в 07:15

Если вы имеете ввиду какой-либо способ обработки с сохранением состояния, то мне о таком неизвестно. Если же просто надо найти процент количества сообщений с «аварийным завершением» относительно сообщений о «начале операции», то это можно.

astronom1 12 мая 2021 в 07:58

Да именно второе. Спасибо за информацию, надо будет попробовать.

gecube 16 мая 2021 в 12:12

Если вы имеете ввиду какой-либо способ обработки с сохранением состояния, то мне о таком неизвестно.

по идее возможно. Но там нюансы будут на каждом шагу
https://community.graylog.org/t/multiline-log-index/3550/7
https://github.com/Graylog2/graylog2-server/issues/2465
Но проще всего, конечно, это на стороне отправителя править, чем на стороне хранилки, каковой является грейлог

itsoft 12 мая 2021 в 07:08

48 закладок и всего один плюс мой.

Как-то это дико странно. Получается статья зашла читателям Хабра, но не авторам Хабра. Хм… интересная статистика.

gecube 16 мая 2021 в 12:01

По сравнению с ELK ресурсоемкость значительно ниже.

как такое может быть, если в грейлоге под капотом ТОТ ЖЕ эластик, да еще и есть дополнительные компоненты? Я отказываюсь в это верить. Похоже на неподтвержденные практикой доводы. Я уж не говорю о том, что возможностей по оптимизации у ЕЛК даже больше, чем у грейлога… Просто это надо делать

Если не используем ipv6 — лучше отключить:

srsly? вообще-то IPv6 не так отключается

Еще я не понял, почему в разных сниппетах разная раскраска форматирования

s_batalov 17 мая 2021 в 09:29

Добрый день!

Ресурсоемкость проверяли на демо-стенде, под наши задачи Graylog показал себя менее ресурсоемким.
Тут стоит отталкиваться от объемов, уверен, в какой-то момент ELK может и должен проявить себя с лучшей стороны.

«возможностей по оптимизации у ЕЛК даже больше, чем у грейлога» — факт, обратного мы в статье и не утверждали.

По воросу ipv6 — не совсем корректно выразились, отключаем не ipv6, а входящие подключения на порты 546-547 (dhcp для IPv6)

Schalker 1 окт 2021 в 18:42

Спасибо за статью. Давно подбирался, а Ваша статья - подтолкнула.

Мои опыты с Graylog тут:

https://lan-meister.blogspot.com/2021/09/graylog.html#more

Зарегистрируйтесь на Хабре, чтобы оставить комментарий