MyZoneITteam28 авг 2023 в 19:32

Система визуализации и мониторинга. Grafana + Prometheus

Простой

5 мин

73K

Системное администрирование * IT-инфраструктура * Визуализация данных *

Туториал

Комментарии 14

olegtsss 29 авг 2023 в 01:05

Чем описанная связка будет отличаться в положительную сторону от Zabbix?

MyZoneITteam 29 авг 2023 в 06:54

На самом деле у Prometheus достаточно удобный и простой язык запросов prom.ql, плюсом возможность масштабирования под новые задачи и большое кол-во различных готовых exporter`ов без необходимости их писать с нуля.

olegtsss 29 авг 2023 в 08:16

Я периодически встречаю подобные реализации внутри российских коммерческих продуктов. Какие плюсы (или минусы) можно получить, если перенести работающую инфраструктуру мониторинга с Zabbix (zabbix сервер, zabbix прокси-серверы, zabbix-агенты, snmp агенты) на Prometheus (Grafana)?

MyZoneITteam 29 авг 2023 в 12:30

Что касается плюсов и минусов при переходе с Zabbix, на свой взгляд, могу выделить: Более приятная визуализация временных рядов и метрик у Prometheus+Grafana по отношению к Zabbix. Отсутствие как таковой БД с метриками, все храниться локально в виде логов. По поводу сбора метрики с удаленных устройств по snmp - есть готовый snmp_exporter, который как раз разворачивается удаленно . Мы разворачивали связку Grafana + Prometheus на одной машине, которая выступала в роли сервера, основную часть, а вот на остальных просто делали сбор метрик, которые забирал Prometheus просто по IP:port. А вот по функционалу Prometheus охватывает те же возможности мониторинга, что и Zabbix. Ниже приложу картинку со сравнением и ссылку на статью, где более подробно описаны ключевые отличия

MyZoneITteam 29 авг 2023 в 12:31

https://www.metricfire.com/blog/prometheus-vs-zabbix/ - Сравнение метрик Zabbix и Prometheus

olegtsss 29 авг 2023 в 13:05

Спасибо, ответили.

Dr_Wut 3 сен 2023 в 21:45

Ничем. Просто автор решил сделать выбор в сторону "можно-молодежно". Вся "веселуха" предложенного стека начинается когда надо будет:

хранить большой объем данных больше пары недель
Строить зависимости
Настраивать гибкие зависимые алерты

olegtsss 4 сен 2023 в 00:21

А чем обусловлено то, что подобную связку используют в коммерческих продуктах?

MyZoneITteam 4 сен 2023 в 09:51

Что касается хранения данных, период в 30 дней хранится нормально. Можно же указать и объем занимаемых логов, что бы ограничить при необходимости, а вот свыше 30 дней в моем случае не было необходимости хранить информацию, тут уже надо потестировать и посмотреть на поведение стека. Что касается зависимостей аллертов, в данном случае мы использовали простенького телеграм-бота для отправки уведомлений, или при повышении нагрузки на сервера или же отключение каких-либо критически важных служб.

OlegSochi 4 сен 2023 в 09:28

Классная статья! А как связаться с вами?

MyZoneITteam 4 сен 2023 в 09:52

Ответили в личку

Wan-Derer 10 апр 2024 в 10:43

Сделал у себя, получилось, спасибо!
Что касается качества статьи: в качестве "заметок для себя" - отлично. Но когда пишешь для других, надо бы более тщательно и подробно, надо рассчитывать в т.ч. на тех кто делает это в первый раз :)
Это я не ругаюсь, а дружески советую.

Wan-Derer 10 апр 2024 в 11:23

И дополню: вот эта панелька хорошая - 19269

MyZoneITteam 13 июн 2024 в 21:39

Спасибо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий