@MyZoneITteam Aug 28 2023 at 19:32

Система визуализации и мониторинга. Grafana + Prometheus

Easy

5 min

67K

System administration * IT Infrastructure * Data visualization *

Tutorial

Comments 14

@olegtsss Aug 29 2023 at 01:05

Чем описанная связка будет отличаться в положительную сторону от Zabbix?

@MyZoneITteam Aug 29 2023 at 06:54

На самом деле у Prometheus достаточно удобный и простой язык запросов prom.ql, плюсом возможность масштабирования под новые задачи и большое кол-во различных готовых exporter`ов без необходимости их писать с нуля.

@olegtsss Aug 29 2023 at 08:16

Я периодически встречаю подобные реализации внутри российских коммерческих продуктов. Какие плюсы (или минусы) можно получить, если перенести работающую инфраструктуру мониторинга с Zabbix (zabbix сервер, zabbix прокси-серверы, zabbix-агенты, snmp агенты) на Prometheus (Grafana)?

@MyZoneITteam Aug 29 2023 at 12:30

Что касается плюсов и минусов при переходе с Zabbix, на свой взгляд, могу выделить: Более приятная визуализация временных рядов и метрик у Prometheus+Grafana по отношению к Zabbix. Отсутствие как таковой БД с метриками, все храниться локально в виде логов. По поводу сбора метрики с удаленных устройств по snmp - есть готовый snmp_exporter, который как раз разворачивается удаленно . Мы разворачивали связку Grafana + Prometheus на одной машине, которая выступала в роли сервера, основную часть, а вот на остальных просто делали сбор метрик, которые забирал Prometheus просто по IP:port. А вот по функционалу Prometheus охватывает те же возможности мониторинга, что и Zabbix. Ниже приложу картинку со сравнением и ссылку на статью, где более подробно описаны ключевые отличия

@MyZoneITteam Aug 29 2023 at 12:31

https://www.metricfire.com/blog/prometheus-vs-zabbix/ - Сравнение метрик Zabbix и Prometheus

@olegtsss Aug 29 2023 at 13:05

Спасибо, ответили.

@Dr_Wut Sep 3 2023 at 21:45

Ничем. Просто автор решил сделать выбор в сторону "можно-молодежно". Вся "веселуха" предложенного стека начинается когда надо будет:

хранить большой объем данных больше пары недель
Строить зависимости
Настраивать гибкие зависимые алерты

@olegtsss Sep 4 2023 at 00:21

А чем обусловлено то, что подобную связку используют в коммерческих продуктах?

@MyZoneITteam Sep 4 2023 at 09:51

Что касается хранения данных, период в 30 дней хранится нормально. Можно же указать и объем занимаемых логов, что бы ограничить при необходимости, а вот свыше 30 дней в моем случае не было необходимости хранить информацию, тут уже надо потестировать и посмотреть на поведение стека. Что касается зависимостей аллертов, в данном случае мы использовали простенького телеграм-бота для отправки уведомлений, или при повышении нагрузки на сервера или же отключение каких-либо критически важных служб.

@OlegSochi Sep 4 2023 at 09:28

Классная статья! А как связаться с вами?

@MyZoneITteam Sep 4 2023 at 09:52

Ответили в личку

@Wan-Derer Apr 10 2024 at 10:43

Сделал у себя, получилось, спасибо!
Что касается качества статьи: в качестве "заметок для себя" - отлично. Но когда пишешь для других, надо бы более тщательно и подробно, надо рассчитывать в т.ч. на тех кто делает это в первый раз :)
Это я не ругаюсь, а дружески советую.

@Wan-Derer Apr 10 2024 at 11:23

И дополню: вот эта панелька хорошая - 19269

@MyZoneITteam Jun 13 2024 at 21:39

Спасибо