Как стать автором
Обновить

Система визуализации и мониторинга. Grafana + Prometheus

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров28K
Всего голосов 9: ↑9 и ↓0+9
Комментарии14

Комментарии 14

Чем описанная связка будет отличаться в положительную сторону от Zabbix?

На самом деле у Prometheus достаточно удобный и простой язык запросов prom.ql, плюсом возможность масштабирования под новые задачи и большое кол-во различных готовых exporter`ов без необходимости их писать с нуля.

Я периодически встречаю подобные реализации внутри российских коммерческих продуктов. Какие плюсы (или минусы) можно получить, если перенести работающую инфраструктуру мониторинга с Zabbix (zabbix сервер, zabbix прокси-серверы, zabbix-агенты, snmp агенты) на Prometheus (Grafana)?

Что касается плюсов и минусов при переходе с Zabbix, на свой взгляд, могу выделить: Более приятная визуализация временных рядов и метрик у Prometheus+Grafana по отношению к Zabbix. Отсутствие как таковой БД с метриками, все храниться локально в виде логов. По поводу сбора метрики с удаленных устройств по snmp - есть готовый snmp_exporter, который как раз разворачивается удаленно . Мы разворачивали связку Grafana + Prometheus на одной машине, которая выступала в роли сервера, основную часть, а вот на остальных просто делали сбор метрик, которые забирал Prometheus просто по IP:port. А вот по функционалу Prometheus охватывает те же возможности мониторинга, что и Zabbix. Ниже приложу картинку со сравнением и ссылку на статью, где более подробно описаны ключевые отличия

Спасибо, ответили.

Ничем. Просто автор решил сделать выбор в сторону "можно-молодежно". Вся "веселуха" предложенного стека начинается когда надо будет:

  • хранить большой объем данных больше пары недель

  • Строить зависимости

  • Настраивать гибкие зависимые алерты

А чем обусловлено то, что подобную связку используют в коммерческих продуктах?

Что касается хранения данных, период в 30 дней хранится нормально. Можно же указать и объем занимаемых логов, что бы ограничить при необходимости, а вот свыше 30 дней в моем случае не было необходимости хранить информацию, тут уже надо потестировать и посмотреть на поведение стека. Что касается зависимостей аллертов, в данном случае мы использовали простенького телеграм-бота для отправки уведомлений, или при повышении нагрузки на сервера или же отключение каких-либо критически важных служб.

Классная статья! А как связаться с вами?

Ответили в личку

Сделал у себя, получилось, спасибо!
Что касается качества статьи: в качестве "заметок для себя" - отлично. Но когда пишешь для других, надо бы более тщательно и подробно, надо рассчитывать в т.ч. на тех кто делает это в первый раз :)
Это я не ругаюсь, а дружески советую.

И дополню: вот эта панелька хорошая - 19269

Спасибо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории