Comments 14
Чем описанная связка будет отличаться в положительную сторону от Zabbix?
На самом деле у Prometheus достаточно удобный и простой язык запросов prom.ql, плюсом возможность масштабирования под новые задачи и большое кол-во различных готовых exporter`ов без необходимости их писать с нуля.
Я периодически встречаю подобные реализации внутри российских коммерческих продуктов. Какие плюсы (или минусы) можно получить, если перенести работающую инфраструктуру мониторинга с Zabbix (zabbix сервер, zabbix прокси-серверы, zabbix-агенты, snmp агенты) на Prometheus (Grafana)?
Что касается плюсов и минусов при переходе с Zabbix, на свой взгляд, могу выделить: Более приятная визуализация временных рядов и метрик у Prometheus+Grafana по отношению к Zabbix. Отсутствие как таковой БД с метриками, все храниться локально в виде логов. По поводу сбора метрики с удаленных устройств по snmp - есть готовый snmp_exporter, который как раз разворачивается удаленно . Мы разворачивали связку Grafana + Prometheus на одной машине, которая выступала в роли сервера, основную часть, а вот на остальных просто делали сбор метрик, которые забирал Prometheus просто по IP:port. А вот по функционалу Prometheus охватывает те же возможности мониторинга, что и Zabbix. Ниже приложу картинку со сравнением и ссылку на статью, где более подробно описаны ключевые отличия

https://www.metricfire.com/blog/prometheus-vs-zabbix/ - Сравнение метрик Zabbix и Prometheus
Ничем. Просто автор решил сделать выбор в сторону "можно-молодежно". Вся "веселуха" предложенного стека начинается когда надо будет:
хранить большой объем данных больше пары недель
Строить зависимости
Настраивать гибкие зависимые алерты
А чем обусловлено то, что подобную связку используют в коммерческих продуктах?
Что касается хранения данных, период в 30 дней хранится нормально. Можно же указать и объем занимаемых логов, что бы ограничить при необходимости, а вот свыше 30 дней в моем случае не было необходимости хранить информацию, тут уже надо потестировать и посмотреть на поведение стека. Что касается зависимостей аллертов, в данном случае мы использовали простенького телеграм-бота для отправки уведомлений, или при повышении нагрузки на сервера или же отключение каких-либо критически важных служб.
Классная статья! А как связаться с вами?
Сделал у себя, получилось, спасибо!
Что касается качества статьи: в качестве "заметок для себя" - отлично. Но когда пишешь для других, надо бы более тщательно и подробно, надо рассчитывать в т.ч. на тех кто делает это в первый раз :)
Это я не ругаюсь, а дружески советую.
Система визуализации и мониторинга. Grafana + Prometheus