andrey_chuyan24 окт 2024 в 15:08

Zabbix vs Prometheus. Что выбрать для гетерогенной инфраструктуры?

Простой

15 мин

44K

DevOps * Сетевые технологии * Настройка Linux *

Туториал

+14

Комментарии 30

ky0 24 окт 2024 в 15:14

TLDR:

Часто появляются и исчезают сущности? -- нет --> Zabbix
|
да
|
V
Не Zabbix

andrey_chuyan 24 окт 2024 в 15:20

Именно так

saboteur_kiev 24 окт 2024 в 15:33

Почему нельзя испоьзовать Zabbix с Графаной?
Графана не часть прометеуса и отлично живет без него

j_larkin 24 окт 2024 в 16:15

Да и с заббиксом прекрасно дружит

melkorus 28 окт 2024 в 13:27

Категорически с вами согласен, как ядро системы мониторинга использую Zabbix + интеграцию с Prometheus (VM) и визуализацию как единую точку в виде Grafana.

andrey_chuyan 24 окт 2024 в 16:26

Так как целью статьи было сравнить prometheus и zabbix в контексте минимальной работоспособности и Zabbix уже имеет встроенную систему визуализацию дашбордов, в данном примере мы к нему не подключаем Grafana. А так да, подключить можно без проблем.

saboteur_kiev 24 окт 2024 в 17:54

Так прометеус вроде тоже имеет простенькую систему визуализации дашбордов, в этом плане тогда минимально можно пробовать без графаны вообще?

А в целом, мне прометеус не нравится по трем причинам. Во-первых изначальная архитектура усложнена и не слишком гибка. Точнее гибкость есть, но она обеспечивается сложнее, чем в других мониторинговых системах.
Популярность прометеуса достигнута была в осномном тем, что он из коробки работает с некоторыми популярными наборами метрик, в результате многие просто по инструкции его ставят в виде next-next-completed, но не понимают ни что под капотом ни как оно работает ни как его кастомайзить. А кастомайзить его сложнее, чем другие мониторинговые системы...

К сожалению, мой опыт работы с прометеусом в основном на уровне proof of concept, поэтоум я могу сильно ошибаться, и ищу статьи где наглядно бы подтвердили или опровергли мое мнение.

NekoYos 24 окт 2024 в 18:23

Комплексно реализованный прометей+графана+алертменеджер на практике оказался более гибким чем заббикс. Можно и заббикс с графаной реализовать, но как будет оно работь с тоной метрик по сравнении с прометеем? Хотя в таких случаях еще лучше будет victoriametrics

andrey_chuyan 24 окт 2024 в 18:36

Мне нравится что он легковеснее, меньше ресурсов ест

saboteur_kiev 24 окт 2024 в 19:54

А без заббикса и без прометея?
У меня так работает достаточно неплохо

NekoYos 24 окт 2024 в 20:02

А метрики куда собираются?

saboteur_kiev 24 окт 2024 в 22:36

В инфлюкс. Графана с инфлюксом, и для метрик отлично. Приложение само кидает метрики в инфлюкс, что умеет делать благодаря библиотеке micrometers, никаких лишних прослоек.

strvv 10 дек 2024 в 13:49

Был бы интересен Ваш опыт, чтобы иметь понятие о возможных ямах и ухабах на пути строительства систем мониторинга. Потому что построение систем мониторинга в гетерогенных сетях представляет то ещё SM..
Хотя-бы обзорная - типа мои страдания с системами мониторинга:
Чем какая запомнилась в +, в чём -, что неопределенно в Вашей ситуации, но видите как перспективную +-..

denaspireone 28 окт 2024 в 15:44

А вы посмотрите вместо prometheus на victoriametrics single. Там встроенный ui есть и графики можно свои пихать, и много чего еще умеет. Вот демо https://play.victoriametrics.com/select/0/vmui. По фичам смотрите доку https://docs.victoriametrics.com/single-server-victoriametrics/#prominent-features. Есть еще и кластер - там же в доке и он open source.

andrey_chuyan 24 окт 2024 в 16:14

AlexGluck 24 окт 2024 в 20:09

А почему не заббикс+Виктория-Метрикс?

Графана сверху закрывает вопрос визуализации.

nakamura 25 окт 2024 в 04:29

Мудохался собрать конфиг с Fortigate генератором для Grafana , нажал один раз apt-update, все слетело.

PrinceKorwin 25 окт 2024 в 07:35

А что можете посоветовать для мониторинга небольшого решения: одна БД (postgresql), nginx, и с пяток запущенных процессов (даже не докер)?

Все крутится на дохлой vps с 1Гб оперативке.

Есть какое-то не жрущее и простое решение для мониторинга подобных небольших инсталляций?

andrey_chuyan 25 окт 2024 в 07:53

Prometheus как раз и подойдет, мониторить службы будет удобно

saboteur_kiev 25 окт 2024 в 09:25

заббикс, mmonit, sensu, grafana и пару скриптов. Все зависит от того, насколько вы скриптописатель, разработчик и с какой системой работали.

Графана стала практически де-факто визуализатором разных метрик, но она может брать данные из любой базы. Вроде для постгреса бесплатный коннектор даже.
Наполнять данные для графаны надо чем-то, тут разные есть варианты, начиная от банальных шелл/перл/питон скриптов, и вплоть до прямого обращенгия приложения в базу. Мониторинг вообще такое общее слово, что без детализации можно сотни предположений делать

ThingCrimson 25 окт 2024 в 12:04

Возможно Вам подойдёт Munin? Достаточно простое клиент-серверное решение; мало жрущее; хранение и визуализация на RRD построена. Я для дома и небольших инсталляций таким пользуюсь лет 15, доволен.

Belkau77 25 окт 2024 в 08:43

Полезная тема и статья, плюсую.
Технические спецификации и код можно было бы вынести в drop-down чтобы было не так тяжело листать (из оформительского).
но в целом все гуд

andrey_chuyan 25 окт 2024 в 10:44

спасибо, учту

321785 25 окт 2024 в 10:22

Для таких как вы поясню, единственно интуитивно понятный для человека интерфейс - это женская грудь, и при этом всё равно часто случаются сбои. Всему остальному НАДО учиться.

PetyaUmniy 25 окт 2024 в 15:53

Кратковременное хранение данных

Странное заявление. У prometheus плотность хранения примерно 1-2 байта на семпл. А у zabbix сколько? Сдается мне что значительно хуже.
Касательно downsampling - в некотором роде справедливо. Но так же справедливо считать thanos, где он есть, вариантом prometheus.

Нужно настраивать и администрировать два или больше отдельных компонента (Prometheus и Grafana) плюс Alertmanager

Вы так же упустили максимально близкий к zabbix случай, когда нет alertmanager. А алерты конфигурируются не в коде prometheus, а навозюкиваются мышкой в grafana. Что может быть проще для новичков. Уверен в grafana тоже достаточно много интеграций.
А еще prometheus способен работать в режиме agent mode (и даже в отличии от zabbix докачивать 2 часа метрик после падения связи), и в таком случае не требуются отталкивающее многих в небольших инсталяциях централизованное динамическое SD. Я, например, поступаю именно так. У меня не слишком много инстансов (примерно 200) и они находятся в паре десятков не связанных сетей за NAT. Просто раскладываю с помощью ansible prometheus agent (45Mb RSS) на каждый инстанс и делаю везде одинаковый (за исключением лейблов инстанса) статический конфиг с remote write и docker SD. А там уж какие контейнеры были подняты на хосте - то и "скребется".

andrey_chuyan 25 окт 2024 в 17:09

То есть Prometheus на инстансах создают изолированные базы метрик и высылают их корневому серверу в http запросах?

PetyaUmniy 25 окт 2024 в 19:01

Да. Плюс минус так.
Как я понимаю создается неполноценный инстанс tsdb в котором не работает compaction и в котором данные удаляются после успешной доставки.

omgiafs 7 ноя 2024 в 02:37

Заббикс тоже умеет данные докачивать. Всё зависит от настроек прокси-серверов на площадках. Зададите им большой кеш и время хранения метрик, и они тоже после потери связи м сервером на него данные закинут в том же порядке, в котором их получили. И агент с проксёй точно так же взаимодействует. Итого, Заббикс тоже позволяет не терять данные при потере связи на период до нескольких часов.

andrey_chuyan 25 окт 2024 в 17:08

melkorus 28 окт 2024 в 13:24

На мой взгляд есть некоторые моменты с которыми не совсем согласен. (Возможно подсвечу некоторые моменты):

Очепятка в виде - "Graphana".
"Хранение данных: Использует реляционные БД для хранения данных ". Он конечно использует реляционные, но в больших инсталляциях используется преимущественно PostgreSQL + TimescaleDB (Не забывая сделать тюнинг). (https://www.zabbix.com/documentation/6.0/ru/manual/appendix/install/timescaledb)
"Масштабируемость: На больших объемах данных может возникнуть проблема масштабируемости и производительности." Используете распределенную архитектуру, в виде Zabbix Proxy. Тюните под свои нужды и возможности. Как Базу данных, так и сам Proxy + HA. Единственное, это довольно ресурсоемко.
(https://www.zabbix.com/documentation/6.0/ru/manual/concepts/server/ha), это больше к серверам но по сути - отправная точка.
"Кратковременное хранение данных: Преимущественно ориентирован на кратковременное хранение данных, хотя интеграция с внешними хранилищами позволяет решить эту проблему." Берем и используем Prometheus - Federation. (https://prometheus.io/docs/prometheus/latest/federation/)
Так же - Интеграция k8s + Zabbix. Пока сам не оттестировал но вполне не плохое решение. Понятное дело то что Prometheus хорош в мониторинге k8s, но и Zabbix от него не отстает.
(https://blog.zabbix.com/monitoring-kubernetes-with-zabbix/25055/)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий