Comments 4
Может получиться неприятный сюрприз. Например, если вдруг захочется проанализировать динамику потребления электричества сервером за последние пару лет.
Проблема всех статей про prometheus в том, что не рассказывается идеология и работа под капотом. Вот возьмем:
После запуска переходим в браузере по адресу "<server_address>:9100/metrics" и смотрим собираемые метрики.
Откуда берутся метрики?
Где взять список метрик с описанием? Для мониторинга загрузки надо брать node_cpu_seconds_total или node_load1(5\15)?
Почему разные ноды отдают разный набор метрик?
Что делать с метриками которые мне не нужны? Как отключить лишнее?
Как часто они обновляются (раз в секунду, раз в наносекунду, раз в минуту)?
А если мне нужно добавить свою?
Что на счет аутентификации?
Если машина с NodeExporter постоянно* меняет адрес (мы же не только на локалхос будем экспортер ставить), то каждый раз ползать в конфиг прометеуса?
Что делать если нода за двойным NAT'ом?
Т.е. после работы с zabbix\netxms приходится ломать привычные паттерны.
* например, если у нас есть филиал без статичного IP
Почему выбор пал именно на композицию "Prometheus, Node Exporter и Grafana", а не, например, Zabbix?
Меня больше интересует tls сборк метрики с https
а именно что cert файлы лежат в открытом виде в фс, никакой поддержки keystore/p12 нет
это нормально вообще?
Введение в мониторинг серверов с помощью Prometheus и Grafana