All streams
Search
Write a publication
Pull to refresh
7
0
Игорь @Igolu

Системный администратор

Send message

Добрый день.

Прошу прощения за долгий ответ.

В статье была допущена ошибка. В описании секции [agent] должны использоваться не двойные, а одинарные квадратные скобки.

Попробуйте изменить ваш конфиг следующим образом и еще раз сделайте тестовый запуск telegraf.

[agent]
interval = "5s"
round_interval = true
metric_batch_size = 1000
metric_buffer_limit = 10000
collection_jitter = "0s"
flush_jitter = "0s"
precision = ""

Спасибо за полезные замечания.
А можете рассказать подробнее как вы используете Get-ServerHealth, как отслеживаете вывод этой команды?

Добрый день..
Согласен с вами, Zabbix - очень мощная система и вполне подошла бы для решения этой задачи. На тот момент, когда искал решения для мониторинга, показалось что Grafana + InfluxDB будут более "легковесной" связкой. Хотя это только на уровне ощущений, производительность и потребление серверных ресурсов я не сравнивал.

Добрый день.
Я бы сказал, что основное преимущество такого решения - его гибкость.
Приведу пример.
В моем случае "почтовый сервис" состоял не только из одного Exchange Server. Вместе с ним использовался Cisco Email Security Appliance (ESA), который стоял перед Exchange и отвечал за прием и отправку сообщений на внешние сервера и проверку их на СПАМ.
Так вот, имея в своем распоряжении сервер с Grafana, довольно просто получилось добавить на один дашборд метрики с двух совершенно разных систем Exchange и ESA.
ESA отдает метрики через HTTP в формате XML. Если кому-то будет интересно, как я их добавил в Grafana, могу рассказать.

Добрый день.

Отвечу сначала на второй вопрос.

Напрямую, описанный способ мониторинга, никак не защитит вас от попадания вашего IP в черный список.

Но, например, вы можете добавить в мониторинг метрики очереди сообщений в Exchange.

Для Exchange 2010 есть счетчик "\MSExchangeTransport Queues(_total)\Aggregate Delivery Queue Length (All Queues)", который показывает общее количество сообщений запланированных на доставку во всех очередях.

В Exchange 2013 этот счетчик называется "\msexchangetransport queues(_total)\messages queued for delivery"

Если ваш сервер будет испытывать проблемы с отправкой сообщений на внешние сервера, то этот счетчик начнет сильно расти, что косвенно может означать, например, что удаленный сервер не принимают запрос на подключение от вашего сервера. И одна из возможных причин — это как раз попадание в черный список.

 

Что касается метрик, которые можно мониторить.

Агент Telegraf позволяет собирать любые метрики, которые доступы с помощью механизма Performance Counters.

Самые основные разделы и метрики (Active Directory Domain Controller, DFS, DNS, IIS, .NET), немного описаны в документации Telegraf https://github.com/influxdata/telegraf/blob/release-1.20/plugins/inputs/win_perf_counters/README.md

Относительно темы стати и мониторинга Exchange, рекомендую посмотреть вот эту статью на сайте Microsoft, в ней более детально описываются метрики относящиеся к Exchange.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity