Добрый день.. Согласен с вами, Zabbix - очень мощная система и вполне подошла бы для решения этой задачи. На тот момент, когда искал решения для мониторинга, показалось что Grafana + InfluxDB будут более "легковесной" связкой. Хотя это только на уровне ощущений, производительность и потребление серверных ресурсов я не сравнивал.
Добрый день. Я бы сказал, что основное преимущество такого решения - его гибкость. Приведу пример. В моем случае "почтовый сервис" состоял не только из одного Exchange Server. Вместе с ним использовался Cisco Email Security Appliance (ESA), который стоял перед Exchange и отвечал за прием и отправку сообщений на внешние сервера и проверку их на СПАМ. Так вот, имея в своем распоряжении сервер с Grafana, довольно просто получилось добавить на один дашборд метрики с двух совершенно разных систем Exchange и ESA. ESA отдает метрики через HTTP в формате XML. Если кому-то будет интересно, как я их добавил в Grafana, могу рассказать.
Напрямую, описанный способ мониторинга, никак не защитит вас от попадания вашего IP в черный список.
Но, например, вы можете добавить в мониторинг метрики очереди сообщений в Exchange.
Для Exchange 2010 есть счетчик "\MSExchangeTransport Queues(_total)\Aggregate Delivery Queue Length (All Queues)", который показывает общее количество сообщений запланированных на доставку во всех очередях.
В Exchange 2013 этот счетчик называется "\msexchangetransport queues(_total)\messages queued for delivery"
Если ваш сервер будет испытывать проблемы с отправкой сообщений на внешние сервера, то этот счетчик начнет сильно расти, что косвенно может означать, например, что удаленный сервер не принимают запрос на подключение от вашего сервера. И одна из возможных причин — это как раз попадание в черный список.
Что касается метрик, которые можно мониторить.
Агент Telegraf позволяет собирать любые метрики, которые доступы с помощью механизма Performance Counters.
Относительно темы стати и мониторинга Exchange, рекомендую посмотреть вот эту статью на сайте Microsoft, в ней более детально описываются метрики относящиеся к Exchange.
Добрый день.
Прошу прощения за долгий ответ.
В статье была допущена ошибка. В описании секции [agent] должны использоваться не двойные, а одинарные квадратные скобки.
Попробуйте изменить ваш конфиг следующим образом и еще раз сделайте тестовый запуск telegraf.
Спасибо за полезные замечания.
А можете рассказать подробнее как вы используете Get-ServerHealth, как отслеживаете вывод этой команды?
Добрый день..
Согласен с вами, Zabbix - очень мощная система и вполне подошла бы для решения этой задачи. На тот момент, когда искал решения для мониторинга, показалось что Grafana + InfluxDB будут более "легковесной" связкой. Хотя это только на уровне ощущений, производительность и потребление серверных ресурсов я не сравнивал.
Добрый день.
Я бы сказал, что основное преимущество такого решения - его гибкость.
Приведу пример.
В моем случае "почтовый сервис" состоял не только из одного Exchange Server. Вместе с ним использовался Cisco Email Security Appliance (ESA), который стоял перед Exchange и отвечал за прием и отправку сообщений на внешние сервера и проверку их на СПАМ.
Так вот, имея в своем распоряжении сервер с Grafana, довольно просто получилось добавить на один дашборд метрики с двух совершенно разных систем Exchange и ESA.
ESA отдает метрики через HTTP в формате XML. Если кому-то будет интересно, как я их добавил в Grafana, могу рассказать.
Добрый день.
Отвечу сначала на второй вопрос.
Напрямую, описанный способ мониторинга, никак не защитит вас от попадания вашего IP в черный список.
Но, например, вы можете добавить в мониторинг метрики очереди сообщений в Exchange.
Для Exchange 2010 есть счетчик "\MSExchangeTransport Queues(_total)\Aggregate Delivery Queue Length (All Queues)", который показывает общее количество сообщений запланированных на доставку во всех очередях.
В Exchange 2013 этот счетчик называется "\msexchangetransport queues(_total)\messages queued for delivery"
Если ваш сервер будет испытывать проблемы с отправкой сообщений на внешние сервера, то этот счетчик начнет сильно расти, что косвенно может означать, например, что удаленный сервер не принимают запрос на подключение от вашего сервера. И одна из возможных причин — это как раз попадание в черный список.
Что касается метрик, которые можно мониторить.
Агент Telegraf позволяет собирать любые метрики, которые доступы с помощью механизма Performance Counters.
Самые основные разделы и метрики (Active Directory Domain Controller, DFS, DNS, IIS, .NET), немного описаны в документации Telegraf https://github.com/influxdata/telegraf/blob/release-1.20/plugins/inputs/win_perf_counters/README.md
Относительно темы стати и мониторинга Exchange, рекомендую посмотреть вот эту статью на сайте Microsoft, в ней более детально описываются метрики относящиеся к Exchange.