Как стать автором
Обновить

PRTG: Система мониторинга и некоторые полезные советы

Время на прочтение 8 мин
Количество просмотров 114K


На рынке существует огромное множество систем мониторинга, начиная от самых простых и бесплатных и заканчивая дорогими решениями от известных производителей, таких как Hewlett-Packard и Microsoft.

В этой статье я расскажу вам о системе PRTG Network Monitor от компании Paessler AG. Сразу хочу оговориться, что я не являюсь серьезным IT специалистом, а работаю в области безопасности, хотя и достаточно тесно сотрудничаю с департаментами IT и IT Security.

Выбор ПО производился мной на основании поверхностного анализа сайтов производителей.

Введение: Почему PRTG?


В июне 2011 года мне была поставлена достаточно простая задача – необходимо было отслеживать работу компьютеров сотрудников охраны и сотрудников моего департамента во всех офисах организации по следующим пунктам:

• Включен ли компьютер?

• Выполнен ли вход в компьютер хотя бы одной доменной учетной записи?

• Установлен ли на ПК корпоративный антивирус?

• Обновлены ли антивирусные базы?

И необходимо было автоматизировать выпуск отчетов из системы мониторинга, для предоставления руководству на еженедельной основе.

Делать это необходимо было самостоятельно без вмешательства сотрудников IT и, не прибегая к их помощи.

Опыта в области мониторинга у меня на тот момент не было абсолютно и мне пришлось несколько дней анализировать то, что мне предложили Google и Яндекс. В поисковой выдаче я обнаружил и PRTG, который предлагался абсолютно бесплатно, но с ограничением количества сенсоров, которое можно установить.

Такой вариант меня вполне устраивал, так как в случае необходимости деньги на покупку коммерческой версии имелись. Я понимал, что 10 сенсоров мне никак не хватит даже для демонстрации возможностей системы руководству, и я купил самую дешевую платную версию (прайс-лист ниже представлен на июнь 2011 года – сейчас цены выше), включающую в себя 100 сенсоров:











Именно после этого и началось мое знакомство с системой.

Общий функционал системы


Система за последние почти полтора года моего с ней знакомства значительно улучшилась (билды выходят стабильно раз в месяц, а бывает и чаще). Постараюсь описать ее возможности максимально подробно, а так же рассказать о некоторых интересных вещах, которые я научился делать в данном ПО.


(Рис. 1 — Login Screen)

В данном случае показан вход в систему через Web-интерфейс. Если вам не привычно использовать браузер для работы с системой вы можете использовать приложения для ваших мобильных устройств (пока только под Android) или же установить на ПК Enterprise Console, которая практически на 100% повторяет интерфейс через Web.

Как я уже показал на скриншоте выше, система поддерживает авторизацию по доменным учетным записям, но вы можете создавать УЗ и вручную, если у вас есть такое желание.

Сразу после входа вы попадете на экран приветствия:


(Рис. 2 — Экран приветствия)

Если это ваш первый вход в систему, после установки, то рекомендую перейти по ссылке Run Configuration Guru , которая поможет сразу же настроить большинство изначальных конфигов:


(Рис. 3 — Configuration Guru)

Именно тут вы настроите:

• Логин и пароль вашего корневого аккаунта администратора (core admin)

• Данные для использования с WMI сенсорами (обычно это учетная запись, имеющая администраторские полномочия в домене)

• Если вы используете UNIX или LINUX системы, вы так же сможете прописать данные ваших УЗ.

• Данные для соединения с интернетом (например, в случае, если в вашей организации используется proxy-сервер) — доступ к интернету полезен как минимум тем, что вы сможете активировать систему без отправки кодов на почту компании paessler, а напрямую, но и конечно же при стабильном интернет соединении система сама сможет скачивать и устанавливать обновления.

• Найдете ПК, сервера и прочее периферийное оборудование в автоматическом режиме (если сеть или сегмент сети небольшой и не будет искаться несколько сотен машин).

После базовой настройки вы попадете на страницу, где отображаются все ваши устройства и сенсоры:


(Рис. 4 — Главная страница устройств)

Индикаторы разных цветов означают следующее:

Красный — ошибка \ недоступно \ превышение заданного параметра \ недостаток до заданного параметра

Оранжевый — нетипичное поведение сенсора (Пример: Пинг в данный момент 200 ms, при среднем пинге на данном устройстве в данное время дня \ недели 110 ms)

Желтый — предупреждение (сенсор приближается к критичных границам заданного параметра или же стал недоступен в момент прошлой проверки)

Зеленый — штатное поведение сенсора

Синий — пауза (устанавливается либо вручную, либо автоматически). В паузу сенсор может поставить как администратор, так и сама система по нескольким причинам: главный для устройства сенсор недоступен и все остальные сенсоры устройства установлены в режим паузы; слишком большое количество запросов одновременно — сенсор будет перезапущен после получения данных с других сенсоров.

Серый — не получены данные с сенсора (только включили, только закончился режим паузы)

Hint: Как я уже написал выше режим паузы может проставляться автоматически. В моей установке системы в каждом устройстве прописана следующая логика — если сенсор ping (главный на каждом устройстве) недоступен, то все остальные сенсоры на устройстве автоматически попадают в режим паузы, чтобы не отправлять запросы впустую (все-равно устройство скорее всего недоступно).


(Рис. 5 — Поведение устройства при паузе главного сенсора)

Далее рассмотрим типовое решение (созданное в виде шаблона), которое я использую для вновь добавляемых компьютеров:


(Рис. 6 — Типовой ПК)

Ping — стандартный ping до машины. Главный сенсор на устройстве.

Users logged in — кто залогинен на данной конкретной машине.

Free Disk Space — % свободного места на жестком диске.

CPU Load — % загруженности процессора(-ов).

Memory — % использования памяти.

Uptime — время с момента последней перезагрузки ПК. Установлено ручное предупреждение — свыше 14 дней — оповещать администратора.

HDD Smart — проверки нескольких параметров чтения \ записи жесткого диска.

Если говорить о представлении устройств, то существует 2 варианта:

1.) Уже представленный выше вариант группировки сенсоров внутри устройств.

2.) Режим карты — вы сами рисуете \ моделируете карту расположения ваших устройств для более удобного визуального восприятия.


(Рис. 7 — Карта)

На этом я закончу показ базового функционала работы системы, и мы перейдем к тому, какие сенсоры можно настроить в системе и какие интересные решения мне уже удалось спроектировать.

Немного о сенсорах


На данный момент в системе доступно свыше 130 различных сенсоров. Подробнее про каждый из них можно прочитать на странице Описание Сенсоров.

Сенсоры делятся на следующие условные категории:

• Common Sensors
• Bandwidth Monitoring Sensors
• Web Servers (HTTP) Sensors
• SNMP Sensors
• Windows/WMI Sensors
• Linux/Unix/OS X Sensors
• Virtual Servers Sensors
• Mail Servers Sensors
• SQL Database Servers Sensors
• File Servers Sensors
• Various Servers Sensors
• VoIP and QoS Sensors
• Hardware Parameter Sensors
• Custom Sensors

Меню добавления сенсоров начиная с 11 версии ПО стало крайне удобным и понятным:


(Рис. 8 — Добавление нового сенсора)

Можно либо выбирать категорию, а потом выбирать нужный сенсор, либо искать сенсор в списке снизу, либо же ввести часть названия и выбирать сенсор из уже отсортированного списка.

Я использую меньше половины предложенных разработчиком типов сенсоров, но и этого мне вполне хватает, чтобы держать вверенные мне сервера и пк под полным контролем и быть уверенным, что все работает штатно.

Читать про базовое описание сенсоров было бы достаточно скучно, поэтому я предпочту описать несколько интересных примеров из своего опыта работы с системой.

Стой! Кто идет?

Первым удачным примером стал поиск нарушителей. Нарушителем в данном конкретном случае мы считаем любого пользователя, который не является «владельцем» конкретного ПК.

Для поиска нарушителя мы будем использовать 2 сенсора типа Users logged in. Первый сенсор будет отображать нам реальную картину — кто в данный момент залогинен на машину (и залогинен ли вообще), а второй сенсор будет иметь на себе фильтр с логинами разрешенных сотрудников (т.е. эти логины не будут отражаться).

На второй сенсор мы устанавливаем оповещение — если количество пользователей больше 0 (а мы помним, что нужные нам логины просто не отобразятся), то немедленно оповестить администратора по почте. Логин нарушителя вы получите в письме вместе с именем и IP адресом машины, куда сотрудник пытался зайти.

Очень действенно если вам действительно необходимо оценивать, кто заходил на ПК достаточно оперативно.

IT помощник

В нашей организации 100% удаленной помощи сотрудникам оказывается через DMWare. Чтобы отслеживать удаленные входы на ПК я установил сенсор process, который отслеживает процесс DMWare Mini Remote Control и как только процесс начинает забирать больше 10 МБ памяти — выдает оповещение с именем \ IP машины. Штатно в моем случае процесс забирает 6-7 МБ, а в рабочем состоянии (когда кто-то использует удаленный вход) около 20 МБ. Пока за полгода использования этого трюка не было ни 1 сбоя \ ложного срабатывания.

Третий полезный пример уже был описан мной ранее — это пауза всех сенсоров после неполучения ответа от сенсора ping.

Помимо этого я настроил sms оповещения, в случае если какой-либо из серверов (ping сервера) недоступен более 10 минут. Настраивалось на ресурсе bulksms. Единственный минус — названия должны быть исключительно на латинице, в противном случае в смс вы получите, что у вас недоступен сервер ??????.

Важно: Если вы не нашли сенсора, который удовлетворяет вашим требованиям это еще не повод отказываться от системы — у вас есть возможность вручную подгрузить скрипты \ написать сенсор. Это делает систему еще более кастомизированной.

В завершение этой главы отмечу, что сенсорный функционал действительно очень богат и может выполнять множество различных действий — дело за вами. Описанное выше это лишь примеры того как в данный момент использую систему я и возможно воодушевившись данными примерами вы захотите посмотреть, а не лучше ли данная система чем то, что в данный момент используете вы сами.

Отчеты


В данный момент в моей установке на автоматическое формирование поставлено 4 отчета: еженедельные отчеты по ПК Москвы и ПК в регионах, а так же их ежемесячные аналоги.

На ручном запуске установлены отчеты по доступности серверов и конкретных процессов \ сервисов на этих самых серверах.

В качестве примера покажу меню ежемесячного регионального отчета:


(Рис. 9 — Отчет)

Несмотря на то, что отчет установлен в автоматический режим у вас есть возможность и ручного запуска процесса.

Как можно увидеть из скриншота у вас есть 3 опции по выпуску отчетов: просмотреть в online режиме html страницу с отчетом, сохранить отчет в виде PDF файла на сервере и уведомить об окончании формирования отчета по почте или же отправить сам PDF файл конечному пользователю.

На закладке Stored Reports вы найдете все сохраненные на вашем сервере файлы.

Если сохранять отчет в PDF, то выглядеть он будет примерно следующим образом:


(Рис. 10 — PDF Отчет)

В данном случае использовано графическое представление данных. Если вас интересует конкретика, то вы можете формировать отчеты в текстовом виде в разрезе, например 5 минут. Тогда вы будете получать вместо картинки строки вида:

01.01.2012 09:00:00 — 01.01.2012 09:05:00 Ping 100% Available

Большинство отчетов вам достаточно настроить 1 раз, протестировать его с пользователем, который будет его использовать и забыть. Формат представления в моем случае очень понравился даже тем, кто компьютера боится как огня и обычно прибегает с вопросами типа "Я 10 раз неправильно ввел пароль, а компьютер почему-то заблокировался"

Логи


Система логирования в данном программном продукте безусловно есть и логирует она абсолютно все, начиная от поведения сенсоров и, заканчивая формированием отчетности и отправкой смс сообщений.


(Рис. 11 — Пример лога)

Тем, кто любит копаться в деталях эта закладка, безусловно, окажется полезной, а тем более она визуально приятна, так как лог раскрашивается разными цветами в зависимости от критичности и типа события.

Заключение


На данный момент мной и моим сотрудником завершено 3 фазы улучшения системы. С каждой фазой мы добавляем и находим для себя все больше и больше функций и хитростей в настройках. Еще в августе прошлого года, когда я устанавливал купленную после презентации руководству систему, я и не подозревал, что смогу довести ее до такого состояния, в котором она находится в данный момент.

Процесс совершенствования системы мониторинга может длится годами и все-равно не будет доведен до совершенства. В данном обзоре я постарался показать самые на мой взгляд актуальные вещи, найденные мной в данном программном продукте, а так же некоторые хитрости, которые я на данный момент уже использую.

Надеюсь после прочтения данной статьи хотя бы несколько человек найдут для себя что-то интересное, а возможно и очень нужное в работе.

Список полезных сайтов по тематике


Сайт разработчика — Paessler AG
Дополнительные сенсоры, аддоны и программы для PRTG
Теги:
Хабы:
+1
Комментарии 7
Комментарии Комментарии 7

Публикации

Истории

Работа

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн