PRTG: Система мониторинга и некоторые полезные советы



На рынке существует огромное множество систем мониторинга, начиная от самых простых и бесплатных и заканчивая дорогими решениями от известных производителей, таких как Hewlett-Packard и Microsoft.

В этой статье я расскажу вам о системе PRTG Network Monitor от компании Paessler AG. Сразу хочу оговориться, что я не являюсь серьезным IT специалистом, а работаю в области безопасности, хотя и достаточно тесно сотрудничаю с департаментами IT и IT Security.

Выбор ПО производился мной на основании поверхностного анализа сайтов производителей.

Введение: Почему PRTG?


В июне 2011 года мне была поставлена достаточно простая задача – необходимо было отслеживать работу компьютеров сотрудников охраны и сотрудников моего департамента во всех офисах организации по следующим пунктам:

• Включен ли компьютер?

• Выполнен ли вход в компьютер хотя бы одной доменной учетной записи?

• Установлен ли на ПК корпоративный антивирус?

• Обновлены ли антивирусные базы?

И необходимо было автоматизировать выпуск отчетов из системы мониторинга, для предоставления руководству на еженедельной основе.

Делать это необходимо было самостоятельно без вмешательства сотрудников IT и, не прибегая к их помощи.

Опыта в области мониторинга у меня на тот момент не было абсолютно и мне пришлось несколько дней анализировать то, что мне предложили Google и Яндекс. В поисковой выдаче я обнаружил и PRTG, который предлагался абсолютно бесплатно, но с ограничением количества сенсоров, которое можно установить.

Такой вариант меня вполне устраивал, так как в случае необходимости деньги на покупку коммерческой версии имелись. Я понимал, что 10 сенсоров мне никак не хватит даже для демонстрации возможностей системы руководству, и я купил самую дешевую платную версию (прайс-лист ниже представлен на июнь 2011 года – сейчас цены выше), включающую в себя 100 сенсоров:











Именно после этого и началось мое знакомство с системой.

Общий функционал системы


Система за последние почти полтора года моего с ней знакомства значительно улучшилась (билды выходят стабильно раз в месяц, а бывает и чаще). Постараюсь описать ее возможности максимально подробно, а так же рассказать о некоторых интересных вещах, которые я научился делать в данном ПО.


(Рис. 1 — Login Screen)

В данном случае показан вход в систему через Web-интерфейс. Если вам не привычно использовать браузер для работы с системой вы можете использовать приложения для ваших мобильных устройств (пока только под Android) или же установить на ПК Enterprise Console, которая практически на 100% повторяет интерфейс через Web.

Как я уже показал на скриншоте выше, система поддерживает авторизацию по доменным учетным записям, но вы можете создавать УЗ и вручную, если у вас есть такое желание.

Сразу после входа вы попадете на экран приветствия:


(Рис. 2 — Экран приветствия)

Если это ваш первый вход в систему, после установки, то рекомендую перейти по ссылке Run Configuration Guru , которая поможет сразу же настроить большинство изначальных конфигов:


(Рис. 3 — Configuration Guru)

Именно тут вы настроите:

• Логин и пароль вашего корневого аккаунта администратора (core admin)

• Данные для использования с WMI сенсорами (обычно это учетная запись, имеющая администраторские полномочия в домене)

• Если вы используете UNIX или LINUX системы, вы так же сможете прописать данные ваших УЗ.

• Данные для соединения с интернетом (например, в случае, если в вашей организации используется proxy-сервер) — доступ к интернету полезен как минимум тем, что вы сможете активировать систему без отправки кодов на почту компании paessler, а напрямую, но и конечно же при стабильном интернет соединении система сама сможет скачивать и устанавливать обновления.

• Найдете ПК, сервера и прочее периферийное оборудование в автоматическом режиме (если сеть или сегмент сети небольшой и не будет искаться несколько сотен машин).

После базовой настройки вы попадете на страницу, где отображаются все ваши устройства и сенсоры:


(Рис. 4 — Главная страница устройств)

Индикаторы разных цветов означают следующее:

Красный — ошибка \ недоступно \ превышение заданного параметра \ недостаток до заданного параметра

Оранжевый — нетипичное поведение сенсора (Пример: Пинг в данный момент 200 ms, при среднем пинге на данном устройстве в данное время дня \ недели 110 ms)

Желтый — предупреждение (сенсор приближается к критичных границам заданного параметра или же стал недоступен в момент прошлой проверки)

Зеленый — штатное поведение сенсора

Синий — пауза (устанавливается либо вручную, либо автоматически). В паузу сенсор может поставить как администратор, так и сама система по нескольким причинам: главный для устройства сенсор недоступен и все остальные сенсоры устройства установлены в режим паузы; слишком большое количество запросов одновременно — сенсор будет перезапущен после получения данных с других сенсоров.

Серый — не получены данные с сенсора (только включили, только закончился режим паузы)

Hint: Как я уже написал выше режим паузы может проставляться автоматически. В моей установке системы в каждом устройстве прописана следующая логика — если сенсор ping (главный на каждом устройстве) недоступен, то все остальные сенсоры на устройстве автоматически попадают в режим паузы, чтобы не отправлять запросы впустую (все-равно устройство скорее всего недоступно).


(Рис. 5 — Поведение устройства при паузе главного сенсора)

Далее рассмотрим типовое решение (созданное в виде шаблона), которое я использую для вновь добавляемых компьютеров:


(Рис. 6 — Типовой ПК)

Ping — стандартный ping до машины. Главный сенсор на устройстве.

Users logged in — кто залогинен на данной конкретной машине.

Free Disk Space — % свободного места на жестком диске.

CPU Load — % загруженности процессора(-ов).

Memory — % использования памяти.

Uptime — время с момента последней перезагрузки ПК. Установлено ручное предупреждение — свыше 14 дней — оповещать администратора.

HDD Smart — проверки нескольких параметров чтения \ записи жесткого диска.

Если говорить о представлении устройств, то существует 2 варианта:

1.) Уже представленный выше вариант группировки сенсоров внутри устройств.

2.) Режим карты — вы сами рисуете \ моделируете карту расположения ваших устройств для более удобного визуального восприятия.


(Рис. 7 — Карта)

На этом я закончу показ базового функционала работы системы, и мы перейдем к тому, какие сенсоры можно настроить в системе и какие интересные решения мне уже удалось спроектировать.

Немного о сенсорах


На данный момент в системе доступно свыше 130 различных сенсоров. Подробнее про каждый из них можно прочитать на странице Описание Сенсоров.

Сенсоры делятся на следующие условные категории:

• Common Sensors
• Bandwidth Monitoring Sensors
• Web Servers (HTTP) Sensors
• SNMP Sensors
• Windows/WMI Sensors
• Linux/Unix/OS X Sensors
• Virtual Servers Sensors
• Mail Servers Sensors
• SQL Database Servers Sensors
• File Servers Sensors
• Various Servers Sensors
• VoIP and QoS Sensors
• Hardware Parameter Sensors
• Custom Sensors

Меню добавления сенсоров начиная с 11 версии ПО стало крайне удобным и понятным:


(Рис. 8 — Добавление нового сенсора)

Можно либо выбирать категорию, а потом выбирать нужный сенсор, либо искать сенсор в списке снизу, либо же ввести часть названия и выбирать сенсор из уже отсортированного списка.

Я использую меньше половины предложенных разработчиком типов сенсоров, но и этого мне вполне хватает, чтобы держать вверенные мне сервера и пк под полным контролем и быть уверенным, что все работает штатно.

Читать про базовое описание сенсоров было бы достаточно скучно, поэтому я предпочту описать несколько интересных примеров из своего опыта работы с системой.

Стой! Кто идет?

Первым удачным примером стал поиск нарушителей. Нарушителем в данном конкретном случае мы считаем любого пользователя, который не является «владельцем» конкретного ПК.

Для поиска нарушителя мы будем использовать 2 сенсора типа Users logged in. Первый сенсор будет отображать нам реальную картину — кто в данный момент залогинен на машину (и залогинен ли вообще), а второй сенсор будет иметь на себе фильтр с логинами разрешенных сотрудников (т.е. эти логины не будут отражаться).

На второй сенсор мы устанавливаем оповещение — если количество пользователей больше 0 (а мы помним, что нужные нам логины просто не отобразятся), то немедленно оповестить администратора по почте. Логин нарушителя вы получите в письме вместе с именем и IP адресом машины, куда сотрудник пытался зайти.

Очень действенно если вам действительно необходимо оценивать, кто заходил на ПК достаточно оперативно.

IT помощник

В нашей организации 100% удаленной помощи сотрудникам оказывается через DMWare. Чтобы отслеживать удаленные входы на ПК я установил сенсор process, который отслеживает процесс DMWare Mini Remote Control и как только процесс начинает забирать больше 10 МБ памяти — выдает оповещение с именем \ IP машины. Штатно в моем случае процесс забирает 6-7 МБ, а в рабочем состоянии (когда кто-то использует удаленный вход) около 20 МБ. Пока за полгода использования этого трюка не было ни 1 сбоя \ ложного срабатывания.

Третий полезный пример уже был описан мной ранее — это пауза всех сенсоров после неполучения ответа от сенсора ping.

Помимо этого я настроил sms оповещения, в случае если какой-либо из серверов (ping сервера) недоступен более 10 минут. Настраивалось на ресурсе bulksms. Единственный минус — названия должны быть исключительно на латинице, в противном случае в смс вы получите, что у вас недоступен сервер ??????.

Важно: Если вы не нашли сенсора, который удовлетворяет вашим требованиям это еще не повод отказываться от системы — у вас есть возможность вручную подгрузить скрипты \ написать сенсор. Это делает систему еще более кастомизированной.

В завершение этой главы отмечу, что сенсорный функционал действительно очень богат и может выполнять множество различных действий — дело за вами. Описанное выше это лишь примеры того как в данный момент использую систему я и возможно воодушевившись данными примерами вы захотите посмотреть, а не лучше ли данная система чем то, что в данный момент используете вы сами.

Отчеты


В данный момент в моей установке на автоматическое формирование поставлено 4 отчета: еженедельные отчеты по ПК Москвы и ПК в регионах, а так же их ежемесячные аналоги.

На ручном запуске установлены отчеты по доступности серверов и конкретных процессов \ сервисов на этих самых серверах.

В качестве примера покажу меню ежемесячного регионального отчета:


(Рис. 9 — Отчет)

Несмотря на то, что отчет установлен в автоматический режим у вас есть возможность и ручного запуска процесса.

Как можно увидеть из скриншота у вас есть 3 опции по выпуску отчетов: просмотреть в online режиме html страницу с отчетом, сохранить отчет в виде PDF файла на сервере и уведомить об окончании формирования отчета по почте или же отправить сам PDF файл конечному пользователю.

На закладке Stored Reports вы найдете все сохраненные на вашем сервере файлы.

Если сохранять отчет в PDF, то выглядеть он будет примерно следующим образом:


(Рис. 10 — PDF Отчет)

В данном случае использовано графическое представление данных. Если вас интересует конкретика, то вы можете формировать отчеты в текстовом виде в разрезе, например 5 минут. Тогда вы будете получать вместо картинки строки вида:

01.01.2012 09:00:00 — 01.01.2012 09:05:00 Ping 100% Available

Большинство отчетов вам достаточно настроить 1 раз, протестировать его с пользователем, который будет его использовать и забыть. Формат представления в моем случае очень понравился даже тем, кто компьютера боится как огня и обычно прибегает с вопросами типа "Я 10 раз неправильно ввел пароль, а компьютер почему-то заблокировался"

Логи


Система логирования в данном программном продукте безусловно есть и логирует она абсолютно все, начиная от поведения сенсоров и, заканчивая формированием отчетности и отправкой смс сообщений.


(Рис. 11 — Пример лога)

Тем, кто любит копаться в деталях эта закладка, безусловно, окажется полезной, а тем более она визуально приятна, так как лог раскрашивается разными цветами в зависимости от критичности и типа события.

Заключение


На данный момент мной и моим сотрудником завершено 3 фазы улучшения системы. С каждой фазой мы добавляем и находим для себя все больше и больше функций и хитростей в настройках. Еще в августе прошлого года, когда я устанавливал купленную после презентации руководству систему, я и не подозревал, что смогу довести ее до такого состояния, в котором она находится в данный момент.

Процесс совершенствования системы мониторинга может длится годами и все-равно не будет доведен до совершенства. В данном обзоре я постарался показать самые на мой взгляд актуальные вещи, найденные мной в данном программном продукте, а так же некоторые хитрости, которые я на данный момент уже использую.

Надеюсь после прочтения данной статьи хотя бы несколько человек найдут для себя что-то интересное, а возможно и очень нужное в работе.

Список полезных сайтов по тематике


Сайт разработчика — Paessler AG
Дополнительные сенсоры, аддоны и программы для PRTG
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее
Реклама

Комментарии 7

    0
    Тоже использую эту систему, очень богатый функционал. Единственный недостаток — неудобное представление и невозможность группировки девайсов — когда сенсоров переваливает за 1000, становится трудно ориентироваться.
      –1
      У меня на данный момент пока почти 900 сенсоров.

      Группирую так:

      Сервера
      — имя сервера \ установленная программа

      Охрана МСК
      — Наименование офиса

      ПК Департамента МСК
      — Фамилия сотрудника

      Регионы
      — Дивизион (Урал \ Сибирь \ Поволжье и т.д.)
      — — Город
      — — — Офис \ Фамилия сотрудника

        0
        У вас все это на одной пробе висит. У меня все проверяется с интервалом в 10 сек, и WMI затыкается. Приходиться использовать несколько проб, а вот их-то и нельзя группировать.
          0
          В данный момент момент 2 проба, так как 1 уже не хватает (очередь). Насчет группировки проб да, полностью Вас поддерживаю, но думаю что разработчики это рано или поздно сделают. Пока двух хватает, но если несколько уменьшить интервалы некоторых сенсоров, то надо будет добавлять еще.
      0
      Очень красивая программа.
      Установка только на Windows? Что значит в прайсе «Количество установок»? Сенсоры — это я так понимаю, параметры которые мониторятся. Как система выдерживает постоянные обновления, если они очень часто выходят?
      и цены какие-то астрономические…
      И странная 30 дневная пробная версия с 5 сенсорами, когда бесплатная имеет 10 :)
        0
        Установка Win.

        Количество установок — количество развернутых систем. Вы можете иметь 1 сервер в мск, 1 в нью-йорке, 1 на луне и каждый будет мониторить свои параметры. Прошу не путать с удаленными пробами, которые прописываются в систему. Я на данный момент использую Unlimited, так как Corporate мне не требуется — все мониторится спокойно из МСК.

        Касательно обновлений: пока ни разу обновления не влияли на работу системы (а я пережил с ней уже с версии 8.х до версии 12.х). Единственное конечно же перезагружать сервер надо, чтобы все корректно установилось.

        Касательно бесплатной \ пробной версий: так как я описывал прайс на момент установки, то там действительно был такой смешной баг в их прайс листе. На данный момент они это исправили и 30-дневная тестовая версия дает безлимитное количество сенсоров на 30 дней.

        Надеюсь ответил на Ваши вопросы.
        0
        Внешний вид очень хороший… Спасибо, попробую поднять в сети бесплатную и показать начальству)

        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

        Самое читаемое