Как стать автором
Обновить

«Вы, должно быть, сумасшедший, если не используете потенциал Open Source». Герхард Лауссер о системах мониторинга с открытым кодом и решениях масштаба предприятия

Время на прочтение6 мин
Количество просмотров19K

Герхард Лауссер — эксперт в области nagios-совместимых систем мониторинга, автор множества публикаций, разработчик широко используемых плагинов для мониторинга многих коммерческих систем (один из них — check_hpasm, мы даже подробно разбирали ранее). Интервью выполнено сотрудником компании WürthPhoenix, которая занимается производством систем мониторинга в виде aplliance под торговой маркой NetEye и опубликовано в блоге компании* в 2010 году. г-н Лауссер излагает взгляд на использование систем мониторинга для мониторинга масштаба предприятия.
*Это не реклама, изделия NetEye и продукция компании WürthPhoenix в РФ не поставляется.
Читать дальше →
Всего голосов 22: ↑19 и ↓3+16
Комментарии15

Nagios vs Icinga. Реальная история одной из самых «горячих» веток в свободном ПО

Время на прочтение32 мин
Количество просмотров34K
От переводчика


Это перевод прошлогодней, хотя и по-прежнему актуальной статьи о конфликте имущественных прав в области свободного ПО. Это только на первый взгляд кажется оксюмороном, ведь публичный код — это не только кропотливый труд, желание принести пользу другим людям и собственное самовыражение; за ним часто стоят личные устремления и интересы, что, будучи помноженным на пробелы в законодательстве, даёт неожиданные эффекты. Конфликт не дошел до судебной стадии, хотя и был очень близок к тому. Его участники отделались тратой нервов, сил и времени. Возможно, эта история будет поучительной для всех, кто занимается свободным ПО.
Читать дальше →
Всего голосов 13: ↑11 и ↓2+9
Комментарии9

Голь на выдумки хитра

Время на прочтение4 мин
Количество просмотров4.9K
Большинство администраторов знает, что для сохранности своего времени, нервов и данных пользователей необходимо использовать RAID массивы. Однако их использование оправдано только в случае, если существует адекватная система мониторинга.
В случае если используется полноценная операционная система, проблем, как правило, не возникает: драйвера и программное обеспечение для получения информации от RAID-контроллера обычно есть.

Но в случае использования ESXi сервера без дополнительной обвязки в виде vCenter, получение информации от контроллеров может быть не совсем тривиальным.
А как?
Всего голосов 6: ↑5 и ↓1+4
Комментарии2

Недостающие структурные элементы в OpenStack уровня предприятия: Часть 1 – высокая степень доступности

Время на прочтение5 мин
Количество просмотров3.6K
Автор: Дмитрий Новаковский

Сейчас отличное время для того, чтобы быть компанией-участницей инициативы OpenStack – вы получаете большую часть данных для маркетинга и управления продукцией, просто разговаривая каждый день с клиентами и партнерами. Как бы то ни было, конкуренция в данной сфере довольно высока, поэтому и для сообщества, и для отдельных вендоров важно грамотно создать задел функциональных возможностей и расставить их приоритеты, при этом четко осознавая, кто и чего хочет. Я выступлю в роли «капитана очевидность», но все же скажу, что потребности Предприятия весьма отличаются от потребностей сервис-провайдера, органа власти или какого-нибудь IT-подразделения, работающего в масштабе World Wide Web.
Читать дальше →
Всего голосов 8: ↑6 и ↓2+4
Комментарии4

Мониторинг инженерной инфраструктуры в дата-центре. Часть 3. Система холодоснабжения

Время на прочтение6 мин
Количество просмотров8.3K

Система охлаждения NORD-4.

Часть 1. Мониторинг инженерной инфраструктуры в дата-центре. Основные моменты.
Часть 2. Как устроен мониторинг энергоснабжения в дата-центре.
Часть 3. Мониторинг холодоснабжения на примере дата-центра NORD-4.
Часть 4. Сетевая инфраструктура: физическое оборудование.

Мы уже рассказывали о том, что такое система мониторинга и почему ее необходимо проектировать на этапе строительства. В статье «Мониторинг инженерной инфраструктуры в дата-центре» мы рассмотрели общие ситуации, в которых необходимо проводить комплексный мониторинг, а также рассказали об особенностях наших систем.

Сегодня поговорим о том, как устроена система мониторинга холодоснабжения на примере дата-центра NORD-4. Перед прочтением рекомендуем ознакомиться со статьей о том, как создавалась система холодоснабжения.
Читать дальше →
Всего голосов 11: ↑11 и ↓0+11
Комментарии4

(Не)безопасность систем мониторинга: NagiosXI

Время на прочтение3 мин
Количество просмотров5.1K
image

Сейчас в компании любого размера зачастую используется та или иная система мониторинга, переодически то в одной, то в другой находят уязвимости (которые закрываются патчами) и слабости (на которые закрываются глаза). Сегодня мы поговорим о системе мониторинга NagiosXI и расскажем о способах ее эксплуатации в ходе пентеста. А также приведем мнение разработчиков относительно проблемы безопасности их продукта.
Читать дальше →
Всего голосов 17: ↑16 и ↓1+15
Комментарии6

Nagios-светофор из китайских кубиков

Время на прочтение6 мин
Количество просмотров5.8K
UPD. Небольшое обновление по итогам 4 лет эксплуатации. За это время сломалась одна лампа и один конвертер USB-COM. Конвертер был просто заменен на другой, без малейшей попытки починить. Лампочка же была успешно отремонтирована, так как оказалась на удивление ремонтопригодна и легко разбиралась. Пришлось заменить один вспухший конденсатор.
На этом все. Продолжаю наблюдение.

Как водится, для начала маленький “письменный отмаз от ответственности”.

  • Цель всех нелепых телодвижений, описанных в статье, одна — облегчение мониторинга серверов и приложений.
  • Этот смелый трюк можно повторить дома и на работе, даже неподготовленным спортсменам.
  • Надеюсь, что этот текст пригодится не только адептам Nagios, но и светозарным джедаям Zabbix и неофитам других конфессий мониторинга.
  • Здесь не будет продемонстрировано приемов высшего пилотажа в использовании паяльной станции, осциллографа и виртуозного владения Ruby/Fortran/etc. Все описанное примитивно, до отвращения, но дешево и сердито. А самое главное — оно работает.
Итак, поехали
Всего голосов 13: ↑13 и ↓0+13
Комментарии2

Как ELK помогает инженерам по ИБ бороться с атаками на сайты и спать спокойно

Время на прочтение6 мин
Количество просмотров7.4K
Наш центр киберзащиты отвечает за безопасность веб-инфраструктуры клиентов и отбивает атаки на клиентские сайты. Для защиты от атак мы используем файрволы веб-приложений FortiWeb (WAF). Но даже самый крутой WAF – не панацея и не защищает «из коробки» от целевых атак. 

Поэтому в дополнение к WAF мы используем ELK. Он помогает собирать все события в одном месте, копит статистику, визуализирует ее и позволяет нам вовремя видеть направленную атаку.

Сегодня расскажу подробнее, как мы скрестили «ёлку» с WAF и что из этого получилось.


Читать дальше →
Всего голосов 16: ↑16 и ↓0+16
Комментарии4

Как мы наблюдаем за метриками в дата-центре и развиваем наш мониторинг

Время на прочтение11 мин
Количество просмотров4K

В этом году мы обновили сервис облачного мониторинга и представили клиентам более удобное и понятное решение для отслеживания статуса их ИТ-инфраструктуры. Сервис вырос из нашей системы мониторинга дата-центра, где мы отслеживаем сотни тысяч метрик в работе оборудования. Какие-то из них очевидные, а какие-то вызывают у клиентов реакцию: “А что, так можно было?!”

В статье покажу, как наш мониторинг устроен изнутри, почему выбрали для него именно эти инструменты и как планируем развивать в сторону самообслуживания.

Читать далее
Всего голосов 13: ↑13 и ↓0+13
Комментарии4

Пишем свой плагин для nagios

Время на прочтение1 мин
Количество просмотров9.6K
В своей повседневной работы я очень активно использую nagios. Как мне кажется, это очень мощная система для мониторинга серверов. Можно мониторить загрузку сервера, доступность разных серверов и тд и тп.

Для нагиоса есть очень много плагинов. Большое собрание плагинов находится по адресу nagiosplugins.org. Можно найти подходящий для себя, поставить и наслаждаться жизнью. Но что же делать если ни один плагин не устраивает вас по функционалу? Да ничего. Напишем свой. Это очень просто.

Итак начнем.

Первое что нам нужно знать для написания простейшего плагина это как работает нагиос на базовом уровне.

Он парсит свой конфиг, находит там команду запуска какого-либо плагина и запускает. Например, php -f checkServer.php. checkServer.php выполняет какую-то свою работу по проверке сервера и отдаёт в ответ статусное сообщение и код завершения работы.

Нагиос понимает 4 кода завершения работы
  • 0 — Все ок.
  • 1 — Предупреждение
  • 2 — Критическая ошибка
  • 3 — Что-то неизвестное случилось

Статусное сообщение это любая информация которая выводится скриптом на стандартный вывод.

И так сам скрипт простейшего плагина под nagios(на php).

define( "STATUS_OK", 0 );
define( "STATUS_WARNING", 1 );
define( "STATUS_CRITICAL", 2 );
define( "STATUS_UNKNOWN", 3 );

$checkFilePath = 'file';
if(file_exists($checkFilePath))
{
echo 'File exists. Everything is ok';
exit(STATUS_OK);
}

echo 'File does not exists';
exit(STATUS_CRITICAL);


вот и все — подключаем в нагиос и он будет проверять существует ли файл или нет. Конечно же Вы можете организовать любую проверку бизнес логики своего проекта, вплоть до автоматического тестирования через phpunit.
Всего голосов 31: ↑22 и ↓9+13
Комментарии6

Графики в Nagios — зачем и чем

Время на прочтение5 мин
Количество просмотров12K

Введение.


Выбрав Nagios в качестве системы мониторинга, получаем систему слежения за качественными характеристиками окружения и историю изменения состояний. И, если посмотреть текст сообщения пробника на данный момент и во время прошлых изменений состояния еще возможно, то данные по периодам между изменениями отсутствуют как класс. При любой более-менее активной работе с мониторингом, возникает желание просмотра истории изменений количественных характеристик тоже, что стандартный Nagios обеспечить не может. Можно, конечно, продублировать все необходимые пробники в тот же Cacti, но это как минимум дополнительные накладные расходы как на конфигурирование так и на машину с поллером. К счастью, Nagios умеет переложить это на плечи пользователя, обеспечивая механизм так называемых «данных производительности» (performance data). В данной статье рассматривается одно из решений по сбору и визуализации полученных данных – Pnp4Nagios.
Читать дальше →
Всего голосов 6: ↑4 и ↓2+2
Комментарии5

Nagios — помощник в мониторинге сервисов и хостов

Время на прочтение5 мин
Количество просмотров13K
Существуют различные бесплатные системы мониторинга состояния систем и сети такие как: Munin, Zabbix и т.д. Я же хочу поделиться с IT сообществом примером настройки системы мониторинга Nagios на операционную систему Arch Linux.

Приведенный ниже пример установки Nagios производился на дистрибутив Arch linux x64, но так же данный материал можно использовать для Arch i686.

Читать дальше →
Всего голосов 7: ↑4 и ↓3+1
Комментарии1

Обработка сообщений ядра

Время на прочтение9 мин
Количество просмотров17K

Предисловие


Страшная сказочка:
EDAC MC0: 1 CE read ECC error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0)
EXT4-fs error: ext4_wait_block_bitmap:445: Cannot read block bitmap
Out of memory: Kill process 95 (sshd) score 31 or sacrifice child
CMCI storm detected: switching to poll mode
page allocation failure: order:1, mode:0x4020
invalid opcode: 0000 [#1] SMP

Неприятно выглядит, правда? Список может быть очень длинным очень длинный. В этой статье я расскажу как с этим жить и что мы с ним сделали.

Часть из этих сообщений в примерах выше заставит вас погрузиться в бездны современной архитектуры процессоров («CMCI storm», удачи в поиске дороги назад, из дебрей интернетов)… Cтранные вещи в ядре могут нарушать ожидания о том, как работают компьютеры, делая последующую отладку очень затруднённой. Отсутствие знания о том, что случилось может даже оставить с грустным ответом «какая-то неведомая фигня, ребутнули, вроде, прошло».
Читать дальше →
Всего голосов 30: ↑29 и ↓1+28
Комментарии13

SMS-уведомления из Nagios малой кровью

Время на прочтение2 мин
Количество просмотров17K
Стоял как-то раз админ в курилке и думал — а как бы ему так в нерабочее время вдали от компьютера и интернетов узнать, что на каком-то из его серверов проблема возникла. Можно конечно посадить студента за монитор с Nagios, чтоб он если что звонил админу и говорил «Тут красненькое что-то появилось»… Стоп. Звонил. На мобильный. Нафиг студента, SMS можно получать. На этом мысль остановилась и админ пошёл пить кофе. Потом вернулся и сел за рабочее место, где в браузуре был загружен Google Calendar… и решение пришло само.
Решение
Всего голосов 33: ↑30 и ↓3+27
Комментарии120

Nagios: оповещение с помощью SMS без Google Calendar

Время на прочтение2 мин
Количество просмотров6.9K
Прочитал топик SMS-уведомления из Nagios малой кровью и удивился почему автор называет это «малой» кровью…
Хочу рассказать про свой способ оповещения при помощи SMS, при котором время получения сообщения как минимум меньше и как максимум вездесущий Google не узнает номера вашего мобильного телефона.
Читать дальше →
Всего голосов 12: ↑7 и ↓5+2
Комментарии17

Nagios + SMS используя мобильный телефон

Время на прочтение2 мин
Количество просмотров6K
Несколькими постами раньше уже были темы об использовании SMS уведомлений в Nagios. Сегодня я расскажу ещё об одном способе уведомлений. Нижеописанный способ несколько надёжнее описанных ранее, но и требует некоторых денежных вложений. Он полезен в том случае, когда какие-то из уведомлений являются критически важными (как, например, выход кондиционера из строя или увеличение влажности).

Способ заключается использовании мобильного телефона с корпоративным тарифом (дабы деньги на телефоне не кончились неожиданно).

Физически подключается к серверу по bluetooth, com или usb. На уровне ПО мы будем использовать два скрипта: один из них умеет отправлять sms, второй проверяет статус мобильной сети. Если мобильная сеть недоступна, то nagios отправляет сообщение на email.

Оба скрипта написаны на python и используют библиотеку gammu для подключения к телефону.
Читать дальше →
Всего голосов 20: ↑18 и ↓2+16
Комментарии17

Оповещения из Nagios телефонным звонком

Время на прочтение2 мин
Количество просмотров10K
До сих пор кажется невероятным, что сервер может мне позвонить в случае проблем, но в действительности реализация оказалась даже проще, чем я думал. Своим решением спешу поделиться.
Читать дальше →
Всего голосов 43: ↑43 и ↓0+43
Комментарии37

Оповещение от Nagios по телефону через Asterisk

Время на прочтение5 мин
Количество просмотров7.1K
Прочитал вчера статью Google translate+Asterisk IVR и подумал — «Клёво! Можно пользоваться для быстрого создания звуковых файлов при заведении новых хостов и сервисов в Nagios!».

Затем задался вопросом, а описано ли где-то как настроить оповещения по телефону для Nagios? Погуглив немного я нашел пару статей, прочитал их и понял, что решения описанные там обладают рядом недостатков:
  • Nagios и Asterisk должны быть установлены на одном сервере.
  • Требуется локальная установка движка по синтезу речи.
  • Телефон админа «зашит» в скрипт и он получает ВСЕ уведомления.
Вот я и решил поделиться своим решением, которое использую уже не первый год.
Читать дальше →
Всего голосов 19: ↑19 и ↓0+19
Комментарии14