Pull to refresh

Nagios-светофор из китайских кубиков

Reading time6 min
Views5.8K
UPD. Небольшое обновление по итогам 4 лет эксплуатации. За это время сломалась одна лампа и один конвертер USB-COM. Конвертер был просто заменен на другой, без малейшей попытки починить. Лампочка же была успешно отремонтирована, так как оказалась на удивление ремонтопригодна и легко разбиралась. Пришлось заменить один вспухший конденсатор.
На этом все. Продолжаю наблюдение.

Как водится, для начала маленький “письменный отмаз от ответственности”.

  • Цель всех нелепых телодвижений, описанных в статье, одна — облегчение мониторинга серверов и приложений.
  • Этот смелый трюк можно повторить дома и на работе, даже неподготовленным спортсменам.
  • Надеюсь, что этот текст пригодится не только адептам Nagios, но и светозарным джедаям Zabbix и неофитам других конфессий мониторинга.
  • Здесь не будет продемонстрировано приемов высшего пилотажа в использовании паяльной станции, осциллографа и виртуозного владения Ruby/Fortran/etc. Все описанное примитивно, до отвращения, но дешево и сердито. А самое главное — оно работает.
Итак, поехали
Total votes 13: ↑13 and ↓0+13
Comments2

Приглашаем вас на первую конференцию Zabbix в России

Reading time2 min
Views2.8K
С 23 по 24 августа в Москве состоится первая российская конференция Zabbix – мероприятие, направленное на обмен опытом и углублённое изучение возможностей универсальной открытой системы мониторинга Zabbix.

image
Читать дальше →
Total votes 9: ↑9 and ↓0+9
Comments6

Zabbix, временные ряды и TimescaleDB

Reading time14 min
Views35K
Каждая система мониторинга сталкивается с тремя видами проблем, связанных с производительностью.

Во-первых, хорошая система мониторинга должна очень быстро получать, обрабатывать и записывать поступающие извне данные. Счёт идёт на микросекунды. Навскидку это может показаться неочевидным, но когда система становится достаточно большой, все эти доли секунд суммируются, превращаясь в хорошо заметные задержки.

image
Total votes 18: ↑18 and ↓0+18
Comments15

21 августа трансляция Zabbix Moscow Meetup #5

Reading time2 min
Views3.8K


Привет!

Меня зовут Илья Аблеев, я работаю в команде мониторинга Badoo. 21 августа приглашаю на традиционную, пятую, встречу сообщества специалистов по Zabbix в нашем офисе!

Поговорим о вечной боли — хранилищах исторических данных. Многие сталкивались с проблемами производительности, вызванными типичными причинами: низкой скоростью дисков, недостаточно хорошим тюнингом СУБД, внутренними процессами Zabbix, которые удаляют старые данные и т.п. Но не всегда всё сводится к стандартным решениям. 

«Из коробки» в Zabbix’е доступно два вида бэкенда: MySQL и PostgreSQL. Не так давно добавили поддержку noSQL хранилища — Elasticsearch. В то же время на рынке есть множество других решений, которые могут хорошо решать задачу хранения и отдачи исторических данных, например, ClickHouse, TimescaleDB, Cassandra.

На митапе мы обсудим опыт внедрения хранилищ, отличных от MySQL и Postgresql, поговорим об их плюсах и минусах, поделимся результатами производительности. 

Трансляция будет на YouTube. Под катом информация о формате и экспертах.
Читать дальше →
Total votes 25: ↑23 and ↓2+21
Comments10

Автоматическое добавление места на виртуальном сервере

Reading time9 min
Views3.3K

Всем привет!


В этой статье мы расскажем о том, как мы автоматизировали задачу по расширению дискового пространства на одном из наших серверов. А чего сложного в такой простой задаче, что пришлось ее автоматизировать — спросите вы? Ничего, если вы не используете каскадно-объединённое монтирование. Чувствую, вопросов стало больше!? Ну тогда поехали под кат.
Читать дальше →
Total votes 14: ↑13 and ↓1+12
Comments2

Как я научил Zabbix за своей нодой присматривать и о проблемах сообщать

Reading time3 min
Views10K
Привет, Хабр!

Я сейчас работаю над проектом мессенджера на блокчейне вместе с командой своих коллег. Кому интересно – смотрите ссылки в профиле или спрашивайте в комментариях.

Блокчейн-разработка – область новая и неизведанная, поэтому порой приходится использовать очень нестандартные инструменты. Куда там микроскопу и гвоздям! Поэтому и решил вести этот блог, чтобы рассказывать разные интересные случаи из практики. Сегодняшний пост – о том, как я настроил моментальные уведомления о состоянии своей ноды, чтобы в случае чего оперативно ее возвращать к жизни.



План, которого я придерживался


Задачу я себе поставил такую: при каждом выходе из строя или прекращении работы ноды мне должны приходить моментальные уведомления об этом. Мы же живем в прогрессивный век и привыкли получать всю важную информацию мгновенно, правда?

Я решил, что для осуществления этой задачи я прикручу Zabbix к Slack (он у нас рабочий инструмент проекта). Zabbix, соответственно, будет мониторить ноду и присылать сообщения о неисправностях мне в личку Slack’a.

Реализация: шаг за шагом


Читать дальше →
Total votes 15: ↑13 and ↓2+11
Comments16

Как мы используем систему мониторинга Zabbix для ритейла

Reading time6 min
Views10K
Системами мониторинга типа Zabbix искушённых пользователей не удивишь. Однако в ритейле они не частые гостьи, а если используются, то всё больше для контроля серверов. Мы же пошли дальше и применяем их для мониторинга кассового ПО и оборудования.

Читать дальше →
Total votes 14: ↑13 and ↓1+12
Comments12

Mattermost. Интеграция с внешними сервисами (часть 2)

Reading time3 min
Views7K

Продолжим разбираться с mattermost в части интеграции с внешними сервисами.


Часть вторая. Интеграция с Zabbix


Во второй части повествования о интеграции mattermost, речь пойдет про отправку сообщений об авариях из zabbix в mattermost. В результате поисков в сети был взят за основу вот
этот скрипт. Код написан на Perl, поэтому может потребоваться доустановка перловых-пакетов. Прежде чем приступить к описанию кода (он несколько изменён по сравнению с исходным) сперва, как водится, произведём некоторые настройки.

Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments11

Как прошло открытие Zabbix в России

Reading time4 min
Views7.1K

14 марта в Москве открылся первый российский офис Zabbix. Праздник открытия прошел в формате мини-конференции, собрав более 300 клиентов и заинтересованных пользователей.


image

Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments12

Вышел Zabbix 4.2

Reading time9 min
Views49K
Наша команда очень рада поделиться новостью о том, что состоялся релиз свободной системы мониторинга с открытым исходным кодом Zabbix 4.2!



Является ли версия 4.2 ответом на главный вопрос жизни, вселенной и мониторинга в целом? Давайте посмотрим!
Читать дальше →
Total votes 47: ↑46 and ↓1+45
Comments81

Боевые стрельбы в ночи, или Почему нагружать прод — не страшно

Reading time10 min
Views6.7K


«А если ты не выстрелишь, то испорчусь я»


Ещё недавно считалось, сервис должен просто работать. Нарисовали, заверстали, написали скрипты — вроде всё ок, можно катить на прод.


Но конкуренты не дремлют, поэтому начинается гонка не только за новыми функциями, но и за скоростью работы. Любое зависание приложения или долгий ответ сервера (не говоря уже про всплывающие 500-е ошибки) портят впечатление от сервиса и вынуждают пользователя уходить куда-то ещё. Наверняка, каждый сталкивался с ситуациями, когда вместо покупки билета на самолет, поезд или концерт на экране отображалось «Internal server error», и вы в ярости хотели разбить монитор.


Я — Виктор Бодров, работаю в Яндекс.Деньгах в команде исследований производительности и хочу рассказать о том, чем полезно изучать производительность прямо на продакшене.

Читать дальше →
Total votes 20: ↑19 and ↓1+18
Comments4

Удаленный мониторинг и управление устройств на базе Linux/OpenWrt/Lede через 80-ый порт, продолжение

Reading time5 min
Views9.8K
Это заключительная часть статьи, вот начало.

В прошлый раз я написал о том, как реализовал мониторинг устройств, теперь речь пойдет о управлении. В дискуссиях с «технарями» со стороны Заказчика я часто встречаюсь с ограниченным восприятием возможностей таких маленьких устройств (с невысокими ресурсами памяти и производительностью), многие считают что «максимум что нам потребуется это отправить reboot, для чего-то более серьезного — отправим бригаду».

Но практика показывает, что это не совсем так.
Читать дальше →
Total votes 8: ↑7 and ↓1+6
Comments0

Энергия, тепло и вода

Reading time7 min
Views7.6K

Предисловие


2019 год. Почти в любом магазине электроники можно купить один из сотен возможных наборов умного дома. Взять и настроить в «2 клика», подключиться к облакам, получать push event-ы в приложение/смс-ки, да и вообще получать всю необходимую информацию в любой точке мира.

Идеально, но в моём случае не сработало. Несколько попавших ко мне в руки решений на деле оказались ограниченным набором определенных функций, покрывающих лишь часть моих запросов, а к тому же — накладывающих почти непреодолимые ограничения. И, как это обычно бывает, чем меньше ограничений, тем больше нужно погружаться в предметную область, самостоятельно продумывать решения, архитектуры. Поэтому — колхозим сами :)

Задачи


1. получать информацию о качестве электросети (скачки напряжения, полное отключение и т.п.).

2. иметь полный мониторинг UPS. А на самом деле иметь этот самый UPS исходя из последствий п2.

3. получать информацию о температуре:

  1. на улице
  2. дома
  3. на чердаке (когда замёрзнет закинутый туда хлам и помидоры)

4. Следить за состоянием потребления воды, алертить если потребление выросло (вдруг протечка, всё датчиками влаги не обвешаешь).

5. Понимать когда дома кто-то есть, чтобы автоматизировать перекрытие/открытие воды.

6. Снятие показаний газового счетчика и alert когда кончается оплаченный запас.
+ прочие всевозможные датчики (влажности, открытия, давления воды, давления в контуре отопления и т.п.).

Глобальная цель — иметь общий интерфейс, где можно будет на всё это посмотреть. Получать нотайсы, если что-то пошло не так. И чтобы за это ничего не было и отдать за это не очень много денег.

Состав комплекса на текущий момент


  • UPS Энергия ПН-750 + батарея на 100 ач
  • USB->RS232 converter на основе PL2303
  • Router Tp-link tl-wr1043nd +
  • 1wire мастер сети на основе купленного USB термометра DS18B20+ PL-2303TA
  • 1wire 3 датчика DS18B20
  • 1wire модуль «счетчик воды» от radioseti на основе DS2423

Виртуалка с Zabbix-сервером за пределами домашней сети.

image

Читать дальше →
Total votes 14: ↑14 and ↓0+14
Comments12

Энергия, тепло и вода: часть вторая

Reading time6 min
Views6.5K
Рассмотрим следующий этап развития схемы умного дома из подручных средств :) (продолжение, первая статья тут).

Решаемые задачи:


  1. Защита от протечек

    + Удалённое управление
    + Знать состояние ввода воды (перекрыто или открыто)
  2. Знать давление и температуру теплоносителя в контуре отопления
  3. Знать давление в системе водоснабжения

Мониторинг по-прежнему в едином интерфейсе отображения (Zabbix), оповещение — через единый механизм alert-инга. А вот управление — это что-то новое. Об этом — далее.

1. Защита от протечек


Да это же избитая тема, девайсов — пруд пруди! Всё работает из коробки!

Так я было и подумал и снова ошибся. Готовых решений действительно много, но найти комплексное решение с возможностью удалённого управления и мониторинга, но при этом не используя чьё-то «облако»/чей-то личный кабинет, — оказалось почти невыполнимой задачей. Ну ок, снова колхозим, попробуем решить задачу без паяльника и коддинга.

Итого, мне нужны:

  1. шаровый кран с электроприводом
  2. датчик протечек
  3. некий контроллер с интерфейсом мониторинга и управления
  4. силовое реле
Читать дальше →
Total votes 18: ↑18 and ↓0+18
Comments9

Анонс вебинара по зонтичной системе мониторинга Broadcom DX Operations Intelligence

Reading time1 min
Views930
image

Запись вебинара

Приглашаем вас в эту пятницу (27 ноября) принять участие в вебинаре, на котором представители Broadcom в России презентуют новую зонтичную систему мониторинга Digital Operational Intelligence (DX OI). Во время сессии мы поговорим об основных функциях системы и рассмотрим основные разделы пользовательского интерфейса. Мы покажем как, опираясь на функциональные возможности DX OI, вы сможете обеспечить значительную операционную эффективность IT-подразделений, что позволит им принимать более быстрые и правильные решения для повышения качества ИТ-услуг и бизнес-сервисов за счет междоменного контекстного анализа.
Читать дальше →
Total votes 8: ↑8 and ↓0+8
Comments0

Мониторинг распределенной системы с помощью Zabbix на примере Apache Ignite

Reading time8 min
Views6.3K

Мониторинг сложных распределенных систем может стать настоящей головной болью как с точки зрения первичной настройки метрик и поддержания их актуальности, так и с точки зрения производительности. Легче всего предотвратить большинство проблем заранее, ещё на стадии проектирования.

Читать далее
Total votes 12: ↑12 and ↓0+12
Comments1

/proc/meminfo + gawk = удобный JSON для discovery метрик в zabbix

Reading time6 min
Views4K

В работе над одной задачей понадобилось добавить в мониторинг все счетчики памяти находящиеся в /proc/meminfo

После создания шаблона, создавать руками каждую метрику и настроить опрос ее с хоста мне показалось полным отстоем, так как сейчас можно делать один запрос к хосту получать массив в JSON после чего раскладывать автоматически по метрикам.

Простыню ниже из показателей разных счетчиков использующих память нужно автоматически добавить как метрики к хосту, после этого в одну метрику раз в минуту забирать данные и раскладывать полученные данные по найденным метрикам:

Читать далее
Total votes 7: ↑6 and ↓1+5
Comments6

Разбираемся, безопасно ли стрелять по проду и чем полезны дашборды

Reading time2 min
Views2.4K
На подходе полезные видео с конференции ЮMoneyDay от специалистов по тестированию. Если заглянете под кат, то узнаете:

  • какие задачи помогают решить исследования производительности на продакшене, и как их результаты влияют на развитие крупного платежного сервиса.
  • как команда интеграционного тестирования использует дашборды и какую пользу можно получить от такого инструмента.



Читать дальше →
Total votes 7: ↑6 and ↓1+5
Comments0

Мониторинг с высокой доступностью. Опыт компании СберСервис

Reading time7 min
Views12K

СберСервис – крупнейшая сервисная компания федерального значения, оказывающая услуги по комплексному техническому обслуживанию широкого спектра информационно-телекоммуникационного оборудования, рабочих мест, офисной техники, серверов и телефонии. Компания является единственным на территории СНГ премиум-партнером компании Zabbix, в ней работает самая крупная команда в России в сфере ИТ-мониторинга, разрабатывая уникальные технические решения в области комплексного внедрения систем мониторинга для организаций с высоконагруженной ИТ-инфраструктурой. Данный факт объясняет, почему в качестве основной платформы для мониторинга СберСервис выбирает Zabbix.

Читать далее
Total votes 9: ↑3 and ↓6-3
Comments44

Как мигрировать Zabbix с MySQL на PostgreSQL с минимальным downtime

Reading time7 min
Views19K

image


В свете того, что Zabbix с некоторых пор поддерживает TimescaleDB, а тут еще и вышел новый LTS релиз Zabbix, то наверняка многие заинтересовались, как осуществить миграцию с MySQL на PostgreSQL.


Несмотря на текст на картинке, вполне можно просто так взять и мигрировать Zabbix с MySQL на PostgreSQL. В интернете есть немало рецептов такой миграции, например:


Доклад с Zabbix Meetup
Видео с Youtube канала Dmitry Lambert


Но я не нашел ни в одном из таких докладов информации, как же минимизировать downtime вашего мониторинга в случае, если полная миграция занимает несколько часов, что конечно зачастую является неприемлемым.


Ниже я опишу свое решение данной проблемы и те подводные камни, которые пришлось обходить по пути.


Важно упомянуть, что я до сих использую Zabbix 4.0. Возможно, в новых версиях схема БД поменялась и поэтапная миграция, описанная ниже, там невозможна.

Читать дальше →
Total votes 16: ↑16 and ↓0+16
Comments14