Comments 14
Дополнение: если делать автотест для шаблонов, то наливается хост, проверяем через API что данные пошли, далее меняем состояние того, что хотим проверить. Скажем, если это доступность SSH, то отключаем ее или просто блокируем на уровне Firewall и проверяем через API что изменения попали в Zabbix и триггер сработал. Идея в том, что нам известно состояние в котором находится система и то, в котором она должна оказаться и эти изменения должны попасть в систему мониторинга. В случае Zabbix, все изменения можно отслеживать через API.
Круто конечно, но то ли задача описана неполно, то ли вы слишком усложняете.
Поднимать CI/CD и виртуалки ради отдельных триггеров мониторинга? Оверкилл, на мой взгляд. Я бы шел по пути использования заббикса, а не против него.
Из текста создаётся впечатление, что вы веб-чеки сайтов руками добавляли/удаляли два года назад (без шаблонов). И заббикс в своей БД вёл аудит, кто что и когда поменял. А сейчас вы то же самое делаете as a code с автотестами в CI/CD, через апи и история ведётся уже в git-е. По мне так шило на мыло сменили, стало сложнее делать простые вещи.
Разве нельзя например написать один-два гибко настраиваемых шаблона веб-проверок и вешать их на хосты клиентов, хоть через авторегистрацию, хоть руками, хоть через апи? И у клиентов был бы доступ к этим данным, автоматически.
Ждём кода.
Первый абзац и сразу грубейшая ошибка — не физическая, а логическую доступность. Или у Вас РЛС определяющая азимут и дистанцию до объекта?
Проверка: задайте себе вопрос, каким методом и каким средством идентифицируется физическое местоположение системы мониторинга?
❷Про глупость. Цитата: «Клиент имеет доступ к метрикам по хостам…», «Беглый анализ показывает, что метрики собираются, а триггеров-то для них…».
→ Во первых, в системе мониторинга по определению не может быть метрик, поскольку метрика это «мера», «размер». Это базовые знания. В мониторинге датчики. В датчиках сенсоры, т.е. чувствительная часть датчика предназначенная для регистрации. Датчики могут быть физические или логические. Мониторинг может быть параметрический и состояния.
→ Во вторых, также как нет метрик, нет и триггеров для метрик. Триггер это устройство имеющее только 2 устойчивых состояния.
❸ Про мониторинг. Цитата: «Система мониторинга, а вы уверены, что она работает?».
А Вы уверены, что у Вас система мониторинга? Уверены, что это не система диагностики автоматизированная скриптами? Изучите назначение систем мониторинга. Структуру и состав функций таких АС, после чего сравните со своей системой. Впрочем, вряд ли это возможно, учитывая контекст статьи. У Вас, скорее всего, отсутствует документация и автоматизируете Вы скриптами, считая, что это программирование.
Система мониторинга, а вы уверены, что она работает?