Как стать автором
Обновить

Комментарии 113

Отлично, очень приятно что есть такой качественный опен сорс проект с постоянными апдейтами. Дашборды то что доктор прописал, а то мы уже начинали изобретать веросипед, еще бы репортинг более расширенный — это реально то чего не хватает для отчетности,

Спасибо! продолжайте в том же направлении :)!
>Уведомления при подтверждении
>Теперь можно получать уведомления от Zabbix в тот момент, когда проблема была подтверждена кем-то, например оператором.
Вот за это отдельная благодарность, недавно застрял на написании подобного функионала.
спасибо, поправили
Замечательно, очень не хватало дашбордов под себя.
Вот новый Zabbix вышел, а хороших мануалов, howTo и примеров реализации очень мало в сети… Офф документация не всегда раскрывает многие подводные камни.
когда будет в репозитарии версия 3.4? сейчас там крайняя 3.2 пока что

Работаем над этим!

Обещали же внешнее хранилище для метрик!

Будет в одной из ранних 3.4.х.

Очень ждём!
Я так понимаю, что это будет реализовано с помощью подключаемых модулей?
Вижу, что на ZShare добавили новый пакет темплейтов. связанных с модулями: Template Modules Pack

Это темплейты-зависимости, которые необходимо импортировать перед тем как использовать сетевые шаблоны:
share.zabbix.com/official-templates/network-devices
Импортировать нужно только если обновляетесь с 3.2, если ставите 3.4 с нуля, то ничего делать не нужно
alexvl а сейчас есть функционал для мониторинга динамически меняющихся окружений? приложений выполняемых в системах оркестрации типа kubernetes/mesos/nomad? хотелось бы функционал «виртуальных» узлов для высокоуровневых сервисов а еще легкое динамическое создание и удаление инстансов.

Это делается с помощью встроенных средств автообнаружения, авторегистрации и/или Zabbix API для интеграции с системами оркестрации. Есть несколько подходов к данной проблеме, выбор решения зависит от конкретных требований к мониторингу и управлению конфигурацией.

А есть например дока по «правильному» внедрению заббикса например для kubernetes? Я так понимаю что сейчас все равно нужны какие то танцы с бубнами чтобы добавлять хосты в заббикс, из коробки тот же kubernetes делать ничего не будет.
к сожалению то, как это делается в zabbix на мой взгляд плохо подходит для мониторинга контейнеров в окружениях вроде swarm, ecs, kubernetes и т.д.

идеально такое сделано в prometheus:
для того или иного сервиса он может подключатся к сервис дискавери вроде Consul, забирать список айпи адресов/портов для сервиса, и потом забирать метрики с него.

список айпи/портов динамический, т.к. очень многие используют динамические порты, для сервисов. и при каждом деплое они меняются.

также при скейл ап, скейл даун, который происходит довольно часто меняется количество инстансов, и как следствие айпи сокетов.

мы сейчас внедряем prometheus для мониторинга инфраструктуры построенной из микросервисов, т.к. заббикс к сожалению такой функционал пока не поддерживает. и наверное не будет ближайшее время поддерживать.

а жаль. это его убьет. хотя zabbix — моя самая любимая система мониторинга.

что-нибудь похожее можно было бы реализовать в заббиксе, если бы он поддерживал динамически конфигурируемые интерфейсы у хоста, которые бы он получал с дискавери сервиса вроде ETCd или Consul и мог бы забирать данные одновременно со всех интерфейсов.

причем всего этого я не понимал, пока плотно не начал работать с контейнерами в динамических окружениях. прометей помню тогда сразу забраковал. а сейчас со всеми его недостатками он кажется сильно круче заббикса :(

Думаю, что рано делать подобные выводы. Тем более, что Zabbix прямо сейчас используется для мониторинга контейнеров и микросервисов. Хотя, безусловно, есть что улучшить и сделать проще для пользователей.

ну да, наверное. но Вы попробуйте как-нибудь, если будет время промониторить какой-ниубдь сервис в swarm/ecs/kubernetes/whatever кластере, у которого 100 раз на дню из-за редеплоймента меняется ip адрес и порт и количество инстансов, с дискавери сервисом вроде consul при помощи prometheus. я уверен, что Вы поймете о чем я говорю. мне кажется подобный функционал заббиксу был бы очень к лицу.

Согласен!

Поучаю Пакет zabbix-release-3.4-1.el7.centos.noarch.rpm не подписан на CentOS 7

Похоже мой косяк со spacewalk.

А где собственно говоря вебинары на русском?

Действительно! Вебинары на русском обязательно будут, похоже, что не успели обновить страничку.

Здравствуйте.
Для всеобъемлющего мониторинга Vmware Vsphere 6.5 + Horizon View 7 есть какое-нибудь коробочное решение (сборка) у Zabbix?
Без плясок с бубном и установок каких-то доп.модулей, а чтобы Далее->Далее->Далее->Setup и получить уже настроенную систему?

Хотелось бы больше подробностей об одновременном сборе данных и зависимых элементах данных. Очень интересная функция. Сейчас, например, для получения статистики по апачу, мы используем самописный скрипт и zabbix_sender. Теперь от этого можно будет отказаться. Но пока из документации непонятно, как именно указать заббиксу соответствия получаемых данных и ключей.

Постараемся в дальнейшем освятить эту тему отдельно на примере.
ну в общем-то мы делали массовые аплоады данных с помощью zabbix_sender, можно же грузить файлами текстовыми, так что «почти» массово + через API JSON request создавали хосты, но соглашусь что иной механизм может оказаться удобнее :)

Хотя чаще всего интереснее изобретать велосипеды :))
Все так делали:)
Речь про support.zabbix.com/browse/ZBXNEXT-3386. Раньше постоянные подключения от каждого IPMI-поллера могли в некоторых случаях прибить IPMI-сервер своим количеством. Теперь подключение к каждому IPMI-серверу только одно.

Ну мы наблюдали не только эту проблему, внутри самого сервера (или прокси) мог произойти сегфолт который намертво останавливал сбор остальных метрик (не IPMI)

Подобные проблемы получают наибольший приоритет и мы их исправляем очень быстро. Сообщайте нашей команде поддержки https://support.zabbix.com/browse/ZBX!

Это все здорово и прекрасно, но только после того как появится фича "Алерт 90% метрик не обновлялись более n-времени". Прикручивать к каждому итему триггер на nodata неразумно и не все итемы поддерживают данные тип.


Неприятно узнать что в проде мониторинг "как живой"

Интересная идея. В настоящее время подобные случаи можно отслеживать наблюдая аномалии поведения внутренней метрики производительности сбора данных.

Многие сетевые железки работают по следующему принципу:
Если юзер залогинен, появляется OID вида 1.3.1.2.3.4.5.6.7.8 (он получается преобразованием ASCII -> DEC)
В свое время отказался от заббикса по причине того что нельзя повесить действие на отсутствие OID.
oid без значения? nodata не поможет? также есть lld
дайте вывод snmpget/walk для них, полюбопытствовать. И что за железки, что конкретно мониторите? На всяких цисках смотреть за новыми тоннелями и их пользователями не вызывало особых проблем, с вафлей также.
Вот четкий пример (zabbix.com не открывается, ссылка на гугло-кеш) — webcache.googleusercontent.com/search?q=cache:2gwdxvOTKgcJ:https://www.zabbix.com/forum/showthread.php%3Ft%3D51541+&cd=1&hl=en&ct=clnk&gl=ru

Там был какой-то workaround через глобальные настройки поставить action на 'not supported' — но он выглядел так монструозно, что пришлось отказаться
В 3.2 и старше можно вешать nodata() и на not supported items. Таким образом, довольно простым триггером можно зафиксировать, когда oid перестал существовать.
Здорово, что есть такой опен соурс проект! спасибо!
Графики то на клиенте рисуются теперь? Или все еще на сервере?

Карты уже рисуются на клиенте, графики пока на сервере, но над этим работаем.

Zabbix и SCADA.
Давненько проскакивал вот этот твит, можно ли узнать сейчас какие либо подробности?
Тема актуальна. Что можете посоветовать не забыть для того, чтобы Zabbix мог выступить как SCADA?
Поддержка различных протоколов. Например нам необходима поддержка МЭК 60870-5-104 — основного протокола в электроэнергетике. Приделали поддержку, но через некие костыли, а хотелось бы из коробки.
спасибо
Во главе угла сбор/обмен данными с ПЛК и распределённой переферией.
Большим плюсом было бы наличие драйверов для наиболее распространённых протоколов (Modbus, Profinet, Profibus, EtherCAT), можно сказать получается opc сервер.
Помнится есть модуль и modbus и opc, но прикрутить их это отдельная песня.
Одним словом — всё должно быть доступно из коробки.
Примеры для подражания по удобству работы с разнообразными протоколами и их количеством: KEPServerEX, Weintek (точнее ПО для работы с панелями Weintek — Easybuilder pro).

Далее какой никакой а HMI, то, что есть сейчас конечно хорошо, но стремиться нужно к максимально простому восприятию информации.
Пример — high performance hmi handbook, вот здесь есть интересная информация на русском.
Есть пример Simple Scada, продукт свежий, простой, интересно наблюдать как развивается.

Ну и генератор отчётов, куда без него.
НЛО прилетело и опубликовало эту надпись здесь
Зависимыми элементами данных: собирайте данные одним мастер-элементом, а затем раскладывайте по множеству зависимых элементов

Это хорошо, можно отдать целиком какой-нибудь mysql -e 'show status' и разбирать уже внутри заббикса, а не городить для каждого значения отдельный userparameter и item.


Проверка exit-кода

Давно не хватало, теперь можно не городить конструкции вида ( curl --max-time 2 --silent http://localhost/php_fpm_status || echo 'active processes: 99999' ) | grep '^active processes' | ...


А вы не собираетесь ввести когда-нибудь ввести item type "numeric signed"? Иногда нужны, но приходится делать их float

Скажите, а в 3.4 так и остался один Zabbix escalator processes или уже можно запускать несколько?
Супер! Спасибо!
А когда можно ожидать исправления небольшого косяка с пингованием хостов за прокси сервером? Даже в версии 3.4 Заббикс пингует их с основного сервера, а не с проксевого. В результате, пинги не проходят.
За дашбоард отдельное спасибо.
А графики типа heatmap не появились? Очень не хватает. Еще хочется картинку стоек, хотя бы схематично.

Картинку стоек можете в картах нарисовать, теперь это просто благодаря drag&drop, поддержки копирования и клонирования элементов. Heatmap графики в планах, пока нет.

Вопрос к знатокам. В заметках по обновлению указано, что рекомендуется использовать регистрозависмую базу (Case-sensitive MySQL database). Зачем это нужно и что будет, если использовать старые настройки (utf8_general_ci)?


PS.Нашел неплохую инструкцию по изменению настроек базы How to change all columns' and tables' collation to 'utf8_bin' in MySQL. Может стоит добавить что-то похожее в документацию для Zabbix?

Это влияет на критерии уникальности и гарантии целостности со стороны базы данных.

Подскажите, а действительно ли невозможно выполнять удаленные скрипты на агентах у которых включены активные проверки? Например, необходимо выключать компьютер при определенных условиях, но на этом компьютере собираются данные активными проверками. Ничего не выйдет?
Отличная новость. Уже опробовал новый дашбоард — супер. Сейчас все необходимые инструменты под рукой. Отдельное спасибо за фильтры в настройках виджета и особенно за «Hide groups without problems» в виджетах «Host status» и «System status»!!!

Выскажу свои пожелания:
Очень очень не хватает числового значения «Latest data» айтема в поле описания события триггера в обозревателе «Problems». Например, сработал триггер «Free disk space is less than 5% on volume D:». Сразу непонятно это 4,9% или 0,001%. Когда проваливаешься из «Problems» в «Event deteils», очень не хватает «simple graph» того айтема по которому произошла сработка триггера.
Это легко решается макросами, например так:
Free disk space ({ITEM.LASTVALUE}) < 10% on [{#FSNAME}] on {HOST.NAME}

Получается такая информация:
Free disk space (7.26 %) < 10% on [D:] on PC.domain.local
Очень спасибо :)
А планируется введение макросов для групп хостов?

Хорошая идея, но конкретных планов на этот счёт нет.

Для использования макросов на нескольких хостах используем шаблоны «ролей» — в них только макросы и подключённые шаблоны, уже с данными и тригерами.
Спасибо за наводку, попробуем так же делать
Существует инструкция по обновлению с 3.2 до 3.4 для debian 7? Желательно через репозиторий. На офф сайте, как обычно, слишком абстрактная инструкция.
Пока не советую обновляться. Есть серьезный Bug. Сам столкнулся с этим.
С браузером Vivaldi нет совместимости. Дашборд вообще невозможно использовать. Помогает маскировка под хром.
Можно в виджеты дашборда добавить Last X issues (или как 'Host group issues' в скринах). Единственное что сейчас можно добавить в дашборд из подобного — это Problems, а оно слишком разухабистое и моргает постоянно. А в остальном здорово!
Попробуйте в настройках виджета Problems использовать вместо Recent только Problems, будет как Last X issues.
Пробовали. Разделение по дням и часам слишком много места занимает, и по свежим проблемам происходит мигание. Хочется простую табличку, как это было в Last Issues.
Попробуйте выставить Administration-> General->Trigger displaying options->On status change triggers blink for = 0
вот спасибо!
А когда планируете выложить Zabbix Appliance для 3.4?

Сделаем, как только выпустим 3.4.1!

После обновления сервера с 3.2 до 3.4 начали отваливаться агенты. Связь есть, перезапуск агента не помогает, обновление до 3.4 тоже. Помог только перезапуск процесса сервера Zabbix.
Так же помогает удаление шаблона с очисткой из настроек узла сети, а потом его добавление по новой. Но надо понимать, критичны все предыдущие данные по этому узлу или нет.
Присоединяюсь, тоже столкнулись с этим, пришлось откатиться. С нетерпением ждем исправления, новая версия понравилась.
Скажите, а с учетом https://support.zabbix.com/browse/ZBX-12549 нет ли смысла убрать пока из Downloads заведомо поломанную версию, и выложить уже с исправлением (3.4.1, скажем)?

Насколько могу судить, как 3.4.0 раздавалась, так и раздается.

А самое-то обидное, что изменения такие интересные, что попробовать и внедрить как раз хочется. Одна обработка значений на стороне сервера чего стоит!
Подскажите пожалуйста что насчет партиционирования?
Планируется появление фикса в репозитариях?
Выложили в репозитории пакеты 3.4.1 с исправлениями.
У меня на дашбордах (3.4.1rc1) графики как-то себя не очень адекватно ведут. Масштаб отличается от комплексных экранов, точки времени не совсем соответствуют реальности (график не там, где должен быть). Ниже картинка: верхний — комплексный экран, нижний — дашборд.

image
Спасибо, завели тикет: support.zabbix.com/browse/ZBX-12602, будем проверять.
Если не сложно, уточните пожалуйста (в тикете, или тут) версию php, и другую информацию об окружении.
Спасибо за тикет,
Apache + php:
Server version: Apache/2.2.22 (Debian)
Server built: Jul 29 2017 16:42:25
PHP 5.4.45-0+deb7u9 (cli) (built: Jul 21 2017 10:23:02)
Copyright (c) 1997-2014 The PHP Group
Zend Engine v2.4.0, Copyright (c) 1998-2014 Zend Technologies
wabbit, извиняюсь что снова сюда, а не в тикетсистему, но тут просто быстрее…

Zabbix 2.3.1rc2. Осталась проблема наблюдаемая в релизе и rc1, думал связано с закрытым ZBX-12602, но нет…

Открываем панель, определяем в фильтре, что значения отображать на «сейчас», после чего переходим куда-нибудь (например меняем вкладку на «Проблемы») и снова возвращаемся к панели. Оставляем её. Через какое-то время становится заметно, что графики застывают и перестают «передвигаться», т.е. не соответствуют настройкам фильтра «сейчас». Если открыть фильтр, то в этом можно будет убедиться. Ниже на картинке сравнение комплексного экрана и панели через 10-15 минут активности:

image

Apache + php:
Server version: Apache/2.2.22 (Debian)
Server built: Jul 29 2017 16:42:25
PHP 5.4.45-0+deb7u9 (cli) (built: Jul 21 2017 10:23:02)
Copyright (c) 1997-2014 The PHP Group
Zend Engine v2.4.0, Copyright (c) 1998-2014 Zend Technologies
Думаю можно задачу объединить. Если в Dashboard вывести графики, с галочкой «Динамический элемент», то показания графика застывают на моменте добавления этого графика в Dashboard, то есть онлайн-состояние график не отображает.
Оказалось, что в фильтре Dashboard по умолчанию стоит масштаб времени = 1 минута, изменил на 5 минут и более, графики начали отображаться корректно. Спасибо.
Скажите пожалуйста, когда будет доступен docker image с багфиксом ZBX-12549

Так ведь в 3.4.1 эта проблем исправлена.

уже доступен, в докере версия 3.4.1
А нельзя ли с помощью препроцессинга убирать ненужные строки? Пример: получаю event log из esxi, но мне, скажем, не нужны сообщения авторизации. Я пробовал матчить нужные строки регуляркой, однако если строка не подпадает под выражение, заббикс переводит зависимый итем с препроцессингом в unsupported, а не удаляет строку из итогового лога.

С помощью препроцессинга это делать (пока?) нельзя. Используйте регулярные выражения в ключе айтема для фильтрации нужных вам строк.

Будут ли в дальнейшем улучшаться виджеты? В частности интересует аналог виджета «Обзор данных», но с выбором не группы элементов данных, а непосредственно самих элементов данных.
Да, похоже это то что нужно!
Нет, это не то. Виджет таблицы — то о чем я сейчас мечтаю :)

Конечно будут! В этом суть того, что мы сделали в 3.4. Заложен фундамент, на котором будут проще и быстрее создаваться новые виджеты.

Я тоже прошу прощения, что сюда пишу, но столкнулся с проблемой отображения шрифтов (точнее, надписи на графиках вообще не отображаются):
screenshot
image

Окружение:
Debian 9.1
Nginx 1.13.4
zabbix 3.4.1-1+stretch
php-fpm 7.1.8
Нашел причину, но комментарий почему-то удалить не могу.
Достаточно было сделать dpkg-reconfigure zabbix-frontend-php (не знаю, почему при установке настройка не произошла)
А можно как-нибудь сделать, чтобы в дашборде графики были с разным масштабом по времени? Например загрузка интернет канала мне нужна за последние 15-30 минут, а баланс лицевого счёта у провайдера за последние 3-4 дня. Если начинаю изменять масштаб вверху в фильтре, то он меняется у обоих графиков.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий