Комментарии 8
Я мониторил zabbix, ставил прям на сам сервер, правда я использовал citrix xen.
Очень удобно подключил репозитарии поставил агента и все как на ладони.
P.S: репозитарий epel+ не стоит забывать об сдк.
Очень удобно подключил репозитарии поставил агента и все как на ладони.
P.S: репозитарий epel+ не стоит забывать об сдк.
0
мониторил нагиосом+грейлогом, в принципе устраивало
0
по сервисам, обычно на чилд доменах были сервисы под мониторингом
если связка пинг\сервис\ссх итыды начала звенеть в нагиосе — что-то нетак
ну и грейлог был настроен на ключевые слова
домены поднимались исключительно хелпдеском, поэтому не было ситуаций «юзер поднял виртуалку, она не встала и все про нее забыли»
если связка пинг\сервис\ссх итыды начала звенеть в нагиосе — что-то нетак
ну и грейлог был настроен на ключевые слова
домены поднимались исключительно хелпдеском, поэтому не было ситуаций «юзер поднял виртуалку, она не встала и все про нее забыли»
0
Специфичные знания.
Состояние dom0 (типовое):
LA (его превышение свидетельствует о проблемах, на нормальном dom0 la не должно выходить за 0.1, больше 2-3 — проблема)
cpu usage. Мониторить обычно дискомфортно (т.к. требует интервала замера), чаще всего реализуется через zabbix/cacti/munin
От 2 до 4 вполне нормальное состояние, особенно если используется xenstore, сделанный фрилансерами-любителями. Юзер легко может захотеть поднять десяток своих серверов одновременно. Будет отвлекать ложное срабатывание.
Свободную память (самого dom0). Если приложения из dom0 уйдут в своп, будет беда для всех виртуалок
best practice vm.swapiness в 0 для хост-систем, это в каждой брошюре написано pic.dhe.ibm.com/infocenter/lnxinfo/v3r0m0/topic/liaat/liaattuning_pdf.pdf
Состояние рейд-массива и жёстких дисков. Отказ или деградация дисков на хосте, даже если они используются «всего лишь» для root (то есть данные виртуалок отдельно), то тормозной /var/log может попортить нервы. Особое внимание в случае аппаратного рейда — надо найти утилиту вендора и использовать её. Софтовый рейд отлично обрабатывает mdadm, если ему почту настроить. Сами диски контролируются smartmontools или чем-то от вендора.
Зачем ставить контроллер на хосту за 10 штук, если есть mdadm.
Состояние dom0 (типовое):
LA (его превышение свидетельствует о проблемах, на нормальном dom0 la не должно выходить за 0.1, больше 2-3 — проблема)
cpu usage. Мониторить обычно дискомфортно (т.к. требует интервала замера), чаще всего реализуется через zabbix/cacti/munin
От 2 до 4 вполне нормальное состояние, особенно если используется xenstore, сделанный фрилансерами-любителями. Юзер легко может захотеть поднять десяток своих серверов одновременно. Будет отвлекать ложное срабатывание.
Свободную память (самого dom0). Если приложения из dom0 уйдут в своп, будет беда для всех виртуалок
best practice vm.swapiness в 0 для хост-систем, это в каждой брошюре написано pic.dhe.ibm.com/infocenter/lnxinfo/v3r0m0/topic/liaat/liaattuning_pdf.pdf
Состояние рейд-массива и жёстких дисков. Отказ или деградация дисков на хосте, даже если они используются «всего лишь» для root (то есть данные виртуалок отдельно), то тормозной /var/log может попортить нервы. Особое внимание в случае аппаратного рейда — надо найти утилиту вендора и использовать её. Софтовый рейд отлично обрабатывает mdadm, если ему почту настроить. Сами диски контролируются smartmontools или чем-то от вендора.
Зачем ставить контроллер на хосту за 10 штук, если есть mdadm.
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Мониторинг Хen'а в продакшене