Комментарии 9
Расскажите, чем не подошёл или не устроил AlertManager от Prometheus? Вроде по функционалу то же самое, но с настройкой явно проще, по сути один yaml с правилами и всё.
Наверное это для адептов мышкакликательных свидетелей гуя. Они же не умеют в cli и конфиги, им GUI подавай и 100500 кликов мышкой.
Большую часть операций выполненных в мануале можно описать в docker-compose файле. Например используя Provision Grafana.
Сразу скажу, что я не являюсь амбассадором Grafana и не пытаюсь её кому либо навязать :)
OnCall умеет в Escalation plans и прочие нужные фичи. Настраивать да все приходится через GUI.
Но как Oss альтернатива PagerDuty вполне неплохо
У Prometheus AlertManager функционал примерно такой же, как у Grafana Alerting. Отследим метрики, сгруппируем алерты и направим письмо на почту.
OnCall же позволяет создавать цепочки эскалации, расписание для сотрудников и интегрируется со Slack и Telegram.
Тут скорее аналогично вопросу про мониторинг. Зачем нужна вика, пром, заббикс, [подставь что-то своё], когда есть ещё какая-то система мониторинга.
Собственно, одна система что-то умеет, другая нет, третья делает это лучше, а четвертая проще. OnCall скорее нужен для дополнения AlertManager, а не вместо него.
Вот тут чуть подробнее про возможности OnCall
Grafana OnCall это всё таки аналог не Alert Manager, а PagerDuty, opsGenie и прочее, то есть когда у вас есть команды, дежурства, расписания, эсколации, постмортемы и так далее.
Отличная статья! Спасибо за такое подробное описание всей связки!
Несколько добавлений:
В версии 1.1 появился полноценный редактор расписаний, можно даже без гугл календаря.
Можно конфигурировать кодом через терраформ: https://registry.terraform.io/providers/grafana/grafana/latest/docs/resources/oncall_escalation
У Grafana OnCall есть русскоязычный чатик: https://t.me/amixr_ru
Grafana OnCall. Быстрое знакомство