Комментарии 7
а что мешало поставить локально OSS OnCall и ним экспериментировать?
Для дежурств мы используем гугл-календарь, OnCall следит за ним и делает ротацию сам, оповещая дежурных.
ну и основная проблема алертов экосистемы Prometheus - мешанина из информации и отвратительный UX без напильника, судя по скринам, так и не решена
Считаю что это хорошо если у вас есть время попереживать про UX в таком деле :) У меня в OnCall только создание расписания доставляет боль чуть ниже спины.
Про Google Calendar отличная идея, – спасибо.
1) OSS OnCall не умеет дозваниваться и отправлять СМС/Пуши. В Телегу/Слак/Email - пожалуйста прямо из коробки. Нужная же команде функциональность работает только если есть подключение к Grafana OnCall Cloud, или к Twilio - поэтому и пришлось изучить связку и сделать эмулятор, так как API у OnCall проще в реализации.
2) В таком наборе можно решать что угодно по информационному наполнению сообщения - у нас сокращение штата прошло раньше чем до этого руки дошли. Но по тому что прилетает в нашем конкретном случае порядок навели и внедрили общий стандарт.
Тут соглашусь, для OSS нужен сторонний провайдер звонков-пушей, у нас как раз Twilio
Увы, нам в процессе эксплуатации функционала наполнения показалось маловато - ввиду отсутствия команды эксплуатации и решения инцидентов силами Dev(Ops) информативность и точность алертов оказалась достаточно важной и пришлось делать свой вариант AlertManager, умеющий "обогащать" алерты дополнительной информацией, облегчающей разбор и анализ алертов, ну и плюс умеющий группировать алерты более сложным способом, чем умеет AlertManager
Я снимаю шляпу перед усилиями, которые вы провернули вокруг OnCall, и не могу не позвать коммитить изменения в апстрим :)
Например, недавно у нас появился достаточно качественный интерфейс для написания собственных звонилок и комьюнити сразу же привинтило к нему znonok: https://github.com/grafana/oncall/pull/2137/files, контрибьютор астериска уже переписывает свой PR на новый интерфейс и, будем надеется, увидим его в апстриме: https://github.com/grafana/oncall/pull/1282
В общем, у нас нет никакого хитрого замысла заставить всех платить Twilio или пользоваться именно нашим мобильным приложением, которое шлет пуши через наш клауд (какой-то облачный сервис для этого нужен, мы запилили свой). Контрибьютеры позитивно относятся к расширению функционала в ту сторону, которая обеспечит вам большую независимость.
А еще, у нас есть русскоязычное коммьюнити, присоединяйтесь: https://t.me/amixr_ru
Эмуляция Grafana OnCall Cloud