Как стать автором
Обновить
6
0

Пользователь

Отправить сообщение

Как добавить системности в мониторинг продакшна: параметры и тулинг для инцидент-менеджмента

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.5K

На проде что‑то сломалось — такова суровая реальность, случается с лучшими из нас, увы. Что часто происходит в подобных случаях: ловим алерты, бежим смотреть графики и логи, вызваниваем из отпуска разработчика, который занимался этой функциональностью, выкатываем фикс, проводим пост‑мортем. Это реакция на уровне здравого смысла, классика.

Но когда речь заходит о недозаработанных из‑за инцидента деньгах, расстроенных пользователях — любое улучшение, даже небольшое, на доли процента — может принести ощутимый результат.

Давайте поговорим, как подойти к вопросу мониторинга методологически — задействовать инструментарий инцидент‑менеджмента. Обсудим, как оценивать критичность сервисов и какие системы могут быть полезны для отслеживания проблем.

Статья ориентирована в первую очередь на тех, кто прямо сейчас занимается мониторингом на уровне общей инженерной грамотности, но пока не использует в явном виде инцидент‑менеджмент как подход.

А что дальше?
Всего голосов 20: ↑19 и ↓1+21
Комментарии4

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность