
Алерт пришел! Что делать?
7 ноября на вебинаре «Прокачка алертов: как постмортемы и ранбуки меняют игру» обсудим, как эффективно работать с инцидентами и что для этого нужно.
Рассмотрим:
→ что такое постмортем, как с ним работать и извлекать выгоду
Кратко: post mortem — это анализ инцидента, который проводится после того, как проблема решена. Он нужен для того, чтобы извлечь уроки из сбоев, выявить root causes (корневые причины), найти слабые места в системе и усовершенствовать процессы. Особенно это полезно, когда есть повторяющиеся проблемы, которые приводят к деградациям и потерям.
Такой подход позволит устранить конкретную проблему и снизить вероятность её повторения в будущем.
Ещё расскажем и покажем:
→ зачем нужен ранбук и как его писать
→ как обычный алерт можно превратить в полезный инструмент с помощью постмортема и ранбука
Спикеры:
→ Кирилл Борисов, SRE в VK Рекламе
→ Максим Гусев, SRE Dodo Engineering
Уникальные кейсы из реальной практики и финансовые вопросы инцидентов в крупных компаниях — на нашей встрече!
Когда: 7 ноября в 19:00 мск
Занять место — по ссылке