Всем привет! Я Максим, тимлид SRE команды бэкенда и SSO, последние семь лет занимаюсь вопросами надежности сервисов и услуг банка. Раз в год мы проводим месяц поиска уязвимостей — Month of Bugs. В 2022 году, когда все компании столкнулись с новыми вызовами, мы превратили Month of Bugs в Month of Reliability — месяц надежности. И сосредоточились не на поиске отдельных багов, а на обеспечении надежности всех систем.
Год был сложным: релизы, aлерты, рутина, баги, сбои и прочие события. Мириться со сбоями мы не желали, поэтому задумались над тем, как кардинально улучшить ситуацию. И решили вовлечь в процесс представителей разных профессий: разработчиков, аналитиков, тестировщиков. Историю проведения этого мероприятия я вам сейчас расскажу.