Pull to refresh

Comments 4

>>Зависимость от внутренних сервисов — прописываем, чтобы в случае инцидента можно было быстро проверить, всё ли в порядке в соседних командах, ускорить поиск причин.

Если вы имеете ввиду, внутренние сервисы вашей компании, но которые управляются другими командами, то по хорошему они тоже должны быть встроены в процесс инцидент-менеджмента с SLA и т.п. Т.е. если у вас обнаружен инцидент, то у них тоже он должен подниматься по цепочке (как тот изза которого у вас он случился, так и тот который вы у них спровоцируете) и они также его должны отрабатывать соответственно.

Да, вы правы, так оно и есть. Зависимость от внутренних сервисов мы решили указывать для того, чтобы не возникло ситуации, когда ищем ошибку там, где её нет. То есть, ошибка у смежной команды, они занимаются её устранением, и забыли предупредить об этом — всякое бывает. Но алерт прилетел и нам, и мы пытаемся найти ошибку в нашем сервисе, на что тратятся время и силы. К тому же у нас в компании вторая линия занимается первичным анализом алертов и, зная зависимости, может быстрее локализовать проблему.

поделитесь пожалуйста гайдами, как это все настраивать?

Привет! Сори за долгий ответ, был в отпуске. Можешь расписать плиз поконкретнее, что именно интересует, а мы попробуем детально все расписать

Sign up to leave a comment.