Комментарии 5
что такое мониторинг и с чем его едят
написание сервиса по мониторингу интернет-соединения на торговых точках компании
так вы про что хотели рассказать про некоторый глобальный-универсальный мониторинг или про "мониторинг интернет-соединения на торговых точках компании"?
Или вы считаете что разницы нет? Вы извините, но такой вывод напрашивается.
Этак можно запустить цикл статей по новому пониманию всех возможных универсальных слов: продакшен, релиз, валидация, геймефикация, трындрениризация...
А что такое этот "специалист по мониторингу"? Это специалист, который развернет необходимую для мониторинга инфраструктуру? Или специалист, который реализует core-компоненты, обеспечивающие прикладных разработчиков инструментарием, с помощью которого будет осуществляться отправка метрик? А возможно это бизнес-аналитик или продакт, который определит, какие отклонения в бизнес-метриках, должны приводить к уведомлениям об инцидентах?
Это специалист, который развернет необходимую для мониторинга инфраструктуру?
Я думаю, что тут как нигде работает принцип разделения на junior, middle и senior позции. Если мы берем senior позицию, то да.
Исходя из моего опыта, я считаю, что в обязанности такого специалиста должны входить:
Сбор требований по системе: что, когда и зачем должно мониториться, какие метрики должны отслеживаться и какой результат выводиться.
Подобрать необходимый инструментарий под задачи.
Построить архитектуру будующего сервиса мониторинга.
Проектирование и реализация самого проекта.
Контейнеризация, создание пайплайнов и настройка CI/CD.
Сбор логов и метрик.
Реализация инструментов визуализации для метрик.
Настройка алертинга.
По поводу того, какие отклонения в метриках должны приводить к оповещению линии поддержки:
обычно это должно согласововаться с заказчиком мониторинга.
По крайней мере так строится моя работа. Я получаю запрос от бизнеса на мониторинг одного из множества ресурсов и прохожу весь процесс от сбора требований до реализации дашборда с метриками на удобном ресурсе и поддержки.
А что тогда входит в обязанности джуна по мониторингу? Чтобы понимать минимум требований; в какой точке ещё "мимокрокодил, услышавший модное слово", а в какой - уже джун?
Звучит как какая-то узкоспецифичная вещь для вашей компании или как карго-культ.
1. Ну сбор понятен, кто-то всегда должен собрать требований.
2. Какие SRE выдаст опции, такие и подберет. Если в компании стандартный пак в виде прома с графаной, так и будет пром с графаной. Или куда и как все логи сливаются, так оно и будет в большинстве случаев. У SRE уже в любом случае есть система мониторинга как минимум железяк и системных сервисов, типа nginx. А если все развернуто в этих ваших кубернетисах, так тем более. И алерты, для всех них должно быть одно окно.
3. Непонятно о чем речь. Базово у тебя есть хранилища, куда стекаются метрики из разных мест. Есть отображалка, которая читает эти хранилища. Что именно подразумевается?
4. Свой statsd пишем? Или loki?
5. Тоже какие-то довольно общие слова.
6. Организация инфраструктуры для наблюдения за приложением -- это так же прерогатива SRE.
7. Свою графану с кибаной пишем? Или имеется в виду дашики накидать в инструменте?
8. Это что? Организация канала алертинга? Это часть инфраструктуры, это SRE-DevOpsEngineer-SysAdmin-любое другое имя, которое сейчас модно. Накидывание правил для конкретных дашбордов-панелей? Так это должны уметь все, как разработчики, которым надо следить за тем, что их приложение работает правильно, так и продактам, которые хотят следить за бизнес-метриками приложений.
Короче мне все равно непонятно, чем в итоге занимается этот инженер по мониторингу. Я в статье увидел только код, который проверяет доступность клика на странице. Это что-то вроде end-2-end тесткейса? Ок, прогнали вы его на тесте-стейдже-препроде-любое другое имя, которое сейчас модно. Можно даже на проде гонять, хотя по хорошему поломаться это может только при релизе приложения, если процессы разработки и доставки отлажены более-менее правильно.
Как мониторинг связан с тестированием. Преимущества мониторинга для бизнеса: как экономить время и деньги