Комментарии 8
> Есть четыре основные метрики:
похоже это можно использовать для оценки службы поддержки
похоже это можно использовать для оценки службы поддержки
Честно листал, чтобы дойти до adaptive sampling (или dynamic sampling), но не дошёл. Видимо, пока в русский сегмент доползёт, ещё несколько лет надо.
В двух словах: мы не можем собирать все логи обо всех событиях. Не можем. Если вы думаете, что можете, как насчёт лога о передаче ip-пакета на маршрутизаторе?
Зато мы можем делать sampling для того, чтобы в случае тенденции было куда смотреть.
Но некоторые события требуют большего внимания, чем другие — и для них sampling rate уменьшается (вплоть до 1). Таким образом мы сохраняем observability, но сохраняем visiblity.
А вот подкручивание sampling rate для разных штук — администрирование будущего.
В двух словах: мы не можем собирать все логи обо всех событиях. Не можем. Если вы думаете, что можете, как насчёт лога о передаче ip-пакета на маршрутизаторе?
Зато мы можем делать sampling для того, чтобы в случае тенденции было куда смотреть.
Но некоторые события требуют большего внимания, чем другие — и для них sampling rate уменьшается (вплоть до 1). Таким образом мы сохраняем observability, но сохраняем visiblity.
А вот подкручивание sampling rate для разных штук — администрирование будущего.
То, что вы говорите очень верно, но фокус доклада все же был о другом, если у вас есть экспертиза в семплинге, может сделаете доклад на DevOpsConf devopsconf.io/moscow/2018? Пишите мне в личку, если интересно.
Нет у меня экспертизы в сэмплинге. Я думаю, ни у кого нет, потому что идея только-только побежала по админским кругам.
А есть хороший доклад про это на каких-либо конференциях? Или статья хорошая?
Я для себя принял аргументы во вопросу тут: read.acloud.guru/why-you-cant-effectively-debug-your-modern-systems-with-dashboards-57fe3ecd26bf
Вот тут 2х минутная TLDR версия расшифровки medium.com/some-tldrs-ru/саммари-по-докладу-как-измерить-успех-стратегии-мониторинга-и-их-связь-с-бизнес-проблемами-4a667d8d0904
Мне кажется, что это все очевидные вещи.
— Сделал системные метрики, мониторы, алерты.
— Сделал бизнес метрики, мониторы, алерты.
— Отслеживаешь что изменилось в приложениях и бизнесе — изменяешь, добавляешь метрики.
— Ловишь какую-то проблему, о которой никто не подумал — добавляешь метрику.
Но почитать было интересно.
— Сделал системные метрики, мониторы, алерты.
— Сделал бизнес метрики, мониторы, алерты.
— Отслеживаешь что изменилось в приложениях и бизнесе — изменяешь, добавляешь метрики.
— Ловишь какую-то проблему, о которой никто не подумал — добавляешь метрику.
Но почитать было интересно.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как измерить успех. Стратегии мониторинга и их связь с бизнес-проблемами