Как стать автором
Обновить

Как понять, выдержит ли ваш сервис нагрузку: метрики, которые должен знать каждый инженер

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров8K
Всего голосов 6: ↑6 и ↓0+6
Комментарии5

Комментарии 5

Наверное все же имеет смысл смотреть на RPS в связке с репонс тайм? И определить через сколько минут/часов после начала нагрузки, мы будем снимать метрики.

Да, вы абсолютно правы — смотреть RPS в отрыве от Response Time бессмысленно.

Эти метрики всегда идут в связке: RPS показывает нагрузку на систему, а Response Time - её фактическую реакцию.

По поводу времени съёма метрик:

На практике я чаще встречала окна в 5-10 минут стабильной нагрузки для съёма метрик. Этого достаточно, чтобы получить репрезентативные данные без “шумов” ramp-up или нестабильных первых минут.

Дальше - всё зависит от целей теста:

Для кратковременных проверок (baseline, smoke-load) достаточно 5 минут стабильной фазы.

Для нагрузочных тестов под пиковую активность обычно держат 10-15 минут.

А вот для длительных soak tests метрики снимают часами - чтобы отследить деградацию и утечки.

Спасибо за этот комментарий - без учета времени метрики действительно могут “врать” и давать ложное чувство стабильности.

Открыл. Не увидел привязку всего описанного к метрикам железа в графане - закрыл.

Не хватает кармы плюсануть, но это очень важный и правильный комментарий

Прочитайте про RED, USE, 4 GOLDEN SIGNALS.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации