Comments 5
Наверное все же имеет смысл смотреть на RPS в связке с репонс тайм? И определить через сколько минут/часов после начала нагрузки, мы будем снимать метрики.
Да, вы абсолютно правы — смотреть RPS в отрыве от Response Time бессмысленно.
Эти метрики всегда идут в связке: RPS показывает нагрузку на систему, а Response Time - её фактическую реакцию.
По поводу времени съёма метрик:
На практике я чаще встречала окна в 5-10 минут стабильной нагрузки для съёма метрик. Этого достаточно, чтобы получить репрезентативные данные без “шумов” ramp-up или нестабильных первых минут.
Дальше - всё зависит от целей теста:
Для кратковременных проверок (baseline, smoke-load) достаточно 5 минут стабильной фазы.
Для нагрузочных тестов под пиковую активность обычно держат 10-15 минут.
А вот для длительных soak tests метрики снимают часами - чтобы отследить деградацию и утечки.
Спасибо за этот комментарий - без учета времени метрики действительно могут “врать” и давать ложное чувство стабильности.
Открыл. Не увидел привязку всего описанного к метрикам железа в графане - закрыл.
Прочитайте про RED, USE, 4 GOLDEN SIGNALS.
Как понять, выдержит ли ваш сервис нагрузку: метрики, которые должен знать каждый инженер