JCDenton Mar 24 2014 at 07:38

CPU Load: когда начинать волноваться?

5 min

232K

High performance*

From sandbox

+134

Comments 87

begemot_nn Mar 24 2014 at 07:52

скажу честно — я сто лет не читал статей из серии «линукс для самых маленьких» (на русском) такого хорошего качества.
статья написана в стиле «до прочтения не знал что это такое, после прочтения — понял и запомнил на всю жизнь».

JCDenton Mar 24 2014 at 08:11

У меня были такие же впечатления после прочтения оригинала. Собственно, поэтому и перевод появился.

shifttstas Mar 24 2014 at 17:39

В таком же изложении с удовольствием бы прочитал статью про:

Хабраюзер enemo в комментариях добавил замечание о том, что выской показатель load average может быть вызван большим количеством процессов, выполняющих в данный момент операции чтения/записи. То есть, load average > 1.00 на одноядерной машине не всегда говорит о том, что в Вашей системе отсутствует запас по загрузке процессора. Требуется более внимательное изучение причин такого показателя. Кстати, это хорошая тема для нового поста на Хабре :-)

dukelion Mar 25 2014 at 04:55

почитайте prutser.wordpress.com/2012/04/23/understanding-linux-load-average-part-1/

Ipeacocks Mar 24 2014 at 10:04

просто аналогия с мостом и автомобилями хороша.

tyomitch Mar 24 2014 at 11:29

Только первая картинка левая (и по ошибке совпадает со второй).
В оригинале

JCDenton Mar 24 2014 at 11:35

Исправил. Спасибо!

hipoint Mar 24 2014 at 07:56

«Я даже не буду задумываться о ней, пока load average не превысит 3.70.» (для системы на 4 ядра).
Т.е. правило 70% применяется к одному ядру, а не ко всей системе. Если применить ко всей системе, то будет 2.80
Хоть это и перевод, но можете уточнить как правильно?

JCDenton Mar 24 2014 at 08:10

В оригинале у автора статьи двуядерный процессор и он пишет, что будет ждать значения 1.70. Видимо, умеется в виду, что пока есть «свободные» 30% хотя бы от одного ядра — все ОК.

jerom Mar 24 2014 at 08:12

Вот только надо понимать, что это относительно верно для числодробилок. Если машина занимается активной раздачей статики, то даже la 50 может быть штатным значением.

JCDenton Mar 24 2014 at 08:17

Собственно, в последнем пункте я про это и говорю.

jerom Mar 24 2014 at 08:21

Не, я не про «и в таких случаях la = 1.00 — то, что доктор прописал». Я говорю, что LA становится странным при добавлении ввода-вывода и LA может превышать количество ядер раз в 10 в таких случаях. На него даже смотреть уже не стоит в таких случаях, чтоб не пугаться.

dukelion Mar 24 2014 at 08:21

LA 50 не будет штатным значением, на 1-процессорной машине с LA 50 вы вряд ли сможете подключиться по SSH к ней.
А к статье надо добавить, что максимальная производительность достигается при LA > 1, т.е. иногда есть смысл держать LA повыше, чтобы более эффективно нагрузить «железо», в ущерб времени обработки отдельного запроса.

JCDenton Mar 24 2014 at 08:30

Выглядит логично. Добавил информацию в основной пост.

UFO landed and left these words here

jerom Mar 24 2014 at 09:00

Когда однопроцессорная машина работает с медленным nfs сервером, то там и с la 500 можно нормально ssh-ем зайти.

dukelion Mar 24 2014 at 09:54

Правда ваша, но это очень частный случай. SSH, т.к. использует и процессор и диск и сеть, чаще всего тормозит при высоком LA, но исключения, конечно, бывают.

youROCK Mar 24 2014 at 19:18

Это при условии, что ваша директория .ssh не находится на этом самом NFS-сервере :))

Flex25 Mar 24 2014 at 08:25

Обоснуйте, пожалуйста, почему la 50 — это нормально при раздаче статики? Это как-то связано с тем, что очередь процессов может искусственно увеличиваться из-за медленных клиентов? И как в таком случае контроллировать la? Как выявить предел допустимого значения?

jerom Mar 24 2014 at 08:58

В la добавляются напрямую все процессы, которые блокированы по io.

Представьте, что каждые 100 ms приходит 50 клиентов с запросом, мы добавляем их в очередь, ищем и находим им информацию, отдаём, 100 ms им постоять приходится. Это и будет la 50. При этом cpu загружен вообще не будет. И машина вполне резво отвечает, никто больше 100ms в среднем не ждёт.

ToSHiC Mar 24 2014 at 09:47

Вообще говоря, смотреть, нагружен ли процессор в этом случае стоит, и смотреть надо на цифру %wa. Если у вас процессор всё время проводит там — дело плохо, пора тюнить софт и файловую систему (и, возможно, железо) под вашу нагрузку.

Meklon Mar 24 2014 at 14:40

Утилита iotop спасает в таких случаях.

enemo Mar 24 2014 at 08:23

Не упомянуто, что на linux в LA учитываются не только ждущие выполнения процессы, но и находящиеся в состоянии блокировки по i/o.
«However, Linux also includes processes in uninterruptible sleep states (usually waiting for disk activity), which can lead to markedly different results if many processes remain blocked in I/O due to a busy or stalled I/O system»
То есть высокий LA на линуксе можно получить и при простаивающих процессорах, надо смотреть комплекснее.

JCDenton Mar 24 2014 at 08:40

Добавил замечание в основной пост. Спасибо!

MaxxxZ Dec 21 2019 at 09:33

В этой связи и не понятно, почему заголовок статьи CPU Load, а в тексте про Load Average. Легко можно словить ситуацию со свободным CPU и большими LA.

Nastradamus Mar 24 2014 at 08:54

Моё грубое определение Load в Linux — это число процессов, находящихся в состоянии R (running or runnable (on run queue)) + число процессов в состоянии D (uninterruptible sleep (usually IO)). Load average усредняет эти значения по хитрой формуле (кажется, это экспоненциально взвешенное скользящее среднее).

Посмотреть статусы можно через ps.

Статья в таком виде не даёт никакого понимания о LA в Linux.

Мало того, LA в Linux вообще не информативен, ибо смешивает очередь I/O и очередь на выполнение процессором. Как я уже говорил, смотреть нужно в ps.

Nastradamus Mar 24 2014 at 08:56

Кстати, на собеседованиях в крупные IT-компании обычно ждут именно такого определния LA. :)

JCDenton Mar 24 2014 at 09:04

Отчасти, Вы правы. Но все же не стоит утверждать, что LA полностью бесполезен. Для грубой оценки потребления ресурсов CPU он вполне подходит.

dukelion Mar 24 2014 at 09:52

LA — хороший показатель для оценки того, насколько в общем система «тормозит»

Nastradamus Mar 25 2014 at 15:17

у вас может быть система с массивом из 10 дисков, которая будет показывать LA 10 и это будет нормальной работой для такой системы.

pansa Mar 25 2014 at 17:46

Не правильно. Длительное нахождение процесса в D-state это не нормально независимо от количества дисков. Более того, если у вас нагрузка распределяется по физическим дискам, ожидание IO это ещё больший аларм.

Nastradamus Mar 26 2014 at 06:39

Где-то видел пример такого LA. Кажется, это было в какой-то статье яндекса.
В живую не видел )

pansa Mar 26 2014 at 07:21

Я постоянно вижу всяческие разноообразные показатели la — от 0 и до 50. В некоторых случаях высокий LA это нормально, в некоторых случаях — нет, но корреляции с _количеством_ дисков, однако, нет вовсе.

MaxxxZ Dec 21 2019 at 09:35

У меня есть один сервер на 4 камнях. LA 8-10, CPU Idle=90%. А оно работает…

Поэтому вы вводите в заблуждение LA это одно, CPU — другое. Они могут быть связаны. А могут быть и нет.

Rondo Mar 25 2014 at 06:38

В старом посте про load average давали ссылку на замечательную статью, где я и прочитал про это самое «кспоненциально взвешенное скользящее среднее»,
Очень рекомендую к прочтению, можно даже добавить в пост.
Часть 1 www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
Часть 2 www.teamquest.com/pdfs/whitepaper/ldavg2.pdf

SilverFire Mar 24 2014 at 15:37

Видел своими глазами сервер с LA ~1200 из-за очереди на операции с хардом, при этом процессор был бодрячком:

# iostat -xk -t 10
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0,82    0,00    0,08   19,39    0,00   79,70

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0,00   128,10    0,00   47,30     0,00   742,40    31,39   100,09 2515,35  21,14 100,00
sda1              0,00     0,00    0,00    0,00     0,00     0,00     0,00     0,00    0,00   0,00   0,00
sda2              0,00   128,10    0,00   47,30     0,00   742,40    31,39   100,09 2515,35  21,14 100,00
dm-0              0,00     0,00    0,00  159,70     0,00   638,80     8,00   399,56 2768,76   6,26 100,00
dm-1              0,00     0,00    0,00    0,00     0,00     0,00     0,00     0,00    0,00   0,00   0,00

Как видно, каждое обращение к диску в среднем ждало 2500мс до выполнения. Серверу жилось очень тяжело)

isden Mar 24 2014 at 18:15

> Видел своими глазами сервер с LA ~1200 из-за очереди на операции с хардом, при этом процессор был бодрячком:

Я под 800-900 видел. Причем, хозяин сервака говорил, что это нормально и у него всегда так. И, что интересно, сайты на том сервачке бодро так шевелились и SSH работал.

urbain Mar 26 2014 at 09:34

мне доводилось проводить экперимент над FreeBSD установленной под гипервизором VmWare — крутил настройки sysctl для достижения максимальной производительности сети.

стрелял в скрипт phpinfo() на апаче при помощи LOIC. LA доходил до 450. ОС при этом была способна управляться по SSH.
ядро, отданное виртуалке было одно.

merlin-vrn Mar 25 2014 at 04:42

так видно же, что всё упёрлость в i/o: iowait = 19.39 — это много

esvaf Mar 24 2014 at 08:25

А как считать если ядер 2, но с HT в системе видно 4 ядра?

JCDenton Mar 24 2014 at 08:32

Хороший вопрос. Постараюсь изучить его и дополнить пост. Если кто-то из более опытных товарищей поделится ссылкой или готовой информацией — с удовльствие добавлю в пост.

JCDenton Mar 24 2014 at 09:00

Добавил немного информации на эту тему в основной пост. Не буду утверждать, что она 100% правильная.

esvaf Mar 24 2014 at 09:16

Спасибо. Тогда количество ядер видимо можно узнать командой
cat /proc/cpuinfo | grep "core id" | sort | uniq | wc -l
Только не знаю насколько правильно она отработает на многопроцессорных системах — сейчас не на чем проверить.

JCDenton Mar 24 2014 at 09:22

Я изменил пример получения количества ядер в статье — посмотрите там.

xandr0s Mar 24 2014 at 10:00

На VDS это даст 0 результат

esvaf Mar 24 2014 at 10:26

Проверил, действительно. Однако не совсем понятно что я должен там увидеть в данной ситуации — на моём vds видно два ядра при том, что процессор 4 ядерный 8 поточный (HT).

JCDenton Mar 24 2014 at 10:42

removed

esvaf Mar 24 2014 at 11:14

Я знаю что такое виртуализация и как она работает, вопрос в том, что при наличии, допустим, 4 ядер, мне ничего не мешает создать 8 виртуальных машин по 1 или 2 ядра каждая — и как в этом случае оценивать LA в рамках одной VM?

JCDenton Mar 24 2014 at 11:25

В рамках виртуальной машины Вы увидите LA этой конкретной машины. Оценивать, я думаю, стоит также, как и для физической.

esvaf Mar 24 2014 at 11:51

Хорошо, но если взять более абстрактную ситуацию — 1 одноядерный процессор, на котором крутятся 2 виртуальные машины, на которых в разное время может нагрузка доходить до предельной. При этом в гипервизоре ограничений не стоит. Что я должен увидить в LA простаивающей машины, если в этот момент вторая забивает ЦП на 100%?

youROCK Mar 24 2014 at 19:24

Что вы должны увидеть — вопрос хороший, но по факту увидите 0.00 :)

ElleSolomina Mar 24 2014 at 12:15

Скорее всего стоит считать как 4 ядра, не оглядываясь на реальную разницу в производительности.

gnomeby Mar 24 2014 at 12:24

Всё верно, просто теперь при той же нагрузке LA будет на 10-30% большей.

ElleSolomina Mar 24 2014 at 12:25

Благодарю, теперь окончательно для себя разобрался.

klirichek Mar 24 2014 at 08:36

Просто подсчёт элементов в /proc/cpuinfo даст количество «логических» ядер. Которых в случае гипертрединга отображается вдвое больше, чем реальных. (Также необязательно пересчитывать элементы; достаточно глянуть на siblings).
А для физических ядер лучше смотреть на число cpu cores.
Как-то так:

$ cat /proc/cpuinfo | grep cores
cpu cores: 4
cpu cores: 4
cpu cores: 4
cpu cores: 4
cpu cores: 4
cpu cores: 4
cpu cores: 4
cpu cores: 4

(как раз тот случай — 4 физических ядра, 8 «логических»).

JCDenton Mar 24 2014 at 09:01

Да, так корректнее. Поменял пример в основной статье.

dukelion Mar 24 2014 at 09:51

А для LA как раз и имеют значение «логические» ядра. LA — это характеристика очереди исполнения, а гипертрединг как раз и увеличивает кол-во одновременных потоков исполнения.

fshp Mar 24 2014 at 10:26

HT не увеличивает количество потоков. Только скорость переключения контекста.

dukelion Mar 24 2014 at 10:54

Это внутри процессора, а для ядра ОС потоков больше работает, если они и блокируются внутри процессора, для ядра это незаметно.

charon Mar 24 2014 at 10:20

когда я запускал клиент распределённых вычислений, то нагрузка была в районе 1 х количество ядер. При этом никаких тормозов, всё работало штатно.

achekalin Mar 24 2014 at 10:29

> ШОЗАНАХ

Мне подумалось, что это слово нужно поставить первым в заголовке сообщений от системы диагностики:
«ШОЗАНАХ: Менее 9% места на диске»
«ШОЗАНАХ: LA постоянно держится выше 2.5»
«ШОЗАНАХ: Увеличение числа попыток логина по ssh»

Апофеозом было бы завести shozanah.ru, но как-то долго писать :)

masterbo Mar 24 2014 at 11:12

С .ru не стоит уже «заморачиваться». А с остальным согласен.

merlin-vrn Mar 24 2014 at 10:34

А если некоторые процессы имеют nice? Я вот часто запускаю процессы вроде компиляции с высоким nice (обычно 15, максимальное значение — 19). Оно отжирает весь проц, даёт LA «выше крыши», но система абсолютно не тормозит, так как если появляется задача с меньшим nice (например, 0 — по умолчанию), все эти процессы уступают ей дорогу.

flashvoid Mar 24 2014 at 10:39

Добавлю прекрасное видео Брендана про Load avarage
youtu.be/ajtoLLGbwiI

Вообще судить о нагрузке системы по LA дело неблагодарное — где можно применить критерий 70% я вообще непредставляю. Обычно профиль нагрузки очень рваный и LA(5) каждый час показывает несколько пиков в 10 раз выше чем LA(15). Просто задания прилетают пачкой (серия HTTP запросов, пачка крон задач выровненных на одну минуту и т.п.), просто так написан софт который надо крутить на сервере — ничего тут не поделаешь.

LA может быть хорошим оповещением — если вырастает в 10 раз выше обычного — надо срочно спасать сервер пока контроль не потерял. Как правильно замечали про NFS (особенно с --hard) бывает и 1200 LA при отлично работающем сервере.

Так же неплохим критерием опасности является CPU idle — если среднее значение за день меньше 30% надо по этому поводу что-то предпринять.

Очень часто LA является указателем на нехватку памяти — мониторить свободную память в линуксе дело еще менее благодарное чем гадать на LA, но все вместе составляет симптом. Первейшее дело это запустить 'vmstat 1' и смотреть колонки r,b,si и so. Если в b какие неадекватные цифры, а в r единички и в то же время в si/so счетчик идет на тысячи и десятки тысяч — надо прям щаз убивать какой-то жирный процесс, а то можно потерять контроль.

JCDenton Mar 24 2014 at 11:33

Профиль нагрузки сильно зависит от ее вида. На моих задачах LA может иметь приблизительно одинаковые значения на протяжении нескольких суток. Вы правильно заметили — резкое изменение показателя LA — это симптом. А проблемы может, на самом деле, и не быть. Нужно просто обращать внимание на колебания LA и исследовать причины его «нестандартного поведения».

flashvoid Mar 24 2014 at 11:40

Ну остается только завидовать — графики вашего мониторинга можно в музей выставлять наверное.
Хотя… если только майнить бикойны или брутфорсить хеши ))

JCDenton Mar 24 2014 at 15:59

Задача очень похожая по своей сути на майнинг биткойнов.

tyomitch Mar 24 2014 at 12:52

Если среднее значение загрузки постоянно превышает 0.70, следует выяснить причину такого поведения системы во избежании проблем в будущем

С другой стороны, если среднее значение загрузки редко превышает 0.70, то это значит, что треть всего времени процессор вхолостую отапливает дата-центр.

merlin-vrn Mar 24 2014 at 13:22

Не особо он отапливает. Он спит. Если dynticks в ядре, то и часы остановлены.

Но это значит, что можно было купить подешевле и он всё равно справился бы.

amarao Mar 24 2014 at 15:06

Ахинея. LA показывает сколько процессов могло бы выполняться, но не выполняется из-за того, что блокированы. Если это LA по процессору, да, числа больше 1 — проблема.

Но любой дурак может изготовить себе LA over 9000 и не испытывать при этом никакого дискомфорта. Достаточно включить в биосе флопповод и начать с него читать в 9000 потоков. LA будет зашкаливать, системе будет пофигу.

VSOP_juDGe Mar 24 2014 at 15:45

Ну т.е. если не заниматься такими извращениями, то статья правильная?

amarao Mar 24 2014 at 16:07

Нет. На практике высокий LA может быть вызван тупящими сетевыми файловыми системами, локальными дисками, ушедшим в дедлок разделом и т.д.

LA не является показателем «хорошести» системы. LA показывает сколько процессов могло бы выполняться с точки зрения скедулера, но не выполняется. И только.

Для меня обычно la 00 обычно означает куда большие проблемы, чем высокий la. В принципе, если говорить про практические наблюдения, изменения LA (в любую сторону) в 2 раза (для более-менее значительного LA) или на 0.5 (если LA маленький) — повод для диагностики.

pansa Mar 26 2014 at 07:25

> LA показывает сколько процессов могло бы выполняться с точки зрения скедулера, но не выполняется. И только.

Простите, но такими определениями вы еще больше путаницы вносите. Если у меня встали колом (на i/o) 1000 процессов и LA скакнул до 1005, это ну совершенно не значит, что на системе могло бы выполняться 1005 процессов. Вообще, что означает «выполняться» в данном случае?

Не путайте, люди сами запутаются =) Есть относительно понятная формула вычисления LA, не стоит напускать тумана.

amarao Mar 26 2014 at 09:57

LA в линуксе показывает: сколько процессов задерживается скедулером процессора (то есть «готовы выполняться, но не выполняются») и сколько блокированы в IO (то есть готовы выполняться как только диск освободится).

Если LA с 1000 скакнул до 1005, то что произошло сказать нельзя. Это может быть ещё +5 процессов в IO, или, внезапно, 1000 процессов в IO и «CPU LA» в 5 (что ужас и страшно).

Таким образом, с сисадминской позиции, на устоявшейся системе важным является не LA, а его внезапное изменение.

merlin-vrn Mar 25 2014 at 04:43

дак и проц просто нагрузить можно — for i in `seq 1 100`; do screen -d dd if=/dev/zero of=/dev/null; done

SovGVD Mar 24 2014 at 15:49

Помню LA около 600 =) По SSH даже зацепиться удалось, но толку мало, почти ниодна комманда не отзывалась, чудовищное ожидавние ввода/вывода, при попытке прибивать процессы они становисись зомбоками. Спасибо удаленному доступу к «кнопкам питания».

lesovsky Mar 24 2014 at 17:26

Откуда такая привычка «cat somefile |grep something»? ведь можно сразу «grep something somefile».

Self_Perfection Mar 24 2014 at 18:08

Думаю оттого, что народ практически не знает хоткеи readline, и поэтому им проще, столкнувшись со слишком большим выводом cat file, набрать
↑ | grep Чем набирать более рациональную команду. Подсказки:
grep Alt+.
↑ Home Alt-D grep

dezconnect Mar 25 2014 at 03:24

что то мне подсказывает что в разных оболочках кардинально разные хоткеи… если вообще есть.

Self_Perfection Mar 25 2014 at 08:48

Не слушайте «что-то», оно вам неправильно подсказывает.

Во всех нормальных консольных юниксовых утилитах пользовательский ввод реализуется библиотекой readline.

Поэтому хоткеи одинаковые и присутствует история команд и в баше, и в питончике, запущенном в интерактивном режиме, и консольном клиенте mysql.

А в ненормальных утилитых, вроде ораклового sqlplus, нормальный ридлайновый ввод можно получить, запуская их через rlwrap.

pavelsh Mar 24 2014 at 20:29

А это что-то плохое? Нравится так народу. Нагляднее :)

dezconnect Mar 25 2014 at 03:25

Один пример из мноооогих учебников =)

amarao Mar 26 2014 at 09:58

Потому что грепы часто стекируются, а cat заменяется на что попало. «Особый» grep в начале отвлекает от pipе'а.

seventh Apr 17 2014 at 08:01

А на моём Highscreen Spark (Android, 2 ядра) при включении опции для разработчиков — отображение загрузки ЦП, показывает
13.69 13.49 13.06
И так постоянно. Как это интерпретировать?

myardyas Mar 12 2015 at 07:07

Автору и переводчику — спасибо за простое и понятное объяснение.

whoim Feb 4 2016 at 09:22

Я как то словил на полчаса loadavg в 70 единиц.
Что это было, так и не понял…
Перевел часть виртуалок на другую ноду — больше такого не было.

mobilesfinks Feb 4 2016 at 11:11

LA может быть высоким, но реально система будет ненагруженной. Будут просто висеть процессы со статусом D например.
Зачастую завершение этих процессов невозможно т.к. это uninterruptible sleep (usually IO). Помогает перезагрузка.