Firemoon16 сен 2018 в 18:51

Изучаем процессы в Linux

7 мин

204K

C * Linux * Системное программирование *

+55

Комментарии 60

roginvs 16 сен 2018 в 19:48

Можно поподробнее про то, что именно получает дочерний процесс (fork и/или exec): открытые файлы, активные соединения, ждущие входящих запросов соединения, итд.

Firemoon 16 сен 2018 в 19:56

Проще перечислить то, чего дочерний процесс НЕ получает.
Википедия в этом плане чуть более развёрнуто объясняет:

Между процессом-потомком и процессом-родителем существуют различия:

— PID процесса-потомка отличен от PID процесса-родителя;
значению PPID процесса-потомка присваивается значение PID процесса-родителя;
— Процесс-потомок получает собственную таблицу файловых дескрипторов, являющуюся копией таблицы процесса-родителя на момент вызова fork(). Это означает, что открытые файлы наследуются, но если процесс-потомок, например, закроет какой-либо файл, то это не повлияет на таблицу дескрипторов процесса-родителя.
— для процесса-потомка очищаются все ожидающие доставки сигналы;
— временная статистика выполнения процесса-потомка в таблицах ОС обнуляется;
— блокировки памяти и записи, установленные в процессе-родителе, не наследуются.

Всё остальное наследуется. Если открыт сокет, то после fork'а он будет открыт и у родителя, и у ребёнка. Так как сокет остаётся один, то и очередь у них будет общая.

khim 16 сен 2018 в 20:43

Это не совсем так. Есть ещё такие вещи, как «информация о файловой системе» (что для нас корень, текущая директория и тому подобное), соединение с дебаггером (если кто-то наш процесс ptrace'ит, то он, по умолчанию, не будет ptrace'ить наших детей), semadj-лист и ещё какие-то вещи. Они по умлочанию не шарятся. Есть гораздо больше вещей (много разных namespaces, cgroup и прочее), которые по умолчанию шарятся, но можно этого не делать.

В man clone это всё описано. Собственно в Linux fork(2) — это обёртка над clone(2) (правда внутри ядра, не внутри системной библиотеки).

red75prim 17 сен 2018 в 04:59

Потоки (threads) тоже не наследуются.

khim 17 сен 2018 в 09:59

В Linux (в ядре) понятие «threads» отсутствует. С точки зрения ядра все потоки — это полноценные, отдельные, процессы (просто с общим адресным пространством).

Потому даже сложно представить как могли бы наследоваться потоки и что это могло бы значить…

sashz 17 сен 2018 в 02:52

enivron?

Firemoon 17 сен 2018 в 07:10

Исправил

tru_pablo 17 сен 2018 в 09:35

не все

1KoT1 17 сен 2018 в 03:21

А где бы почитать, почему fork() устроен именно так или иначе?
Мне непонятно, зачем ребёнку наследовать открытые сокеты, файлы и т. д.

fishHook 17 сен 2018 в 05:20

Например, чтобы писать что-то в общий лог, или читать что-то из общего файла (который мы можем передать в stdin, т.о. программа заранее не знает, какой файл надо открыть в дочернем процессе). Допустим, у нас программа веб-сервер. Сервер слушает 80-й порт и как только он получает новый запрос на создание соединения, он запускает дочерний процесс, разумеется, мы хотим, чтобы stdout и stderr остались такими же, какие были и главного процесса.

Firemoon 17 сен 2018 в 07:11

Помимо того, что написал fishHook, могу добавить, что возможно просто так исторически сложилось.

iig 17 сен 2018 в 11:56

Раз потомок получает копию адресного пространства родителя, значит, заодно получает и все открытые файлы (это же тоже структура в памяти). Делать иначе — очевидно, дороже (ядро, вместо Copy-On-Write должно будет сделать полную копию памяти и освободить некоторые ресурсы, пользовательская программа — должна проверять валидность некоторых указателей..)

khim 17 сен 2018 в 13:10

Раз потомок получает копию адресного пространства родителя, значит, заодно получает и все открытые файлы (это же тоже структура в памяти).

Это структура в другой памяти. И её нужно копировать, да.

Делать иначе — очевидно, дороже (ядро, вместо Copy-On-Write должно будет сделать полную копию памяти и освободить некоторые ресурсы, пользовательская программа — должна проверять валидность некоторых указателей..)

Какой ужас. У вас вообще представление есть о том, как файловые дескрипторы работают? Даю подсказку — это ни разу не указатель. Это число. Маленькое. От 0 до 1023 в далёком прошлом, сейчас верхний предел динамический, но принцип тот же. Дальше — рассказывать или сами догадаетесь?

Копировать файловые дескрипторы сложнее и дороже, но удобнее. Hint: Unix, в ранних версиях, сокетов не имел — но зато имел pipes. Дальше рассказывать или сами догадаетесь?

iig 17 сен 2018 в 19:01

Я программист ненастоящий, man в репозитории нашел :) Если есть маленькое число, идентифицирующее файловый дескриптор, должна существовать структура, указывающая на имя файла и его атрибуты.

khim 17 сен 2018 в 19:42

Если есть маленькое число, идентифицирующее файловый дескриптор, должна существовать структура, указывающая на имя файла и его атрибуты.

Угу. Вот только самое важное вы пропустили — если число маленькое, то это, скорее всего, индекс в массиве. И массив копируется, когда вы делаете fork. И количество ссылок пересчитывается.

В общем совершается довольно много работы, которую можно было бы и не делать, если бы у «копии» процесса все файлы бы закрывались. Но так — этим было бы сложнее пользоваться…

maquefel 17 сен 2018 в 05:47

nfw 17 сен 2018 в 07:51

http://turnoff.us/geek/dont-sigkill/
Вы мне глаза решили сломать?

lega 17 сен 2018 в 07:01

Не указана важная «фича», exec не запускает новый процесс, он запускает приложение в текущем процессе, в итоге для того что-бы запустить новый процесс сначала нужно сделать fork и после — exec.

Отсюда есть проблема — т.к. fork делает дублирование текущего процесса, происходит проверка есть ли свободная памяти под этот форк (в 100% размера от текщего процесса), в итоге процесс который использует много памяти (>60%) не сможет запустить другое приложение (тот же /bin/cat) по причине не хватки памяти под форк.

Firemoon 17 сен 2018 в 07:12

Хм. У меня появилось желание опытным путём проверить истинность этого высказывания. Как только доберусь до ПК, проверю и отпишусь.

fishHook 17 сен 2018 в 07:24

А разве copy-on-write не решает эту проблему на корню?

Firemoon 17 сен 2018 в 07:43

Вот мне кажется, что решает.

lega 17 сен 2018 в 08:53

Решает, но linux все равно возвращает ошибку «не достаточно памяти», т.к. идет проверка есть ли память для всего объема, т.е. проблема в проверке, как минимум у меня на серевере с linux 3.13 это воспроизводится (в свежем linux ожидаю аналогичного).

fishHook 17 сен 2018 в 08:56

В таком случае вообще непонятно, а нафига в линуксе есть swap? Может быть у вас просто раздел подкачки не подключен или у него размер крошечный?

НЛО прилетело и опубликовало эту надпись здесь

sh1kel 18 сен 2018 в 08:05

зависит от vm_overcommit

Tangeman 17 сен 2018 в 12:12

Это зависит от того, разрешен ли безусловный overcommit (значение 1). Если да, то ядро не будет проверять наличие памяти до того как она реально используется (т.е. в неё реально что-то запишут). По умолчанию значение параметра 0 (использовать эвристику), и в этом случае ядро будет (скорее всего) проверять память с учётом свопа.

Просто из вредности я проверил это на 4.15 (поставив vm.overcommit_memory=1), без проблем всё работает (как и ожидалось). Ядро 4.15 (Ubuntu 18.04), реальной памяти 2G, свопа нет, процесс запрашивает 1G памяти через calloc() и потом делает fork() 16 раз — без проблем.

Если посмотреть на процессы, то видно 17 процессов и каждый имеет резидентных чуть более 1G — но реально этот 1G является shared memory. Если же дети начнут писать в эту память — вот тогда начнутся проблемы.

lega 17 сен 2018 в 13:38

Просто из вредности я проверил это на 4.15 (поставив vm.overcommit_memory=1), без проблем всё работает

Да, это опционально, и vm.overcommit_memory=1 может быть не безопасно, но в дефолтном состоянии будет валится.
Так что не плохо упомянуть «особый» способ запуска новых процессов в статье про процессы.

sh1kel 18 сен 2018 в 14:47

Есть приложения (например редис), которые могут занимать десятки ГБ памяти и любят форкаться (для сохранения данных на диск, в случае редиса в примере), и им необходим безусловный оверкоммит, хотя по факту там за счет cow перерасход памяти будет совсем небольшой, но вот виртуальной памяти это будет занимать х2

lega 18 сен 2018 в 14:59

В таком случае обычно форкается мастер процесс, который использует минимум памяти, а работой уже занимаются дочерние ворекры. При таком подходе этой проблемы нет.

im_stD 17 сен 2018 в 07:25

Здравствуйте. Спасибо за статью.
Обьясните пожалуйста, Вы или кто-то другой, более развернуто, что такое ядро? То есть обозначьте его рамки что-ли. Его везде описывают как некую абстракцию, а хочется чуть больше конкретики, и простым языком.
…
И ещё один вопрос:

void child_sm_kill() { wait(NULL); } 

void SendMessage(char *chat_id, char *send_text, int cod) 
{
    pid_t smpid;  
    signal(SIGCHLD, child_sm_kill);  
    smpid = fork();
    if(smpid == 0) 
     { 
       char json_str[LENJSONSEND] = {0,}; 
       char str[BREADSIZE] = {0,}; 
       
       if(cod == 0) // strat
        {
           ...

Функция SendMessage вызывается время от времени, выполняет свою работу и завершается.

Скажите, правильно ли я убиваю зомби?
signal(SIGCHLD, child_sm_kill); ⇨ void child_sm_kill() { wait(NULL); }

Заранее спасибо.

Firemoon 17 сен 2018 в 09:55

Вряд ли я отвечу Вам как-то более подробно, что такое ядро. В моём понимании, ядро — это просто большая программа и ничего более. А рамки… Про привилегированный и непривилегированный режим знаете?

Функция SendMessage вызывается время от времени, выполняет свою работу и завершается.

Во-первых, использование signal(2) не рекомендуется, даже ман-страница об этом говорит:

The behavior of signal() varies across UNIX versions, and has also varied historically across different versions of Linux. Avoid its use: use sigaction(2) instead.

Во-вторых, мне кажется несколько избыточным устанавливать обработчик сигналов КАЖДЫЙ раз, это достаточно сделать один раз при инициализации.

К самому обработчику вопросов нет, я бы так же сделал.

im_stD 17 сен 2018 в 12:16

Спасибо.

В моём понимании, ядро — это просто большая программа и ничего более.

Собственно про это и хотел спросить. Мне однажды задали вопрос — «что такое ядро»? — и я не смог дать какого-либо ответа, кроме похожего на Ваш. Углубление в режимы (привилегированный и непривилегированный) приводит к ещё большему размыванию понятия. )))
Просто хотел услышать Ваше мнение и мнение других людей в виде тезиса.

Во-первых, использование signal(2) не рекомендуется, даже ман-страница об этом говорит:

Приму к сведению.

Во-вторых, мне кажется несколько избыточным устанавливать обработчик сигналов КАЖДЫЙ раз, это достаточно сделать один раз при инициализации.

Достаточно будет поместить его в майн()?

Firemoon 17 сен 2018 в 12:27

Достаточно будет поместить его в майн()?

Зависит от того, как вы написали программу. Если инициализация программы происходит в main() — то да, самое место. Если где-то ещё — то лучше вставить его туда, где логически ему самое место.

im_stD 17 сен 2018 в 12:47

Спасибо.

im_stD 17 сен 2018 в 13:06

Я немного недопонимаю. Если у меня несколько разных функций вызывающих форки…

void child_sm_kill() { wait(NULL); } 
void child_ui_kill() { wait(NULL); } 

void SendMessage(char *chat_id, char *send_text, int cod) 
{
    pid_t smpid;  
    signal(SIGCHLD, child_sm_kill);  
    smpid = fork();
    if(smpid == 0) 
     { 
       ...

void update_instag(char *chat_id) 
{ 
  pid_t geekfork;
  signal(SIGCHLD, child_ui_kill);
  geekfork = fork();
  if(geekfork == 0) 
   {
      ...

int main() 
{   
   ...

… то как быть? Сделать в main() один вызов сигнала для обоих функций?

khim 17 сен 2018 в 13:15

Не очень понимаю чего вы не понимаете. Вы ж не можете на один сигнал два обработчика поставить!

А процесс может завершаться сколько угодно времени (например если NFS-сервер «выйдет погулять»).

Так что если у вас несколько обработчиков, то это всё равно надёжно работать не будет, а если один — то почему бы его в main и не проинициализировать?

im_stD 17 сен 2018 в 13:40

Как бы Вы сделали? Применительно к выше указанному коду.

mayorovp 17 сен 2018 в 13:55

Применительно к указанному вами коду, у вас обработчики абсолютно одинаковые и их можно заменить одним. Который и проставлять в main.

Если же обработчики будут разные — значит, нужно сохранять значения возвращаемые fork в какой-нибудь структуре данных, а в обработчике сигнала проверять что вам вернула wait и принимать на основе этого нужное решение.

im_stD 17 сен 2018 в 14:08

Спасибо.
Если обработчик будет один, будет ли он правильно работать (подчищать зомби) для обоих функций, или нужно обязательно писать два разных обработчика?

khim 17 сен 2018 в 14:31

Если вы напишите два обработчика — то что вы с ними будете делать? Ещё раз: вы можете вызвать signal(2) (или, лучше, sigaction(2)) хоть 100 раз — но работать-то будет только обрабочик, поставленный последним!

Потому обработчик должен быть один… а дальше уже всё, что писал mayorovp. Да, конечно, «чистый» wait — для «зачистки зомби» достаточен, а если вам нужно что-то большее, то писать два обработчика всё равно бессмысленно, так как использовать-то можно безопасно только один! Нужно как-то в рамках вот этого одного всё разруливать…

im_stD 17 сен 2018 в 14:48

Спасибо.
Мне нужно только убийство зомби. Если я оставлю один вызов сигнала в main(), и один обработчик, то этого будет достаточно для убийства зомби обоих функций?

До этого момента я думал, что понимаю работу signal и wait, оказывается нет.

khim 17 сен 2018 в 17:04

До этого момента я думал, что понимаю работу signal и wait, оказывается нет.

У меня есть ощущение, что вы всей картины не видите.

То, что вы изобразили — это то, что называется code smell — то есть код, который не то, что на 100% неверен, но, скорее, код, который скорее всего неверен — потому что вы не смотрите на всю картину с достаточно большой высоты.

То есть начнём сначала: зачем вы вообще вешаете обработчик на SIGCHLD? Если вам нужно просто запустить ребёнка и дождаться пока он отработает — то никакие сигналы вам не нужны! Просто вызываете waitpid(2) и ждёте, пока процесс завершится.

Если же вы устраиваете возню с сигналами — то это значит, что вы хотите, чтобы программа работала параллельно со своим ребёнком.

А тогда как вы обеспечите, что ребёнок умрёт и будет «подметён» обрабочиком SIGCHLD, который вы установили до вызова fork(2), до того, как другая функция с другим обработчиком вызовется? Даже если ребёнок сообщает родителю о том, что он завершил работу — я вам сейчас 2-3 сценария могу нарисовать, когда от завершения функции main до завершения процесса будет полчаса проходить при корректно написанном коде!

Да, можно навернуть какие-то локи, семафоры и как-то «разрулить» эту ситуацию… но зачем? В 99% программ проще иметь один обработчик SIGCHLD, который будет «обслуживать» все форки. Ибо, как я уже сказал — этот обрабочик это глобальный ресурс (когда-то давно в Линуксе можно было повесить этот обработчик на поток, но потом кто-то огрел Линуса талмудом с распечаткой POSIX-стандарта по башке и это стало невозможно)!

im_stD 17 сен 2018 в 18:11

У меня есть ощущение, что вы всей картины не видите.

Вы правы.

это значит, что вы хотите, чтобы программа работала параллельно со своим ребёнком.

Да, нужно чтоб программа работала независимо от «детей». Функция маин() крутится в цикле и время от времени вызывает функции с форками.

А тогда как вы обеспечите, что ребёнок умрёт и будет «подметён» обрабочиком SIGCHLD, который вы установили до вызова fork(2), до того, как другая функция с другим обработчиком вызовется?

Мыслил исходя из того, что каждый форк делает копию всей программы.

Сделал так:

void ckill_all_childl() { wait(NULL); } 

void SendMessage(char *chat_id, char *send_text, int cod) 
{
    pid_t smpid;  
    smpid = fork();
    if(smpid == 0) 
     { 
       ...

void update_instag(char *chat_id) 
{ 
  pid_t geekfork;
  geekfork = fork();
  if(geekfork == 0) 
   {
      ...

int main() 
{  
  signal(SIGCHLD, kill_all_child);   
   ...

khim 17 сен 2018 в 19:50

Мыслил исходя из того, что каждый форк делает копию всей программы.

Ребёнок — да, копия… но оригинал-то не дублируется!

Сделал так:

Да — так оно разумнее будет. И кода меньше.

lorc 17 сен 2018 в 17:09

Сигналы — вообще страшная штука. Практически, как прерывания. Могут прийти тогда, когда вы их совершенно не ожидаете (и когда не ожидает рантайм), например во время работы malloc() или во время pthread_mutex_lock(). Поэтому и не рекомендуют использовать signal (2), а в особо сложных случаях — рекомендуют обрабатывать сигналы синхронно, через sigwait (3)/sigwaitinfo(2)

khim 17 сен 2018 в 17:30

С сигналами вообще много мороки если вы не всё программу пишете, а используете чужие библиотеки. Так-то удобнее всего через signalfd, но, увы, для него требуются те ещё пляски с бубном.

lorc 17 сен 2018 в 17:00

Мне однажды задали вопрос — «что такое ядро»? — и я не смог дать какого-либо ответа, кроме похожего на Ваш.

Зависит от того что хочет услышать вопрошающий. Еще круче спросить «что такое ОС»?

Особенно, принимая во внимание существование всяких baremetal OS (типа freertos или minios), микроядер и попытки запихнуть веб-сервер прямо в linux kernel.

im_stD 17 сен 2018 в 18:13

Что бы Вы ответили?

lorc 17 сен 2018 в 18:27

Зависит от того кто и когда спрашивает. Незнакомому мужику на остановке я бы сказал одно, жене — другое, интервьюеру на собеседовании — третье.

Вообще наиболее полный ответ, который я могу дать звучит приблизительно так: «ОС — понятие довольно размытое. В большинстве случаев под этим словом подразумевают минимальных набор системных программ, который позволит пользователю запускать их прикладные приложения и таким образом получать какую-то пользу от использования компьютера». Можно еще ввернуть что-то про управление и разделение ресурсов (процессор, память, сеть, диск, батарея и другая периферия) и абстрагирование от железа, но все равно совершенно точное определение дать не получится потому что практически всегда можно будет привести контрпример.

im_stD 17 сен 2018 в 18:55

Спасибо. Возьму на вооружение.

mayorovp 18 сен 2018 в 06:44

и попытки запихнуть веб-сервер прямо в linux kernel.

В другой ОС эта попытка даже оказалась успешной...

Tangeman 17 сен 2018 в 19:44

Честно говоря, в вашем конкретном случае, раз уж неважно как завершится child, вам вообще не нужно обрабатывать сигналы. Просто делаете (в начале main()):

signal(SIGCHLD, SIG_IGN);

и забываете про зомби как страшный сон — их просто не будет. Для этого простейшего случая использование signal() вместо sigaction() вполне адекватно.

wait() нужно только если вам важен код завершения процесса или если нужно дождаться завершения оного.

im_stD 17 сен 2018 в 22:57

Да, действительно этого достаточно, и даже в википедии про это написано.) Спасибо.

im_stD 18 сен 2018 в 00:15

Обращаюсь и к Вам, и к khim. Правильно ли я понимаю работу signal()?
Функция signal() вызванная единожды из main() висит где-то в памяти на протяжении всего времени жизни приложения и ожидает сигналов. То есть функция signal() это что-то вроде какого-то отдельного процесса? Или это что-то похожее на обработчик прерываний в микроконтроллерах?

И с параметрами поясните пожалуйста. Первый параметр — это ожидаемый сигнал, второй параметр — это то, что нужно сделать при поступлении сигнала.
То есть, вот это — signal(SIGCHLD, SIG_IGN) нужно понимать как — signal(при получении сигнала от ребёнка, игнорировать сигнал), что значит игнорировать? Типа пошёл ты к чёрту, плевать я на тебя хотел. ))

mayorovp 18 сен 2018 в 06:49

Это не просто "похоже", сигнал — это и есть аналог прерывания. Только прерывания идут из "железа" в ядро, а сигналы — из ядра в прикладную программу.

im_stD 18 сен 2018 в 07:51

Спасибо, я очень надеялся это услышать. Офигенно круто.

amarao 17 сен 2018 в 08:25

Это всё работает пока мы не начинаем рассматривать поведение процесса в состоянии TASK_UNINTERRUPTIBLE. Для однопоточного приложения всё просто — процесс застыл в IO (или чём-то подобном) и его нельзя убить.

Но!

Как только приложение становится многопоточным и один из его тредов застревает в этом состоянии, то ситуация становится creepy.

Во-первых, все потоки работают нормально (кроме залипшего). Во-вторых, попытка сделать SIG_STOP приводит к тому, что ядро не возвращает управление из обработчика сигнала (и SIG_CONT не работает). В третьих, выход из треда переводит процесс в состояние (которое я не могу толком описать).

Короче, всё хорошо, пока не случается TASK_UNINTERRUPTIBLE (D+ в ps'е).

domix32 17 сен 2018 в 09:44

Отличная статья. Жду подобную же статью для процессов в fuchsia

Tangeman 17 сен 2018 в 11:34

Вся информация о завершении процесса влезает в тип данных int.

На самом деле это не совсем так — можно получить несколько больше информации о завершении процесса, если использовать waitid() и потом изучить данные из siginfo_t. Это тоже далеко не всё (есть ещё taskstats), хотя в большинстве случаев это мало кому нужно.

maydjin 18 сен 2018 в 08:58

Хорошая статья. Но, не раскрыта тема потоков и примитивов синхронизации.

Например — что будет если ждать в дочернем процессе на cv созданной в родительском? Какие потоки наследуются дочерним процессом? Как с этим жить, какие коллбэки для этого предусмотренны в posix?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий