Введение в операционные системы

Привет, Хабр! Хочу представить вашему вниманию серию статей-переводов одной интересной на мой взгляд литературы — OSTEP. В этом материале рассматривается достаточно глубоко работа unix-подобных операционных систем, а именно — работа с процессами, различными планировщиками, памятью и прочиими подобными компонентами, которые составляют современную ОС. Оригинал всех материалов вы можете посмотреть вот тут. Прошу учесть, что перевод выполнен непрофессионально (достаточно вольно), но надеюсь общий смысл я сохранил.

Лабораторные работы по данному предмету можно найти вот тут:

Другие части:

А еще можете заглядывать ко мне на канал в телеграм =)

Алярм! к этой лекции есть лаба! смотри гитхаб

Process API

Рассмотрим пример создания процесса в UNIX системе. Он происходит через два системных вызова fork() и exec().

Вызов fork()

Рассмотрим программу, которая выполняет вызов fork(). Результат ее выполнения будет следующим.

В первую очередь мы входим в функцию main() и выполняем вывод строки на экран. Строка содержит идентификатор процесса который в оригинале называется PID или process identifier. Этот идентификатор применяется в UNIX для того чтобы обращаться к процессу. Следующей командой будет выполнен вызов fork(). В этот момент создается практически точная копия процесса. Для ОС это выглядит так, что в системе запущены как будто бы 2 копии одной и той же программы, которые в свою очередь выйдут из выполнения функции fork(). Вновь созданные процесс-потомок (по отношению к создавшему его процессу-родителю) уже не будет выполняться, начиная с функции main(). Следует помнить, что процесс-потомок не является точной копией процесса-родителя, в частности у него есть собственное адресное пространство, собственные регистры, свой указатель на исполняемые инструкции и тому подобное. Таким образом, значение, возвращаемое вызывателю функции fork() будет разным. В частности, процесс-родитель получит в качестве возврата значение PID процесса ребенка, а ребенок получит значение равное 0. По этим кодам возврата в дальнейшем уже можно разделять процессы и заставлять каждый из них выполнять свою работу. При этом выполнение данной программы не определено строго. После разделения на 2 процесса ОС начинает следить за ними, так же, и планировать их работу. В случае выполнения на одноядерном процессоре, работу продолжит один из процессов, в данном случае — родительский, а затем управление получит процесс-потомок. При повторном запуске ситуация может сложиться иначе.

Вызов wait()

Рассмотрим следующую программу. В этой программе за счет наличия вызова wait() процесс-родитель всегда будет дожидаться завершения работы процесса-потомка. В этом случае мы получим строго определенный вывод текста на экран

Вызов exec()

Рассмотрим вызов exec(). Этот системный вызов полезен, когда мы хотим запустить совершенно другую программу. Здесь мы будем вызывать execvp() для запуска программы wc, которая является программой подсчета слов. Что же происходит при вызове exec()? Этому вызову передаются в качестве аргументов имя исполняемого файла и некоторые параметры. После чего происходит загрузка кода и статических данных из этого исполняемого файла и перезатирание собственного сегмента с кодом. Остальные участки памяти, такие как стек и куча переинициализируются. После чего ОС просто исполняет программу, передавая ей набор аргументов. Таким образом, мы не создавали новый процесс, мы просто трансформировали текущую запущенную программу в другую запущенную программу. После выполнения вызова exec() в потомке наступает впечатление, что изначальная программа как будто бы в принципе не запускалась.

Такое усложнение запуска абсолютно нормально для shell оболочки Unix, и позволяет этой оболочке исполнять код после вызова fork(), но до вызова exec(). Примером такого кода может быть подстройка окружения оболочки под нужды запускаемой программы, перед ее непосредственным запуском.

Shell — всего лишь пользовательская программа. Она показывает вам строку приглашения и ждет, пока вы в него что-нибудь напишете. В большинстве случаев если написать туда имя программы, shell найдет его месторасположение, вызовет метод fork(), а затем чтобы создать новый процесс вызовет какой-либо из типов exec() и дождется его выполнения с помощью вызова wait(). Когда процесс-потомок завершится shell вернется из вызова wait() и выведет снова строку приглашения и будет ждать ввода следующей команды.

Разделение fork() & exec() позволяет shell делать следующие вещи, например:
wc file > new_file.

В этом примере вывод программы wc перенаправлен в файл. Способ, которым shell достигает этого достаточно прост — при создании процесса-ребенка перед вызовом exec(), shell закрывает стандартный поток вывода и открывает файл new_file, таким образом, весь вывод из далее запущенной программы wc будет перенаправлен в файл вместо экрана.

Unix pipe реализованы похожим образом, с разницей, что они используют вызов pipe(). В этом случае поток вывода процесса будет подключен к очереди pipe, расположенной в ядре к которой же будет присоединен поток ввода другого процесса.

Operating Systems: Three Easy Pieces. Part 3: Process API (перевод)