kt97679 Feb 14 2023 at 03:58

Блокировки в bash скриптах

3 min

12K

*nix *

+13

Comments 24

vaniacer Feb 14 2023 at 05:54

Сохранять пид в файле, и проверять активен ли этот пид, нет?

vaniacer Feb 14 2023 at 06:01

code

#!/bin/bash
pidf=file.pid
pid=$(cat $pidf)
[[ -e /proc/${pid:-0} ]] && { echo fail; exit 1; }

echo  $$ > $pidf
sleep $1

DmitryKoterov Feb 14 2023 at 10:11

Думаю, вы сами найдете в этом скрипте все race conditions, где оно заглючит. Блокировка - чертовски хрупкая штука в целом, когда нет нужного готового и оттестированного примитива в среде.

vaniacer Feb 17 2023 at 08:06

Можно и без файла обойтись:

code

#!/bin/bash
ps -ef | grep -v $$ | grep $0 && exit 1

sleep $1
echo FIN

kt97679 Feb 17 2023 at 15:28

Если вы параллельно запустили редактирование vim /path/to/script ваш подход не сработает. Если случилось так, что у вашего скрипта пид 1111, а уже работает процесс с пидом 11111, то тоже не сработает.

xforce Feb 14 2023 at 06:47

Технически, PID не уникален и может быть выдан другому процесс в промежутках между проверками, а вы потом будете вечно ждать его завершения, если это что-то долгоживущее окажется.

vadimr Feb 14 2023 at 07:42

Самый простой способ – создать в /tmp файл с любым именем и дать команду rename -o mytemp.file my-script.lock my-script.lock для переименования его в my-script.lock. Нулевой код возврата из переименования – работаем, ненулевой – отваливаемся.

VXP Feb 20 2023 at 10:43

А если mytemp.file не создастся?

vadimr Feb 20 2023 at 11:34

Плохо дело, если не создаются файлы в /tmp

kt97679 Feb 20 2023 at 19:17

Что делать, если скрипт завершился аварийно и не удалил my-script.lock?

vadimr Feb 20 2023 at 19:22

Надо скрипт вызывать из другого скрипта, который удаляет my-script.lock. А так вообще этот вопрос неразрешим на сто процентов, только с большой вероятностью. Может и задача на семафоре подвиснуть, и пид повторно выделиться.

kt97679 Feb 20 2023 at 19:41

Но ведь при удаление my-script.lock происходит race condition?

vadimr Feb 20 2023 at 19:47

Race condition не происходит, просто по жизни не определено, какой в точности момент считать окончанием работы скрипта. Когда скрипт уже вышел на терминальную ветку и начал завершаться, уже можно запускать вторую копию или ещё нельзя?

kt97679 Feb 20 2023 at 20:01

А как вы поступаете в своих скриптах, использующих такой подход?

vadimr Feb 20 2023 at 20:11

Надо по смыслу операции смотреть. Обычно периодически запускаемые скрипты, которые нужно обсемафоривать, ничего не теряют от того, что какой-то один раз не запустятся.

Например, если это суточный бэкап в полночь, и так получилось, что он сам по себе продолжается сутки, то нам не очень важно, завершился он в 00:00:01 или в 23:59:59 – в любом случае, пропустив следующий запуск в 00:00:00, мы фактически ничего не теряем.

magf Apr 27 2025 at 02:52

если скрипт завершится аварийно, то есть такая функция trap, в которой это можно обработать.

у меня была более интересная ситуация, когда я этот файл оставлял и при запуске по его наличию как раз и определял, было ли аварийное завершение?

в целом, мягкая блокировка файла через flock - это лучший способ, который был мной найден.

kt97679 Apr 27 2025 at 11:08

trap не поможет, если отключилось питание и файл остался на диске. Если доступен flock безусловно надо использовать его, именно это я и написал в самом начале статьи.

plutarh Feb 14 2023 at 08:12

Не претендую на сколь-нибудь полное понимание вопроса, но приведу свою версию запрета выполнения нескольких экземпляров скрипта:

DmitryKoterov Feb 14 2023 at 10:17

Здесь race condition конечно же: этот скрипт стартует одновременно дважды, оба процесса входят в ветку else, и вот вам две копии запущенные. Причем кажется, что оно должно редко происходить, но если вдруг на 10-ядерной машине окажется ненадолго load average 50 (баг где-нибудь или что-то еще), то вероятность многократно возрастает.

Не надо недооценивать и велосипедить с блокировками, это очень опасно. В блокировках есть точно работающее решение, не вероятностное, а строгое, которое работает при любой нагрузке. Его и надо использовать.

AndreyVys Feb 15 2023 at 18:54

Это какой-то вид садизма, вместо кода выкладывать скриншот из notepad++?

DmitryKoterov Feb 14 2023 at 10:23

В баше лучше однозначно flock, но его нет в MacOS! (Как это вообще возможно в 2022 году, что flock нет в MacOS и нет в Node, для меня полная загадка.)

Вариант автора с pid-ами… ну спорно: несмотря на все тесты, есть ли четкое доказательство, что оно прям всегда работает? а с условием ротации пидов? а если Load Average искусственно загнать под сотню?

Зато железобетонный flock есть в… Perl. И perl есть во всех OS, причем один и тот же, и запускается быстро. Поэтому если надо уж прям совсем кросс-платформенное скриптовое решение, то я использую perl + exec в нем (процесс умирает - лок сам освобождается, и за счет exec от perl-а не остается и следа в pstree).

kt97679 Feb 17 2023 at 15:38

Ротация пидов действительно может вызвать проблемы. Возможно для учета не только пида, но и имени процесса, можно использовать ps -eo pid,command, но я не знаю насколько портабельно это решение.

magf Apr 27 2025 at 03:00

в этом подходе есть одна очень важная и распространённая ошибка - определять содержание по форме.

Вы же не исключаете такой вариант развития событий, что скрипт может быть переименован и/или перенесён в другое место?

поэтому я в свих изысканиях сразу отказался от использования имени скрипта/пути запуска, как от идентификатора.

не нужно выходить из плоскости кода на другой уровень, который коду не подконтролен - это фундаментальная ошибка.

если я Вас правильно понял)

kt97679 Apr 27 2025 at 11:13

Тогда над принять во внимание и сценарий, когда скрпит использует flock, но он был отредактирован и имя лок файла поменялось. Думаю в оценке рисков имеет смысл не доводить до абсурда.