RomanenkoDenys 17 авг 2020 в 18:00

Лучшие практики bash-скриптов: краткое руководство по надежным и производительным скриптам bash

6 мин

35K

Блог компании VKСистемное администрирование**nix*

Перевод

+54

Комментарии 70

wsf 17 авг 2020 в 18:24

Хорошая, годная статья. Но одна из лучших практик написания на bash — минимизировать использование bash.

+19

evgenyk 17 авг 2020 в 18:55

Думаю это крайность, я бы переиначил так: Нужно иметь в голове для скриптов верхнюю границу их сложности, после которой лучше использовать что-нибудь другое.

wsf 17 авг 2020 в 19:29

В том то и проблема, что граница эта очень условная. Ибо, как показывает практика, отстрелить себе ногу или удалить /usr можно легко и непринужденно одной очевидной на первый взгляд строчкой, при этом, чтобы нормально покрыть ее защитной логикой требуется написать кучу вырвиглазой обвязки.

OleksiyT 17 авг 2020 в 20:33

Честно говоря, не представляю сценария, где бы я мог удалить /usr.

Работать только в своём каталоге уже не модно?

Tangeman 18 авг 2020 в 05:17

Модно, но иногда люди делают sudo make install и аналогичные вещи. Был уже один такой баг, не помню в каком, но популярном пакете.

Впрочем, случайно удалить свой домашний каталог тоже то ещё удовольствие.

kisaa 18 авг 2020 в 14:44

Оно?
https://m.habr.com/ru/post/122020/

saboteur_kiev 18 авг 2020 в 03:01

Эти проблемы появляются тогда, когда много пишешь на разных php/js/java/gо и др. А потом приходишь в bash и думаешь, я ж сеньор девелопер, что я тут в баше за 2 минуты не разберусь?

А если копнуть, то в bash и синтаксиса и возможностей и всего остального ненамного меньше, чем в любом другом скриптовом языке, и недооценивать его нельзя. Я вот буквально пару лет назад осмелился считать себя в баше сеньором, и то — всегда нахожу подводные пещеры, где я никогда не бывал.

vvpoloskin 17 авг 2020 в 21:39

Я знаю много опытных NIX админов, кто-то из них знает php, кто-то python, кто-то perl. Но объединяет их одно — все знают bash.

evg_krsk 18 авг 2020 в 14:04

Или думают, что знают :-)

saboteur_kiev 18 авг 2020 в 02:55

Если хорошо знаешь bash, то наоборот — лучше использовать его, чем кучу других решений.

Основная задача баш, в отличие от других языков программирования — работа с ОС и другими программами.

ksergey01 17 авг 2020 в 18:51

А где про «производительные скрипты» написано?

Sergey-S-Kovalev 17 авг 2020 в 18:53

отлаживать = корень «лажать»
производить отладку
/зануда-off

-8

slepnoga 17 авг 2020 в 19:12

Уровень гайда — КО.
Хотя, наверное для девляпса это божественное откровение

-12

Nalivai 17 авг 2020 в 20:40

Что заставляет вас ходить в гайды и рассказывать всем что вы это и так знали?

slepnoga 17 авг 2020 в 22:00

По Вашему мнения, я не могу высказать свое оценочное суждение о представленном материяле?

-10

xsevenbeta 18 авг 2020 в 08:22

Вы конечно можете, но более чем заслужено огребёте минуса т.к ваш комментарий не несёт никакого конструктива и никакой пользы.

Более того, вы походя уничижительно задели социальную группу, и человека написавшего неплохой и не самый кстати очевидный материал с примерами. И кстати, даже самые простые материалы имеют право на жизнь т.к могут вызвать живое обсуждение, в котором ответы (возможно) будут не столь очевидны.

з.ы. Высокомерие и желание утвердится за счёт других — как правило компенсаторный механизм.

Al_Azif 18 авг 2020 в 21:10

1. Потому что уровни у всех — разные. Для кого-то эта информация — полезна.
2. Какой у вас лично уровень, и какие симптомы у вас вызывает этот факт — как-то всё равно. Т.к. вы даже не осознаёте п.1.

mxms 17 авг 2020 в 19:17

Забыли про главную практику написания shell-скриптов, а именно не использовать bash-специфичный синтаксис и пользоваться POSIX shell.

Tangeman 17 авг 2020 в 22:13

Зачем вообще нужен bash если его фичами нельзя пользоваться? Не говоря уже о том что сейчас сложно найти систему где его нет (разве что MCU), да и статья не о shell-scripts а конкретно о bash.

Все эти заявления на тему "непортабельно" изрядно устарели — если им следовать, то можно вообще прекратить разработку чего-то нового, ибо "не рекомендуется", но я подозреваю что реально совместимость с 99% систем нужна едва-ли в 1% случаев.

Что касается POSIX… то он тоже не без нареканий, если всё притянуть за уши к соответствию, весь сделанный прогресс можно откатить лет на 20 назад, ибо работать в чём-то что строго следует стандарту (и писать под это код) — примерно как бегать с будкой на голове и обмотав ноги цепью.

iDm1 17 авг 2020 в 23:29

BusyBox. Он включает некоторое количество «фишек» из Bash, но далеко не все. Так что меру знать в их использовании приходится.

tagirb 18 авг 2020 в 00:21

А где он, кроме ембеда, встречается? В контейнерах? Ну там и баш немудрено поставить.

YourChief 7 сен 2020 в 04:42

Помимо того в busybox сами по себе утилиты урезанные, поэтому даже если шелл-скрипт будет POSIX-совместимый, не факт что он будет нормально работать в таком кастрированном окружении, где все аналоги ГНУшных утилит имеют только 3-5 основных опций.

Nalivai 11 сен 2020 в 15:24

Вы так говорите «кроме ембеда», будто ембед можно просто отбросить

tagirb 11 сен 2020 в 18:51

А в ембеде нужны переносимые скрипты?

edo1h 12 сен 2020 в 21:15

а почему нет?
это банально удобно: писать на одном языке для разных устройств. писать/отлаживать на своей рабочей станции, а запускать потом в других местах. использовать один и тот же код в разных местах, наконец.

mxms 18 авг 2020 в 00:44

Ну, хотя бы, потому, что полно UNIX дистрибутивов, где bash нет в составе базовой системы.
И, если писать по-настоящему портабельный софт, то заставлять тащить туда совершенно ненужный bash это, как минимум, моветон.

tagirb 18 авг 2020 в 01:18

Ну, хотя бы, потому, что полно UNIX дистрибутивов, где bash нет в составе базовой системы.

Насчёт UNIX ещё могу поверить, но кому сейчас нужно что-то, кроме Linux? Не-Linux — это маргинальный случай, для которого нужен отдельный набор инструментов, включая скрипты. Поэтому "полно UNIX дистрибутивов" — это явное преувеличение.

А если вы имели в виду Linux-дистрибутивы — было бы интересно узнать, в каких же из них нет bash. Раз уж их "полно", может, назовёте, хотя бы, 3-4?

mxms 18 авг 2020 в 19:44

Разумеется, не Linux. Все *BSD, например или линейка Solaris и её наследников.
Насчёт Linux не скажу, поскольку мне не слишком интересно ковыряться в этой куче.
Ну и, про Busybox вам уже написали.

tagirb 18 авг 2020 в 22:15

Ок, сам Solaris можно сразу вычеркнуть:

GNU Bourne-Again Shell (bash) (/usr/bin/bash)
Bash is the default shell for users in Oracle Solaris.

Наследники уже тоже все почили.

Про *BSD я совсем забыл. Ок, самый популярный из них — Darwin, т.е. macOS, шёл с bash, в последнем релизе перешли на zsh.

Ок, остаются FreeBSD, OpenBSD, NetBSD (ну и DragonFlyBSD) с дефолтными /bin/sh и /bin/tcsh. Ну да, отличные системы, очень их уважаю и ценю, только вот что за скрипты должны быть переносимы между ними и Linux?

YourChief 7 сен 2020 в 04:45

Даже если на посикс-шелле писать, они всё равно не будут переносимыми, потому что опции бздяшных стандартных утилит могут отличаться от их гнушных (надо сказать превосходящих) аналогов.

saboteur_kiev 18 авг 2020 в 02:57

Напишите статью про posix shell, и где конкретно лучше писать именно так.

В статье не указано ни про портабельный софт ни про линукс шелл. Написано прямо про bash.

mxms 19 авг 2020 в 22:10

Писать на POSIX shell надо конкретно примерно всегда.
Если вдруг у вас возникает потребность, именно потребность, а не соблазн, использовать bash специфичные возможности, то весьма вероятно то вам пора переходить на другой язык программирования с более богатой функциональностью.
Таков мой опыт проектов на shell (это, кстати говоря, тысячи строк кода).

saboteur_kiev 20 авг 2020 в 00:05

Тысячи кода это не презентабельно совершенно.
Презентабельно, если вы расскажете сколько и каких компаний вы сменили, и какие ОС там использовались.

За последние 15 лет, у меня баш или ksh был практически везде, за исключением ембеддед. Сейчас иногда встречается в контейнерах, но тоже нечасто.

Поэтому писать на POSIX shell нужно не конкретно примерно всегда, а тогда когда к этому вынуждает рабочая обстановка.

Переходить на другой язык программирования, когда выгоднее использовать баш — тоже совет так себе.

А вот писать скрипт из тысяч строк кода на баш — на вашем месте я бы задумался про другой язык.

mxms 20 авг 2020 в 00:17

К сожалению, конкретики не будет в связи с NDA. Скажу лишь, что компании не сказать чтобы крупные в мировых масштабах, но в своей сфере и в своём регионе заметные.
Базовая система там одна из мутаций Linux, однако никакой нужды использовать конкретно особенности bash не было вовсе. Широкое использование shell скриптинга связанно с чрезвычайно гетерогенной в силу исторических причин средой, как средство её унификации и сокращения инструментария используемого в backend, а также обеспечения портабельности за переделы экосистемы Linux.

-1

saboteur_kiev 20 авг 2020 в 09:40

К сожалению, конкретики не будет в связи с NDA

Ох-ох.
Совершенно не проблема сказать название области, не называя компанию, чтобы было понятно почему там такой зоопарк разных *nix систем.

Тем не менее вы подтверждаете, что «Писать на POSIX shell надо конкретно примерно всегда» это ваше личное IMHO базирующееся на вашем личном опыте работы, а не всемирная бест практика.

mxms 21 авг 2020 в 20:38

Совершенно не проблема сказать название области, не называя компанию, чтобы было понятно почему там такой зоопарк разных *nix систем.

Связь, если говорить в общем. Компания старая.

saboteur_kiev 13 сен 2020 в 03:36

В одной очень старой компании, которая буквально основала связь, я работал. И там был ksh

tagirb 18 авг 2020 в 11:20

А, ну и насчёт портабельности: на работе везде RHEL-подобные системы и никаких эзотерических новых дистров не ожидается и не приветствуется. Зачем мне там портабельность? Для понтов?

AlexGluck 17 авг 2020 в 19:37

Лимит на длину строки 140 символов, количество непустых строк не более 600. Вот и все правила, если в них баш не укладывается, пишем на питон/ансибл.

Tangeman 18 авг 2020 в 05:24

О да… Расскажите про это автору osync — 6503 строчки на bash, даже если убрать комментарии и пустые (их там мало), то всё равно наберется около 6000.

AlexGluck 18 авг 2020 в 06:32

Ну кто-то захотел сделать велосипед, это полезно для практики (lsync может выполнять всю ту же работу и написан на си). В easyrsa 1700 строк. Но это же не значит, что так надо делать? У нас вот те правила, что я выше описал.

-2

Tangeman 17 авг 2020 в 22:19

rand_dir_name="$(cat /dev/urandom | tr -dc 'a-zA-Z0-9' | fold -w 16 | head -n 1)"

Зачем такой ужас? Есть же mktemp, который делает ровно то что нужно.

ilyakruchinin 18 авг 2020 в 08:58

Полностью солидарен.
mktemp решает все эти вопросы легко и элегантно.

CaptainFlint 18 авг 2020 в 22:01

Более того, рандом имеет ненулевую вероятность наткнуться на существующий каталог, а mktemp гарантирует, что этого не произойдёт.

Kostiantyn 17 авг 2020 в 22:25

А как же правило "не изобретай велосипед"?

Как минимум по двум пунктам:

lock фалы использовать через flock
временные директории создавать через mktemp -d

+10

saboteur_kiev 18 авг 2020 в 02:58

Лучше вместо лок файлов использовать PID файлы

-1

Kostiantyn 18 авг 2020 в 10:11

Вы имели ввиду использовать flock но не на отдельных файлах на PID файлах?
Тогда согласен.

PnDx 18 авг 2020 в 15:33

Но есть нюанс: данный олдскульный хак (как результат, всего один fd у демонизированного процесса, если ему других файлов не надо) при запуске посредством unit-файла в экосистеме одного известного not-a-bug'а приводит к ругани в ~~syslog~~journald.
Судя по всему, происходит так:

Вызываем flock() на будущий pid-файл. Понятно что сначала блокировка, может уже́ инстанс был запущен. Он создаётся.
В systemd прилетает inotify, он бросается читать pid (а его ещё нету).
Ругань про невозможность прочитать pid (а тем временем процесс отфоркался, написал в pid что получилось и на следующем заходе всё хорошо).

tagirb 18 авг 2020 в 16:52

А почему не подходит Type=simple безо всяких PID-файлов?

PnDx 18 авг 2020 в 17:39

Потому что демон?
Понимаю, сейчас это не модно. Но бывают случаи, когда нужно как можно скромнее потреблять ресурсы. Для этого когда-то был придуман двухкратный форк самого себя. С избавлением от всего лишнего, включая tty*.
Модель «simple» предполагает что «каким родился — таким и пригодился», а тут вообще всё меняется (кроме ppid).

Для подобных штук придумали ещё фокус с сигнализацией (STOP самому себе и CONT от поймавшего сигнал супервизора). Но как-то он популярности не получил. Судя по всему, архитектор systemd про это вообще не знал и сделал свой велосипед через dbus.

tagirb 18 авг 2020 в 18:05

Но бывают случаи, когда нужно как можно скромнее потреблять ресурсы. Для этого когда-то был придуман двухкратный форк самого себя. С избавлением от всего лишнего, включая tty*.

Звучит как экономия на спичках, неужели это всё ещё востребовано, особенно, там, где есть systemd?

776166 22 сен 2020 в 12:39

Отсутствие мыслей об экономии обычно заканчивается пофигизмом, несоблюдением элементарных стандартов и докером в продакшене.

-1

tagirb 18 авг 2020 в 01:46

Для обработки таких сценариев важно использовать встроенные функции set, такие как set -o errexit, set -o pipefail или set -o nounset в начале скрипта.

Это must have в любом скрипте, ещё удобно использовать сокращённый вариант: set -euo pipefail.

Стоит интегрировать что-то вроде ShellCheck в ваши конвейеры разработки и тестирования, чтобы проверять ваш код bash на применение лучших практик.

Ещё для самой базовой проверки синтаксиса можно использовать bash -n:

$ echo 'if then else fi' > badscript.sh
$ bash -n badscript.sh 
badscript.sh: line 1: syntax error near unexpected token `then'
badscript.sh: line 1: `if then else fi'
[2]$

Как и в других языках программирования высокого уровня, я всегда использую в моих скриптах bash собственные функции логирования, такие как __msg_info, __msg_error и так далее.

Я обычно делаю проще:

info() { >&2 echo -e  " INFO: $*"; }
die() { >&2 echo -e "ERROR: $*"; exit 1; }

Тогда всякие вспомогательные проверочки можно писать в лаконичном декларативном стиле, чем-то напоминающим Perl:

#/bin/bash

set -euo pipefail
info() { >&2 echo -e  " INFO: $*"; }
die() { >&2 echo -e "ERROR: $*"; exit 1; }

info "Checking the environment variables"
[[ -n ${MY_DIR:-} ]] \
  || die "'MY_DIR' is not defined"

[[ -d $MY_DIR ]] || mkdir -p $MY_DIR \
  || die "Could not create the directory '$MY_DIR'"

PlatinumThinker 18 авг 2020 в 08:56

Большое спасибо за статью, хорошие советы, сам многое делаю именно так.
Есть замечание по

rand_dir_name="$(cat /dev/urandom | tr -dc 'a-zA-Z0-9' | fold -w 16 | head -n 1)"

Тут нет проверки что такой каталог уже не используется из другого скрипта что может закончится плачевно.
Есть mktemp который занимается этим (может создать временный каталог\файл)

iig 18 авг 2020 в 09:28

Ещё я читал, что есть такая переменная $RANDOM.

powerman 19 дек 2020 в 22:15

Есть. Не портабельно, к сожалению. Мнения насчёт нужно ли соблюдать POSIX sh или забить и писать под bash выше разошлись, но лично я стараюсь писать портабельно. Альтернатива, например, такая:

random="$(od -vAn -N2 -td2 </dev/urandom | tr -cd 0-9)" # 0-32767

ALexhha 18 авг 2020 в 13:50

Тут нет проверки что такой каталог уже не используется из другого скрипта что может закончится плачевно.

так mktemp тоже не проверяет, что каталог используется, но с учетом самого имени

$ mktemp
/var/folders/gn/qxngd93x399fjdmtzkqwbvnw0000gn/T/tmp.a0e7TEP5

думаю, что вероятность совпадения стремится к 0

Tangeman 18 авг 2020 в 18:20

mktemp, в теории, должен попробовать другое имя если сгенерированное уже занято, но это зависит от конкретной версии, наверное.

Плюс, гарантируется что если он завершился успешно, то файл (или директорий) был создан с этим именем (именно создан — т.е. его там не было раньше) — а если сначала генерить имя, а потом "вручную" пытаться создать его — это race condition, пусть и с очень низкой вероятностью (хотя как знать, что там в random, может он глючной).

Но основная суть в том что mktemp проще чем приведённая в статье конструкция, выполняющая ту же функцию.

НЛО прилетело и опубликовало эту надпись здесь

speshuric 19 авг 2020 в 12:38

Тоже хотел оставить эту ссылку, а именно цитату:

Shell should only be used for small utilities or simple wrapper scripts.

If you are writing a script that is more than 100 lines long, or that uses non-straightforward control flow logic, you should rewrite it in a more structured language now. Bear in mind that scripts grow. Rewrite your script early to avoid a more time-consuming rewrite at a later date.

ЗЫ: статья в целом хорошая и полезная, но этой цитаты не хватает :)

vaniacer 18 авг 2020 в 14:58

Полезно, учту.

Antonto 18 авг 2020 в 21:41

Вроде как надо использовать lock-директории, а не lock-файлы. Т.к. mkdir вернет ошибку, если директория уже создана. С файлами такого сделать не получится.

amarao 18 авг 2020 в 22:03

Баш — это такой язык, в котором надо использовать обширный набор специальных практик по борьбе с идиотскими дефолтами. Те, кто знает их все, а так же большей частью не забывает применять, называют "гуру".

Defensive programming в чистом виде. #pragma warn, любая опечатка может и будет использована для UB и т.д. Garbage in, garbage out.

Проблема с башом не в отдельных скриптах, а в том, что башизмы — это типовой метод склеивания разных кусков CI'я. Начинается невинно — список команд для выполнения. Потом появляется первый if или ||, потом кто-то добавляет строковые операции или полагается на специальную магию, а потом получившийся тонкий слой баша поверх всех остальных абстракций уже читать невозможно.

Чем меньше баша, тем лучше. И под башом я подразумеваю любой шелл sh-типа.

tagirb 18 авг 2020 в 22:17

Тем не менее, иногда бывает полезно (и приятно) заменить страницу Ansible-плейбука на shell: >- из нескольких строчек...

amarao 18 авг 2020 в 22:24

В том месте, где вы используете баш "снизу" он наименее опасен. Потому что как только кто-то перестаёт понимать написанное или оно вызывает вопросы, то shell превращается в кастомный модуль с тестами (как минимум юнит, как максимум — интерграционными с коллекцией на galaxy).

Самый страшный — это баш сверху и в прослойках. Например, если кто-то решил срезать угол и что-то меняет в инвентори. Или ансибл вызывается с прелюбоптнейшими выражениями баша внутри -e, и т.д.

Для меня code smell проекта — это функция экспоненты от цикломатической сложности баша (включая неявные условия от математики над переменными). 1 — ок, 2 — уже попахивает, 3 — конкретный code smell, 4 — беда-беда, 5 — я такое не читаю и от review такого отказываюсь.

Это не отменяет возможности писать на баше нормально. Мы, например, используем git vendor, который внутри — 230 строк баша, но написанных так хорошо, что напоминают нормальную программу.

Но как смазочный материал — опасно. Часто нужно, но чем меньше, тем лучше.

edo1h 19 авг 2020 в 11:11

BTW, про тестирование в ansible не хотите статью написать?

Kirikekeks 21 авг 2020 в 22:58

Давно читал что-то вроде "Если бы все знали bash, sed и awk — то 90 % программ не понадобилось бы" Преувеличение, конечно. Но если добавить vim, screen и ssh то вроде и правда :-)). Глядя на wallix bastion отчетливо понимаешь "Победа сил добра над силами разума".

romy4 6 сен 2020 в 23:05

Просто пусть полежит здесь.
Некогда для своего же удобства был написан мини пошаговый db для bash. Просто красивый вывод исполняемой строки с глубиной вложения и с возможностью продолжения по нажатию клавиши.

debug_handler()
{
    local dkey="$1"
    echo "[DEBUG[]]"
}

PS4='+ ${BASH_SOURCE##*/}:${LINENO}:${FUNCNAME[0]-main}():[${SHLVL},${BASH_SUBSHELL},e=$?]`[ $DEBUG_BY_LINE ] && read -s -N 1 -r DBGKEY && debug_handler "$DBGKEY"`# '

могло включаться в любом месте файла, который надо отладить просто добавлением DEBUG_BY_LINE=1

source ./debug
# .....
DEBUG_BY_LINE=1
# ... то что нужно отладить
DEBUG_BY_LINE=0

SlavikF 7 сен 2020 в 04:10

Как по мне — то это пример write-only кода. То есть такого кода, который можно написать, но прочитать (и понять) уже практически никто не может, зачастую даже и сам автор.

saboteur_kiev 7 сен 2020 в 05:12

Да не, тут все понятно, но я бы сказал что слишком оверхед для дебага.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий