korotovsky Feb 14 2009 at 11:06

Элементарный Bash скрипт для резервного копирования данных

3 min

56K

Configuring Linux *

+33

Comments 63

cachealot Feb 14 2009 at 11:43

если не ошибаюсь что-то подобное уже где то было
но все равно спасибо за старания =)

korotovsky Feb 14 2009 at 11:55

Я старался показать, что можно выжать из самого минимального набора софта на сервере, и сделать это как можно юзабельнее :)

IntenT Feb 14 2009 at 12:00

Я в свой скрипт резервного копирования (запускается кроном) добавил хранение бекапов только за определенное количество дней (сейчас — 7).
Потому что размер одного бекапа примерно 2G.

korotovsky Feb 14 2009 at 12:02

Когда почти террабайт на сервере стоит, не задумываешься о таком пока что :) но идея хороша :) доработаю потом.

SteelRat Feb 15 2009 at 06:43

А потом может быть поздно :))

Backspace Feb 15 2009 at 10:25

Дык несложно ведь, модифицировать то :)
/usr/bin/find $DATADIR -not -mtime -7d -mindepth 1 -delete >/dev/null 2>&1

Backspace Feb 15 2009 at 10:32

Дык несложно ведь, модифицировать то :)
/usr/bin/find $DATADIR -not -mtime -7d -mindepth 1 -delete >/dev/null 2>&1

Backspace Feb 15 2009 at 10:38

Прошу прощения за дубль.

korotovsky Feb 15 2009 at 11:15

Добавлю к себе в скрипт, спасибо :)

qmax Feb 14 2009 at 12:09

и всё-таки,
unix-way — это выполнение задачи специально приспособленными для неё утилитами, а не «минимумом средств»

IntenT Feb 14 2009 at 13:11

Ага а если утилиты нету — пишем ее сами. :)))

Чем именно в данном случае?

qmax Feb 14 2009 at 13:29

для копирования файлов вообще есть утилита rsync, которая кроме прочего, умеет бэкапить на удалённые хосты, и при этом копирует только изменившиеся фрагменты файлов.

для MyISAM таблиц достаточно сделать им LOCK_TABLES/FLUSH_TABLES и скопировать rsyncом бинарные файлы, в которых он хранятся.

для бэкапа InnoDB таблиц эффективнее использовать бинарный лог, позволяющий делать инкрементальный бэкап.

всё подробно описано в мануале

а с mysqldumpом при восстановлении нужно ещё следить за ссылочной целостностью и автоинкрементными полями.

IntenT Feb 14 2009 at 14:22

А что будет быстрее — бекапить rsync'ом или tar + gzip?

qmax Feb 14 2009 at 14:25

rsync просто копирует + проверяет изменения. он не сжимает.
(сжимает только для передачи по сети)

IntenT Feb 14 2009 at 14:38

Ок, убираем сжатие.
Что быстрее — просто копирование или просто копирование с проверкой изменений (tar vs rsync)?

qmax Feb 14 2009 at 14:43

tar — это не программа копирования.

полная копия rsyncом будет медленне, чем cp или scp
а если файл изменился только частично — то естественно, rsync быстрее.

korotovsky Feb 14 2009 at 15:35

Тогда предлагаю (cp+md5sum vs rsync)

qmax Feb 14 2009 at 15:38

в rsync алгоритм гораздо хитрее, чем md5sum.
он вычисляет изменившиеся _фрагменты_ файла, чтобы сократить трафик.

на cp+md5sum придётся городить некислый скриптовый огород.

korotovsky Feb 14 2009 at 15:42

Но если чкрестить cp+md5sum и во время первого бэкапа создавать лист контрольных сумм, то потом это будет работать быстрее, мне так кажется. Ведь найти контрольную сумму из списка быстрее чем изменившийся фрагмент

qmax Feb 14 2009 at 15:47

пробовали.
предыдущий админ в нашей конторе так и сделал (на перле, для бэкапа файл-сервера гигов на 30)

rsync оказался быстрее настолько, что замерять насколько именно даже в голову не пришло.

korotovsky Feb 14 2009 at 15:49

Будет время, я знакомого попрошу написать на баше такое, он хорошо шарит. Лично посмотрим :)

qmax Feb 14 2009 at 16:06

одно время юзал
скрипт с невыговариваемым названием bontmia

он делает (rsyncом) снапшоты каталога.
на каждый снапшот — бэкапит изменившиеся файлы, а неизменившиеся делает хардлинком на предыдущий снапшот.

возможно, стоит на него посмотреть.

Greignar Feb 15 2009 at 01:01

А для проверки md5sum файла (чтобы узнать, изменен он или нет) разве его прочитать не нужно? Не проще ли обратить внимание на дату файла — если она изменилась, то и файл теоретически должен измениться.

UFO landed and left these words here

cashby Feb 14 2009 at 13:28

Имхо сделано как раз в духе Unix-way: каждая отдельная программа выполняет конкретно ту задачу, которую умеет выполнять лучше всего.

Frosty Feb 14 2009 at 15:43

«Специальной утилитой»? Это тот миллион быдлософтинок для «бекапа, очистки и всего всего всего», что активно плодятся как мухоморы после дождя под виндой и просят всего $49.95 за красивый интерфейс?

qmax Feb 14 2009 at 15:49

нет, это пара сотен юникс-утилит, каждая из которой выполняет одну функцию, и выполняет её идеально уже много лет.

qmax Feb 14 2009 at 15:50

а в интерфейсе для задачи бэкапа я вообще не вижу смысла.

korotovsky Feb 14 2009 at 15:51

Да мы и первого раза понимаем :D

qmax Feb 14 2009 at 15:55

ну вот не все понимают :)

korotovsky Feb 14 2009 at 15:55

оффтоп, как вы удалили камент? :)

qmax Feb 14 2009 at 15:56

хм… какой?

korotovsky Feb 14 2009 at 15:57

а в интерфейсе для задачи бэкапа я вообще не вижу смысла.

вот этот :) у меня было 2 штуки на странице

qmax Feb 14 2009 at 16:07

не. это НЛО.
я писал один раз :)

qmax Feb 14 2009 at 16:08

правда я сначала нечайно нажал кнопочку «предпросмотр»
(сейчас тоже нажал и дописываю ещё одну фразу)

heroOfOurTime Feb 14 2009 at 12:38

Даешь разделение кода! Конфиги отдельно, каждую операцию — в отдельную функцию.

korotovsky Feb 14 2009 at 12:43

Если конфиги отдельно то это уже имхо не самый элементарный скрипт :)

barev Feb 14 2009 at 13:36

Полезная вещь.

shuvalov Feb 14 2009 at 13:46

Вы бы date +%F--%H-%M в отдельную функцию вынесли, раз уж используете ее в каждой строчке почти что

borka66 Feb 14 2009 at 15:33

Да и вообще, если использовать %F для даты, то можно уже и поставить %Т для времени. А конструкция echo с date внутри — избыточна. Надо просто: date '+[+-----] %F-%T Begin'

zaartix Feb 14 2009 at 13:50

надо еще ротацию дописать

Serzhenko Feb 14 2009 at 14:24

tee /home/bond/backup/backup.log

Имхо лучше tee -a, чтобы лог не перезаписывался, а делался append.

korotovsky Feb 14 2009 at 14:28

Ну да, можно и так, это в зависимости от задачи и кому как нужно :)

unicast Feb 14 2009 at 14:25

Откройте для себя bacula.

borka66 Feb 14 2009 at 15:37

Ещё одно замечание. Большие дампы лучше сжимать на лету: mysqldump… | gzip > sql.dmp.gz

korotovsky Feb 14 2009 at 15:40

Мой дамп бесполезен для сжатия :)

qmax Feb 14 2009 at 15:41

ну и вообще говоря, mysqldump генерит sql-текст, что существенно больше, чем бинарники.
если же бэкапить сами файлы таблиц, сжатие менее актуально.
а rsync сможет забэкапить только те куски таблиц, котрые изменились.

korotovsky Feb 14 2009 at 15:45

я думаю вообще не соразмерно сравнвать баш скриптик в 1.5 килобайта, и пакет rsync
Инфо из репозитория

rsync (source: rsync): fast remote file copy program (like rcp). In component main, is standard. Version 3.0.3-2ubuntu1 (intrepid), package size 324 kB, installed size 656 kB

qmax Feb 14 2009 at 15:55

это сравнимо с объёмами баз, котрые бэкапятся? :)

mr_smile Feb 14 2009 at 16:05

автор принципиально не использует процедуры? :)

function print()
{
d=`date +%F--%H-%M`
prefix=$1
msg=$2
echo "$prefix $d $msg"
}

Вам же самому проще будет менять формат вывода в одном месте, чем искать их по всему скрипту

korotovsky Feb 14 2009 at 16:16

Я сейчас ничего править не буду, потом лучше перепишу более основательно

Cancel Feb 14 2009 at 18:26

С mysqldump нужно поаккуратнее, иначе есть шансы получить такой дамп, который хрен восстановишь. Помнится, ресторили мы один INSERT, в котором было много миллионов записей…

Cancel Feb 14 2009 at 18:31

Впрочем, это было давно. Сейчас жить стало лучше, жить стало веселее.

scorpionium Feb 14 2009 at 19:09

еще можно потом отправить весь архив на S3 :)
есть библиотека code.google.com/p/s3-bash/, которая в этом поможет

или просто на резервный бэкап сервер (scp), чтоб мы не потеряли все бэкапы, если накроеся винт

korotovsky Feb 14 2009 at 19:26

Как я понял, бэкапы сольются на сервер Amazon?

scorpionium Feb 14 2009 at 19:27

да, это такой их севис — aws.amazon.com/s3/

korotovsky Feb 14 2009 at 19:32

Классно, не знал. +

Regis Feb 14 2009 at 22:15

Эх, хорошо с этим у линукоидов. А мне бы нормальную бэкапилку под Винду :(

Jekel Feb 14 2009 at 23:31

Под винду такого софта можно найти вагон и маленькую тележку, начиная от самого MS и того что уже включено в windows заканчивая мегамонстром Ahead Nero — в котором тоже есть функционал для бекапа.

Zeboton Feb 15 2009 at 07:18

В тему. Может кому пригодится статья Автоматизация резервного копирования в Linux от IBM developerWorks.

lost_shadow Feb 15 2009 at 14:02

К слову о функциях и переменных:

function assert2 {
        msg=$1
        shift
        test "$@"
        ec=$?
        if [ $ec -gt 0 ]
        then
                echo "ERROR (assertion $* failed): $msg"
                exit 2
        fi
}

function run {
        "$@"
        ec=$?
        if [ $ec -gt 0 ]
        then
                echo "failed with error code $ec:" "$@"
                exit 3
        fi
}

И всё, что можно, оформляется в таком духе:

d=`date +%F--%H-%M`
assert2 "mysqldump_console is empty" ! -z "$mysqldump_console"
run $mysqldump_console --result-file=$backup_to"${d}-database.sql"

$mysqldump_console и $backup_to берётся из настроек конкретного проекта с помощью команды source.

При таком подходе проблемы начинаются тогда, когда нужна более продвинутая обработка ошибок вроде конструкции try-catch-finally и пролетающих сквозь стэк исключений. Тогда я не жалею времени, чтобы переписывать bash-скрипт бэкапа на программу на питоне:

...
if not machine_is_on(machine_info['host']):
	turn_on_machine(machine_info['host'], machine_info['mac'])

assert not os.listdir(settings.target_mountpoint), 'mountpoint is not empty'

mount_command = ("smbmount //%(host)s/%(shared_path)s " + settings.target_mountpoint + " -o %(mount_options)s") % machine_info
if not os.system(mount_command) == 0:
	raise Exception('mount error')
try:
	# do backup
finally:
	if not os.system("smbumount %s" % settings.target_mountpoint) == 0:
		raise Exception('umount error')
...

korotovsky Feb 15 2009 at 14:22

Оо спасибо за подсказку :)

vitamin Feb 16 2009 at 11:56

Я использую backupninja в сочетании с rdiff-backup. Рекомменд.