olemskoi May 5 2017 at 12:00

Ускоряем восстановление бэкапов в PostgreSQL

4 min

60K

Слёрм corporate blogSystem administration*Server optimization*Server Administration*Database Administration*

Translation

+24

Comments 23

wom May 5 2017 at 12:08

72 часа за год — это много :)
у меня основное время при разворачивании базы занимает создание индексов.
реально помогает задирание maintenance_work_mem и отключание автовакуума

Shaz May 5 2017 at 12:18

А если накинуть еще 4 ядра в виртуалку и заливать дамп в 16 потоков?

wizard_s May 5 2017 at 12:53

А почему не используете directory format и многопоточный дамп как его плюшку? Ну и если уж жать-разжимать gzip-ом, так использовать многопоточный pigz

azubarev May 5 2017 at 12:55

А почему решили не использовать pg_basebackup?
В случае его использования время развертывания будет примерно равно времени копирования файлов.
Из минусов — так можно делать только целиком для кластера и версии PG должны быть одинаковые.

mrobespierre May 5 2017 at 13:56

админ и «админ баз данных» уже давно две разные профессии)
но ничего, ребята скоро разберутся

Aytuar May 6 2017 at 15:35

Это ресторить кластер можно, а не одну БД.

Roman_Zhuravskiy May 5 2017 at 12:56

не знаю как в postgres(наверно можно сделать), но в mysql самое быстрое это останавливать mysql и подменять файлы базы. Если стоит ssd или raid, то за пару минут в вас будет копироваться база.

wizard_s May 5 2017 at 12:59

А вообще для dev-среды эффективнее всего просто останавливать базу и полностью заменять файлы. Получится моментально. Если, конечно, применимо. Постгрес в контейнер, дамп выкачали по http, распаковали pigz-ом, подсунули новый volume контейнеру и все. Никаких томительных часов ожидания, пока на медленном диске виртуалки индексы прожуются

Tiendil May 5 2017 at 14:10

pg_dump -Fc db

Имеет смысл явно указывать уровень сжатия. Например pg_dump -Fc -Z 1 db
По умолчанию для -Fc он стоит в 6, что нагружает проц и увеличивает время бекапа

sabio May 5 2017 at 15:23

А ещё есть zstd, который в 4 раза быстрее zlib при той же степени сжатия.

bolk May 5 2017 at 15:26

pg_basebackup не пробовали?

darthunix May 5 2017 at 16:02

Как вариант, можно настроить в привилигерованном lxc контейнере реплику и использовать ее в качестве образа для легковесных overlayfs контейнеров. То есть мастер транслирует wal логи на lxc реплику. Когда мы хотим себе полигон, просто делаем lxc-copy с типом overlayfs (легковесный снимок основного lxc контейнера, который пишет только разность относительно замороженного слоя), переводим postgresql overlayfs копии в боевой режим и экспериментируем на здоровье. Должно происходить мгновенно. Была статья на хабре, где парень что-то похожее на эту схему делал, только на btrfs

symbix May 5 2017 at 18:30

просто направить запакованный файл напрямую в psql с помощью zcat

Не везде есть. Но практически везде есть gzip -cd.

robert_ayrapetyan May 5 2017 at 20:22

Краткое содержание статьи — прочитали мануал и нашли опции -Fc и -j. Нелохо.
Но вот что реально помогло сэкономить время на бекап\восстановление в нашем проекте:
как правило, в размерах таблиц в базе соблюдается принцип 20/80. Оказалось что для dev 80 не нужны (обычно это стата). Так вот гораздо более полезной было открытие опции (опять же, из манулов) --exclude-table с выкидывание ненужных таблиц из бекапа и последующим их созданием с минимально необхоимым для дев контентом.

Aytuar May 6 2017 at 15:39

Лучше использовать exclude-table-data тогда сами таблицы оставит, а данные не сдампит.

nikweter May 5 2017 at 20:33

Как раз тоже занимаюсь анализированием pg_dump — pg_restore. Столкнулся со странным поведением второй команды Почему-то при восстановлении в логи ругаутся ошибками[archiver (db)] could not execute query: ERROR: relation «table_1» does not exist.
При восстановлении одной таблицы ругается на отсутствие другой, на отсутствие директорий, отсутствие индексов.
В итоге восстановление просто не завершается. И в текстовом формате дампил, и в бинарном. Ничего не понимаю…

Aytuar May 6 2017 at 15:41

Скорее всего не все схемы в дампе или ресторишь не все.

SXN May 6 2017 at 13:34

спасибо автору за полезную статью (переводу), когда планируется 2 часть.

olemskoi May 6 2017 at 13:34

Вторая часть планируется 10.05.2017.

olemskoi May 10 2017 at 08:49

https://habrahabr.ru/company/centosadmin/blog/328058/

Gasaraki May 7 2017 at 12:31

Варианты увеличение скорости:
1) Взять SSD, на нем же быстрее будет идти разработка.
2) Бэкапить снапшотом и вытаскиванием файлов баз. Потом просто подключать файлы в базу.
3) Зеркалить репликой с мастер базы на слейв. Затем просто оторвать слейв и сделать его девом. К мастеру подключить новый слейв, к моменту когда будет нужен новый дев — база уже докатится.

Хотя конечно без структуры вашей фермы разработки и продакшена сложно сказать как лучше оптимизировать.

RomanAK May 9 2017 at 12:20

Мы делаем zfs снапшотами, всё моментально, причём на продакшн, причём база 300 гигов а не 30. А уж для dev очевидно что dump-restore это совершенно не нужно, просто держать копию базы где-то и подпихивать её не знаю, симлинком каким-нибудь.

Hubbitus May 19 2017 at 23:44

В особенности если это используется для тестирования, рекомендую просто подготовить Docker образ, и откатываться к любой закоммиченной точке в течении единичных секунд.