unfilled 8 окт 2020 в 21:10

MS SQL Server: BACKUP на стероидах

9 мин

17K

Microsoft SQL Server*Администрирование баз данных*Резервное копирование*

+13

Комментарии 38

mixsture 8 окт 2020 в 22:08

Боюсь, что когда в «лучших» значениях оказались столь разные параметры:
BLOCKSIZE = 16384, BUFFERCOUNT = 224, MAXTRANSFERSIZE = 4194304
BLOCKSIZE = 16384, BUFFERCOUNT = 448, MAXTRANSFERSIZE = 2097152
BLOCKSIZE = 4096, BUFFERCOUNT = 56, MAXTRANSFERSIZE = 4194304

и разница между ними менее 1%, то уверенно можно сказать, что связь между параметрами и скоростью бекапа в этих пределах значений случайна, никакой закономерности нет. Но отход от встроенных параметров, очевидно, хорошо повлиял на результат.

Предложу вам построить графики зависимости времени бекапа от каждого параметра. Будет понагляднее и, думаю, можно будет предположить, в каких интервалах было хорошее влияние на скорость.

Плюс есть у меня еще ощущение, что для точности теста надо рестартить sql, чтобы гарантировать, что в кэше ничего не осталось. Иначе довольно сложно предсказать, когда он может что-то из кэша взять, а когда нет.

unfilled 8 окт 2020 в 22:17

отход от встроенных параметров, очевидно, хорошо повлиял на результат

Хорошо сформулировано, спасибо. Завтра добавлю его в текст, с указанием авторства, если вы не против. Просто это именно то, что я хотел проверить и показать. Если делать по-хорошему, нужна серия тестов и какое-то усреднение. Но мне уже дальше не очень интересно, т.к. хватает (точнее хватало, потому что сейчас бэкапы не в моей ответственности) того результата, который даёт размазывание по разным устройствам.

Что касается кэша, насколько я понимаю, влиять может только кэш ос/диска, но тогда все они были в равных условиях, т.к. предварительно я несколько раз прогонял «стандартный» бэкап, чтобы убедиться, что скорость всегда примерно одинакова.

mixsture 8 окт 2020 в 22:40

Можно и без авторства. А есть у вас полная таблица с данными замеров BLOCKSIZE, BUFFERCOUNT, MAXTRANSFERSIZE?

unfilled 8 окт 2020 в 22:50

Да, конечно, там в тексте ссылка https://docs.google.com/spreadsheets/d/19af2YOxP5VfnWpZcF1Imt4InFV4C1c5-0Qq7tvER1YQ/edit?usp=sharing

mixsture 9 окт 2020 в 00:40

Сам закрашенный столбец — это среднее значение. Низ вертикальной черточки — минимальное, верх — максимальное.

Похоже только buffer_count оказывает существенное влияние и похож на функцию с минимумом в районе 56.

mixsture 9 окт 2020 в 00:57

Тепловые карты (2 измерения, чем темнее квадрат — тем лучше, т.е. меньше время выполнения)

в целом в центре оптимальное ядро.

к верхнему правому углу оптимальные значения

справа и по высоте по центру оптимальные

mssqlhelp 9 окт 2020 в 11:10

Никогда не меняйте парамеры BUFFERCOUNT, BLOCKSIZE, MAXTRANSFERSIZE на проде. Они сделаны только для написания подобных статей. На практике огребёте проблемы с памятью по поной.

unfilled 9 окт 2020 в 11:21

Александр, спасибо за ваш комментарий!
А можете чуть подробнее объяснить почему? Бэкап на несколько устройств же допустим? А при нём BUFFERCOUNT, как минимум, увеличивается. Если использовать +- те же значения, чтобы иметь один файл с бэкапом?

mssqlhelp 9 окт 2020 в 11:38

Чего тут объяснять то, очевидно же, у чего буфера отнимаются. Об этих параметрах пишут уже 20 лет и потом описывают последствия. ИМХО, не стоит без большой нужды их использовать.

Zoldan89 11 окт 2020 в 11:16

Ну у нас 30 баз на одном сервере и сокращение времени копирования позволит добавить например обновление статистики (в отчётный период нужная вещь). Переносить некуда, нового не покупают, остаются такие эксперименты).

edo1h 12 окт 2020 в 19:27

Так сегодня память на сервере БД исчисляется сотнями гигабайт, расход каких-то мегабайт на буферы навряд ли сделает больно

mssqlhelp 12 окт 2020 в 19:45

Ну, ну…

edo1h 13 окт 2020 в 20:10

так объясните, пожалуйста

Zoldan89 10 окт 2020 в 12:30

А как допилить скрипт в несколько файлов для нескольких баз?

unfilled 10 окт 2020 в 12:31

Не очень понял вопрос. Зависит от того, как он у вас сейчас формируется.

Zoldan89 10 окт 2020 в 12:54

допустим у меня есть 5 баз каждую из которых надо бекапить в 4 файла, как перечислить эти базы чтоб не писать скрипт 5 раз. Этот дописать
RESTORE DATABASE [bt]
FROM
DISK = 'D:\SQLServer\backup\bt1.bak',
DISK = 'D:\SQLServer\backup\bt2.bak',
DISK = 'D:\SQLServer\backup\bt3.bak',
DISK = 'D:\SQLServer\backup\bt4.bak'
WITH REPLACE, RECOVERY;

unfilled 10 окт 2020 в 13:11

Всё ещё ничего не понимаю. Если вы каждую базу бэкапили в свой отдельный файл — как вы эту задачу решали? Что изменилось от того, что добавились файлы с бэкапами?

Zoldan89 10 окт 2020 в 13:12

Скрипт перепутал
BACKUP DATABASE [bt]
TO
DISK = 'D:\SQLServer\backup\bt1.bak',
DISK = 'D:\SQLServer\backup\bt2.bak',
DISK = 'D:\SQLServer\backup\bt3.bak',
DISK = 'D:\SQLServer\backup\bt4.bak'
WITH COMPRESSION;

Zoldan89 10 окт 2020 в 13:13

такой вариант не работает
BACKUP DATABASE [bt], [bt2], [bt3]
TO
DISK = 'D:\SQLServer\backup\bt1.bak',
DISK = 'D:\SQLServer\backup\bt2.bak',
DISK = 'D:\SQLServer\backup\bt3.bak',
DISK = 'D:\SQLServer\backup\bt4.bak'
WITH COMPRESSION;

unfilled 10 окт 2020 в 13:30

Для каждой базы нужен свой скрипт.

Zoldan89 10 окт 2020 в 14:42

Получилось с помощью курсора одним скриптом сделать, только довольно длинный получился.

jobgemws 29 окт 2020 в 13:45

Большое спасибо за интересную статью.
Но обычно резервную копию делают на постоянной основе через теневые копии-обычно либо через PowerShell, либо через стороннее ПО, минимально нагружая тем самым промовскую (продовскую) среду. Естественно, если все среды виртуальные.

unfilled 29 окт 2020 в 14:59

спец. ПО для резервного копирования SQL Server, например, от RedGate и Spotlight, как раз использует часть из описанного

jobgemws 29 окт 2020 в 15:10

Конечно, но в большинстве случаев лучше брать готовые и проверенные временем и разными проектами решения, чем делать свое.
Хотя порой тоже спорно.
В любом случае не будет лишним знать что внутри и как это делают готовые решения.
Однако, важно правильно применять и оценивать готовые решения и самописные.

edo1h 29 окт 2020 в 15:18

ИМХО никто лучше sql server'а не знает что и как нужно бэкапить.
конечно, shadow copy хорошо интегрированы, и sql server знает, что его сейчас будут бэкапить, но родное резервное копирование всё равно мне кажется предпочтительнее.

минимально нагружая тем самым промовскую (продовскую) среду. Естественно, если все среды виртуальные.

вы просто выносите нагрузку с виртуальной машины, но она остаётся на том же физическом сервере, так что в чём профит?

jobgemws 29 окт 2020 в 15:22

А Вы проверяли на практике что и как нагружает БД?
Через backup как раз БД периодически сильно нагружается, а вот через теневую копию практически незаметно по счетчикам производительности

edo1h 29 окт 2020 в 15:26

можно детали? на какие счётчики вы ориентируетесь, какие значения получаете

jobgemws 29 окт 2020 в 15:36

Прямо сейчас на вскидку не готов ответить, но счетчики стандартные по блокировкам именно и времени ожидания процессов.
На одной стороне разные скрипты с использованием backup, а с другой скрипт на PowerShell с использованием теневой копии.
Второй дольше создает резервную копию базы из теневой копии системы, что естественно. Однако, при этом практически незаметно для СУБД.

jobgemws 29 окт 2020 в 15:46

В документации вообще говорится, что в будущем конструкции BACKUP и RESTORE не будут поддерживаться.
Хотя профайлер поддерживается уже как 5+ лет после аналогичной публикации о том, что он не будет поддерживаться.
И скрипты по теневым копиям значительно сложнее писать, чем просто использовать BACKUP.

edo1h 29 окт 2020 в 15:49

интересно, не знал. а как же тогда бэкапить сервер на линуксе?

jobgemws 29 окт 2020 в 15:55

Честно-не знаю.
Профайлер заменяется расширенными событиями (и то-это упрощенный мониторинг, т е он полностью профайлер не заменит, о чем говорится в документации).
Резервные копии и восстановления можно делать и без ключевых слов BACKUP и RESTORE-об этом в частности обсуждалось здесь и более детально описано в документации.
Но сам честно прям 100% без BACKUP и RESTORE еще не делал.

jobgemws 29 окт 2020 в 16:12

Я Вас обманул-прошу прощения, делали что-то подобное как с помощью вима, так и потом с помощью PowerShell-скриптов без вима:
Резервное копирование и восстановление баз данных виртуализованного Microsoft SQL Server.

unfilled 29 окт 2020 в 15:54

По вашей ссылке говорится, что deprecated backup [log] with [media]password и backup [log] to tape — нельзя будет пароль повесить и на ленту бэкап сделать. Про сам backup/restore речь не идёт

jobgemws 29 окт 2020 в 15:59

Благодарю за поправку.
Делали что-то подобное как с помощью вима, так и потом с помощью PowerShell-скриптов без вима:
Резервное копирование и восстановление баз данных виртуализованного Microsoft SQL Server.
При этом не использовались ключевые слова BACKUP и RESTORE.

unfilled 29 окт 2020 в 16:50

По ссылке, несколько я понял, всё равно под капотом используется backup log, как минимум. Не очень понимаю зачем делать бэкап без использования ключевого слова бэкап.

Предполагаю, что со снапшота ФС можно снять копии файлов данных и ЖТ, и оно потом заведётся.

jobgemws 29 окт 2020 в 17:16

Да, лог через BACKUP LOG, остальное-без использования ключевого слова BACKUP.
Делается это для минимизации нагрузки на СУБД.

unfilled 29 окт 2020 в 17:25

Было бы очень интересно увидеть как измерялась нагрузка от бэкапа и её влияние на производительность/отзывчивость системы в целом.

jobgemws 29 окт 2020 в 17:29

При возможности опишу, но это будет отдельная публикация и не в ближайшее время. Вы можете это проверить у себя-будет быстрее

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

MS SQL Server: BACKUP на стероидах

Комментарии 38

Публикации

Истории