В инфраструктурах среднего и крупного масштаба Data Domain давно используется как стандартное целевое хранилище для резервного копирования. Поэтому при развитии «Бересты» для нас было важно реализовать корректную и полноценную поддержку работы с этой платформой через DDBoost.
Разберёмся, как это устроено.
Что такое Data Domain и почему он используется для бэкапа
Dell EMC Data Domain — это специализированная платформа для резервного копирования и архивного хранения данных. По сути, это целевое хранилище для бэкапа: на него сохраняются данные из файловых систем, виртуальных сред и баз данных.
Ключевая особенность Data Domain — дедупликация на уровне блоков. Система хранит не полные копии данных, а только уникальные фрагменты. Повторяющиеся блоки не записываются повторно.
Это даёт два очевидных эффекта:
· существенно сокращается объём хранения;
· снижается нагрузка на сеть при регулярных инкрементальных копированиях.
Дополнительно используется компрессия и оптимизация структуры хранения под задачи резервного копирования и восстановления данных.
Почему NFS — не самый эффективный вариант
Data Domain может использоваться как обычная файловая система по NFS. Но при таком подходе вся логика дедупликации остаётся на стороне хранилища.
Это означает:
· по сети передаются полные объёмы данных;
· дедупликация выполняется уже после приёма;
· растёт нагрузка на сеть и увеличивается окно резервного копирования.
Для крупных инфраструктур такой подход быстро становится узким местом.
Что даёт DDBoost
DDBoost — это библиотека, которая позволяет системе резервного копирования работать с Data Domain на уровне протокола, а не как с файловой системой.
Главное отличие от NFS — часть логики дедупликации переносится на сторону источника.
В результате:
· на Data Domain отправляются в основном только уникальные блоки;
· передаются метаданные, необходимые для формирования резервной копии;
· снижается сетевой трафик;
· увеличивается скорость резервного копирования.
Именно поэтому связка Data Domain + DDBoost де-факто стала стандартом для интеграции систем резервного копирования корпоративного класса с этим типом СХД.
Интеграция DDBoost в «Бересте»
Поддержка DDBoost в «Бересте» реализована не как внешний модуль, а как встроенный механизм работы силовых серверов.
Без дополнительных агентов
Для работы не требуется установка отдельных клиентов или сервисов. Взаимодействие с DDBoost выполняется непосредственно процессами «Бересты».
Дедупликация выполняется на стороне источников, что соответствует архитектуре протокола.
Без точек монтирования
«Береста» взаимодействует с Data Domain как со специализированным устройством, а не как с файловой системой.
Это означает:
· отсутствуют точки монтирования;
· нет прямого доступа к виртуальной файловой системе Data Domain;
· не используются дополнительные сервисные скрипты.
Такой подход снижает риск повреждения данных, в том числе в случае компрометации операционной системы силового сервера.
Централизованная настройка через WebUI
Добавление устройства DDBoost реализовано через визард создания нового устройства в WebUI «Бересты».
Параметры доступа задаются один раз и далее используются всеми процессами на всех силовых серверах.
В интерфейсе отображаются:
· состояние подключения;
· параметры доступности;
· актуальная статистика работы;
· счётчики операций в реальном времени.
Таким образом, вся конфигурация и управление выполняются из единого центра.
Инвентаризация и восстановление метаданных
Отдельный важный сценарий — утрата метаданных резервных копий.
Если по каким-либо причинам каталог бэкапа был повреждён или утрачен, «Береста» поддерживает автоматическую инвентаризацию устройства Data Domain.
С помощью опции «Инвентаризация» выполняется:
· анализ содержимого хранилища;
· повторное обнаружение резервных копий;
· восстановление метаданных в системе.
Это позволяет вернуть управляемость и возможность восстановления без ручной реконструкции структуры хранения.
Итог
Интеграция с Data Domain через DDBoost — это не просто поддержка очередного протокола.
Архитектурно это означает:
· дедупликацию на стороне источника;
· снижение сетевой нагрузки;
· ускорение инкрементального резервного копирования;
· отсутствие прямого файлового доступа к целевому хранилищу;
· централизованное управление;
· возможность инвентаризации и восстановления метаданных.
Для инфраструктур, где Data Domain уже используется как стандартное целевое хранилище, такая интеграция позволяет сохранить привычную архитектуру и получить управляемую работу из единого интерфейса «Бересты».
