В инфраструктурах среднего и крупного масштаба Data Domain давно используется как стандартное целевое хранилище для резервного копирования. Поэтому при развитии «Бересты» для нас было важно реализовать корректную и полноценную поддержку работы с этой платформой через DDBoost.

Разберёмся, как это устроено.

Что такое Data Domain и почему он используется для бэкапа

Dell EMC Data Domain — это специализированная платформа для резервного копирования и архивного хранения данных. По сути, это целевое хранилище для бэкапа: на него сохраняются данные из файловых систем, виртуальных сред и баз данных.

Ключевая особенность Data Domain — дедупликация на уровне блоков. Система хранит не полные копии данных, а только уникальные фрагменты. Повторяющиеся блоки не записываются повторно.

Это даёт два очевидных эффекта:

·      существенно сокращается объём хранения;

·      снижается нагрузка на сеть при регулярных инкрементальных копированиях.

Дополнительно используется компрессия и оптимизация структуры хранения под задачи резервного копирования и восстановления данных.

Почему NFS — не самый эффективный вариант

Data Domain может использоваться как обычная файловая система по NFS. Но при таком подходе вся логика дедупликации остаётся на стороне хранилища.

Это означает:

·      по сети передаются полные объёмы данных;

·      дедупликация выполняется уже после приёма;

·      растёт нагрузка на сеть и увеличивается окно резервного копирования.

Для крупных инфраструктур такой подход быстро становится узким местом.

Что даёт DDBoost

DDBoost — это библиотека, которая позволяет системе резервного копирования работать с Data Domain на уровне протокола, а не как с файловой системой.

Главное отличие от NFS — часть логики дедупликации переносится на сторону источника.

В результате:

·      на Data Domain отправляются в основном только уникальные блоки;

·      передаются метаданные, необходимые для формирования резервной копии;

·      снижается сетевой трафик;

·      увеличивается скорость резервного копирования.

Именно поэтому связка Data Domain + DDBoost де-факто стала стандартом для интеграции систем резервного копирования корпоративного класса с этим типом СХД.

Интеграция DDBoost в «Бересте»

Поддержка DDBoost в «Бересте» реализована не как внешний модуль, а как встроенный механизм работы силовых серверов.

Без дополнительных агентов

Для работы не требуется установка отдельных клиентов или сервисов. Взаимодействие с DDBoost выполняется непосредственно процессами «Бересты».

Дедупликация выполняется на стороне источников, что соответствует архитектуре протокола.

Без точек монтирования

«Береста» взаимодействует с Data Domain как со специализированным устройством, а не как с файловой системой.

Это означает:

·      отсутствуют точки монтирования;

·      нет прямого доступа к виртуальной файловой системе Data Domain;

·      не используются дополнительные сервисные скрипты.

Такой подход снижает риск повреждения данных, в том числе в случае компрометации операционной системы силового сервера.

Централизованная настройка через WebUI

Добавление устройства DDBoost реализовано через визард создания нового устройства в WebUI «Бересты».

Параметры доступа задаются один раз и далее используются всеми процессами на всех силовых серверах.

В интерфейсе отображаются:

·      состояние подключения;

·      параметры доступности;

·      актуальная статистика работы;

·      счётчики операций в реальном времени.

Таким образом, вся конфигурация и управление выполняются из единого центра.

Инвентаризация и восстановление метаданных

Отдельный важный сценарий — утрата метаданных резервных копий.

Если по каким-либо причинам каталог бэкапа был повреждён или утрачен, «Береста» поддерживает автоматическую инвентаризацию устройства Data Domain.

С помощью опции «Инвентаризация» выполняется:

·      анализ содержимого хранилища;

·      повторное обнаружение резервных копий;

·      восстановление метаданных в системе.

Это позволяет вернуть управляемость и возможность восстановления без ручной реконструкции структуры хранения.

 

Итог

Интеграция с Data Domain через DDBoost — это не просто поддержка очередного протокола.

Архитектурно это означает:

·      дедупликацию на стороне источника;

·      снижение сетевой нагрузки;

·      ускорение инкрементального резервного копирования;

·      отсутствие прямого файлового доступа к целевому хранилищу;

·      централизованное управление;

·      возможность инвентаризации и восстановления метаданных.

Для инфраструктур, где Data Domain уже используется как стандартное целевое хранилище, такая интеграция позволяет сохранить привычную архитектуру и получить управляемую работу из единого интерфейса «Бересты».