В инфраструктурах среднего и крупного масштаба Data Domain давно используется как стандартное целевое хранилище для резервного копирования. Поэтому при развитии «Бересты» для нас было важно реализовать корректную и полноценную поддержку работы с этой платформой через DDBoost.
Разберёмся, как это устроено.
Что такое Data Domain и почему он используется для бэкапа
Dell EMC Data Domain — это специализированная платформа для резервного копирования и архивного хранения данных. По сути, это целевое хранилище для бэкапа: на него сохраняются данные из файловых систем, виртуальных сред и баз данных.
Ключевая особенность Data Domain — дедупликация на уровне блоков. Система хранит не полные копии данных, а только уникальные фрагменты. Повторяющиеся блоки не записываются повторно.
Это даёт два очевидных эффекта:
· существенно сокращается объём хранения;
· снижается нагрузка на сеть при регулярных инкрементальных копированиях.
Дополнительно используется компрессия и оптимизация структуры хранения под задачи резервного копирования и восстановления данных.
Почему NFS — не самый эффективный вариант
Data Domain может использоваться как обычная файловая система по NFS. Но при таком подходе вся логика дедупликации остаётся на стороне хранилища.
Это означает:
· по сети передаются полные объёмы данных;
· дедупликация выполняется уже после приёма;
· растёт нагрузка на сеть и увеличивается окно резервного копирования.
Для крупных инфраструктур такой подход быстро становится узким местом.