Comments 3
Супер! Спасибо!
Некоторые преимущества Data Vault подхода довольно спорны:
Быстрота и удобство разработки ETL-процессов. - с одной стороны ETL по доставке данных из источника в EDW слой действительно проще, но не стоит забывать о построении слоя представления, куда и переносится вся сложность. В итоге получаем тот же ETL но с созданием промежуточного EDW слоя.
Отсутствие избыточности данных - избыточность данных все равно присутствует в слое презентации.
Отказоустойчивость - недоступность сателлита может быть не критичной для ad hoc запроса к таблицам DV напрямую, но все равно приведет к сбою построения Data Mart таблиц.
Спасибо за ваш комментарий!
Быстрота и удобство разработки ETL-процессов: Основное преимущество в простоте получения данных. Новый сателлит можно добавить без изменения или пересчета существующих сателлитов и хабов. Разработка слоя представления требуется в любом случае, но его возможная сложность несравнима с трудностями, которые возникали ранее.
Отсутствие избыточности данных: Избыточность может присутствовать в слое представления, но Data Vault минимизирует её в ядре хранилища (EDW). Это снижает дублирование данных, особенно при больших объемах, а избыточность в слое презентации обычно связана с бизнес-потребностями, а не методологией.
Отказоустойчивость: Недоступность сателлита может затруднить построение Data Marts, но архитектура Data Vault спроектирована так, чтобы минимизировать критичность отказов. Например, данные из хабов и линков могут использоваться напрямую даже при временной недоступности сателлитов.
Ваши замечания подчёркивают важность грамотного проектирования Data Vault и акцента на бизнес-процессы при разработке слоя представления. Благодарим за конструктивную критику!
Секреты построения Data Vault 2.0: эффективное хранение данных