Pull to refresh

Comments 3

Некоторые преимущества Data Vault подхода довольно спорны:

Быстрота и удобство разработки ETL-процессов.  - с одной стороны ETL по доставке данных из источника в EDW слой действительно проще, но не стоит забывать о построении слоя представления, куда и переносится вся сложность. В итоге получаем тот же ETL но с созданием промежуточного EDW слоя.

Отсутствие избыточности данных - избыточность данных все равно присутствует в слое презентации.

Отказоустойчивость - недоступность сателлита может быть не критичной для ad hoc запроса к таблицам DV напрямую, но все равно приведет к сбою построения Data Mart таблиц.

Спасибо за ваш комментарий!

Быстрота и удобство разработки ETL-процессов: Основное преимущество в простоте получения данных. Новый сателлит можно добавить без изменения или пересчета существующих сателлитов и хабов. Разработка слоя представления требуется в любом случае, но его возможная сложность несравнима с трудностями, которые возникали ранее.

Отсутствие избыточности данных: Избыточность может присутствовать в слое представления, но Data Vault минимизирует её в ядре хранилища (EDW). Это снижает дублирование данных, особенно при больших объемах, а избыточность в слое презентации обычно связана с бизнес-потребностями, а не методологией.

Отказоустойчивость: Недоступность сателлита может затруднить построение Data Marts, но архитектура Data Vault спроектирована так, чтобы минимизировать критичность отказов. Например, данные из хабов и линков могут использоваться напрямую даже при временной недоступности сателлитов.

Ваши замечания подчёркивают важность грамотного проектирования Data Vault и акцента на бизнес-процессы при разработке слоя представления. Благодарим за конструктивную критику!

Sign up to leave a comment.

Information

Website
www.cinimex.ru
Registered
Founded
1997
Employees
201–500 employees
Location
Россия