Data Mart vs Data Warehouse

    Некоторое время назад я начал разбираться в OLAP и в данном посте хочу проверить правильность собственных мыслей на счет этих двух понятий.

    Терминология
    Data Mart — витрина данных, в переводе.
    Data Warehouse — хранилище данных.
    Но дело в том, что оба эти термина могут переводится как Хранилище данных…
    Data Mart — срез Data Warehouse.

    image
    (кликабельно)
    Есть два подхода к построению хранилищ данных:
    Первый проще, по Кимбелу (Kimball)
    image
    Тут информация от OLTP системы напрямую попадает в data mart, откуда уже OLAP берет необходимые ему данные. Первый случай очевидно иллюстрирует подход М. Демареста (M.Demarest), который, как говорит Wikipedia:
    в 1994 году предложил объединить две концепции и использовать хранилище данных в качестве единого интегрированного источника данных для витрин данных.

    Второй, по Инману (Inman), см. книгу.
    image
    Здесь информация от OLTP сначала попадает в хранилище данных (data warehouse), потом только в data mart, откуда OLAP снова берет необходимую ему информацию.

    Мы же адаптируем подход Инмана, который называет хранилищем данных настоящую релиционную бд, тогда как Кимбел — смесь data mart`ов.
    Data mart — это база данных, созданная по требованиям моделирования измерений (dimensional modelling) и состоит из таблиц фактов и таблиц измерений.

    Data Mart
    При реализации системы по методологии Кимбела, фронтендом бд должен выступать data mart, который использует Analysis Services для куба в качестве источника данных
    Data Warehouse
    image
    (кликабельно)
    таким образом является сложнее data mart`a, включает в себя не только бд, но и систему поддержки принятия решений и клиент-серверную архитектуру, тогда как data mart по сути является бд, созданной с учетом требований будущих кубов.
    Источники:
    http://ru.wikipedia.org/wiki/Витрина_данных
    http://ru.wikipedia.org/wiki/Хранилище_Данных
    Книга Expert Cube Development with Microsoft SQL Server 2008 Analysis Services, на английском

    image
    которую я перевожу у себя в блоге.
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 2

      0
      Data Mart — Витрина Данных, во всех встреченных мной проектах являлась составной частью хранилища данных (Data Warehouse). При этом хранилище данных гораздо более емкое, сложное понятие, формируется ETL джобами из разных (и разнородных) источников, но внутри себя после трансформации содержит уже унифицированную информацию. Как можно более полную, желательно. И по возможности приведенную к каким-либо промышленным стандартам вроде Basel II. После формирования хранилища (это может быть полная или, чаще, инкрементальная загрузка) уже и формируются витрины данных — кастомизированные, заточенные под реальные нужды клиентов, часто независимые друг от друга — отдельные блоки аналитической информации. Скажем, в банковском бизнесе — данные в хранилище общие по банку (клиенты, счета, транзакции и т.п.), а витрины разные — скажем, несколько витрин касаемо кредитного бизнеса, несколько — касаемо депозитного. то есть по разделам деятельности банка. И как правильно нарисовано на схеме Инмана, в дальнейшем по витринам строятся OLAP-отчеты, преобразующие многомерные кубы в понятные человеку отчеты, скажем, в своем веб-браузере. Я в ближайшее время опубликую в своем блоге первый свой хабратопик — статью о SAS Banking Intelligence Solution. Тогда приглашу оценить!

    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

    Самое читаемое