1/ Microstrategy Enterprise Semantic Graph является неотъемлемой частью платформы Microstrategy. По какой модели вы планируете использовать - это ваш выбор.
2/ Сразу скажу, что у меня лично не было опыта внедрения Data Catalog-ов. Тем не менее, некоторые из компаний, с которыми общаюсь, делали попытки внедрения Data Catalog. Проекты действительно довольно сложные. Мне пока не известны компании кто в этом преуспел. Даже те, кто публично выступали с историями успеха внедрения Data Catalog, на самом деле по факту использовали и продолжают использовать confluence для описания своего дата актива. В связи с этим, до какого-то практического или даже теоретического опыта интеграции Data Catalog c Microstrategy Enterprise Semantic Graph еще не доходило, поэтому мне не приходилось исследовать данный вопрос.
Однако давайте попробуем определиться, что значит интеграция DC и ESG? :)
Например, многие DC предлагают виртуализацию данных.
В какой-то степени Microstrategy ESG это и есть виртуализация данных, т.е. «те же яйца, но вид с боку» предоставляя примерно тоже самое:
виртуальное объединение и подключение к различным источникам данных в виде семантического слоя (слоя виртуализации), к которому может обращаться через Microstrategy/Power BI/Tableau/Qlik/Excel, R, Python, Rest APIs, приложения собственной разработки и тд.
оптимизация запросов к различным источникам данных с возможностью сохранения результатов запросов в кэше или in-memory кубах Microstrategy
поддержка как чтения, так и записи данных в источники
управление безопастностью
высокая производительность и масштабируемость
поддержка real-time
... и тд
Предположу, что под интеграцией DC и ESG вы подразумеваете синхронизацию слоев виртуализации DC и Microstrategy ESG?
Если так, то полагаю такой интеграции нет. Если что-то другое, то уточните, пожалуйста.
Польза от единого семантического слоя не зависит от количества хранилищ данных, скорее от размера BI проекта. Если у вас BI решает какую-то конкретную задачу в одном локальном департементе, а остальным в компании BI не нужен, то эффективнее будет не тратить время на единый метаслой. Если же вы создаете корпоративное BI решение уровня всей компании, то в этом случае целесообразно задуматься о едином метаслое.
Это решается на уровне разграничения прав и правилегий пользователей - есть public objects доступные всем пользователям. В ней поддерживается governance, единая логическая модель (атрибуты, факты, показатели), политики безопасности доступа к данным, единый гайдлайн отчетности и прочее. Все остальное - пользовательская область, где пользователи могут наворачить что хотят, в том числе подключая сторонние источники данных и объединяя их с единым слоем бизнес абстракции. Если что-то в пользовательской зоне становится полезным и интересным большому кругу пользователей или имеет бизнес-ценность для компании, это может быть добавлено в единый семантический слой.
По ссылке подробнее по вопросу создания метаслоя:
Добрый день!
Спасибо за положительный отзыв о статье.
Что касается ваших вопросов:
1/ Microstrategy Enterprise Semantic Graph является неотъемлемой частью платформы Microstrategy. По какой модели вы планируете использовать - это ваш выбор.
2/ Сразу скажу, что у меня лично не было опыта внедрения Data Catalog-ов. Тем не менее, некоторые из компаний, с которыми общаюсь, делали попытки внедрения Data Catalog. Проекты действительно довольно сложные. Мне пока не известны компании кто в этом преуспел. Даже те, кто публично выступали с историями успеха внедрения Data Catalog, на самом деле по факту использовали и продолжают использовать confluence для описания своего дата актива. В связи с этим, до какого-то практического или даже теоретического опыта интеграции Data Catalog c Microstrategy Enterprise Semantic Graph еще не доходило, поэтому мне не приходилось исследовать данный вопрос.
Однако давайте попробуем определиться, что значит интеграция DC и ESG? :)
Например, многие DC предлагают виртуализацию данных.
В какой-то степени Microstrategy ESG это и есть виртуализация данных, т.е. «те же яйца, но вид с боку» предоставляя примерно тоже самое:
виртуальное объединение и подключение к различным источникам данных в виде семантического слоя (слоя виртуализации), к которому может обращаться через Microstrategy/Power BI/Tableau/Qlik/Excel, R, Python, Rest APIs, приложения собственной разработки и тд.
оптимизация запросов к различным источникам данных с возможностью сохранения результатов запросов в кэше или in-memory кубах Microstrategy
поддержка как чтения, так и записи данных в источники
управление безопастностью
высокая производительность и масштабируемость
поддержка real-time
... и тд
Предположу, что под интеграцией DC и ESG вы подразумеваете синхронизацию слоев виртуализации DC и Microstrategy ESG?
Если так, то полагаю такой интеграции нет. Если что-то другое, то уточните, пожалуйста.
Польза от единого семантического слоя не зависит от количества хранилищ данных, скорее от размера BI проекта. Если у вас BI решает какую-то конкретную задачу в одном локальном департементе, а остальным в компании BI не нужен, то эффективнее будет не тратить время на единый метаслой. Если же вы создаете корпоративное BI решение уровня всей компании, то в этом случае целесообразно задуматься о едином метаслое.
Это решается на уровне разграничения прав и правилегий пользователей - есть public objects доступные всем пользователям. В ней поддерживается governance, единая логическая модель (атрибуты, факты, показатели), политики безопасности доступа к данным, единый гайдлайн отчетности и прочее. Все остальное - пользовательская область, где пользователи могут наворачить что хотят, в том числе подключая сторонние источники данных и объединяя их с единым слоем бизнес абстракции. Если что-то в пользовательской зоне становится полезным и интересным большому кругу пользователей или имеет бизнес-ценность для компании, это может быть добавлено в единый семантический слой.