Search
Write a publication
Pull to refresh
0
0
Владимир Ефанов @VLVE

Data Warehouse & Business Intelligence

Send message

По ссылке подробнее по вопросу создания метаслоя:

Добрый день!

Спасибо за положительный отзыв о статье. 

Что касается ваших вопросов:

1/ Microstrategy Enterprise Semantic Graph является неотъемлемой частью платформы Microstrategy. По какой модели вы планируете использовать - это ваш выбор.

2/ Сразу скажу, что у меня лично не было опыта внедрения Data Catalog-ов. Тем не менее, некоторые из компаний, с которыми общаюсь, делали попытки внедрения Data Catalog. Проекты действительно довольно сложные. Мне пока не известны компании кто в этом преуспел. Даже те, кто публично выступали с историями успеха внедрения Data Catalog, на самом деле по факту использовали и продолжают использовать confluence для описания своего дата актива. В связи с этим, до какого-то практического или даже теоретического опыта интеграции Data Catalog c Microstrategy Enterprise Semantic Graph еще не доходило, поэтому мне не приходилось исследовать данный вопрос. 


Однако давайте попробуем определиться, что значит интеграция DC и ESG? :)


Например, многие DC предлагают виртуализацию данных. 

В какой-то степени Microstrategy ESG это и есть виртуализация данных, т.е. «те же яйца, но вид с боку» предоставляя примерно тоже самое:

  • виртуальное объединение и подключение к различным источникам данных в виде семантического слоя (слоя виртуализации), к которому может обращаться через Microstrategy/Power BI/Tableau/Qlik/Excel, R, Python, Rest APIs, приложения собственной разработки и тд.

  • оптимизация запросов к различным источникам данных с возможностью сохранения результатов запросов в кэше или in-memory кубах Microstrategy

  • поддержка как чтения, так и записи данных в источники

  • управление безопастностью 

  • высокая производительность и масштабируемость

  • поддержка real-time 

  • ... и тд

Предположу, что под интеграцией DC и ESG вы подразумеваете синхронизацию слоев виртуализации DC и Microstrategy ESG?

Если так, то полагаю такой интеграции нет. Если что-то другое, то уточните, пожалуйста.

Польза от единого семантического слоя не зависит от количества хранилищ данных, скорее от размера BI проекта. Если у вас BI решает какую-то конкретную задачу в одном локальном департементе, а остальным в компании BI не нужен, то эффективнее будет не тратить время на единый метаслой. Если же вы создаете корпоративное BI решение уровня всей компании, то в этом случае целесообразно задуматься о едином метаслое.

Это решается на уровне разграничения прав и правилегий пользователей - есть public objects доступные всем пользователям. В ней поддерживается governance, единая логическая модель (атрибуты, факты, показатели), политики безопасности доступа к данным, единый гайдлайн отчетности и прочее. Все остальное - пользовательская область, где пользователи могут наворачить что хотят, в том числе подключая сторонние источники данных и объединяя их с единым слоем бизнес абстракции. Если что-то в пользовательской зоне становится полезным и интересным большому кругу пользователей или имеет бизнес-ценность для компании, это может быть добавлено в единый семантический слой.

Information

Rating
Does not participate
Registered
Activity