Как стать автором
Обновить

Комментарии 7

Можно вопрос? А начем у вас построенно хранилище данных ???

Сейчас рассматриваем три варианта, Вертика, MS SQL 2012(колоночные индексы), и Оракл(еще не смотрели).

У вертики проблемы, 1 терабайт бесплатно, после 1 терабайта, 2-ой терабайт стойт 100 тыс бачинских.
Если говорить именно о хранилищах данных (а не витринах), фактически всегда это либо MS SQL Server, либо Oracle (причем, по сугубо личным наблюдениям, MS SQL Server последнее время стал встречаться значительно чаще).

Тестовая витрина данных (которая используется в настоящем материале) построена на MS SQL Server 2008.

Несколько лет назад (где-то в 2011 году) сталкивался с вертикой, которая использовалась как витрина данных для IBM Cognos BI. В нашем случае были некоторые проблемы с совместимостью (возможно в современном варианте этих проблем уже нет).
MS SQL щас чаще стал использоватся, так как не требуется специалистов по другим системам.
Щас в новой редакции они еще сделали колоночные индексы, которые существенно в 10 раз быстрее выполяняют запросы.
https://youtu.be/su_SM040xKE?t=1307
Synthetic Key (как минимум две совпадающие по имени колонки в нескольких таблицах) в Qlikview это антипаттерн. Он не дает пользоваться преимуществами системы (сильно падает скорость), кроме того приводит к неоднозначности в ассоциативной логике в гуе. Дело в том, что Qlikview это колоночная база данных. Колонки с одинаковым именем в разных таблицах — это на самом деле один объект. Синтетический ключ это вынужденный эрзац такого объекта.

Стандартный способ избавления — создание ключа через хеширование конкатенированных (совпадающих) колонок во всех таблицах при загрузке. Потом колонки переименовываются уникальным образом.

При разработке схем данных для QlikView рекомендуется делать их более звездообразными и желательно, чтобы «лучей» у звезды было как можно меньше. В большинстве случаев QlikView умеет дедублицировать данные самостоятельно. Поэтому, нормализовывать их как правило нет смысла.
Хотелось бы увидеть именно сравнение, а так получилось просто описание двух продуктов.
Лично я считаю, что именно сравнение и получилось. Я реализую одну задачу 2-мя разными инструментами, а Вы уже сами решаете где все более удобно и логично организованно. Мое ИМХО здесь будет лишним, т. к. в силу ряда обстоятельств, я не смогу объективно сравнить инструменты.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории