Comments 2
Хотелось бы понять вот этот момент:
Теперь с этой витриной можно работать в Clickhouse, который, как известно, не тормозит!
Т.е. рабтая на представительном уровне в GreenPlum и выгружая табличку в Clickhouse пользователю получается нужно работать в двух системах? Непосредственно из гринплама прозрачно не получится работать с этой таблицей в быстром кликхаусе?
Пробую объяснить свой сценарий.
Есть Greenplum как general purpose DWH, в нем делаются все преобразования, джоины, тяжелые расчеты. В результате получаются витрины, содержащие очищенные и ценные данные.
Эти витрины имеет смысл перенести в Clickhouse, т.к. именно Clickhouse может обеспечить отклик запросов за миллисекунды.
Например, BI инструмент будет смотреть именно в Clickhouse.
Пользователю, работающему с BI (PowerBI / Tableau / Datalens / ...) не обязательно знать детали реализации и что и куда смотрит. Он просто кликает графики и дашборды, получая ответы на вопросы интерактивно, вне зависимости от объемов данных.
Недаром Arenadata строит свой стек на Hadoop + Greenplum + Clickhouse (и всё Open Source).
Сценарии применения Greenplum PXF для интеграции с Data Lake, OLTP, Clickhouse