ГП тоже умеет и в редистрибуцию и в броадкаст таблицы/датасета, и активно их использует) в статье все в общих чертах описано. Даже касательно кликхауса - правая таблица совершенно необязательно должна помещается в память, в последних версиях клика по кр мере.
По сравнению с вертикой, какие минусы у гп, навскидку : в гп нет кластерного индекса (в том же кликхаузе по факту он есть), соответственно нет мерж джойнов; нет join elimination; индексы в гп по факту сложно использовать, ТК они не сжимаются и ... Еще какие-то там с ними проблемы; механизма проекций тоже нет, но можно просто создать таблицу-дубль с другой дистрибуцией; вроде ещё что-то было, щас не могу вспомнить...
В целом же ГП весьма хорош, тот опенсорс который во многом не хуже платных mpp баз.
ГП тоже умеет и в редистрибуцию и в броадкаст таблицы/датасета, и активно их использует) в статье все в общих чертах описано. Даже касательно кликхауса - правая таблица совершенно необязательно должна помещается в память, в последних версиях клика по кр мере.
По сравнению с вертикой, какие минусы у гп, навскидку : в гп нет кластерного индекса (в том же кликхаузе по факту он есть), соответственно нет мерж джойнов; нет join elimination; индексы в гп по факту сложно использовать, ТК они не сжимаются и ... Еще какие-то там с ними проблемы; механизма проекций тоже нет, но можно просто создать таблицу-дубль с другой дистрибуцией; вроде ещё что-то было, щас не могу вспомнить...
В целом же ГП весьма хорош, тот опенсорс который во многом не хуже платных mpp баз.