Comments 4
Это обеспечивает интеграцию с любым ПО, поддерживающим PostgreSQL.
Подумайте, как грустно будет выглядеть мониторинг запросов на 20 сегментах, которые ещё выполняются на каждом сегменте по-разному. В теории - должно работать, на практике всё обвязочное ПО для Postgres нужно тестировать и брать желательно заточенное под greenplum и его кластерную архитектуру. То же самое с бэкапами, репликацией, high availability.
В общем, если есть мысль переехать, потому что "это же совсем как Postgres и админить мы его умеем" - не обманывайте себя. 40% Postgres 9.4, в остальном придётся доучиваться. Но её нужность не отрицаю, параллельные запросы и скорость их выполнения перевешивают неудобства.
И когда начали думать, как его синхронизировать с мастер-веткой PostgreSQL, приняли решение затягивать изменения из PostgreSQL в GreenPlum. Наоборот было бы слишком сложно
Наоборот было бы невозможно. Даже если бы пытались (а пытаются небольшие коммиты), вероятно патчи были бы отклонены (ну и большинство кануло).
А вы уверены что в GP есть автоматическое секционирование? Что подразумевается под этим термином?
А вы уверены что в PG нет параллелеризма? Он есть конечно же. Тут нужно вводить термин внутриузлового и межузлового параллелеризма. Внутриузловой в PG прекрасно работает. Межузловой паралелелризм в GP имеет и свои недостатки. Вы его задать можете один раз при установке системы, определив количество сегментов на сегмент-хосте. А выбирается кол-во сегментов исходя из предполагаемого характера нагрузки и уровня конкурентности запросов.
В PG есть и сжатие (кое какое то все же есть) и колоночное хранение, если это необходимо.
В целом за последние месяцы только ленивый не написал материал на тему - какая хорошая система GP. Жаль только что многие из тех кто пишет (не принимайте пжста на свой счет) не приводят недостатки (коих не мало), которые есть у всех (!) MPP систем и какие то адекватные сравнения.
Здравствуйте!
Очень рада, что вам понравилась моя статья от 17 авг. 2021 года про PG и GP https://www.bigdataschool.ru/blog/greenplum-vs-postgresql-what-is-the-difference.html настолько, что вы на ее основе решили написать свой пост https://habr.com/ru/company/southbridge/blog/682248/ от 12 августа 2022 года.
Обычно в таком случае ставится ссылка на первоисточник.
Благодарю за понимание, у нас в блоге очень много интересных и полезных материалов — https://www.bigdataschool.ru/blog/, пользуйте на здоровье, только ссылки ставьте, плиз)
Анна Вичугова
Связь GreenPlum и PostgreSQL