Комментарии 6
А как обходится ограничение что у Segment instanсe может быть только одна реплика (зеркало)?
Hash join — один из лучших способов соединения таблиц
скажем так, не бесспорное утверждение. Зависит от характера и объёма данных на которых происходит это соединение. Если данных мало Nested loops будет быстрее. Если данные упорядочены Merge join будет и быстрее и эффективнее с точки зрения памяти.
Можно даже попытаться перефразировать Черчилля для случая большого количества неупорядоченных данных: «Hash join — отвратительный вариант соединения больших неупорядоченных таблиц, но все остальные ещё хуже» :)
Возможно, в предыдущих статьях было сравнение (ссылка устроит), но все же задам вопрос: кроме «бесплатности» есть еще плюсы в ваших глазах у Greenplum? Почему не Teradata, Vertica?
Цена решения сама по себе важный плюс, помимо этого greenplum все-таки open source. Плюс разные подходы к распространению. Та же teradata продается только в варианте готового комплекса (софт + железо), что влияет как на цену, так и на сроки внедрения. Ну и как бонус, greenplum на базе postgresql, найти специалистов проще, но нужно принять во внимание все, что описано в статье.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
5 лайфхаков оптимизации SQL-запросов в Greenplum