Как стать автором
Обновить

Комментарии 6

А как обходится ограничение что у Segment instanсe может быть только одна реплика (зеркало)?
Просто используем spread mirroring, распределяя зеркала одного хоста по нескольким другим.
Hash join — один из лучших способов соединения таблиц


скажем так, не бесспорное утверждение. Зависит от характера и объёма данных на которых происходит это соединение. Если данных мало Nested loops будет быстрее. Если данные упорядочены Merge join будет и быстрее и эффективнее с точки зрения памяти.
Можно даже попытаться перефразировать Черчилля для случая большого количества неупорядоченных данных: «Hash join — отвратительный вариант соединения больших неупорядоченных таблиц, но все остальные ещё хуже» :)
гринплам в отличии от многих других сортированно данные хранить не умеет, поэтому мерж практически всегда не вариант. А вот NL кстати вариант т.к. индексы в отличии от большинства аналогов у него как раз есть.
Возможно, в предыдущих статьях было сравнение (ссылка устроит), но все же задам вопрос: кроме «бесплатности» есть еще плюсы в ваших глазах у Greenplum? Почему не Teradata, Vertica?
Цена решения сама по себе важный плюс, помимо этого greenplum все-таки open source. Плюс разные подходы к распространению. Та же teradata продается только в варианте готового комплекса (софт + железо), что влияет как на цену, так и на сроки внедрения. Ну и как бонус, greenplum на базе postgresql, найти специалистов проще, но нужно принять во внимание все, что описано в статье.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий