Comments 6
днём у нас работает пять ЦПУ, а вечером у нас поднимается 1 000 обработчиков, и работает десять ЦПУ. При этом не нужно делать баланс данных, потому что они лежат внутри одного хранилища— подскажите, как это сделано без баланса данных? В Greenplum же нужно заранее задать кол-во сегментов, на которые делятся данные. И каждый сегмент обрабатывает одно ядро
0
На текущий момент можно менять число сегментов только в большую сторону с последующим распределением данных на сегментах. А в будущем можно будет хранить все на S3 и менять число сегментов динамически и в большую и в меньшую сторону.
«И каждый сегмент обрабатывает одно ядро».
На самом деле сегмент может загрузить больше одного ядра, если параллельно выполняется несколько запросов.
«И каждый сегмент обрабатывает одно ядро».
На самом деле сегмент может загрузить больше одного ядра, если параллельно выполняется несколько запросов.
0
А реализация S3-совместимого хранилища в облаке КРОК поддерживает S3 Select? И, если не секрет, какое вы используете решение для хранения в S3?
0
У нас S3 на базе Ceph, S3 select пока не поддерживает.
0
Sign up to leave a comment.
Массивно-параллельная база данных Greenplum — короткий ликбез