Как стать автором
Обновить

Комментарии 7

Если запросить GET_PROJECTIONS по таблице (в статье есть), то можно посмотреть на значение UpToDate.

Хоть в загаловке и сказано про "почему не стоит создавать их под каждый запрос", но ответа в целом нет, кроме одного абзаца и то спорного...

Самый главный момент, который вы упустили/опустили - это то, что вставка данных замедляется пропорционально количеству проекций. Так же вы не указали, как именно увеличевается занимаемое место на диске, в чем отличие сегментированных проекций от обычных, что такое супер-проекция и в чем её отличие от обычных, в общем, продолжать можно много, тема очень обширная, а статья совсем уж слабая...

Спасибо за уточнения, это действительно важно. Про сегментирование в статье я уточнил что проекция может иметь отличное от супер-проекции сегментирование, а примеры таблиц специально были упрощены, чтобы все внимание сместить на проекции.

Не сказано или не увидел, что Vertica это MPP. Это "самое" важное.

В Vertica для оптимального хранения на физическом уровне есть такая фича как Encoding.

И при правильном применении Segment работа с несколькими "таблицами" Projection в этой MPP "доставляет" (чтобы это не значило).

ну сейчас любая аналитическая субд - это MPP. Но у остальных никаких проекций нету.

Сейчас все аналитические базы это MPP. Не до конца понимаю как кодирование и сжатие данных на диске связано с проекциями, у проекций другое назначение. Сегментирование в статье было специально опущено, чтобы примеры получились максимально понятными.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий