Pull to refresh

Comments 4

Ну, по сути, Вы тут не опровергли ничего. Как техлиду или архитектору мне проще сказать джунам что клик не для джойнов, кладите плоскую таблицу, обогащайте и фильтруйте.

Ну и в современном мире 20 млн строк это не объем, счет идет на миллиарды обычно

Неважный из тебя тех.лид. Сам не вник,не понял и другим у джунов отбил желание

Разбудите меня когда CH пройдет хотя бы TPCDS

Статья хорошая, автор раскрыл тему. Огромное ему спасибо.

Но тут есть три НО:
1. Автор рассматривает всего одно соединение, а если их несколько потребление памяти растет пропорционально

2. Если таких запросов в системе не один, а скажем 100 или больше, то внезапно память уже кончилась, а если еще несколько джойнов в одном запросе (смотри пункт первый)

3. Ну и наконец добавляем шарды, и тут становится совсем весело, так как если мы отказываемся от локальных джойнов, то при джойне 2 больших таблиц все данные едут на один шард и там кончается память

Собственно пока clickhouse не научится писать на диск информацию для джойна при нехватке памяти (пункты 1-2) и нормальную обработку джойнов шардированных таблиц не таща вся на один шард (пункт 3), для меня это система на которой нормального функционала джойнов нет.

Sign up to leave a comment.

Articles