Comments 4
Ну, по сути, Вы тут не опровергли ничего. Как техлиду или архитектору мне проще сказать джунам что клик не для джойнов, кладите плоскую таблицу, обогащайте и фильтруйте.
Ну и в современном мире 20 млн строк это не объем, счет идет на миллиарды обычно
Разбудите меня когда CH пройдет хотя бы TPCDS
Статья хорошая, автор раскрыл тему. Огромное ему спасибо.
Но тут есть три НО:
1. Автор рассматривает всего одно соединение, а если их несколько потребление памяти растет пропорционально
2. Если таких запросов в системе не один, а скажем 100 или больше, то внезапно память уже кончилась, а если еще несколько джойнов в одном запросе (смотри пункт первый)
3. Ну и наконец добавляем шарды, и тут становится совсем весело, так как если мы отказываемся от локальных джойнов, то при джойне 2 больших таблиц все данные едут на один шард и там кончается память
Собственно пока clickhouse не научится писать на диск информацию для джойна при нехватке памяти (пункты 1-2) и нормальную обработку джойнов шардированных таблиц не таща вся на один шард (пункт 3), для меня это система на которой нормального функционала джойнов нет.
ClickHouse не тормозит, но не умеет джойнить. Убиваем миф