Комментарии 3
Познавательно, спасибо. Но ещё больше стал ценить системы нацеленные на пользователя, а не разработчика, где подобные выборы за вас делает система. Вроде BigQuery, где всё на что можно повлиять это указать PARTITION BY и CLUSTER BY , за остальной оптимизацией и корректностью следит система.
Для быстрой переливки данных из distributed в distributed есть parallel_distributed_insert_select.
Благодарю, было полезно. Жду обещанную статью
Далее планируем рассказать, как мы боролись с нехваткой памяти, тюнингом запросов и самого кластера и, самое классное, — как мы запилили бэкап распределенной СУБД.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как работать эффективно с распределенными таблицами в ClickHouse