All streams
Search
Write a publication
Pull to refresh
3
0
Send message

Как полностью устранить дублирующие записи в ClickHouse

Level of difficultyEasy
Reading time4 min
Views9.9K
image

Всем привет!

Меня зовут Валерий Локтаев, я backend-разработчик сервиса биллинга в CloudMTS.

В этой статье я расскажу, как насовсем убрать дублирующие записи в ClickHouse (CH). Логичный вопрос — откуда вообще взялась проблема? Можно взять движок таблицы ReplacingMergeTree, указать ORDER BY в качестве ключа дедупликации, и CH чудесным образом удалит все дубли в базе.

ReplacingMergeTree, безусловно, отличное решение. Но представьте, что ваша задача — сделать так, чтобы в таблице дубли никогда не появлялись, даже на несколько секунд.

Далее я расскажу, в каких случаях это необходимо и какое решение удалось подобрать.

Читать дальше →

Information

Rating
Does not participate
Registered
Activity

Specialization

Backend Developer
Senior
From 6,000 $
Golang
MongoDB
ClickHouse
Apache Kafka
Linux
Docker
Git
PostgreSQL
High-loaded systems
SQL