chlorine Jan 24 2025 at 04:00

Горизонтальное масштабирование базы данных. Репликация. Партицирование. Шардирование

Easy

11 min

45K

Programming * Algorithms * System Programming * System Analysis and Design * Database Administration *

Tutorial

+17

Comments 10

economist75 Jan 24 2025 at 05:44

Понравилось изложение. В статье не упомянуто, что партицирование (горизонтальное) на практике чаще всего делается по времени (по годам или же чаще по кварталам), т.к. 80% данных в большом бизнесе - это временные ряды (индексы таблиц чаще всего TimeStamp c наносекундами). Партицирование прекрасно реализовано даже в крохотных бессерверных аналитических движках типа DuckDB, без падения скорости выполнения запросов по всем партициям (и с ускорением в разы при запросах по последней партиции, самым частым, те же 80%).

Но в использовании оно все равно сложное, потому что "бухгалтерия в конце марта закрывает декабрь", а значит приходится обновлять не одну (4 кв.), а две партиции (4+1 кв.) А на практике часто все 5, потому что... Потому что изменения в марте часто вносятся и в 1-й квартал прошлого года, а значит придется изменить все 5-ть партиций.

Akina Jan 24 2025 at 05:47

Вы хотели говорить о методах, которые масштабируют за счёт увеличения количества узлов. Очень хочется спросить - какое отношение к этому методу имеет секционирование (партиционирование)? Вся работа данного метода осуществляется в рамках одного инстанса сервера БД, ну максимум можно раскидать партиции по разным томам.

SkillMax999 Jan 24 2025 at 08:45

Хорошая статья. Всё разложено по полочкам, структурно. Подходит для тех, кто готовится к собесам

Gabenskiy Jan 24 2025 at 09:18

не хватило примеров, теорию я понимаю, а как мне это реализовать на практике?

chlorine Jan 24 2025 at 09:42

согласен. статья была с фокусом на теорию. возможно подсветим практику в следующих публикациях

ashkraba Jan 24 2025 at 11:51

Такс, а теперь опрос: у кого есть горизонтальное масштабирование бд? Мастер-слейвы не в счёт. Не все могут заставить разрабов разделять запросы на запись и на чтение на уровне апки.