droidroot 27 фев 2023 в 14:31

Репликация между SQL- и NoSQL-базами данных: туда и обратно

Средний

9 мин

Блог компании VKOracle*PostgreSQL*Java*Tarantool*

+30

Комментарии 8

dimkus 28 фев 2023 в 16:25

Познавательно для желающих реализовать репликацию данных. Сам писал собственный тул для реплицирования из SQLServer в PostgreSQL и Kafka на основе вычитывания данных из SQLServer Snapshot и последующим автоматическим переключением на живую SQLServer базу и считыванием изменений из CDC (LSN является ориентиром). Очень много подводных камней. Сейчас улучшаю перформанс первоначальной загрузки из snapshot и тесты показывают, что в разы вырастает скорость если считываю данные из snapshot в CSV, после через CopyIn в PostgreSQL с временным удалением индексов и primary ключей в PostgreSQL.

droidroot 1 мар 2023 в 18:04

Было бы интересно почитать о вашем опыте

arheops 28 фев 2023 в 20:08

Нагрузка не может не увеличится, вы же как минимум выполняете операцию чтения WAL. Плюс сам инструментарий.

droidroot 28 фев 2023 в 23:13

Операция чтения WAL идет через репликационный слот и нагрузка в таком случае будет минимальна, нежели сделать фуллскан по всем записям в таблице.

arheops 28 фев 2023 в 23:32

А репликационный слот не создает нагрузки?

droidroot 28 фев 2023 в 23:35

Создает, но меньшую. Намного меньшую.

LaRN 6 мар 2023 в 09:08

Репликационный слот накладывает ограничение на перезапись wal. Т.е. пока данные из слота не прочитаны wal будет расти и при высокой нагрузке может очень быстро съесть все отведенное место на диске, с дальше сервер упадёт с ошибкой.

droidroot 6 мар 2023 в 16:04

Да, есть такое. Поэтому мы и пытались сделать лаг репликации минимальным.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий