danx29 авг 2011 в 13:46

Репликация базы данных PostgreSQL на основе SymmetricDS

10 мин

23K

PostgreSQL *

Из песочницы

+21

Комментарии 29

compdemon 29 авг 2011 в 13:57

В принципе интересно, но как добавить репликацию к уже имеющейся и пусть не сильно большой, но уже прилично весящей базе? Экспортировать текущую, создавать новую реплицируемую и импортировать данные туда? Или можно добавить репликацию к имеющейся рабочей базе «на лету» (естественно с требующейся по ходе дела остановкой, если нужно).

danx 29 авг 2011 в 14:14

Да, можно добавить репликацию к имеющейся базе. Для этого необходимо модифицировать код файла insert_sample.sql, создав в таблицах Symmetric DS (начинающизся на sym_) нужные записи.
Особенность Symmetric DS такова, что он может реплицировать не всю базу подряд, а только некоторые ее таблицы. Например, у нас есть branch office и менеджер по продажам вносит в локальную базу нового клиента. Эта информация о клиенте синхронизируется с главной базой в headquarters и становится после этого доступна для остальных branch offices.

Lolka 29 авг 2011 в 14:35

И еще, рассматривали, как ведут себя базы в случае потери соединения? Скажем, у меня две БД в разных городах — интернет есть всегда, но вдруг чего, разное бывает — пропадает. В таких случаях, если у нас мультимастер репликация, надо будет решать конфликты по id'ам insert'ов и update'ам. Хотелось бы еще несколько слов об этом.

miwa 30 авг 2011 в 08:17

Из тех систем, с которыми я сталкивался проблема решается двумя способами — либо каждая база данных имеет свой непересекающийся диапазон идентификаторов, либо первичный идентификатор составной — ИД записи + ИД базы данных. Можно еще позаморачиваться с UUID в качестве идентификаторов, но это уже совсем для гурманов.

Lolka 30 авг 2011 в 08:27

Да-да, у меня, к примеру, две ноды и больше не предвидится, id'ы идут чёт-нечёт.

el777 30 авг 2011 в 10:27

Проблема не только в id.
А если так? Что будет на выходе?

LighteR 29 авг 2011 в 15:04

Каким образом SymmetricDS разрешает конфликты?

datacompboy 29 авг 2011 в 15:29

А в чем преимущество над, например, slony?
Если я понимаю, разрешения конфликтов при доступе в обе нет — это master-slave репликация только?

danx 29 авг 2011 в 17:22

В нашем проекте используется master-slave модель, когда данные пишутся только в master базу и реплицируются на находящуюся в hot standby вторичную базу.

Отвечу сразу на вопрос Lolka — при временном обрыве соединения между базами изменения в master базе накапливаются в служебных таблицах SymmetricDS, и при возобновлении соединения они загоняются в secondary db.

Вопрос об разрешении конфликтов при мультимастерной конфигурации, думаю, это тема отдельного поста. Пока же скажу, что симметрик умеет изменять запрос INSERT на UPDATE в случае, если в destination db такая запись уже есть.

LighteR 14 сен 2011 в 08:12

Если вы используете только master-slave, то чем это тогда лучше встроенной в постгрес streaming replication?

el777 29 авг 2011 в 17:31

К сожалению, полноценной мастер-мастер репликации не существует в природе. См. CAP-теорему Брюэра — это прямо следует оттуда.

Как поведет себя система в такой ситуации:

1> BEGIN;
2> BEGIN;
1> UPDATE…
2> UPDATE той же строки с другими данными
1> COMMIT;
2> COMMIT;

Lolka 30 авг 2011 в 06:20

Да, но можно решать конфликты одним из способов. Например — кто последний, тот и прав. Такое работает, не для всех данных, конечно же.

el777 30 авг 2011 в 07:47

Это очень важно как он будет себя вести.
Например, rubyrep, так же позионирующийся как мастер-мастер репликатор, тупо падает в этой ситуации. А это, согласитесь, обозначает полную неприменимость.

Давно смотрел на М-М решения, но пока не видел ничего достойного.

440hz 30 авг 2011 в 08:09

тоже мониторим М+М решения. пока ничего не нашли работающего.
=(

Lolka 30 авг 2011 в 08:24

У меня работает уже второй год Bucardo в режиме асинхронной М-М для двух серверов в разных городах. С падениями канала справляется. Конфликты решаются по методу latest. Всё работает без сбоев. «Трафик» по запросам правда совсем маленький — до 50k запросов (update, insert, delete) в сутки.

440hz 30 авг 2011 в 06:29

БД более 300G. продакшен. работаем на master-slave реплике (hot_standby WAL) + pgpool для отказоустойчивости. полет нормальный. отставание практически незаметное. pgpool допилен немного скриптами для грамотного переключения и управления нодами.

так же есть балансировка нагрузки. на slave летит 99% SELECT.

el777 30 авг 2011 в 07:48

Какая у вас версия PG?

Как осуществляется переключение при выходе из строя мастера?

440hz 30 авг 2011 в 08:08

схема такая.

pgpool. 2 сервера под HA.

pgcluster. 2 сервера master-slave. все запросы идут через pgpool. он же переключает master-slave.

есть скрипты ручной/автоматической синхронизации мастера со слейвами.

на тестовом стенде делали 1 мастер 2 слейва. все прекрасно синкается, переключается, обрабатывается. отставания нод практически нет.

работает все под серверами ubuntu + pgpoolIII ( 2 проца. 2Г памяти)+ pgbonucer+pg9.0.4 (8 проц. 40Г память)

нагрузка порядка 100-200 коннектов на PG. 1000-1500 на бонусерах и пуле в сек.

п.с. в принципе есть дока… могу куда-нить выложить… наверное… =)

el777 30 авг 2011 в 10:24

Интересно. Выложите :)

Как пгпул переключает слейвы? Не нужно как-то явно говорить, что такой-то слейв теперь стал мастером?
Во всяком случае в слоне так — и он просто запрещает запись на слейв сервер.

440hz 30 авг 2011 в 10:39

pgpool мониторит сервера и при отказе запускает скрипт, который и возвращает ему мастера.

el777 30 авг 2011 в 10:41

Мы поостереглись делать автоматическое переключение мастера — т.к. в случае временных перебоев или еще каких сетевых проблем, начнется переконфигурация кластера.

440hz 30 авг 2011 в 11:08

с чего она начнется-то?

1. падает мастер.
2. pgpool делает slave мастером. в случае нескольких слейвов запускается синхронизация с новым мастером.

даже если старый мастер поднимется он не включиться в текущую схему. его можно только принудительно сделать слейвом и так же принудительно включить в кластер.

где-же тут конфликты?

el777 31 авг 2011 в 06:07

Представим, что где-то возник таймаут — например, за счет перебоев в сети, скачка нагрузки, где-то своп подкачался и пр. — причин может быть масса.
После этого скрипт считает, что мастер пропал — тут же все переключается на слейв. Затем мастер появился, но работать уже не может — т.к. он рассинхронизирован. Таким образом из рабочей конфигурации вы потеряли 1 сервер БД. Конфигурация ослабла. Если будет скачок нагрузки, то есть риск вылета еще одного сервера таким же макаром, а дальше все будет «складываться» как домино.

440hz 31 авг 2011 в 06:30

надо понимать, что это все-таки псевдо-кластер. да. с большим отказом, но есть узкие места.
=)

при переходе на нового мастера, слейвы должны будут посинкаться с новым мастером. старый мастер стать слейвом и тоже посинкаться. в общем есть там слабые места. есть. не спорю, но это лучше чем вообще ничего и если надо обеспечить 24Хх7 то это хоть что-то при отказах, а не тупое «БД не доступна».

440hz 31 авг 2011 в 06:31

момент переключения очень слабое место в таком конфиге. да. но пока нет ничего лучше.

440hz 30 авг 2011 в 10:40

все в автоматическом режиме. сиди, кури…
=)

el777 30 авг 2011 в 10:41

Если это все еще развалится в автоматическом режиме :)

440hz 30 авг 2011 в 11:08

это с чего бы?

vasilisc 30 авг 2011 в 06:36

хорошая статья спасибо
позвольте поумничать
«Сервера должны пинговать друг друга, потому что SymmetricDS использует HTTP протокол для синхронизации. „
пинг это ICMP протокол, а HTTP — это другой протокол.
можно сделать чтобы сервера не пингались, а HTTP работает =)
[/умничать]

Зарегистрируйтесь на Хабре, чтобы оставить комментарий