mixermsk Feb 10 2012 at 00:11

Отказ мастера в PostgreSQL-кластере: как быть?

3 min

10K

PostgreSQL *

+22

Comments 9

datacompboy Feb 10 2012 at 05:13

По-моему, проблема рестарта при смене реплика=>мастер не страшна — всё равно даунтайм больше времени рестарта — требуется же задетектить саму проблему, принять решение что надо менять мастера и тп.

UncleAndy Feb 10 2012 at 08:37

Автор, думаю, вы не правы (ну или частично неправы). При втором способе такое прокатит только если будет совершенно случайная ситуация когда на слэйвах после отключения мастера актуальными оказалась одинаковые точки в бинарном логе. При активной работе с БД даже при штатном отключении мастера это очень маловероятно. А уж тем более при падении на мастер метеорита.

Я с этим экспериментировал и мне не удалось вторым способ восстановить работу слэйвов без перезаливки базы.

mixermsk Feb 10 2012 at 09:08

Не могли бы вы рассказать в чём именно заключалась проблема — я постараюсь её воспроизвести? Дело в том, что переключение со смещенной позицией(когда есть отстающие реплики) я тоже, разумеется, рассматривал — все отработало штатно. В моём случае я тестировался так:
1. Из /dev/urandom в 5-6 потоков льются данные в одну из таблиц.
2. Я закрываю мастер фаерволлом от одной из реплик(дабы спровоцировать отставание), жду пару минут — делал и с этим пунктом и без него.
3. Выключаю мастер.
4. Делаю описанное выше.

Более того, мне известен случай, когда случай, когда подобным образом неоднократно переключали production-кластер. Успешно, разумеется.

UncleAndy Feb 10 2012 at 09:24

Если на будущем мастере смещение будет более ранним чем на одном из слэйвов, то слэйв к нему не подключится.

mixermsk Feb 10 2012 at 10:10

Я не просто так писал о необходимости найти самую свежую реплику в начале второй части поста. Или я вас неправильно понял?

Касательно предпоследнего абзаца(про перемещение файлов xlog`а между машинами) — да, каюсь, не сработало — исправил на работающий вариант.

UncleAndy Feb 10 2012 at 10:36

Хотя да, точно. Сначала не совсем понял зачем это вам надо было. А так да — вполне может сработать.

EXSlim Feb 10 2012 at 12:08

repmgr

mixermsk Feb 10 2012 at 12:22

Изучу, спасибо

mtyurin Apr 13 2012 at 11:35

спасибо за статью.

скорее всего первый пункт и не нужен. можно брать любую из реплик в качесте мастера, нужно лиш вычитсить pg_xlog с остальных.

www.sql.ru/forum/actualthread.aspx?tid=933852