AlexGluck Feb 26 2019 at 15:14

Кластерное хранилище Pacemaker + DRBD (Dual primary) + samba

5 min

10K

High performance*System administration*IT Infrastructure*Data storage*Distributed systems*

Tutorial

+14

Comments 26

amarao Feb 26 2019 at 15:34

pacemaker с отключенным stonith — неподдерживаемая конфигурация (и потенциально, неопределённое поведение).

AlexGluck Feb 26 2019 at 15:36

Если вы знаете как с 2мя виртуалками без возможности управления сделать STONIT, расскажите, вы спасёте этим много молодых голов.

vesper-bot Feb 26 2019 at 15:46

Надо три поднять, и на третьей держать только pacemaker. В худшем случае просто кластер остановится. Вот если есть только два хоста… тогда поинтереснее. А по мне, если возникла нужда в drbd+HA, проще взять NAS и поднять на нем айскази-таргет, ибо так или иначе точка отказа сеть.

AlexGluck Feb 26 2019 at 15:51

По условиям у вас есть только 2 виртуалки, никаких NAS и дополнительных виртуалок нет и не будет год-полтора. Как сделать по уму, так это поставить ceph или другую кластерную фс. Но уж точно не одинокий NAS стОящий денег и ограничивающий вас.

amarao Feb 26 2019 at 16:00

Для арбитража split brain'а, кстати, есть такой грязный хак, как «reachability».

Если у нас есть третий узел в сети (а он есть — роутер, как минимум), то кто пинги от соседа не видит, а роутера видит — того и тапки. Предполагается, что если до роутера и до пира не допинговаться, то надо сидеть на попе ровно и считать себя трупом.

vesper-bot Feb 26 2019 at 16:11

Как-то раз очень клево у меня поломалась сеть, ошибка в работе свитча привела к тому, что оба гипера видели роутер, но не видели друг друга. ВМ на гиперах также видели роутер, но не видели ВМ на соседнем гипере. От такой ситуации даже reachability не спасет.

AlexGluck Feb 26 2019 at 16:20

Увы это ненадёжный метод как указали ниже, поэтому я и написал, что не надо так делать.

amarao Feb 26 2019 at 15:58

Ключевое слово — виртуалки. У них есть гипервизор, у гипервизора есть команда «умри эту VM». (например, virsh destroy). Отличный stonith, между прочим.

vesper-bot Feb 26 2019 at 16:09

А дальше при разрыве сети и доступности управляющих интерфейсов гипера запускается stonith deathmatch. Неприятно, мягко скажем. Ну или ничего недоступно, тогда и stonith бесполезен.

amarao Feb 26 2019 at 16:11

Из чего мы делаем вывод, что нельзя разделить 3 нацело честно.

Вообще, вся это double primary drbd так воняет, что слов нет.

PS С точки зрения CAP-теоремы, если в случае проблем все ноды умрут, кластер останется highly available.

AlexGluck Feb 26 2019 at 16:24

Когда нет выбора, надо делать шлёп-шлёп и в продакшен.

vesper-bot Feb 26 2019 at 16:27

В такой ситуации я бы реализовывал VM replication между гиперами и одну ВМ для хранения данных. Так или иначе шлеп-шлеп получается, репликация хотя бы может обеспечить более-менее быстрый возврат в работу при отказе гипервизора.

AlexGluck Feb 26 2019 at 16:37

По условиям у вас нет доступа к гиперу, дома и в деве мы можем крутить, что хотим, но когда архитектор заложил неверно структуру, мы уже не в состоянии это поменять.

vesper-bot Feb 26 2019 at 16:46

Тогда жопа, и я бы делал тогда одну ВМ вообще

AlexGluck Feb 26 2019 at 16:49

Вам дали задачу сделать HA кластер самбы и 2 виртуалки. Больше никого не волнует ничего. Только нас, когда мы в углах по ночам плачем от таких задач.

kvaps Feb 26 2019 at 16:58

Вообще если очень хочется в fencing, то можно использовать softdog method, он не идеален но предоставляет хоть какие-то гарантии, при этом не требуя никакого доступа к внешним устройствам или гипервизору.

Проблема в том, что для восстановления по прежнему необходим кворум и хотя бы три виртуалки.

AlexGluck Feb 26 2019 at 16:21

Вам не дали такого интерфейса или вы не можете его во вменяемые сроки реализовать.

amarao Feb 26 2019 at 18:17

Вы, в 2019, не можете выключить виртуалку через API? Мне стыдно спросить, что за систему виртуализации вы используете. Неужели, higan?

AlexGluck Feb 26 2019 at 18:19

Можете погадать, вам всё равно не ответят или не дадут доступа к управлению через апи.

amarao Feb 26 2019 at 18:22

В этой ситуации лучше иметь primary + secondary и переключать руками. Оператор будет выступать в качестве арбитра и у вас будет консистентность.

Я не понимаю людей, которые уверены, что именно у них в этой конфигурации split brain никогда не настанет.

gecube Feb 26 2019 at 22:15

Полностью согласен насчёт Сплита. Пускай тогда будет «горячий» резерв, но вводить — только руками оператора

AlexGluck Feb 27 2019 at 01:24

Хорошая идея и конкурсы интересные) Только доступ оператора на закрытую площадку это 2 рабочих дня) А уж как узнать о том что там что-то сломалось, так это вообще песня.

gecube Feb 27 2019 at 08:37

Доступ оператора — имеется в виду ssh. Этого достаточно, чтобы привести систему в разумное состояние, но уже без отказоустойчивости. А если есть iLo и пр… ну, тогда можно вообще никуда не ездить.

AlexGluck Feb 27 2019 at 21:38

ILO нет, ссш нет, доступ только через физическое пристутствие в цоде.

amarao Feb 27 2019 at 21:50

А от кого вы про split brain узнавать будете? Кластер-то тоже встанет, только в более плохую позу.

AlexGluck Feb 27 2019 at 22:31

Вся суть в том, что от какого нибудь случайного пользователя, потому что иных путей нет. Идиотизм процветает.

Show the best of all time