AlexGluck26 фев 2019 в 12:14

Кластерное хранилище Pacemaker + DRBD (Dual primary) + samba

5 мин

14K

IT-инфраструктура * Высоконагруженные системы * Распределённые системы * Системное администрирование * Хранение данных *

Туториал

+11

Комментарии 26

amarao 26 фев 2019 в 12:34

pacemaker с отключенным stonith — неподдерживаемая конфигурация (и потенциально, неопределённое поведение).

AlexGluck 26 фев 2019 в 12:36

Если вы знаете как с 2мя виртуалками без возможности управления сделать STONIT, расскажите, вы спасёте этим много молодых голов.

vesper-bot 26 фев 2019 в 12:46

Надо три поднять, и на третьей держать только pacemaker. В худшем случае просто кластер остановится. Вот если есть только два хоста… тогда поинтереснее. А по мне, если возникла нужда в drbd+HA, проще взять NAS и поднять на нем айскази-таргет, ибо так или иначе точка отказа сеть.

AlexGluck 26 фев 2019 в 12:51

По условиям у вас есть только 2 виртуалки, никаких NAS и дополнительных виртуалок нет и не будет год-полтора. Как сделать по уму, так это поставить ceph или другую кластерную фс. Но уж точно не одинокий NAS стОящий денег и ограничивающий вас.

amarao 26 фев 2019 в 13:00

Для арбитража split brain'а, кстати, есть такой грязный хак, как «reachability».

Если у нас есть третий узел в сети (а он есть — роутер, как минимум), то кто пинги от соседа не видит, а роутера видит — того и тапки. Предполагается, что если до роутера и до пира не допинговаться, то надо сидеть на попе ровно и считать себя трупом.

vesper-bot 26 фев 2019 в 13:11

Как-то раз очень клево у меня поломалась сеть, ошибка в работе свитча привела к тому, что оба гипера видели роутер, но не видели друг друга. ВМ на гиперах также видели роутер, но не видели ВМ на соседнем гипере. От такой ситуации даже reachability не спасет.

AlexGluck 26 фев 2019 в 13:20

Увы это ненадёжный метод как указали ниже, поэтому я и написал, что не надо так делать.

amarao 26 фев 2019 в 12:58

Ключевое слово — виртуалки. У них есть гипервизор, у гипервизора есть команда «умри эту VM». (например, virsh destroy). Отличный stonith, между прочим.

vesper-bot 26 фев 2019 в 13:09

А дальше при разрыве сети и доступности управляющих интерфейсов гипера запускается stonith deathmatch. Неприятно, мягко скажем. Ну или ничего недоступно, тогда и stonith бесполезен.

amarao 26 фев 2019 в 13:11

Из чего мы делаем вывод, что нельзя разделить 3 нацело честно.

Вообще, вся это double primary drbd так воняет, что слов нет.

PS С точки зрения CAP-теоремы, если в случае проблем все ноды умрут, кластер останется highly available.

AlexGluck 26 фев 2019 в 13:24

Когда нет выбора, надо делать шлёп-шлёп и в продакшен.

vesper-bot 26 фев 2019 в 13:27

В такой ситуации я бы реализовывал VM replication между гиперами и одну ВМ для хранения данных. Так или иначе шлеп-шлеп получается, репликация хотя бы может обеспечить более-менее быстрый возврат в работу при отказе гипервизора.

AlexGluck 26 фев 2019 в 13:37

По условиям у вас нет доступа к гиперу, дома и в деве мы можем крутить, что хотим, но когда архитектор заложил неверно структуру, мы уже не в состоянии это поменять.

vesper-bot 26 фев 2019 в 13:46

Тогда жопа, и я бы делал тогда одну ВМ вообще

AlexGluck 26 фев 2019 в 13:49

Вам дали задачу сделать HA кластер самбы и 2 виртуалки. Больше никого не волнует ничего. Только нас, когда мы в углах по ночам плачем от таких задач.

kvaps 26 фев 2019 в 13:58

Вообще если очень хочется в fencing, то можно использовать softdog method, он не идеален но предоставляет хоть какие-то гарантии, при этом не требуя никакого доступа к внешним устройствам или гипервизору.

Проблема в том, что для восстановления по прежнему необходим кворум и хотя бы три виртуалки.

AlexGluck 26 фев 2019 в 13:21

Вам не дали такого интерфейса или вы не можете его во вменяемые сроки реализовать.

amarao 26 фев 2019 в 15:17

Вы, в 2019, не можете выключить виртуалку через API? Мне стыдно спросить, что за систему виртуализации вы используете. Неужели, higan?

AlexGluck 26 фев 2019 в 15:19

Можете погадать, вам всё равно не ответят или не дадут доступа к управлению через апи.

amarao 26 фев 2019 в 15:22

В этой ситуации лучше иметь primary + secondary и переключать руками. Оператор будет выступать в качестве арбитра и у вас будет консистентность.

Я не понимаю людей, которые уверены, что именно у них в этой конфигурации split brain никогда не настанет.

gecube 26 фев 2019 в 19:15

Полностью согласен насчёт Сплита. Пускай тогда будет «горячий» резерв, но вводить — только руками оператора

AlexGluck 26 фев 2019 в 22:24

Хорошая идея и конкурсы интересные) Только доступ оператора на закрытую площадку это 2 рабочих дня) А уж как узнать о том что там что-то сломалось, так это вообще песня.

gecube 27 фев 2019 в 05:37

Доступ оператора — имеется в виду ssh. Этого достаточно, чтобы привести систему в разумное состояние, но уже без отказоустойчивости. А если есть iLo и пр… ну, тогда можно вообще никуда не ездить.

AlexGluck 27 фев 2019 в 18:38

ILO нет, ссш нет, доступ только через физическое пристутствие в цоде.

amarao 27 фев 2019 в 18:50

А от кого вы про split brain узнавать будете? Кластер-то тоже встанет, только в более плохую позу.

AlexGluck 27 фев 2019 в 19:31

Вся суть в том, что от какого нибудь случайного пользователя, потому что иных путей нет. Идиотизм процветает.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий