neznayuktoya 16 авг 2017 в 16:54

Установка и настройка MongoDB на Debian, а также ReplicaSet и пара других мелочей

6 мин

38K

Администрирование баз данных*Системное администрирование*

Из песочницы

Комментарии 16

AutomationD 17 авг 2017 в 05:54

Сколько лет уже прошло, а кластеринг все равно ручной. Ну почему не пойти по стопам Elastic Search или Cassandra, например… А еще про шардинг не слова, там вообще сложность управления кластером увеличивается до небес.
Мне кажется, или это такое у них бизнес-решения для завлечения в MMS?

onyxmaster 17 авг 2017 в 08:38

Рассказать одной машине о соседях это "ручной"? Боюсь представить какой тогда автоматический.

AutomationD 17 авг 2017 в 10:16

А представьте когда у вас десятки или сотни нод в кластере. А представьте когда на каждом сервере может быть по несколько инстансов монги (потому что оптимизируем диск под запись). А представьте когда волатильность кластера высокая (ноды приходят и уходят).

Да, верно, можно вспомнить про управление конфигурациями, но оно в данной ситуации выглядит для меня немного в качестве костыля, в то время как в мире других БД с кластеризацией / шардингом все гораздо более автоматизировано из коробки.

Автоматический, например, используя unicast / multicast. Задал имя кластера и все.
Или, например, используя механизмы service discovery, когда задаешь адрес сервиса где содержиться информация о кластере.

Плюс возможность выбирать мастера через кворум, можно сказать, стандарт в распределенных системах. В монге мaster/slave выбирается тоже кворумом после фелов,, но мастера обязаны назначить мы. Таким образом подход "cattle" превращается в "pets".

Это мои реалии. Но все же, давайте попробуем рассудить, может мои представления о кластеризации не реалистичны?

jsirex 17 авг 2017 в 11:37

В монге мастера назначать не надо. После выхода из строя мастера происходит голосование и выбор нового мастера автоматически.

multicast удобная штука, но не всегда доступен.
unicast — заставит вас всё равно мейнтейнить список. в принципе для своего кластера сгенерил json, в котором описана топология.
+ есть ещё набор инструментов для развёртывания разных кластеров буквально кнопками, но он платный на сколько мне известно.

Я бы сказал, что у монги с этим всё не так уж и плохо.
Как выяснилось, у того же постгреса всё намного печальнее. Но там и типа базы другой, можно понять.

AutomationD 17 авг 2017 в 11:50

По поводу назначения мастера, да, это происходит лучше чем в MySQL. Но мы должны изначально задать Primary. Нельзя взять 3 пустых сервера и обезличенно развернуть. Голосование — да, работает вполне стабильно.
Разворачивать приходится все, я выбрал вариант Ansible, но раздражает что нужно решать кто primary. А дальше — съем бекапов (откуда? — как мы узнаем о том, кто primary а кто нет? — нужен тогда always-secondary? ). При включённом шардинге можно использовать mongos на самом сервере съёма бекаров. Работает ок. Но тогда гемор с воссоединением частей кластера ещё выше. короче хочу чтобы было master-master sharding/replication как в Elsstic Search, чтобы можно указать на члена кластерам и все работало само. Ведь, как видно сегодня, это возможно.

По набору инструментов — да, это тот самый MMS о котором я говорил. Это отдельный облачный продукт (не плохой). Но о чем я пытался сказать что это выглядит несколько низковато выносить такие вещи в платные продукты.

jsirex 17 авг 2017 в 11:59

Но мы должны изначально задать Primary

Может, мы одно и тоже по-разному понимаем, но:
1. Ничего вы не должны.
2. Берём три сервера (будущая реплика). На любом делаем инициализацию.
3. И можно сразу скормить весь конфиг, не делая rs.addWhatEver().
4. Готово.
Возможно, не стоит делать инициализацию на будущем арбитре. Я, чтобы наверняка работало, подключался только к тем серверам, которые могут стать мастером в будущем. Этого достаточно.
У меня было так N серверов для master/slave + 1 сервер арбитер. Я подключался к первому попавшемуся из N и делал rs.conf, скармливая весь список. Реплика инициализируется и работает.

AutomationD 17 авг 2017 в 19:28

Думаю вцелом мы говорим об одном и том же. И Вы правы — это более-менее упрощает независимую конфигурацию репликасета, но на сколько можно упростить конфигурацию шардинга?

neznayuktoya 22 авг 2017 в 10:50

Вообщем-то как раз после прочтения статей про шардинг и сравнения с нашими хотелками было принято решение пристальнее смотреть в сторону Эластика.

andjel 17 авг 2017 в 10:41

А что будет если сделать mongorestore на репликасет? Восстановит?
На каком узле делать?

jsirex 17 авг 2017 в 11:39

Если у вас только репликасет. можете — заставит просто лить в мастер, а слэйвы скопируют всё.
Можно указать replicaset connection string в виде: rsName://host1:port1,host2:port2… — тогда драйвер сам разберётся. Но мне так делать не приходилось. Я восстановление обычно в роутер произвожу. Опять же с шардированным кластером не всегда так можно.

andjel 17 авг 2017 в 11:48

Спасибо за ответ.
А про роутер можно по-подробнеее?

jsirex 17 авг 2017 в 11:52

Это для шардированного кластера.
Сервера собираются в репликасет. Репликасеты собираются в общий кластер. Роутер — точка входа, балансер, прокся, вроде бы умел функции агрегации и возможно что-то от map reduce. Но тут боюсь соврать. Лучше почитать доки. Они реально неплохие. Можно потратить 6-8 часов и полностью разобраться что там у монги есть.

andjel 17 авг 2017 в 11:55

Как раз то, что было интересно — спасибо.
Просто не собирал еще шардированный кластер.
Соглашусь насчет док у монги.

AutomationD 17 авг 2017 в 19:26

А еще удобно роутер запихнуть на клиент, тогда вообще кластер полностью энкапсулируется!

AutomationD 17 авг 2017 в 11:51

Да, на сколько помню все будет ок. Главное делать на primary. А реплика должна синхронизировать.

neznayuktoya 22 авг 2017 в 10:49

Исходя из моего опыта, если делать рестор, то нода просто вываливается на время из реплики(на время восстановления), после чего в зависимости от приоритетов — либо становится primary и репликация идёт с неё, либо secondary, но тогда при реплакации вотановленные данные будут автоматически затерты новыми.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий