NetAngels Apr 13 2017 at 11:33

Отказоустойчивый кластер для балансировки нагрузки

8 min

60K

«NetAngels» corporate blog*nix*Nginx*Server Administration*

Recovery Mode

+12

Comments 16

kvaps Apr 13 2017 at 11:58

Спасибо за статью, очень познавательно!

Расскажите, вы пробовали СlusterIP?
Очень интересно сравнение обоих методов, какие плюсы и минусы у LVS по сравнению с СlusterIP?

redfs Apr 13 2017 at 12:04

Если у вас возникли вопросы по статье или что-то показалось спорным — пожалуйста, оставляйте свои комментарии, будем рады обсудить.

Спорного тут есть, давайте обсудим.
Навскидку — для горизонтального масштабирования схема неоптимальна. Если уж вы используйте VRRP, то для балансировщика проще прописать два VIP в DNS, каждый из keepalived будет одновременно работать и как MASTER и как BACKUP (зеркально). Если один из них упадет, его VIP переедет на соседний сервер. И не надо никаких дополнительных скриптов с пробросом портов.
Более подробно схема описана например тут.

NetAngels Apr 13 2017 at 19:15

Согласны с Вами, тоже рабочий вариант.

Однако, на наш взгляд, при таком варианте могут возникнуть потенциальные сложности с настройками персистентности в будущем. Например, в самом простом случае не получится отправлять каждый отдельный IP на один и тот же конечный сервер с приложением. Т.е., в зависимости от работы DNS, запрос может уходить на разные конечные сервера, проходя через разные балансеры. Если при этом конечные сервера ничего друг про друга не знают, могут появиться ошибки с сессиями и т.п.

В предлагаемом нами решении можно включить настройки персистентности на уровне LVS и на уровне Nginx, что в итоге позволит закрепить каждый отдельный IP за конкретным конечным сервером.

Т.е, нам кажется, что наш вариант в этом плане более универсальный.

pfactum Apr 13 2017 at 12:10

Для балансировки DNS UDP есть специализированные решения типа dnsdist'а или dnsbalancer'а.

NetAngels Apr 13 2017 at 14:46

Спасибо, будем иметь их ввиду.

Если говорить про наш внутренний DNS, то основное, что нам был нужно — это чтобы DNS продолжал работать, если один их backend серверов упадет или мы сами его выключим. Нам оказалось достаточно возможностей Nginx.

pfactum Apr 13 2017 at 15:51

Если не секрет, какая нагрузка? Интересует количество DNS-запросов в секунду, которые пропускает через себя балансировщик, и объём этого трафика в мегабитах.

NetAngels Apr 13 2017 at 19:13

Нагрузка там минимальная. В пиковые моменты, когда запускаются всякие "ночные" скрипты по крону, бывает около 150-200 запросов в секунду.

pfactum Apr 13 2017 at 19:39

А, ну это не очень серьёзно. Мне хотелось посмотреть, как nginx ведёт себя на десятках тысяч QPS, ибо те специализированные балансеры на такую нагрузку и рассчитаны.

UFO just landed and posted this here

NetAngels Apr 13 2017 at 14:00

Пока мы не встречали никаких проблем именно с работой протокола VRRP и его реализацией в Keepalived.

Были некоторые нарекания именно к работе Keepalived. Не всегда корректно отрабатывал механизм reload (версия 1.2.2, в wheezy). Приходилось именно перезагружать, со всеми вытекающими.

А с сетевым оборудованием проблем не было. Тот сегмент сети, где обитает VRRP трафик, состоит из обычных коммутаторов (L2). Плюс мы помещаем трафик разных VRRP групп в разные vlan'ы.

Будем признательны, если Вы сможете поделиться с нами опытом касательно возможных проблем.

UFO just landed and posted this here

NetAngels Apr 13 2017 at 14:51

Немного непонятно из вашего комментария, о чём конкретно вы говорите. Давайте вы уточните и мы продолжим беседовать? А проблемы могут возникнуть и не только из-за VRRP.

UFO just landed and posted this here

sshikov Apr 14 2017 at 21:36

А где такой, простейший в общем-то, случай, когда один или несколько серверов server-1, server-2 и т.д. недоступны? Причем вообще говоря, они могут быть недоступны как полностью, так и частично.

porutchik Apr 16 2017 at 17:00

Непонятно, зачем dns резервировать. Он же отказоустойчивый по природе своей.

Aristarkh Apr 17 2017 at 09:33

Чтобы уменьшить время простоя сервиса при недоступности одного dns-сервера. К тому же, некоторые сервисы чувствительны к задержкам и отваливаются по таймауту до того, как начнется опрос второго dns-сервера.