infobox 25 июл 2014 в 10:37

Облачная инфраструктура InfoboxCloud запущена в Амстердаме. Технические детали инсталляции

4 мин

4.3K

Комментарии 33

pavelodintsov 25 июл 2014 в 11:56

О, крутота :) А куда бэкапите многотерабайтные пулы Cloud Storage? Какая конфигурация у «Storage nodes. Отдельный вид серверов, используемый для бекапов вне Cloud Storage»?

pavelodintsov 25 июл 2014 в 11:58

«Перезагрузка занимающая от нескольких секунд (в случае использования контейнерной виртуализации)» — самое быстрое, что может выдать vzreboot (кривоватый аналог reboot less reboot) — это около 15 минут на ровно такой же конфигурации, от запуска команды ребута до подъема последнего контейнера.

pavelodintsov 25 июл 2014 в 12:00

Как у вас работает бэкап силами PCS/PVA?

pavelodintsov 25 июл 2014 в 12:01

И еще вопрос — PCS/S научился работать с контроллерами Adaptec? Зачем вообще нужны контроллеры для Cloud Storage? Они используются как HBA?

Используется ли рекомендованное вендором SSD кэширование?

infobox 25 июл 2014 в 13:14

PCS/S научился работать с контроллерами Adaptec?

Да, научился.

Зачем вообще нужны контроллеры для Cloud Storage? Они используются как HBA?

Да

Используется ли рекомендованное вендором SSD кэширование?

Нет

pavelodintsov 25 июл 2014 в 13:15

Тогда как Adaptec оказался в Dell? Dell такую конфигурацию 100% поддерживать и собирать не будет. Это самособор?

infobox 25 июл 2014 в 13:30

Нет, используются сервера Dell с поддержкой. В статье была неточность, исправлена.

pavelodintsov 25 июл 2014 в 14:21

В комментах значит та же самая неточность? То есть PCS/S так и не умеет Adaptec?

infobox 25 июл 2014 в 14:39

Нет, в комментах все верно. Adaptec использовался в другой локации.

infobox 25 июл 2014 в 13:13

Cloud Storage кластер очень надежен и не имеет точки отказа, поэтому в дополнительном бекапе всех данных нет необходимости. Однако пользователь может включить резервное копирование своего облачного сервера и оно будет выполняться на хосты вне Cloud Storage.

-1

pavelodintsov 25 июл 2014 в 13:16

А первая строка из гайда по интеграции PCS:S говорит «БЭКАПЬТЕСЬ НА ОТДЕЛЬНЫЙ НЕЗАВИМИСИМЫЙ МАССИВ» =)

infobox 25 июл 2014 в 13:58

Есть конечный пользователь, есть админ. Для конечных пользователей есть конкретный функционал бекапа. Админ же в свою очередь сам решает, что бэкапить или не бекапить в зависимости от требований, предъявляемых к его инфраструктуре. Гайд к PCS, это гайд для админов. Эта строчка, для несознательных админов, Которые не делают бекапов компонентов администрирования. Мы делаем.

-2

Denssss 25 июл 2014 в 13:24

>>однако использование 2х локаций InfoboxCloud позволяет создавать решения, при которых даже перезагрузка, занимающая от нескольких секунд (в случае использования контейнерной виртуализации) до нескольких минут (в случае использования виртуальных машин) прошла незамеченной для критичных к доступности проектов.

А как у вас связаны обе локации и чем осуществляется репликация или бесшовная миграция клиентского инстанса между локациями?

infobox 25 июл 2014 в 13:51

Обе локации независимы. Непрерывная репликация всех клиентов облака сделала бы цену на услугу фантастически большой из-за стоимости каналов между локациями. Однако если программная система клиента готова к работе на распределенных виртуальных серверах — она может работать надежно и между несколькими локациями. В критически важных системах необходимо предусматривать такой вариант в самой архитектуре используемого ПО. В самом простом примере клиенты легко могут выполнять репликацию своих баз данных в другую локацию и переключаться на нее при необходимости.

Denssss 25 июл 2014 в 14:54

А как же смена IP-адресов и вся работа с DNS?

infobox 25 июл 2014 в 16:10

Фактически при доступности одного ДЦ решения типа Virtual IP не нужны из-за Cloud Storage. Дата-центр имеет много аплинков, электропитание резервируется + используйте DNS с низким TTL.

Denssss 25 июл 2014 в 18:53

>> В самом простом примере клиенты легко могут выполнять репликацию своих баз данных в другую локацию и переключаться на нее при необходимости.
При такой конфигурации и независимых локациях у инстансов будут разные IP и при переключении с одного на другой будет даунтайм на время обновления DNS-кэша. Разве нет?

infobox 26 июл 2014 в 00:02

будет, если один дата-центр уйдет в офлайн, где установлен балансировщик в cloud storage. Мы используем надежные дата-центры.

pavelodintsov 26 июл 2014 в 14:58

Бррр, трижды перечитал Ваш пост. Virtual IP работает в пределах ДЦ и если ДЦ, куда он привязан кувыркнется — кувыркнется и услуга. Как Вы предлагаете защищать доступность сервиса на случай вылета либо первого либо второго ДЦ? Фраза про надежные ДЦ — звучит по меньшей мере странно, ДЦ, которые не падали целиком — на планете можно пересчитать по пальцам.

pavelodintsov 25 июл 2014 в 13:27

А Ариста классная… хотеть такую вместо домашнего свича :) Как она в боевых условиях?

infobox 25 июл 2014 в 13:31

отлично себя показывает

GAS_85 25 июл 2014 в 14:42

хотеть такую вместо домашнего свича

Что вы дома все такое делаете, что такой свитч нужен?

pavelodintsov 25 июл 2014 в 14:53

Высоконагруженный сетевой софт тестируем — fastnetmon :) К сожалению, не дома, в ДЦ, дома было бы удобнее, но у меня же нет такого крутого свича! :)

vazic 25 июл 2014 в 23:38

Главный сетевой вендор для решений, где нужна минимальная задержка. Например электронные биржи

Denssss 25 июл 2014 в 14:50

>>Для централизованного управления и мониторинга используется Parallels Virtual Automation (PVA), интегрированная с Cloud Server. В сферу ответственности PVA входит управление и мониторинг физических серверов: добавление, группировка, вывод из эксплуатации, управление пулами IP–адресов, бекапы управляющих хостов, мониторинг в реальном времени ресурсов каждого физического сервера.

Насколько я знаю, PVA не умеет бэкапить управляющую хост-ноду… Да и ведь у PSC:S нет точки отказа? И «функция» мониторинга тоже весьма сомнительна, так как нет никакой системы оповещения…

infobox 25 июл 2014 в 15:20

У Parallels Cloud Storage нет единой точки отказа. Отказать может управляющий хост, который бекапируется. Он не является частью Cloud Storage и не влияет на сохранность данных пользователей. Мы используем не просто Cloud Server + Storage, а PACI + дополнительные собственные инструменты.

amarao 25 июл 2014 в 15:49

Есть, это софт. Одинаковая копия софта с одинаковыми багами, работающая на всех узлах. Возникает условие (високосная секунда, 30 февраля, просто «так байты сложились») — и вся конструкция складывается. Синхронно.

infobox 25 июл 2014 в 16:33

1. Софт проходит тщательное тестирование и в Parallels и у нас
2. ПО обновляется не синхронно на всех хостах. Есть возможность раннего обнаружения проблем до их влияния на пользователей.
3. Есть возможность бекапа вне Cloud Storage для пользователей.
4. Мы не обновляем одновременно обе локации.
5. Точка отказа все-таки есть — планета Земля. В данном случае речь идет про возможность выхода из строя оборудования и надежной работы при этом.
Люди не идеальны и не научились создавать идеальные вещи и технологии в принципе, но научились делать вычислительные системы гораздо более надежными, чем раньше.

amarao 25 июл 2014 в 16:38

Софт проходит бла-бла-бла. Извините, но мы все помним, как vmware выключила нафиг все виртуалки у всех клиентов из-за бага в сервере лицензий.

При обновлении обновляется микроскопическая часть кода. Большая часть кода не меняется годами — и баги там могут жить тоже годами и десятилетями. Например, недавно был устранён баг в BSD (в той самой, первой), который существовал 20+ лет.

Я же говорил про другое: у любой кластерной системы есть фатальная проблема — это синхронные ошибки в синхронном коде.

Так что говорить про отсутствие единой точки отказа не стоит. «Нет единой точки отказа в оборудовании» — больше поверю.

infobox 25 июл 2014 в 16:40

Само собой, об этом и написали. В статье поправим. Спасибо.

pavelodintsov 29 июл 2014 в 15:54

Stray bug crashes one node after the other:

vazic 25 июл 2014 в 23:33

А как балансировка нагрузки выполнена? (https)

infobox 26 июл 2014 в 00:05

https балансировка запланирована в будущих релизах облачного ПО. Сейчас для https можно самостоятельно настроить балансировщих внутри виртуальной машины

Зарегистрируйтесь на Хабре , чтобы оставить комментарий