Выбирая IaaS-провайдера, основное внимание компании уделяют характеристикам облака. Они оценивают доступность, возможности масштабирования и др. Однако за работоспособность любой виртуализированной среды отвечает «железо», установленное в дата-центре. По большей части от этой инфраструктуры (и места, где она размещается) и зависит надежность облачных сервисов.

Сегодня мы решили рассказать, на какие моменты при оценке параметров дата-центра IaaS-провайдера следует обратить внимание.


/ фото Arthur Caranta CC

Уровень надежности и резервирование


В первую очередь при оценке ЦОД IaaS-провайдера следует обратить внимание на резервирование инженерной инфраструктуры, в частности, систем электропитания. Так как именно этот параметр влияет на уровень доступности, то есть время непрерывной работы без сбоев.

Для оценки уровней резервирования можно использовать классификацию Uptime Institute.

  • Tier 1 — в этом случае схема резервирования отсутствует (N). Надежность зависит от каждого отдельного элемента инфраструктуры, а сбой в одной единице оборудования приводит к простою всего ЦОД.
  • Tier 2 — подразумевает схему резервирования N+1. К N элементам инфраструктуры добавляется один дополнительный, снижая риски сбоев.
  • Tier 3 — схема резервирования также N+1, но с возможностью параллельного проведения технических работ.
  • Tier 4 — резервирование 2N. Когда каждый элемент дублируется аналогичным.

Классификация Tier предполагает, что инженерные системы считаются единым целым. Если хотя бы один из компонентов не зарезервирован, уровень отказоустойчивости UI сни��ается. Чем выше Tier, тем выше доступность. Однако надо понимать, что в классификация UI нет «худших и лучших». Нельзя сказать, что во всех ситуациях подойдёт какой-то один Tier. Поэтому выбирать провайдера с ЦОД, имеющим тот или иной уровень резервирования, нужно отталкиваясь от задач, стоящих перед компанией.

Крупным организациям, простои в работе для которых нежелательны, имеет смысл обратить внимание на ЦОД с резервированием 2N. Например, по этому пути пошли в Facebook. Дата-центр компании, расположенный в шведском городе Лулео, имеет резервирование 2N. Энергетические системы дата-центра Сбербанка в «Сколково» зарезервированы аналогичным образом.

Однако в ряде случаев такая система может быть избыточной. Так как чем выше Tier, тем дороже обходится аренда оборудования облачного провайдера. Поэтому компаниям, для которых простой ИТ-инфраструктуры и сервисов в течение одного часа в год некритичен, стоит выбирать дата-центр с меньшим Tier.

Например, IaaS-провайдер «ИТ-ГРАД» размещает оборудование в дата-центрах DataSpace (Москва) и Xelent (Санкт-Петербург). Это ЦОД с классом Tier III, время простоя у которых составляет порядка полутора часов в год. В них резервирование сделано по схеме N+1. Например, на московской площадке непрерывное электропитание обеспечивают две городские подстанции по шести независимым линиям. В дата-центре установлены шесть независимых трансформаторов по 2 МВА, каждый из которых является точкой присоединения независимой электрической цепи.

В случае форс-мажоров и перепадов напряжения возможное отключение одной ветки электропитания никак не отражается на работе системы в целом, так как вся нагрузка переводится на резервную ветку. В качестве «запасного плана» имеются автоматические дизельные генераторы с 6 баками топлива по 950 литров. При полной загрузке резервный запас обеспечит дата-центру 84 часа непрерывной работы.

Поддержание микроклимата


Следующий важный аспект — оценка работы «холодильных установок» ЦОД. Способность систем охлаждения поддерживать оптимальный микроклимат в машинном зале сказывается на надежности «железа», величине потребляемого электричества и, соответственно, ценнике за предоставляемые услуги по размещению оборудования.

Например, при повышении температуры в ЦОД с 22°C. до 35°C, энергопотребление серверов возрастает в среднем на 20%. А как пишут представители общества инженеров ASHRAE, занимающегося разработкой стандартов в сфере коммуникаций и оценки качества воздуха, температуры ниже 18 °C и выше 27 °C могут значительно снизить выходную мощность и время жизни батарей систем бесперебойного питания (страница 29 отчета).

Однако также нужно учитывать, каким именно образом в ЦОД поддерживается необходимая температура. Так как если эффективность системы охлаждения будет низкой, она будет расходовать большое количество электроэнергии. В некоторых случаях на кондиционирование тратится до 40% всего энергопотребления дата-центра. Это, в свою очередь, сказывается на счетах за аренду оборудования.

Поэтому часто для контроля микроклимата и температуры воздуха в ЦОД используют технологию «свободного охлаждения» (или фрикулинга). Она позволяет снизить энергопотребление. По последним данным, на российском рынке лучший показатель энергоэффективности функционирования ЦОД (PUE) имеет дата-центр Xelent — он составил 1,29. Рекордсменом в этой сфере считается ЦОД компан��и Google — ИТ-гиганту удалось достичь значения PUE в 1,11.

В дата-центре Xelent температурный режим для всего ИТ-оборудования поддерживается в соответствии с рекомендациями ASHRAE. За микроклимат в дата-центре отвечает роторный теплообменник. Это большое пятиметровое колесо, обеспечивающее передачу тепла из машинных залов ЦОД на улицу практически без конвекции воздуха.

Нужно учитывать и то, как в ЦОД, обеспечивается заданный уровень влажности. Образование конденсата может быть опасно для серверного оборудования и привести к его порче. Как это и случилось с первым ЦОД Facebook в Прайнвилле, где ошибки в работе системы микроклимата привели к попаданию жидкости на оборудование. В серверной буквально пошел «конденсатный дождь». Оборудование пришлось экстренно отключить. В ASHRAE отмечают, что уровень влажности в ЦОД не должен превышать 60%. В случае с Facebook этот показатель достиг 95%.


/ фото Tim Dorr CC

Физическая безопасность


Сегодня есть дата-центры, расположенные в подземных бункерах, вход в которые охраняют вооруженные солдаты. Есть ЦОД, защищенные от ядерных взрывов или ЭМИ. Однако чаще всего их используют крупнейшие транснациональные компании или военные структуры. Для большинства организаций такие меры являются излишними и экономически невыгодными. Однако вопрос безопасности и физического проникновения остаётся актуальным для всех.

Есть три момента, которые нужно учитывать: пропускной режим, наличие видеокамер и сигнальных датчиков по периметру, защищенность «клеток» с серверными стойками. Пожалуй, лучший способ проверки каждого из них — экскурсия в дата-центр. Так вы сможете самостоятельно оценить, насколько сложно проникнуть в машинные залы того или иного ЦОД.

Например, дата-центр Xelent на входе имеет систему контроля доступа. Все посетители и автомобили досматриваются на пропускном пункте. Также все, кто проходит на территорию ЦОД (включая сотрудников), в обязательном порядке регистрируются. На самой территории «раскиданы» две сотни видеокамер, которые мониторят обстановку в серверной. Доступ же в машинные залы возможен только в сопровождении работников дата-центра, имеющих спецкарты доступа (это могут быть карты-ключи или биометрические карточки).

При проверке физической защиты машинных залов оценивайте не только защищенность периметра и серверных, но и пожарную безопасность на объекте. Например, ЦОД DataSpace использует систему сверхраннего обнаружения пожара. Датчики по всему зданию оценивают пробы воздуха, что позволяет предупредить возгорание. В дата-центре используется безопасная оборудования газовая система пожаротушения, которая в случае ЧП позволяет свести размер возможного ущерба к минимуму.

Подведем итоги


При оценке надежности ЦОД облачного провайдера следует сделать следующие вещи:

  • Обратите внимание на резервирование инженерной инфраструктуры. От неё зависит уровень доступности. Выбирайте необходимую схему резервирования в зависимости от требований и задач компании.
  • Оцените систему охлаждения и поддержания микроклимата в машинном зале. Хорошо, если дата-центр использует технологии, направленные на снижение показателя PUE. Так, ЦОД тратит больше электроэнергии на проведение вычислений, а не на охлаждение серверов, что экономит деньги клиентов.
  • Внутри ЦОД должна быть организована физическая защита серверных помещений (охрана, противопожарные системы тушения, видеонаблюдение), и прописаны строгие процедуры допуска посетителей на территорию.

Однако защищенность и надежность ЦОД определяют не только физические меры безопасности, но и программное обеспечение: файрволы, механизмы защиты от DDoS, шифрование данных и др. Об этих аспектах мы расскажем в нашем следующем материале.



P.S. Еще несколько материалов из Первого блога о корпоративном IaaS:


P.P.S. Свежие посты из нашего блога на Хабре:




Основное направление деятельности компании ИТ-ГРАД — предоставление облачных сервисов:

Виртуальная инфраструктура (IaaS) | PCI DSS хостинг | Облако ФЗ-152 | Аренда 1С в облаке