Как стать автором
Обновить
Selectel
IT-инфраструктура для бизнеса

Уроки пожара в дата-центре OVH: кто виноват и что делать бизнесу

Время на прочтение3 мин
Количество просмотров8.1K

В марте прошлого года в результате пожара во французском ЦОДе SBG2 пострадали 3,6 млн сайтов. Наконец вышел официальный отчет о происшествии, и в этом материале мы разберем, как бизнесу научиться доверять дата-центрам, а также поговорим о лучших практиках пожарной безопасности.

Что случилось с SBG2


В ходе расследования были установлены множественные нарушения правил пожарной безопасности, допущенные еще на стадии проектирования. 

Деревянные перекрытия без должной огнезащитной пропитки и неправильная конструкция вентиляции помогли огню быстро распространиться по зданию из энергоотсека. Первое, что нужно сделать в такой ситуации — обесточить оборудование. На это ушло порядка трех часов, поскольку конструкция не предполагала централизованного отключения систем. Возможно, автоматическая система пожаротушения смогла бы победить огонь или хотя бы минимизировать урон оборудованию, но ее не оказалось вовсе. В большинстве стран Евросоюза собственник здания может взять на себя подобные риски, поэтому отсутствие автоматики не противоречит нормам.


Пожарные прибыли на место через 40 минут и столкнулись с неочевидной проблемой: компания не внесла ЦОД в список объектов повышенной важности, поэтому рядом оказался только один гидрант, не обеспечивающий нужный расход и напор воды. 

Тем временем огонь перекинулся на соседний ЦОД SBG1. Объект пострадал настолько, что позже компания примет решение не восстанавливать его. Стоит заметить, что хранение резервных копий осуществлялось на этом же объекте.


После таких потрясений бизнес задается вопросом: как убедиться, что выбранный провайдер не допустит таких же ошибок?

Что делать бизнесу


Перед размещением данных в ЦОДе можно ознакомиться с описанием систем безопасности, которые используются на объекте. Узнать, прекращает ли работу поддержка, в случае эвакуации сотрудников из дата-центра. Спойлер: саппорт следует разместить в другом здании.


Полезно получить информацию о самих зданиях, в которых находятся дата-центры.

Здесь преимущество часто оказывается за компаниями, которые сами строят ЦОДы и понимают потенциал определенных конфигураций. Например, хорошей практикой является разнесение серверных друг от друга и поддержка герметичности помещений. В серверных также не должно быть каких-либо инструментов или шкафов с материалами, чтобы не увеличивать пожарную нагрузку.

Установка ДГУ.

Неправильная вентиляция может буквально раздуть пожар. Система не должна быть единой для всего объекта, иначе будет сложно локализовать возгорание. Вместе с системой вентиляции также должна быть установлена система дымоудаления.

Интерес вызывает сам способ пожаротушения. Спор часто ведется между технологией газового подавления горения и тонкораспыленной водой. У каждого из этих способов есть особенности.

Панель управления ДГУ

В отдельных случаях клиентам можно записаться на личную экскурсию. В Selectel гостей проводят по серверным зонам, показывают аккумуляторную и систему пожаротушения. В соответствии с требованиями СНиПов и федеральных законов, система оповещения на объектах срабатывает автоматически. То есть дежурному не нужно звонить в службу и сообщать о проблеме. Службы сами видят сигнал и приезжают на место. Когда персонал получает подтверждение, что все сотрудники эвакуированы (расчетное время 4 мин), запускается герметизация помещений. Через минуту они заполняются газом, не поддерживающим горение.

Серверные и распределительные помещения для оптики дополнительно оборудованы системой аспирации. Она выявляет в воздухе продукты горения еще до того, как сработает пожарная автоматика.

Если бы экскурсия в ЦОД была текстом:

→ О том, как работает система мониторинга в дата-центрах, можно узнать здесь

→ Как мы прошли через терни и создали DCIM-систему Racks для контроля оборудования на разных объектах.

Безопасная и стабильная работа ЦОДов — это не только надежное оборудование, но и высокая экспертиза сотрудников и подрядчиков.

Человеческий фактор


Самая продуманная и защищенная система бессильна перед человеческим фактором.

Каждый сотрудник ИТО, перед тем как выйти на первую смену в дата-центр, проходит обучение от 4 до 9 месяцев в зависимости от квалификации специалиста.

Поскольку ЦОДы обслуживаются круглосуточно, необходимо всегда иметь «скамейку запасных». В этом смысле у опытных инженеров на объектах существует практика не есть одинаковую еду.

Баллоны с хладоном 125.

Даже если мониторинг показывает, что все хорошо, каждые 3 часа на объектах осуществляется полный обход. Обход проходит по определенному маршруту, чтобы отследить тренды оборудования. По любым изменениям показателей формируется прогноз, регламентирующий порядок мер реагирования.

Опыт OVH поучителен во многих смыслах. Стоит больше интересоваться тем, как хранятся данные. Запрашивать документы и изучать открытую информацию о ЦОДах. Для провайдеров — это красная тряпка и сигнал о том, что наравне с пожарной автоматикой стоит инвестировать в развитие команд обслуживания.

Теги:
Хабы:
+42
Комментарии22

Публикации

Информация

Сайт
selectel.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия
Представитель
Влад Ефименко