Вышел шестой номер журнала ЦОДы.РФ
Эксплуатация ЦОДа: ахиллесова пята?
Как известно, ни один договор SLA не покрывает убытков от серьезной аварии в ЦОДе. А причиной 70 % инцидентов в дата-центрах, по статистике, является человеческий фактор, т. е. ошибки персонала. Но стоит ли винить только персонал ЦОДа в случившихся происшествиях? Не лучше ли организовать процесс эксплуатации так, чтобы свести к минимуму число инцидентов и смягчить последствия от их наступления? Этот вопрос стал темой февральского выпуска журнала «ЦОДы.РФ».
Эксплуатация может внести разную «лепту» в уровень отказоустойчивости дата-центра. При плохой организации процесса эксплуатации можно существенно понизить уровень надежности ЦОДа. Однако известны примеры площадок, которые в реальной жизни функционируют без единого сбоя, в соответствии даже с более высоким уровнем устойчивости, чем было заявлено при проектировании объекта. При правильном проектировании и построении ЦОДа с разумным подходом к его эксплуатации инцидентов в дата-центрах практически не бывает.
Конечно, пресловутый «человеческий фактор» полностью устранить невозможно. Но, как отмечает Грег Шерри, эксперт международного уровня в области эксплуатации ЦОДов, зачастую проблема кроется не в конкретных исполнителях, а в качестве управления. Многие операторы, например, зачастую скрывают информацию о происшествиях. А иначе пришлось бы признаться в отсутствии плана выхода из аварийной ситуации, нерегулярности тестирования оборудования или даже в том, что проект был выполнен не на должном уровне, а обучению персонала уделялось мало внимания.
Чтобы обеспечить безопасность эксплуатации ЦОДа, нужно учесть, какие процедуры используются и какие факторы их сопровождают: работа в авральных условиях (а значит, перегрузки и усталость персонала); недостаток знакомства с оборудованием; слабая мотивация; нездоровая рабочая обстановка в коллективе и проч., и проч. В некоторых дата-центрах присутствует пагубная культура обвинений, за которой стоит нечеткое разделение зон ответственности. А наложение неблагоприятных факторов лишь увеличивает риск возникновения аварийной ситуации.
Другая сторона вопроса — это стоимость ЦОДа, которая складывается из капитальных затрат и длительных инвестиций в эксплуатацию. При правильной организации служба эксплуатации может превратиться в структуру, помогающую сократить расходы на эксплуатацию дата-центра.
Методология определения рисков в различных рабочих ситуациях в ЦОДе постоянно совершенствуется. Но, к сожалению, ни ГОСТа, ни документов ANSI, посвященных канонам эксплуатации ЦОДов, пока не существует — имеются лишь рекомендации на основе лучших практик, разработанные различными некоммерческими организациями. Впрочем, на российском рынке ситуация в течение ближайших лет может кардинальным образом измениться. Российская Ассоциация участников отрасли ЦОДов в качестве первоочередной своей задачи ставит разработку системы национальных стандартов в области строительства и эксплуатации дата-центров.
В номере, который читатель держит в руках, много полезной информации посвящено не только эксплуатации дата-центра, но и его проектированию. В рубрике «Проектируем ЦОД» российские компании SUNLINE Engineering и Ayaks Engineering представили свои решения по консолидации дата-центра потенциального заказчика.
Еще один материал — фотоэкскурсия в новый ЦОД «МИРАН-2» петербургской компании МИРАН — обещает никого не оставить равнодушным. В основе проекта, выполненного специалистами SUNLINE Engineering, использовался модульный принцип. Разработчик и производитель модуля, составляющего основу этого красивого инженерного решения, — российская компания GreenMDC, в линейке продуктов которой есть несколько вариантов модулей для наружного и внутреннего применения.
Надеемся, что этот номер надолго задержится в вашей коллекции. Впрочем, как и все остальные номера «ЦОДы.РФ»
Наталья Жилкина, главный редактор
С полным содержанием номера Вы можете ознакомиться на сайте ЦОДы.РФ №6