Эксплуатация ЦОДа: ахиллесова пята?



Как известно, ни один договор SLA не покрывает убытков от серьезной аварии в ЦОДе. А причиной 70 % ин­цидентов в дата-центрах, по стати­стике, является человеческий фактор, т. е. ошибки персонала. Но стоит ли винить толь­ко персонал ЦОДа в случившихся происше­ствиях? Не лучше ли организовать процесс эксплуатации так, чтобы свести к минимуму число инцидентов и смягчить последствия от их наступления? Этот вопрос стал темой февральского выпуска журнала «ЦОДы.РФ».

Эксплуатация может внести разную «леп­ту» в уровень отказоустойчивости дата-цен­тра. При плохой организации процесса экс­плуатации можно существенно понизить уровень надежности ЦОДа. Однако извест­ны примеры площадок, которые в реальной жизни функционируют без единого сбоя, в соответствии даже с более высоким уровнем устойчивости, чем было заявлено при проек­тировании объекта. При правильном проек­тировании и построении ЦОДа с разумным подходом к его эксплуатации инцидентов в дата-центрах практически не бывает.

Конечно, пресловутый «человеческий фактор» полностью устранить невозмож­но. Но, как отмечает Грег Шерри, эксперт международного уровня в области эксплу­атации ЦОДов, зачастую проблема кроется не в конкретных исполнителях, а в качестве управления. Многие операторы, например, зачастую скрывают информацию о проис­шествиях. А иначе пришлось бы признаться в отсутствии плана выхода из аварийной си­туации, нерегулярности тестирования обо­рудования или даже в том, что проект был выполнен не на должном уровне, а обучению персонала уделялось мало внимания.

Чтобы обеспечить безопасность эксплуа­тации ЦОДа, нужно учесть, какие процедуры используются и какие факторы их сопро­вождают: работа в авральных условиях (а значит, перегрузки и усталость персонала); недостаток знакомства с оборудованием; слабая мотивация; нездоровая рабочая об­становка в коллективе и проч., и проч. В не­которых дата-центрах присутствует пагуб­ная культура обвинений, за которой стоит нечеткое разделение зон ответственности. А наложение неблагоприятных факторов лишь увеличивает риск возникновения ава­рийной ситуации.

Другая сторона вопроса — это стоимость ЦОДа, которая складывается из капиталь­ных затрат и длительных инвестиций в экс­плуатацию. При правильной организации служба эксплуатации может превратиться в структуру, помогающую сократить расходы на эксплуатацию дата-центра.

Методология определения рисков в раз­личных рабочих ситуациях в ЦОДе постоян­но совершенствуется. Но, к сожалению, ни ГОСТа, ни документов ANSI, посвященных канонам эксплуатации ЦОДов, пока не су­ществует — имеются лишь рекомендации на основе лучших практик, разработанные раз­личными некоммерческими организациями. Впрочем, на российском рынке ситуация в течение ближайших лет может кардиналь­ным образом измениться. Российская Ас­социация участников отрасли ЦОДов в каче­стве первоочередной своей задачи ставит разработку системы национальных стандар­тов в области строительства и эксплуатации дата-центров.

В номере, который читатель держит в ру­ках, много полезной информации посвяще­но не только эксплуатации дата-центра, но и его проектированию. В рубрике «Проекти­руем ЦОД» российские компании SUNLINE Engineering и Ayaks Engineering представили свои решения по консолидации дата-центра потенциального заказчика.

Еще один материал — фотоэкскурсия в новый ЦОД «МИРАН-2» петербургской компании МИРАН — обещает никого не оставить равнодушным. В основе проек­та, выполненного специалистами SUNLINE Engineering, использовался модульный принцип. Разработчик и производитель модуля, составляющего основу этого кра­сивого инженерного решения, — россий­ская компания GreenMDC, в линейке про­дуктов которой есть несколько вариантов модулей для наружного и внутреннего при­менения.

Надеемся, что этот номер надолго задер­жится в вашей коллекции. Впрочем, как и все остальные номера «ЦОДы.РФ»

Наталья Жилкина, главный редактор

С полным содержанием номера Вы можете ознакомиться на сайте ЦОДы.РФ №6