Эксплуатация дата-центра, серверной чем-то напоминает езду по автомобильной дороге. Когда дорога пустая, то можно рискнуть и ездить против правил, и ничего страшного не случится. Но как только на дороге появляется много машин, любой неверный маневр, незамеченная яма или колдобина могут привести к аварии. Похожая ситуация с дата-центрами и серверными: чем больше загруженность, тем выше цена ошибки.
Сегодня расскажу про ошибки в проектировании, строительстве и эксплуатации, из-за которых в дата-центре может произойти авария.
Не совсем праздничными выдались последнии дни декабря для телекоммуникационного гиганта Vodafone, который расположен недалеко от города Лидс в Йоркшире, на реке Эйр (Англия).
В конце декабря из-за постоянных ливней Великобританию накрыло наводнение в ряде районов Ланкашира и Йоркшира, в Манчестере и Лидсе реки вышли из берегов. Метеослужбами было выдано более чем 300 предупреждений о наводнениях в Англии, Шотландии и Уэльсе. Многие подстанции были выведены из строя и тысячи жителей остались без света, было закрыто большинство автомагистралей, прервано железнодорожное сообщение с Шотландией. Последствия, разбушевавшейся стихии, напрямую коснулись и британской серверной фермы Vodafone.
Продолжая тему аварий на серверных фермах. Причины ухода в офлайн мощных инфраструктур дата-центров весьма различны: перебои в электроснабжении, неполадки в системах охлаждения, работе резервного дизель-генератора, в оборудовании, ненадлежащее техническое обслуживание этого же оборудования и т.п. Не стоит забывать и о человеческом факторе.
Как говорится, на ошибках учатся, и хорошо если не на своих. Операторы серверных ферм могут извлечь полезные уроки о том, как подготовится к потенциально возможной аварии, устранить ее последствия, да и вообще избежать каких-либо промахов, которые влекут за собой немалые потери.