
Дата-центры оцениваются по уровням отказоустойчивости от I до IV. Эти уровни бывают TIA (не требующие проверки, просто по заявлению) и Uptime Institute (с жесткой сертификацией). TIER III предполагает возможность работы при выходе из строя любого из узлов в любом месте инфраструктуры. Если это труба с хладагентом — должна быть вторая такая же. Если это топливный бак, то должен быть второй запасной. Если это охлаждение — должны быть резервы по чиллерам N+1 и т.п.
Сначала это соответствие уровню TIER III устанавливалось по проекту. Мы защищали документацию: грубо говоря, инженеры Аптайма «зачёркивали» любой узел и смотрели, сможет ли работать остальное. Этот квест проходят многие.
Следующий шаг — пройти сертификацию по готовому объекту, то есть подтвердить соответствие документации и принципам отказоустойчивости уже на реализованном объекте. Это самое сложное в России, потому что заявить в плане и построить — две большие разницы. Особенную прелесть процессу добавляли заказчики, которые уже принесли на площадку свой продуктив. Поэтому пройденная проверка — очень круто.
Третий шаг — мы получили сертификацию по эксплуатации. То есть подтвердили, что команда и все процессы соответствуют принципам Uptime. Таких ЦОДов в России всего 2 штуки.