Search
Write a publication
Pull to refresh
130.28
ua-hosting.company
Хостинг-провайдер: серверы в NL до 300 Гбит/с

Человеческие ошибки, проектирование и простои

Reading time3 min
Views18K
Если одной из лидирующих причин в падении ЦОД является человеческий фактор, то почему мы тратим так много времени на уровневую классификацию и построение рейтингов дата центров? Конечно, проектирование имеет важное значение в обеспечении надежности, но это ничтожно мало в сравнении с людьми, процессами, эксплуатацией и техническим обслуживанием, жизненным циклом оборудования и стратегиями по снижению риска.



Людские ошибки ведут к риску сбоя в работе любого ЦОД, так почему же мы продолжаем выдумывать новые меры предосторожности, заранее зная результат? Разве не пришли мы в этой достаточно молодой отрасли к пониманию того, что человеческие ошибки неизбежны, и попытки исправить первопричины этих ошибок слишком сложны? Эта мысль привела к сверх резервированию и пустой трате ресурсов, в результате чего вспыхнули споры между лидерами этого рынка о том, что на самом деле скрывается за ранжированием.

Система ранжирования


Уровневая классификация в индустрии традиционно считалась ориентиром в стандартах проектирования и надежности ресурсов. ИТ-директора в поисках дата центра для своих организаций обращаются к этой классификации, формируя представление о предполагаемой надежности ЦОД. Однако опрометчиво слишком сильно полагаться на этод метод. Гораздо более важны результаты, полученные на базе реальных данных из центров обработки данных.

Возможно, не стоит игнорировать «наиболее вероятные» причины сбоев в попытках спроектировать систему в обход человеческого фактора. Можно достаточно уверенно утверждать, что управленческая и операционная часть влияет намного больше, чем класс дата центра. Ранжирование и любые сопряженные проекты – это еще не гарантия надежности.

До недавнего времени надежность ЦОД определялась избытком возможностей и мощностей, принуждая клиентов к организации лишних резервов и как следствие – пустой трате ресурсов в процессе работы. Сегодня экономика выступает против такого подхода, заметен сдвиг индустрии к более прогрессивному видению надежности дата центров: проектирование под конкретные задачи, объединенное с управленческими системами мирового класса.

Как свести к минимуму влияние человеческого фактора в ЦОД


Человеческая ошибка является крупнейшим «вкладчиком» в простой центров обработки данных. Этот простой может быть дорогостоящим. В среднем, большая компания может потерять порядка 100 000 фунтов всего за минуту простоя. В таких масштабах, час простоя может фактически подтолкнуть компанию к банкротству. Итак, как Вы справляетесь с человеческими ошибками в ЦОД? Вот несколько советов, чтобы свести их к минимуму:

Правильные показатели

Убедитесь, что все оборудование и машины имеют надлежащую маркировку на них, чтобы проиллюстрировать правильную последовательность действий, которые необходимо выполнить на них.

Строгие эксплуатационные указания

Важно иметь руководство пользователя или руководство по использованию для объекта в целом. Убедитесь, что это руководство доступно всему персоналу, так что он может ссылаться на него в периоды чрезвычайной ситуации, и действовать самым оптимальным образом.

Периодические учения

Реакция сотрудников должна периодически анализироваться и оцениваться путем проведения учений и репетиции возможных чрезвычайных ситуаций, которые могут произойти. Это позволит персоналу быть более подготовленному в подобных ситуациях.

Мониторинг и наблюдение

Убедитесь, что движение и местонахождение каждого сотрудника тщательно контролируют таким образом, чтобы предотвратить его несанкционированный доступ к конфиденциальной информации.

От проектирования к эксплуатации


Несмотря на перемены, очень большую важность несет в себе проектирование дата центров, которое всё же остаётся лишь малой частью в обеспечении высокой доступности. Необходимо уделять больше времени программе «Печати одобрения управления и эксплуатации» (Management and Operations Stamp of Approval Program) Института аптайма (Uptime Institute). Исследования в этой области должны продолжаться. Почему? Потому что после того, как ЦОД спроектирован и построен, он неизбежно управляется людьми. Ни один известный на сегодняшний день проект не может предотвратить вмешательство человека.

Нельзя просто взять и решить эту проблему переброской ресурсов или проектированием. Ее можно решить, создав организационную структуру, которая снизит или полностью устранит вмешательство человеческого фактора. Однако это не так просто. Поощрение собственности, технологическая дисциплина, соблюдение процедур, обучение и благоприятные условия работы создадут рабочий набор в головах Вашей команды, что позволит Вашему центру обработки данных развить максимальный потенциал независимо от ранжирования.

Наконец, итоговая оценка успешности Вашего ЦОД предельно проста: годы обеспеченной Вами непрерывной бесперебойной работы, несмотря на количество случившихся у Вас внеплановых перебоев. Акцентируя внимание на эксплуатационном мышлении и организационной стратегии, можно получить весьма длительный период бесперебойной работы. Это не вопрос удачи, не вопрос проектирования, это стратегия.
Tags:
Hubs:
Total votes 20: ↑14 and ↓6+8
Comments0

Articles

Information

Website
ua-hosting.company
Registered
Founded
Employees
11–30 employees
Location
Латвия
Representative
HostingManager