Pull to refresh
177.96
Rating
Инфосистемы Джет
российская ИТ-компания

Чем СХД отличается от курицы?

Инфосистемы Джет corporate blog System administration *IT Infrastructure *Data storages *
Это история из серии «Записки сервисного инженера». На вопрос ответим чуть позже, а сначала небольшой сказ об одном МАССИВном падении. Недавно в наш Сервисный центр обратился клиент, который решил самостоятельно проапгрейдить массив HDS AMS2000: заменить часть старых дисков на новые большего размера. Со слов заказчика, он вставил новый диск – и один контроллер сломался; вытащил новый диск – и второй контроллер тоже включил аварийную индикацию, а со всех систем пропал доступ к массиву.

Задаем администратору вопросы по его действиям. Выясняется, что именно этот администратор заступил на свою смену уже после того, как решили вытащить новый диск. В итоге массив не включался. Согласно логам с контролеров, контроллеры не могли раскрутить диски, а на дисках отсутствовала какая-либо индикация.

Что же тут могло случиться? Собрали «консилиум» наших сервисных инженеров, стали думать. Первая версия: может быть, при установке диска что-то произошло с дисковым бекплейном и он стал нерабочим? Решили найти шасси массива без контроллеров, чтобы заменить шасси целиком вместе с бекплейном. Не найдя его, попросили заказчика переусадить все диски в шасси с контроллером и попробовать завести массив.

И вот тут-то нас ждал что называется «удар – и катарсис» (и та самая «банановая шкурка», которая уронила всю систему). Выяснилось, что в шасси с котроллером клиент вытащил аккурат первые пять дисков (если вы понимаете, о чем я)! Именно их размер он и хотел увеличить. Все то время, пока предпринимались попытки реанимировать массив, диски были извлечены. Вернули прежние диски на место. И, о чудо, массив включился!

Мораль сей басни проста: только курица может бегать без головы, да и то недолго. В HDS Mid-Range на первых пяти дисках хранится копия конфигурации массива. При загрузке массив сначала пытается раскрутить первые 5 дисков в шасси с контроллером. В случае неудачи (например, из-за отсутствия оных), загрузка останавливается.

Николай Ведяшкин, эксперт Сервисного центра компании «Инфосистемы Джет».
Tags:
Hubs:
Total votes 20: ↑16 and ↓4 +12
Views 12K
Comments Comments 15

Information

Founded
1991
Location
Россия
Website
jet.su
Employees
1,001–5,000 employees
Registered