Это история из серии «Записки сервисного инженера». На вопрос ответим чуть позже, а сначала небольшой сказ об одном МАССИВном падении. Недавно в наш Сервисный центр обратился клиент, который решил самостоятельно проапгрейдить массив HDS AMS2000: заменить часть старых дисков на новые большего размера. Со слов заказчика, он вставил новый диск – и один контроллер сломался; вытащил новый диск – и второй контроллер тоже включил аварийную индикацию, а со всех систем пропал доступ к массиву.
Задаем администратору вопросы по его действиям. Выясняется, что именно этот администратор заступил на свою смену уже после того, как решили вытащить новый диск. В итоге массив не включался. Согласно логам с контролеров, контроллеры не могли раскрутить диски, а на дисках отсутствовала какая-либо индикация.
Что же тут могло случиться? Собрали «консилиум» наших сервисных инженеров, стали думать. Первая версия: может быть, при установке диска что-то произошло с дисковым бекплейном и он стал нерабочим? Решили найти шасси массива без контроллеров, чтобы заменить шасси целиком вместе с бекплейном. Не найдя его, попросили заказчика переусадить все диски в шасси с контроллером и попробовать завести массив.
И вот тут-то нас ждал что называется «удар – и катарсис» (и та самая «банановая шкурка», которая уронила всю систему). Выяснилось, что в шасси с котроллером клиент вытащил аккурат первые пять дисков (если вы понимаете, о чем я)! Именно их размер он и хотел увеличить. Все то время, пока предпринимались попытки реанимировать массив, диски были извлечены. Вернули прежние диски на место. И, о чудо, массив включился!
Мораль сей басни проста: только курица может бегать без головы, да и то недолго. В HDS Mid-Range на первых пяти дисках хранится копия конфигурации массива. При загрузке массив сначала пытается раскрутить первые 5 дисков в шасси с контроллером. В случае неудачи (например, из-за отсутствия оных), загрузка останавливается.
Николай Ведяшкин, эксперт Сервисного центра компании «Инфосистемы Джет».
Задаем администратору вопросы по его действиям. Выясняется, что именно этот администратор заступил на свою смену уже после того, как решили вытащить новый диск. В итоге массив не включался. Согласно логам с контролеров, контроллеры не могли раскрутить диски, а на дисках отсутствовала какая-либо индикация.
Что же тут могло случиться? Собрали «консилиум» наших сервисных инженеров, стали думать. Первая версия: может быть, при установке диска что-то произошло с дисковым бекплейном и он стал нерабочим? Решили найти шасси массива без контроллеров, чтобы заменить шасси целиком вместе с бекплейном. Не найдя его, попросили заказчика переусадить все диски в шасси с контроллером и попробовать завести массив.
И вот тут-то нас ждал что называется «удар – и катарсис» (и та самая «банановая шкурка», которая уронила всю систему). Выяснилось, что в шасси с котроллером клиент вытащил аккурат первые пять дисков (если вы понимаете, о чем я)! Именно их размер он и хотел увеличить. Все то время, пока предпринимались попытки реанимировать массив, диски были извлечены. Вернули прежние диски на место. И, о чудо, массив включился!
Мораль сей басни проста: только курица может бегать без головы, да и то недолго. В HDS Mid-Range на первых пяти дисках хранится копия конфигурации массива. При загрузке массив сначала пытается раскрутить первые 5 дисков в шасси с контроллером. В случае неудачи (например, из-за отсутствия оных), загрузка останавливается.
Николай Ведяшкин, эксперт Сервисного центра компании «Инфосистемы Джет».