Pull to refresh

Про блоки питания NONAME, или краткий экскурс в устройство служебной информации дисков Western Digital

Reading time 3 min
Views 42K
Мы продолжаем цикл публикаций о дисках одного из немногих оставшихся производителей НЖМД — Western Digital и их проблемах. Сегодня на операционном столе WD5000AAKS-00S9B0, семейства Dragon Fly III.



Со слов клиента, от предыдущего администратора ему достался парк рабочих станций с некачественными noname-блоками питания Made In China, случаи выхода из строя дисков по этой причине уже были, но предыдущие накопители, в отличие от этого, важных данных не содержали.

Как обычно — “только вчера диск работал исправно”, а сегодня стал определяться в BIOS как WDC-ROM MODEL-DF3-PL2K, и объемом 232Gb.

Получив винчестер на диагностику перво-наперво проверили плату электроники на предмет возможных повреждений (http://habrahabr.ru/company/hardmaster/blog/251263/) и подали питание на диск. На запрос get ID в поле паспорта “высветился” заводской псевдоним. Здесь необходимо сделать небольшое отступление и рассказать, в чем обычно заключается причина такого поведения дисков WD архитектуры Royl.

В тех случаях, когда диск, при комплексной инициализации, не может прочитать критичные для нормального старта модули служебной информации (Service Area), накопитель переходит в так называемый, Kernel Mode, отдавая только код семейства из ПЗУ, а паспортные данные (которые, на самом деле, лежат в SA) – отдаются вот такой вот «рыбой». Или не отдаются вообще.



Вроде бы все понятно – проблемы с чтением SA, пора искать вышедшую из строя голову. Но указанный диск, отдавая такой паспорт, в Kernel Mode НЕ находился. Как минимум программный код (оверлеи) прочитаны и загружены в ОЗУ. Это уже интересно. Если инициализация пошла – значит модули в служебной области в принципе читаются. И причину отдачи такого «кривого» паспорта надо искать где-то в другом месте.

Здесь необходимо сделать еще одно отступление и немного рассказать о структуре служебной информации “Вестернов”.

Для того, чтобы диск смог работать с модулями служебной информации, ему необходимо знать, где, в каких секторах, эти модули находятся. Описать их координаты призван самый первый модуль SA, находящийся по смещению, прописанному в ПЗУ – это id00 DIR.

Паспорт диска и его основные рабочие параметры описаны в модуле по соседству – это id02 — Drive Configuration.

На этом с теоретическими рассуждениями закончим и, поскольку у нас (по меньшей мере) присутствуют проблемы с паспортом диска, посмотрим, какое же содержимое id02 пациента:



Очевидно, что никаких паспортных данных тут и близко нет. А как же так? И куда делся оригинальный id02? Вопросов много.

Следующим шагом мы проверили наличие в памяти диска всех необходимых оверлеев, нужных для работы по АТА, и запустили специальную процедуру, которая сканирует SA, и по сигнатурам, находит в ней модули.



И даже DIR нашелся. Предположим, что найденное – это несколько не то, что отдает нам диск в обычном режиме. Настроим утилиту по найденному DIR и попробуем получить доступ к SA с помощью него.



Вот и ответ на вопрос «куда делся оригинальный id02». Он никуда не девался и находится на своем месте. А вот его координата в DIR – запорчена.

На всякий случай, резервируем все найденные модули, а также полностью всю SA единым дампом. Пробуем писать id02 в то место, которое указано в DIR, передергиваем питание, диск корректно проинициализирован и готов к снятию с него данных в штатном режиме:



Что же случилось, спросите вы?

В процессе работы диск периодически обновляет некоторые модули. Это SMART, дефект-листы и т.д. Скорее всего, в момент очередного обновления какого-то из этих модулей, произошел выброс по питанию, обусловленный низким качеством примененного БП, и запись произошла не в искомый модуль, а в DIR, “удачно” подпортив координату id02 в нем. Пока содержимое id02 находилось в ОЗУ диска, все работало нормально, а после рестарта по питанию случился полный швах.

Для инженера, обладающего достаточными знаниями по внутреннему устройству дисков Western Digital — это не очень сложная работа. В данном случае пришлось потратить около получаса, с момента приемки диска в работу, до получения доступа к “поляне” (пользовательским данным). Но, в современных условиях тотальной экономии на всем, на чем только можно, последствия зачастую бывают гораздо более печальными. Здесь и прогоревшие платы и вылетевшие коммутаторы БМГ в гермозоне. Данные обычно восстанавливаются, но достаточно обидно осознавать, что когда-то сэкономленные $20 теперь привели к потере денежной суммы, объемом примерно в 50 раз выше.
Tags:
Hubs:
+46
Comments 57
Comments Comments 57

Articles

Information

Website
www.hardmaster.info
Registered
Founded
Employees
2–10 employees
Location
Россия