Как стать автором
Обновить

Экономия на спичках или восстановление данных из скрежещущего HDD Seagate ST3000NC002-1DY166

Время на прочтение9 мин
Количество просмотров35K
Всего голосов 59: ↑58 и ↓1+57
Комментарии95

Комментарии 95

Данные пациентов говорите… пришел я как-то в травмпункт в начале года, так мне направление на рентген распечатали на половинке А4, на обратной стороне которого была титульная страница карты какого-то больного с ФИО, телефоном, адресом, номером страховки и вроде паспортом. Видимо закончилась бумага в принтере и в ход пошли черновики… А вы про деньги на систему хранения данных…
Я какое-то время обслуживал принтеры для поликлиник (ремонт, замена расходников, но не бумаги). Так вот, зачастую, при наличии бумаги в поликлинике и свободному к ней доступу у персонала, они все равно пытались её экономить.
догадайтесь — «почему?»
а потому что потом на родительском собрании в школе можно гордо встать и сказать «я могу на работе распечатать! БЕСПЛАТНО!»
не нести же потом распечатки на «черновиках» — это ж позорище на весь класс на несколько лет сразу!
Кое-где «черновики» требуют повторно использовать. У нас периодически тоже кто-нибудь такую рацуху пытается протолкнуть.
Передо мной лежит (лежало) два результата моей флюрографии с одного и того же аппарата где доза облучения отличалась в 10 разСудя по всему нулем больше, нулем меньше напечатаь — пофиг.
Если это два разных снимка, то возможно они были сняты в разных режимах работы установки (например, один снимок в режиме флюорографа, а другой в режиме полноценного рентгеновского аппарата).
не растраивайтесь
зачем хранить эти рентгены, их пациенты выбрасывают почти сразу
99% материала обычно не является критически важным, но есть исключения.

Срок хранения твёрдых копий аналоговых изображений составляет 2 года при отсутствии патологии и 5 лет для снимков, отражающих патологические изменения. Снимки больных детей хранятся 10 лет*.
Это связано с тем, что состояние больного человека развивается со временем и старые снимки бывают полезны в специфических случаях а в общем случае — важнее свежие снимки.




*Проект Приказа Министерства здравоохранения РФ "Об утверждении Правил проведения рентгенологических исследований" (подготовлен Минздравом России 03.12.2016).
Есть и хорошие новости: хотя в этом новом проекте правил рентгенологических исследований и регламентируются только сроки для твёрдых копий, но наличие сервера в рентгенлаборатории уже предусмотрено. Со временем и до облачного хранения дойдёт дело.
По идее, неотключаемое прозрачное фоновое автоматическое резервное копирование ещё и должно было предусматриваться в самом ПО для АРМ рентгенлаборанта, причём оно должно было быть сделано с учётом сроков хранения — хотя и регламентируются пока только сроки для твёрдых копий. О пациенте поликлиника всё равно знает его дату рождения и дату съёмки — поэтому может автоматически делать копии снимков до 5 лет и снимков детей, размещая их в разных местах диска.

Здравствуйте! Не первый раз читаю ваши success-story. Не могу не спросить, вот в этом случае, как на картинке, у винта были какие-нибудь шансы или уже бесполезно пытаться? Утром ушел на работу, вернулся через 9 часов, винт стучит. Выключил, выкрутил, повез в лабораторию. Прислали фотку, сказали, что вероятность какого-либо восстановления нулевая. Это правда, или попытаться стоило?
Фотография
Здравствуйте. При подобных запилах, как на вашем фото, обычно шансы около нуля.
НЛО прилетело и опубликовало эту надпись здесь
А про сигей — купил, почти новый диск начал тупить на запись. Сервис денег не вернул, ибо читалось все хорошо.

таких историй от пользователей можно услышать про любого производителя.
А смарт что-то показывал до этого?
На рисунке №2 что за интересная конструкция полукруглая над пластинами?
Разделитель. Его задачи рассекать потоки воздуха, чтобы снизить шумы. Кроме это происходит отвод тепла.
Здравствуйте! Мне последнее время не дает покоя один вопрос, связанный с HDD. Где-то месяц назад я купил новый ноутбучный диск WD Black. В том что он новый нет никаких сомнений: лично разрезал запечатанный антистатический конверт с силикагелем. Показатели SMART после первого запуска также показывали, что это было первое включение (атрибуты start/stop count, power cycle count и power-on hours count). Но! С момента первого включения атрибут BF (Shock sense) равен 4. И я теряюсь в догадках, это какие-то последствия заводских тестов? Никаким ударам диск не подвергался (при первом запуске, когда впервые всплыла эта 4, был в ssd отсеке десктопа, стоящего на полу). С тех пор BF не растет. Если вы работали с такими дисками, нет ли у них такой особенности что BF имеет ненулевое значение прямо с завода?
Здравствуйте. Ненулевого значения в новом диске не встречалось. Полагаю в вашем счетчик прирос на этапе между первым запуском и первым запуском программы просмотра показаний SMART. Современные диски весьма «нежные» порой чуть более сильный стук пальцами по клавишам воспринимается как ударные нагрузки и фиксируется в BF
Вооще первое правило — если винт еще откликается, но уже сбоит и постоянно рекалибруется — заморозить его. Да. Буквально. Засунуть в морозилку, опустить температуру существенно ниже комнатной. После этого _обычно_ они и грузятся и данные читаются, пока он не прогреется. Я так вытащил данные с нескольких винтов, которые уже даже не грузились.
Насчёт SMART — ни разу не помогло. SMART или молчит или выдает false positives. А вот что помогает — обдув винчестеров и контроль температуры, — ни в коем случае нельзя допускать нагрева свыше 40С.
Это довольно очевидно из картинки головки, которая нагревается резистором. Планирует она в зависимости от разницы температур — головки и поверхности диска. Чем горячее диск, тем меньше помогает прогрев головок. Получаем касание со всеми вытекающими.
Вооще первое правило — если винт еще откликается, но уже сбоит и постоянно рекалибруется — заморозить его.

далеко не во всех случаях это будет полезно.
Насчёт SMART — ни разу не помогло. SMART или молчит или выдает false positives.

Смотря как за ним смотреть и трактовать показатели. Если ждать, чтобы накопитель на команды 0xB0 0xDA начал сообщать, что уже все плохо, то чаще SMART будет бесполезен, а если реагировать на первые признаки по RAW полям, то чаще можно успеть скопировать данные без особых затруднений.
далеко не во всех случаях это будет полезно


Я не понял. Вы это пробовли во всех случах и в некоторых это не помогло, или просто высказываете своё мнение, которое не опирается на опыт?

Всё что я посоветовал — это мой опыт. Этот способ мне помог. Надеюсь кому-то еще поможет.

Смотря как за ним смотреть и трактовать показатели.


Нормальный протокол не допускает разной «трактовки». SMART 0 позволяет что-то трактовать так или иначе. Отсюда простовй вывод SMART не является нормальным протоколом. Каждый производитель наворотил что-то своё. Общие подходы не работают. Во всяком случае, мне не известны такой способ чтобы достоверно определить что диску плохо и он уже скоро скажет алаверды, независимо от производителя. Если вам известны — изложите. Будет полезно всем ознакомиться.
Нормальный протокол не допускает разной «трактовки»
Блеск. А ничего, что мы тут обсуждаем вещи, которые в принципе не могут однозначно что-либо трактовать?

Во всяком случае, мне не известны такой способ чтобы достоверно определить что диску плохо и он уже скоро скажет алаверды, независимо от производителя.
Они собственно, никому не известны. Если бы были известны — никакие «протоколы» были бы не нужны, просто можно было бы на этикетке диске при продаже писать «динск #12345, прикажет долго жить 5 сентяюря 2019 года, будьте осторожны».

Этот способ мне помог. Надеюсь кому-то еще поможет.
То есть когда вы даёте советы, которые могут привести к проблемам (несмотря на то, что вам они помогли) — это нормально. Если это делает кто-то другой, то виноваты разработчики винтов, протоколов, кто угодно, кроме раздолбая забывшего про бекапы!
Я не понял. Вы это пробовли во всех случах и в некоторых это не помогло, или просто высказываете своё мнение, которое не опирается на опыт?

Мы проверяли множество различных слухов. Учитывая огромную донорскую базу, у нас есть возможность экспериментировать с накопителями. Рекомендация бездумно морозить накопитель выйдет боком, так как при многих проблемах это как мертвому припарка. Кроме этого лишние попытки старта для полумертвого могут стать последними. Картинка с запилом, как на рис. 2 тоже может стать следствием действий пользователя над еще неокончательно умершим накопителем. Также имеет место негативное влияние в виде образования конденсата.

При коммерческом оказании услуги кому-либо морозить накопитель нельзя, учитывая все риски. Другое дело, если это ваш личный накопитель, на котором нет ценных для Вас данных. Тогда можно экспериментировать. Умрет окончательно, так умрет. Отдаст данные — хорошо, не потребуется заново качать с торрентов.

Всё что я посоветовал — это мой опыт. Этот способ мне помог. Надеюсь кому-то еще поможет.
хорошо бы пояснять опыт с инженерной точки зрения и также указывать на риски, которые с ним сопряжены.
Нормальный протокол не допускает разной «трактовки».
для начала S.M.A.R.T. не протокол. Какие протоколы используются в общении с накопителями можно прочитать в документации АТА стандарта.
Общие подходы не работают. Во всяком случае, мне не известны такой способ чтобы достоверно определить что диску плохо и он уже скоро скажет алаверды, независимо от производителя. Если вам известны — изложите. Будет полезно всем ознакомиться.

Общие подходы есть. И более того в публикации даже содержится ссылка на материал про SMART. Где описывается его устройство, как получаются показатели из накопителя и как они трактуются. А также указан набор атрибутов показатели которых желательно контролировать по RAW полям.
Если диск. По
SMART
smartctl 6.5 2016-05-07 r4318 [i686-linux-4.11.4-pmagic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.14 (AF)
Device Model: ST500DM002-1BD142
Serial Number: Z2AJ5YD2
LU WWN Device Id: 5 000c50 03f8cb051
Firmware Version: HP73
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Thu Jul 13 11:13:27 2017 CDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 592) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 77) minutes.
SCT capabilities: (0x103b) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 114 099 006 Pre-fail Always - 66948328
3 Spin_Up_Time 0x0023 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 435
5 Reallocated_Sector_Ct 0x0033 073 073 036 Pre-fail Always - 8968
7 Seek_Error_Rate 0x002f 084 060 030 Pre-fail Always - 324950068
9 Power_On_Hours 0x0032 070 070 000 Old_age Always - 27068
10 Spin_Retry_Count 0x0033 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 433
180 Unknown_HDD_Attribute 0x002b 100 100 000 Pre-fail Always - 1207497011
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0033 100 100 097 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0 0 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 071 053 045 Old_age Always - 29 (Min/Max 28/29)
194 Temperature_Celsius 0x0022 029 047 000 Old_age Always - 29 (0 14 0 0 0)
195 Hardware_ECC_Recovered 0x003a 060 033 000 Old_age Always - 66948328
196 Reallocated_Event_Count 0x0032 073 073 036 Old_age Always - 8968
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Interrupted (host reset) 90% 1 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
8968 ремапов. Но статус не Bad. Какой вообще логикой руководствуются производители, если в таком состоянии диск считается нормальным?
Пока есть место в G-list будут выполнять ремапы. Как количество дефектов в G-list достигнет максимально возможного для данной микропрограммы количества, то статус по SMART станет BAD.
hddmasters
Рекомендация бездумно морозить накопитель выйдет боком, так как при многих проблемах это как мертвому припарка.

Где же вы нашли в моих рекомендациях «бездумно морозить»?
Только когда вы слышите частые заходы на термокалибровку, когда запил НЕ образовался или ЕЩЕ только образуется. Физический смысл — очень прост — когда механика холодная головке намного проще парить от сравнительно небольшого нагрева подогревателя. А когда вокнуг жара 40 и сами винт раскален до 50-55, каков будет зазор парящей головки и вероятность запила? Про деформацию дисков при нагреве тоже не забываем. При охлаждении, надо подчеркнуть, деформация НЕ образуется — тоже довольно элементарно, т.к. материалы сжимаются при охлаждении, в отличие от нагрева, когда диск теряет плоскость. IBM пока еще выпускала deskstar довольно плотно занималась этой проблемой.
Поэтому еще раз спрашиваю — вы пробовали сами? Если нет — ваши возражения — как сферический конь в вакууме, не основаны ни на чем. Мой опыт — скромен, но успешен.
для начала S.M.A.R.T. не протокол

вы, конечно, умный человек, отличаете протокол от непротокола. Но грань здесь тонкая, т.к. SMART подразумевает передачу данных, имеющих некую физическую интепретацию. Есть формат запроса. Есть формат ответа. Про АТА — откровенно слабоватое возражение, потому что SMART работает далеко не только на АТА дисках, и вообще появился не на АТА дисках впервые, да будет вам известно.
Но в любом случае — проблема вовсе не о том, что SMART — это протокол или «метод». Whatever. Проблема в отсутствии общей интерпретации, и именно об этом речь. Насчёт статьи… Ох. Больше смахивает на «новье» времен второй половины 90х. Скажите лучше как быть вот с этим?
en.wikipedia.org/wiki/S.M.A.R.T.
Standards and implementation
Lack of common interpretation
Many motherboards display a warning message when a disk drive is approaching failure. Although an industry standard exists among most major hard drive manufacturers, issues remain due to attributes intentionally left undocumented to the public in order to differentiate models between manufacturers.
From a legal perspective, the term «S.M.A.R.T.» refers only to a signaling method between internal disk drive electromechanical sensors and the host computer. Because of this the specifications of SMART are entirely vendor specific and, while many of these attributes have been standardized between drive vendors, others remain vendor-specific. SMART implementations still differ and in some cases may lack «common» or expected features such as a temperature sensor or only include a few select attributes while still allowing the manufacturer to advertise the product as «SMART compatible.»

И эта проблема существует примерно с 95г и до сих пор не решена. Каждый производитель гонит свои счётчики со своим «улучшенным» набором данных. А базовые показатели в большинстве случаев меняются, если вообще меняются, когда уже слишком поздно.
Смотрю SMART(HDD).
Read error rate >140млн
Seek error rate >190млн
Reallocated sector count = 0.
Для второго диска:
Read error rate >120млн
Seek error rate >60трлн
Reallocated sector count = 0.
Диски пора менять? Если да, то что можете посоветовать, объемом >=1тб. Диски используются для различных проектов. Ко второму диску обращаюсь очень редко.
Если никаких стуков нет, тест чтения поверхности проходит без каких-либо затруднений, то оснований для замены нет. Говоря о SMART пишите пожалуйста производителя и модель диска. Например Seagate будет помещать в SMART события об ошибках чтения и позиционирования во время работы и естественно эти показатели ежедневно будут расти, так как отражают реальную картину. Другие производители предпочитают не стимулировать рост показаний этих атрибутов и не фиксировать большинство событий.
Спасибо.
Первый: ST1000DM003-1ER162
Второй: ST500LM000-SSHD-8GB
Seagate в отличии от других производителей фиксирует ошибки в 1 и 7 атрибуте и весьма скурпулезно, отсюда такие огромные цифры в RAW полях. Ничего страшного в этих цифрах нет. Смотрите остальные рекомендованные параметры. Особое внимание 5 и 197.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Ошибки чтения есть у всех жестких дисков и весьма массово. Но емкости ЕСС достаточно для коррекции ошибок. Микропрограммы накопителей других производителей не фиксируют эти события. Микропрограммы Seagate фиксируют. Особенно это хорошо заметно на жестких дисках Seagate, где присутствует атрибут 0xC3 (195) Hardware ECC Recovered. В них атрибуты 0x01 и 0xC3 растут синхронно.
Если у Вас серьезные проекты — сделайте софтовое зеркало хотя бы.
Сперва надо озаботиться бэкапами. Зеркало можно потом, по остаточному принципу.
Спорный вопрос. Смотря чего Вы боитесь больше — вирусов или поломки винта.
Если второго — то зеркало лучше и делается проще/быстрее.
А вот потом уже можно бекапами отполировать систему.
Бэкап спасает от всего, в том числе и от поломки винта.
А зеркало вообще не спасает. Зеркало нужно для уменьшения времени простоя в случае смерти оборудования, не более. Потому для сохранения информации бэкап первостепенную важность имеет, а зеркалами надо по остаточному принципу заниматься. То есть иметь их неплохо, но всяко не за счет бэкапа.
Зеркало спасает как раз от поломки винта, при этом Вы имее полную копию своей инфы и софта.
У Вас даже работа не остановится если один винт из зеркала умрет.
Бекап Вам не поможет в таком случае.
Смотря как у вас винт помер. Если одномоментно пропал — то да, поможет. А вот в случае протяженной деградации есть шансы отзеркалить битые файлы на второй винт.

У Вас даже работа не остановится если один винт из зеркала умрет.

Вот это и называется «обеспечение бесперебойности».

Бекап Вам не поможет в таком случае.

Как настроите, так и будет.
А с показаниями смарта на ssd-ных дисках есть какой-то опыт работы?
От себя добавлю к списку атрибутов, которые неплохо бы мониторить, собственно температуру дисков — позволяет на ранних стадиях заметить засоренную вентиляцию, предсмертное состояние кулеров и т.п.
А с показаниями смарта на ssd-ных дисках есть какой-то опыт работы?

Есть, но пока предпочту пособирать статистику проблем и показаний, а после будет выражено в виде небольшой заметки-рекомендации.
От себя добавлю к списку атрибутов, которые неплохо бы мониторить, собственно температуру дисков

данный атрибут я не описывал, так как это единственный атрибут, который основная масса пользователей, получивших показания SMARТ, адекватно оценивает.
НЛО прилетело и опубликовало эту надпись здесь
смертны внезапно,
хуже того, бывают смертны группой — два подряд или три. Это из-за общих причин и главная — плотная установка, плохой обдув и в результате — перегрев.
40С — импирически установлено — критическая температура для HDD. Нельзя ее превышать никак.
Для SSD — пока нет статистики. Судя по технологии и росту отказов флеш памяти при нагреве — я так же не даю SSD нагреваться выше 40С.
По SMART — каждый производитель пихает туда всё что угодно. Нужен обзор и разъяснения производителей. Пока выглядит как мусор. Некоторые программы ставят цветовое сопровождение — типа зеленый — ок, желтый — предупреждение и красный — кирдык. У одного винта с рождения был один показатель желтый. Так он до сих пор желтый уже столько лет. А у недавно сдохшего — всю дорогу всё было зеленое. Сдох — там рассыпался подшипник шпинделя. Судя по дате производства — я как раз попал на «после фукусимы».
Сдох — там рассыпался подшипник шпинделя.

Не совсем корректно «рассыпался». Заклинивать гидродинамический подшипник может из-за перегрева. Устройство подшипника простое: вал (втулка) с каналами для циркуляции смазки и корпус подшипника. Тонка пленка смазки — изолирующий слой уменьшающий потери на трение. Заклинивание вала обычно происходит из-за ударов, которые могут спровоцировать образование некой мини стружки + хорошая температура в итоге происходит практически закупоривание протоков и начинается хорошее трение с большим выделением тепла внутри подшипника, в некоторых случаях доходит чуть ли не до приваривания вала. При мгновенном заклинивании просходит резкая остановка с деформацией вала.
Не могу согласиться. Дискам вредны перепады температур.
Из примеров:
Были много десктопных сигейтов работавших при 45-47 градусов (никогда не опускалась ниже 40 во включенном состоянии). Для них по даташиту максимальная рабочая температура была то ли 50, то ли 55.
До сих пор работает 2.5" Toshiba 1Tb, налет больше 20тыс. часов. Режим 24х7 с редкими отключениями. Температура средняя 53-55 грудусов (по даташиту максимум 55). Были довольно продолжительные периоды до 63 градусов в летнее время.

У меня есть несколько таких тошиб. Тоже макс температура 55 градусов.
Практика показала, что при нагревании до 44 система через пару дней рандомно зависает.
Поставил принудительное охлаждение и температура выше 37 не растёт, аптайм стал до 200 дней(больше не проверял, ребутался для обновлений).
Для себя сделал вывод, что лучше не допускать выше 40 градусов.

Спасибо за статьи! Буду с нетерпением ждать про SSD.
Но пока что меня все еще мучает вопрос, на который не получилось найти адекватного ответа.
Может у вас найдется ответ? https://toster.ru/q/155183
Признаки того, что появляются дефекты, обычно намекает на износ NAND памяти. Но при малом количестве исключенных (блоков, страниц) совсем необязательно, что проблема серьезная. Рекомендация — скопировать данные. Выполнить Security Erase и заново попробовать использовать. Если износ не носит массовый характер, то изделие еще поработает.

По поводу современных жестких дисков могу сказать, что при первых признаках дефектов в 0x05 и 0xС5 лучше не ждать больших цифр, а скопировать информацию заблаговременно.
Естественно. В вопросе я не уточнял, но речи конечно не идет о ценных данных.
Спасибо.
НЛО прилетело и опубликовало эту надпись здесь
Температура один из показателей, который стоит досматривать. Также необходимо помнить, что не только на температуру нужно смотреть.

И стоит учитывать, что некоторые проблемы развиваются лавинообразно. Особенно это касается накопителей у которых состоялся неудачный контакт слайдера с поверхностью (например из-за внешних факторов).
НЛО прилетело и опубликовало эту надпись здесь
Скажем так, изредка повышенная температура винта может говорить о том, что механике кранты и боржоми пить, собственно, уже поздно.
при живом накопителе — это обычно говорит о том, что стоит подумать над организацией системы охлаждения или очистить от пыли текущую.
НЛО прилетело и опубликовало эту надпись здесь
У нас тут кажется полное взаимопонимание ;)

Чуть более развернутый ответ про еще живые накопители.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
hddmasters нет ли у вас опыта работы с новыми сериями seagate? посматриваю на ironwolf серию для домашнего хранилища
Новинки пока требуют обстоятельного исследования и сбора статистики. Как правило в первый год после выхода того или иного накопителя немного их попадает в наши застенки. Сегодня давать комментарии про Ironwolf преждевременно.
Спасибо! Читаю все статьи как хорошие детективы, особенно про грех админа понравилось.

Есть ли интересные данные про серию Constellation ES.3? Например, про ST2000NM0033?
Бывали и такие накопители в работе. Семейство Megalodon. Чего-то особо интересного в них не наблюдалось. Типичные проблемы, как и у всех жестких дисков. Учитывая чуть более высокую цену менее распространены, посему попадаются к нам реже.

Спасибо.


Если можно, еще вопрос. Есть 2 диска WD Green серии WD15EADS-00P8B0, которым уже много лет (точно больше 7). Парковка головок каждые 10 секунд отключена, показатели смарт в норме, ошибка были давно только в UDMA_CRC_Error_Count, после переподключения кабеля все ок. Имеет ли смысл переставать их использовать и заменять на новые или можно использовать, если мониторить SMART?


SMART 1
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   186   179   021    Pre-fail  Always       -       5700
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       384
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   028   028   000    Old_age   Always       -       53108
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       378
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       271
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       122
194 Temperature_Celsius     0x0022   120   101   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART 2
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   181   176   021    Pre-fail  Always       -       5933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       377
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   029   029   000    Old_age   Always       -       52205
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       373
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       269
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       116
194 Temperature_Celsius     0x0022   121   100   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0
Имеет ли смысл переставать их использовать и заменять на новые или можно использовать, если мониторить SMART?

Я бы продолжил использование с контролем показаний. В профилактических мерах бы рассмотрел бы тест чтения всего логического пространства (обязательно наблюдая за ним)

Спасибо! Например, копирование файлов с последующим сравнением с исходником или что-то другое имеете в виду?

Можете использовать бесплатный PC3000DiskAnalyzer и выполнить тест чтения от 0 сектора до последнего.

А, понял, спасибо, тогда викторией прогоню. Меня смутило, что речь шла о логическом пространстве.

Так все сектора с 0 по последний — это и есть логическое пространство для доступа к которому используется Logical Block Adressing, Как можете узреть во многих публикациях карты мини зон по физическим головкам реализующие тот или иной участок логического пространства. Реальная ж адресация с учетом размеров зон, деления на минизоны, резервных треков в каждой зоне, исключенных (дефектных) треков или секторов слишком сложна и слишком сильно отличается у разных накопителей. Посему и придумалось в свое время в АТА стандарте понятие LBA, чтобы дать больше воли производителям устройств. В итоге современные накопители достаточно интересные устройства живущие своей жизнью и реагирующие на запросы из внешнего мира, только в случае, если в работе внутренней микропрограммы, обслуживающей запросы извне, все гладко.

Спасибо за хорошее объяснение. Хоть новых фактов не узнал, но по полочкам уже известные хорошо разложили.

Немного офтопик. НО. Это не экономя на спичках. Это некомпетентность. Для хранения изображений полученных с медицинских аппаратов используют DICOM сервера. Да есть например OpenSource варианты http://www.orthanc-server.com/ Если говорить о коммерческих системах, то цена может легко переплюнуть 10000$

Почему я говорю о некомпетентности. Я сам слышал такую беседу: «А что насчет компьютеров? А что насчет них? Тут все просто. Компьютер в ДНС стоит 8000р. Если что даже мой сын подскажет — он вон учится на физмате и там ничего сложного нет». И все.
Немного офтопик. НО. Это не экономя на спичках. Это некомпетентность.

в данном случае на комплексных решений от производителя сэкномили. А хватило бы одного простого NAS'а с ежедневным резервным копированием. Чтобы подобная неприятность не побеспокоила. И в этом случае изначально задумывались о простых решениях, но из-за постоянного откладывания решения произошло то, от чего нужно было застраховаться.
Интересно, а сколько из этих 3-х терабайт было заполнено?
Предварительно можно сделать вывод, что данный диск использовался только в границах первых 2ТБ, оставшиеся 794,52ГБ не использовались в процессе эксплуатации.

Заполнение используемых 2ТБ было более, чем на 80%
Что касается медицинских учреждений — давно нужно обязать их сгружать первичную документацию, снимки, анализы, заключения, истории — всё до последнего в одно общее облако, с возможностью доступа как для самого пациента, так и из других клиник. Такой гос. проект действительно пошел бы на благо, с учетом нынешнего состояния медицины.
До общего облака — как пешком до луны. Было бы неплохо для начала научиться передавать данные хотя бы внутри одной больницы. Меня пару лет назад в 17ю по ОМС положили, а когда я оклемался и позвонил в страховую — на ДМС перевели. Так мне анализы заново пришлось сдавать! Это внутри одного отделения! Из одного бокса в другое перешел!

А вы говорите — облако.
Имеется ввиду гос. проект, с обязательным требованием к клиникам пользоваться облаком по любому чиху. Это автоматически наладит передачу данных и внутри них.
НЛО прилетело и опубликовало эту надпись здесь
Со скрипом, но внедрится. Первые годы будет так, как Вы говорите, а через 10 лет уже никто и не вспомнит про бумажки.
Без серьезной централизованной проработки это наладит лишь регулярную утечку данных. А профукать их в «обюлаке» не сильно сложнее чем в своем шкафу.
Сделают за многократно завышенный прайс из чего-попало и палок. Это же госпроект.
А можно у вас проконсультироваться?
Есть один диск, этой мой системный диск, и однажды, то ли в результате отключения питания, то ли сам по себе, он выключился с нехарактерным щелчком, после чего в smart появилась вот такая запись (uncorrectable sector count). Это было примерно пол года назад, диск, как работал, так и работает, скорость отличная, переназначенных секторов нет, этот счетчик тоже не увеличивается. Что означает эта ошибка и стоит ли из за нее волноваться? Стоит ли что то предпринимать?
Жесткий диск WD, серия, кажется, RE, вот полное его название: WD2502ABYS.
Ну и попутно вопрос, что можно сказать про smart моего диска? На какие вообще параметры smart обращать внимание в дисках WD?
Скриншот CrystalDiskInfo

Жесткий диск WD, серия, кажется, RE, вот полное его название: WD2502ABYS.

Полное название на скриншоте «WD2502ABYS-01B7A0»
Есть один диск, этой мой системный диск, и однажды, то ли в результате отключения питания, то ли сам по себе, он выключился с нехарактерным щелчком, после чего в smart появилась вот такая запись (uncorrectable sector count).

если из-за аварийного отключения питания, то возможно ничего страшного. Рекомендация скопировать информацию, а после выполнить тест записи всего логического пространства, потом тест чтения, если проблем не будет обнаружено, то можно пользоваться накопителем далее (заново создать раздел(ы) и скопировать информацию обратно)

Спасибо за ответ. А чем можно такой тест произвести?
Копировать диск (для последующего восстановления) лучше программой Acronis True Image или посоветуете что то другое?
И хотелось бы, хотя бы в общих чертах, услышать ответ на это: На какие вообще параметры smart обращать внимание в дисках WD?
Извините за кучу вопросов.
Общие рекомендации по анализу SMART есть. Отдельного акцента на WD нет нужды делать.
А чем можно такой тест произвести?

можно использовать бесплатный PC3000 DiskAnalyzer
Копировать диск (для последующего восстановления) лучше программой Acronis True Image или посоветуете что то другое?

Это как Вам удобнее. Можете просто файловую копию, можете использовать средства вроде Acronis True Image

Ну идеальная жеж реклама! Я теперь знаю, к кому обращаться если что)
Есть статистика по этому Seagate'у? Такой уже пару лет крутится с музыкой и фильмами.

Ага, реклама отличная. До этого знал, что в случае чего можно обращаться к Сергею Казанцеву (кстати, он тоже из Минска), автору программы Victoria. Теперь вот еще 1 контакт есть.

Толку от этой рекламы? Очень далеко не все читатели этих статей живут в Минске.
Так не реклама это. См. ниже

Ага, но из Москвы доехать просто. Конечно, это увеличит полную стоимость восстановления, но, например, мне будет спокойнее обратиться к профи, в которых уверен.

Ну идеальная жеж реклама! Я теперь знаю, к кому обращаться если что)

На Хабрахабр преследуется иная цель. Слишком уж много становится жертв youtube, где демонстрируются неразумные способы восстановления данных. Данный цикл статей альтернативная точка зрения. Пытаюсь донести немного теоретической + практической части, чтобы у некоторых был выбор: прислушиваться к мнениям многих авторов видеороликов на youtube и совершать незамысловатые движения с огромным риском безвозвратного уничтожения или все же более ответственно подходить к вопросу.
Есть статистика по этому Seagate'у?

все умирают и Ваше не будет исключением. Контролируйте SMART, как именно, указано в публикации про SMART. При первых признаках — копируйте данные, так как эти признаки будут началом конца.

Благодарю Вас!
Очень интересно и познавательно.
НЛО прилетело и опубликовало эту надпись здесь
Здравствуйте. Я не пользуюсь подобным ПО, в силу наличия немалого числа профессиональных комплексов. Но если глянуть в поиск то из более свежего можно попробовать HDAT2

А вообще не пугайтесь тестировать под Windows. Можно в нулевом секторе 510/511 байты c 0x55 0xAA сменить на любое другое значение и после перезагрузки диск для ОС будет неразмеченым и влияение ОС на результаты тестирования будет минимальным. Можно обойтись и без перезагрузки выполнив нужные действия в панели управления дисками. Страхи про то, что многозадачная ОС повлияет на результаты тестирования преувеличены. Небольшие задержки могут возникать в некоторых случаях, но наша задача на скане найти дефекты, а они с одинаковым успехом будут найдены, что под DOS, что под Windows. Для того чтобы вернуть разделы обратно, достаточно будет в нулевом секторе вернуть обратно 0x55 0xAA. Если не было тестов с записью, то данные отобразятся вновь.
НЛО прилетело и опубликовало эту надпись здесь
А подскажите, для чего нужны пластины на рис.2, захватывающий наполовину верхний блин и проходящие далее между остальными блинами? Я так понимаю, чаще встречаются они в серверных решениях, чем в бюджетных. Недавно разбирал старенький scsi диск, там тоже были эти «полукруги». Очень интересна их функция. Спасибо.
Их основное назначение — направить поток воздуха, так как это нужно накопителю (кроме этого уменьшится и шум). В накопителях, где эти сепараторы выполнены из алюминия они еще и помогают в отводе тепла.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации