hddmasters30 июн 2017 в 20:00

Экономия на спичках или восстановление данных из скрежещущего HDD Seagate ST3000NC002-1DY166

9 мин

37K

Восстановление данных * Резервное копирование * Системное администрирование * Хранение данных *

+54

Комментарии 95

proton17 30 июн 2017 в 21:12

Данные пациентов говорите… пришел я как-то в травмпункт в начале года, так мне направление на рентген распечатали на половинке А4, на обратной стороне которого была титульная страница карты какого-то больного с ФИО, телефоном, адресом, номером страховки и вроде паспортом. Видимо закончилась бумага в принтере и в ход пошли черновики… А вы про деньги на систему хранения данных…

AndreyD 30 июн 2017 в 22:52

Я какое-то время обслуживал принтеры для поликлиник (ремонт, замена расходников, но не бумаги). Так вот, зачастую, при наличии бумаги в поликлинике и свободному к ней доступу у персонала, они все равно пытались её экономить.

5ergunka 9 июл 2017 в 17:16

догадайтесь — «почему?»
а потому что потом на родительском собрании в школе можно гордо встать и сказать «я могу на работе распечатать! БЕСПЛАТНО!»
не нести же потом распечатки на «черновиках» — это ж позорище на весь класс на несколько лет сразу!

aik 1 июл 2017 в 06:24

Кое-где «черновики» требуют повторно использовать. У нас периодически тоже кто-нибудь такую рацуху пытается протолкнуть.

nerudo 1 июл 2017 в 12:05

Передо мной лежит (лежало) два результата моей флюрографии с одного и того же аппарата где доза облучения отличалась в 10 разСудя по всему нулем больше, нулем меньше напечатаь — пофиг.

artyums 1 июл 2017 в 20:57

Если это два разных снимка, то возможно они были сняты в разных режимах работы установки (например, один снимок в режиме флюорографа, а другой в режиме полноценного рентгеновского аппарата).

teemour 30 июн 2017 в 21:34

не растраивайтесь
зачем хранить эти рентгены, их пациенты выбрасывают почти сразу

hddmasters 1 июл 2017 в 04:29

99% материала обычно не является критически важным, но есть исключения.

Vjatcheslav3345 1 июл 2017 в 09:26

Срок хранения твёрдых копий аналоговых изображений составляет 2 года при отсутствии патологии и 5 лет для снимков, отражающих патологические изменения. Снимки больных детей хранятся 10 лет*.
Это связано с тем, что состояние больного человека развивается со временем и старые снимки бывают полезны в специфических случаях а в общем случае — важнее свежие снимки.

*Проект Приказа Министерства здравоохранения РФ "Об утверждении Правил проведения рентгенологических исследований" (подготовлен Минздравом России 03.12.2016).
Есть и хорошие новости: хотя в этом новом проекте правил рентгенологических исследований и регламентируются только сроки для твёрдых копий, но наличие сервера в рентгенлаборатории уже предусмотрено. Со временем и до облачного хранения дойдёт дело.
По идее, неотключаемое прозрачное фоновое автоматическое резервное копирование ещё и должно было предусматриваться в самом ПО для АРМ рентгенлаборанта, причём оно должно было быть сделано с учётом сроков хранения — хотя и регламентируются пока только сроки для твёрдых копий. О пациенте поликлиника всё равно знает его дату рождения и дату съёмки — поэтому может автоматически делать копии снимков до 5 лет и снимков детей, размещая их в разных местах диска.

Gobl1n 30 июн 2017 в 22:39

Здравствуйте! Не первый раз читаю ваши success-story. Не могу не спросить, вот в этом случае, как на картинке, у винта были какие-нибудь шансы или уже бесполезно пытаться? Утром ушел на работу, вернулся через 9 часов, винт стучит. Выключил, выкрутил, повез в лабораторию. Прислали фотку, сказали, что вероятность какого-либо восстановления нулевая. Это правда, или попытаться стоило?
Фотография

hddmasters 1 июл 2017 в 04:16

Здравствуйте. При подобных запилах, как на вашем фото, обычно шансы около нуля.

НЛО прилетело и опубликовало эту надпись здесь

hddmasters 1 июл 2017 в 16:59

А про сигей — купил, почти новый диск начал тупить на запись. Сервис денег не вернул, ибо читалось все хорошо.

таких историй от пользователей можно услышать про любого производителя.

Stas911 4 июл 2017 в 20:15

А смарт что-то показывал до этого?

vilgeforce 30 июн 2017 в 23:25

На рисунке №2 что за интересная конструкция полукруглая над пластинами?

hddmasters 1 июл 2017 в 04:19

Разделитель. Его задачи рассекать потоки воздуха, чтобы снизить шумы. Кроме это происходит отвод тепла.

Vir2o 1 июл 2017 в 01:09

Здравствуйте! Мне последнее время не дает покоя один вопрос, связанный с HDD. Где-то месяц назад я купил новый ноутбучный диск WD Black. В том что он новый нет никаких сомнений: лично разрезал запечатанный антистатический конверт с силикагелем. Показатели SMART после первого запуска также показывали, что это было первое включение (атрибуты start/stop count, power cycle count и power-on hours count). Но! С момента первого включения атрибут BF (Shock sense) равен 4. И я теряюсь в догадках, это какие-то последствия заводских тестов? Никаким ударам диск не подвергался (при первом запуске, когда впервые всплыла эта 4, был в ssd отсеке десктопа, стоящего на полу). С тех пор BF не растет. Если вы работали с такими дисками, нет ли у них такой особенности что BF имеет ненулевое значение прямо с завода?

hddmasters 1 июл 2017 в 04:23

Здравствуйте. Ненулевого значения в новом диске не встречалось. Полагаю в вашем счетчик прирос на этапе между первым запуском и первым запуском программы просмотра показаний SMART. Современные диски весьма «нежные» порой чуть более сильный стук пальцами по клавишам воспринимается как ударные нагрузки и фиксируется в BF

Dmitri-D 1 июл 2017 в 04:23

Вооще первое правило — если винт еще откликается, но уже сбоит и постоянно рекалибруется — заморозить его. Да. Буквально. Засунуть в морозилку, опустить температуру существенно ниже комнатной. После этого _обычно_ они и грузятся и данные читаются, пока он не прогреется. Я так вытащил данные с нескольких винтов, которые уже даже не грузились.
Насчёт SMART — ни разу не помогло. SMART или молчит или выдает false positives. А вот что помогает — обдув винчестеров и контроль температуры, — ни в коем случае нельзя допускать нагрева свыше 40С.
Это довольно очевидно из картинки головки, которая нагревается резистором. Планирует она в зависимости от разницы температур — головки и поверхности диска. Чем горячее диск, тем меньше помогает прогрев головок. Получаем касание со всеми вытекающими.

hddmasters 1 июл 2017 в 04:27

Вооще первое правило — если винт еще откликается, но уже сбоит и постоянно рекалибруется — заморозить его.

далеко не во всех случаях это будет полезно.

Насчёт SMART — ни разу не помогло. SMART или молчит или выдает false positives.

Смотря как за ним смотреть и трактовать показатели. Если ждать, чтобы накопитель на команды 0xB0 0xDA начал сообщать, что уже все плохо, то чаще SMART будет бесполезен, а если реагировать на первые признаки по RAW полям, то чаще можно успеть скопировать данные без особых затруднений.

Dmitri-D 9 июл 2017 в 06:01

далеко не во всех случаях это будет полезно

Я не понял. Вы это пробовли во всех случах и в некоторых это не помогло, или просто высказываете своё мнение, которое не опирается на опыт?

Всё что я посоветовал — это мой опыт. Этот способ мне помог. Надеюсь кому-то еще поможет.

Смотря как за ним смотреть и трактовать показатели.

Нормальный протокол не допускает разной «трактовки». SMART 0 позволяет что-то трактовать так или иначе. Отсюда простовй вывод SMART не является нормальным протоколом. Каждый производитель наворотил что-то своё. Общие подходы не работают. Во всяком случае, мне не известны такой способ чтобы достоверно определить что диску плохо и он уже скоро скажет алаверды, независимо от производителя. Если вам известны — изложите. Будет полезно всем ознакомиться.

khim 9 июл 2017 в 07:58

Нормальный протокол не допускает разной «трактовки»

Блеск. А ничего, что мы тут обсуждаем вещи, которые в принципе не могут однозначно что-либо трактовать?

Во всяком случае, мне не известны такой способ чтобы достоверно определить что диску плохо и он уже скоро скажет алаверды, независимо от производителя.

Они собственно, никому не известны. Если бы были известны — никакие «протоколы» были бы не нужны, просто можно было бы на этикетке диске при продаже писать «динск #12345, прикажет долго жить 5 сентяюря 2019 года, будьте осторожны».

Этот способ мне помог. Надеюсь кому-то еще поможет.

То есть когда вы даёте советы, которые могут привести к проблемам (несмотря на то, что вам они помогли) — это нормально. Если это делает кто-то другой, то виноваты разработчики винтов, протоколов, кто угодно, кроме раздолбая забывшего про бекапы!

hddmasters 9 июл 2017 в 09:46

Я не понял. Вы это пробовли во всех случах и в некоторых это не помогло, или просто высказываете своё мнение, которое не опирается на опыт?

Мы проверяли множество различных слухов. Учитывая огромную донорскую базу, у нас есть возможность экспериментировать с накопителями. Рекомендация бездумно морозить накопитель выйдет боком, так как при многих проблемах это как мертвому припарка. Кроме этого лишние попытки старта для полумертвого могут стать последними. Картинка с запилом, как на рис. 2 тоже может стать следствием действий пользователя над еще неокончательно умершим накопителем. Также имеет место негативное влияние в виде образования конденсата.

При коммерческом оказании услуги кому-либо морозить накопитель нельзя, учитывая все риски. Другое дело, если это ваш личный накопитель, на котором нет ценных для Вас данных. Тогда можно экспериментировать. Умрет окончательно, так умрет. Отдаст данные — хорошо, не потребуется заново качать с торрентов.

Всё что я посоветовал — это мой опыт. Этот способ мне помог. Надеюсь кому-то еще поможет.

хорошо бы пояснять опыт с инженерной точки зрения и также указывать на риски, которые с ним сопряжены.

Нормальный протокол не допускает разной «трактовки».

для начала S.M.A.R.T. не протокол. Какие протоколы используются в общении с накопителями можно прочитать в документации АТА стандарта.

Общие подходы не работают. Во всяком случае, мне не известны такой способ чтобы достоверно определить что диску плохо и он уже скоро скажет алаверды, независимо от производителя. Если вам известны — изложите. Будет полезно всем ознакомиться.

Общие подходы есть. И более того в публикации даже содержится ссылка на материал про SMART. Где описывается его устройство, как получаются показатели из накопителя и как они трактуются. А также указан набор атрибутов показатели которых желательно контролировать по RAW полям.

Taciturn 13 июл 2017 в 11:44

Если диск. По

SMART

smartctl 6.5 2016-05-07 r4318 [i686-linux-4.11.4-pmagic] (local build)

Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org



=== START OF INFORMATION SECTION ===

Model Family: Seagate Barracuda 7200.14 (AF)

Device Model: ST500DM002-1BD142

Serial Number: Z2AJ5YD2

LU WWN Device Id: 5 000c50 03f8cb051

Firmware Version: HP73

User Capacity: 500,107,862,016 bytes [500 GB]

Sector Sizes: 512 bytes logical, 4096 bytes physical

Rotation Rate: 7200 rpm

Device is: In smartctl database [for details use: -P show]

ATA Version is: ATA8-ACS T13/1699-D revision 4

SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)

Local Time is: Thu Jul 13 11:13:27 2017 CDT

SMART support is: Available - device has SMART capability.

SMART support is: Enabled



=== START OF READ SMART DATA SECTION ===

SMART overall-health self-assessment test result: PASSED



General SMART Values:

Offline data collection status: (0x82) Offline data collection activity

 was completed without error.

 Auto Offline Data Collection: Enabled.

Self-test execution status: ( 0) The previous self-test routine completed

 without error or no self-test has ever 

 been run.

Total time to complete Offline 

data collection: ( 592) seconds.

Offline data collection

capabilities: (0x5b) SMART execute Offline immediate.

 Auto Offline data collection on/off support.

 Suspend Offline collection upon new

 command.

 Offline surface scan supported.

 Self-test supported.

 No Conveyance Self-test supported.

 Selective Self-test supported.

SMART capabilities: (0x0003) Saves SMART data before entering

 power-saving mode.

 Supports SMART auto save timer.

Error logging capability: (0x01) Error logging supported.

 General Purpose Logging supported.

Short self-test routine 

recommended polling time: ( 2) minutes.

Extended self-test routine

recommended polling time: ( 77) minutes.

SCT capabilities: (0x103b) SCT Status supported.

 SCT Error Recovery Control supported.

 SCT Feature Control supported.

 SCT Data Table supported.



SMART Attributes Data Structure revision number: 10

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE

 1 Raw_Read_Error_Rate 0x002f 114 099 006 Pre-fail Always - 66948328

 3 Spin_Up_Time 0x0023 100 100 000 Pre-fail Always - 0

 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 435

 5 Reallocated_Sector_Ct 0x0033 073 073 036 Pre-fail Always - 8968

 7 Seek_Error_Rate 0x002f 084 060 030 Pre-fail Always - 324950068

 9 Power_On_Hours 0x0032 070 070 000 Old_age Always - 27068

 10 Spin_Retry_Count 0x0033 100 100 097 Pre-fail Always - 0

 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 433

180 Unknown_HDD_Attribute 0x002b 100 100 000 Pre-fail Always - 1207497011

183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0

184 End-to-End_Error 0x0033 100 100 097 Pre-fail Always - 0

187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0

188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0 0 0

189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0

190 Airflow_Temperature_Cel 0x0022 071 053 045 Old_age Always - 29 (Min/Max 28/29)

194 Temperature_Celsius 0x0022 029 047 000 Old_age Always - 29 (0 14 0 0 0)

195 Hardware_ECC_Recovered 0x003a 060 033 000 Old_age Always - 66948328

196 Reallocated_Event_Count 0x0032 073 073 036 Old_age Always - 8968

197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0

198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0

199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0



SMART Error Log Version: 1

No Errors Logged



SMART Self-test log structure revision number 1

Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error

# 1 Extended offline Interrupted (host reset) 90% 1 -



SMART Selective self-test log data structure revision number 1

 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS

 1 0 0 Not_testing

 2 0 0 Not_testing

 3 0 0 Not_testing

 4 0 0 Not_testing

 5 0 0 Not_testing

Selective self-test flags (0x0):

 After scanning selected spans, do NOT read-scan remainder of disk.

If Selective self-test is pending on power-up, resume after 0 minute delay.

8968 ремапов. Но статус не Bad. Какой вообще логикой руководствуются производители, если в таком состоянии диск считается нормальным?

hddmasters 13 июл 2017 в 13:47

Пока есть место в G-list будут выполнять ремапы. Как количество дефектов в G-list достигнет максимально возможного для данной микропрограммы количества, то статус по SMART станет BAD.

Dmitri-D 18 авг 2017 в 04:49

hddmasters

Рекомендация бездумно морозить накопитель выйдет боком, так как при многих проблемах это как мертвому припарка.

Где же вы нашли в моих рекомендациях «бездумно морозить»?
Только когда вы слышите частые заходы на термокалибровку, когда запил НЕ образовался или ЕЩЕ только образуется. Физический смысл — очень прост — когда механика холодная головке намного проще парить от сравнительно небольшого нагрева подогревателя. А когда вокнуг жара 40 и сами винт раскален до 50-55, каков будет зазор парящей головки и вероятность запила? Про деформацию дисков при нагреве тоже не забываем. При охлаждении, надо подчеркнуть, деформация НЕ образуется — тоже довольно элементарно, т.к. материалы сжимаются при охлаждении, в отличие от нагрева, когда диск теряет плоскость. IBM пока еще выпускала deskstar довольно плотно занималась этой проблемой.
Поэтому еще раз спрашиваю — вы пробовали сами? Если нет — ваши возражения — как сферический конь в вакууме, не основаны ни на чем. Мой опыт — скромен, но успешен.

для начала S.M.A.R.T. не протокол

вы, конечно, умный человек, отличаете протокол от непротокола. Но грань здесь тонкая, т.к. SMART подразумевает передачу данных, имеющих некую физическую интепретацию. Есть формат запроса. Есть формат ответа. Про АТА — откровенно слабоватое возражение, потому что SMART работает далеко не только на АТА дисках, и вообще появился не на АТА дисках впервые, да будет вам известно.
Но в любом случае — проблема вовсе не о том, что SMART — это протокол или «метод». Whatever. Проблема в отсутствии общей интерпретации, и именно об этом речь. Насчёт статьи… Ох. Больше смахивает на «новье» времен второй половины 90х. Скажите лучше как быть вот с этим?
en.wikipedia.org/wiki/S.M.A.R.T.
Standards and implementation
Lack of common interpretation
Many motherboards display a warning message when a disk drive is approaching failure. Although an industry standard exists among most major hard drive manufacturers, issues remain due to attributes intentionally left undocumented to the public in order to differentiate models between manufacturers.
From a legal perspective, the term «S.M.A.R.T.» refers only to a signaling method between internal disk drive electromechanical sensors and the host computer. Because of this the specifications of SMART are entirely vendor specific and, while many of these attributes have been standardized between drive vendors, others remain vendor-specific. SMART implementations still differ and in some cases may lack «common» or expected features such as a temperature sensor or only include a few select attributes while still allowing the manufacturer to advertise the product as «SMART compatible.»

И эта проблема существует примерно с 95г и до сих пор не решена. Каждый производитель гонит свои счётчики со своим «улучшенным» набором данных. А базовые показатели в большинстве случаев меняются, если вообще меняются, когда уже слишком поздно.

ExplosiveZ 1 июл 2017 в 07:48

Смотрю SMART(HDD).
Read error rate >140млн
Seek error rate >190млн
Reallocated sector count = 0.
Для второго диска:
Read error rate >120млн
Seek error rate >60трлн
Reallocated sector count = 0.
Диски пора менять? Если да, то что можете посоветовать, объемом >=1тб. Диски используются для различных проектов. Ко второму диску обращаюсь очень редко.

hddmasters 1 июл 2017 в 08:02

Если никаких стуков нет, тест чтения поверхности проходит без каких-либо затруднений, то оснований для замены нет. Говоря о SMART пишите пожалуйста производителя и модель диска. Например Seagate будет помещать в SMART события об ошибках чтения и позиционирования во время работы и естественно эти показатели ежедневно будут расти, так как отражают реальную картину. Другие производители предпочитают не стимулировать рост показаний этих атрибутов и не фиксировать большинство событий.

ExplosiveZ 1 июл 2017 в 09:28

Спасибо.
Первый: ST1000DM003-1ER162
Второй: ST500LM000-SSHD-8GB

hddmasters 1 июл 2017 в 09:32

Seagate в отличии от других производителей фиксирует ошибки в 1 и 7 атрибуте и весьма скурпулезно, отсюда такие огромные цифры в RAW полях. Ничего страшного в этих цифрах нет. Смотрите остальные рекомендованные параметры. Особое внимание 5 и 197.

НЛО прилетело и опубликовало эту надпись здесь

hddmasters 1 июл 2017 в 09:54

Ошибки чтения есть у всех жестких дисков и весьма массово. Но емкости ЕСС достаточно для коррекции ошибок. Микропрограммы накопителей других производителей не фиксируют эти события. Микропрограммы Seagate фиксируют. Особенно это хорошо заметно на жестких дисках Seagate, где присутствует атрибут 0xC3 (195) Hardware ECC Recovered. В них атрибуты 0x01 и 0xC3 растут синхронно.

Dioxin 3 июл 2017 в 06:23

Если у Вас серьезные проекты — сделайте софтовое зеркало хотя бы.

aik 3 июл 2017 в 06:28

Сперва надо озаботиться бэкапами. Зеркало можно потом, по остаточному принципу.

Dioxin 3 июл 2017 в 06:30

Спорный вопрос. Смотря чего Вы боитесь больше — вирусов или поломки винта.
Если второго — то зеркало лучше и делается проще/быстрее.
А вот потом уже можно бекапами отполировать систему.

aik 3 июл 2017 в 06:45

Бэкап спасает от всего, в том числе и от поломки винта.
А зеркало вообще не спасает. Зеркало нужно для уменьшения времени простоя в случае смерти оборудования, не более. Потому для сохранения информации бэкап первостепенную важность имеет, а зеркалами надо по остаточному принципу заниматься. То есть иметь их неплохо, но всяко не за счет бэкапа.

Dioxin 3 июл 2017 в 06:48

Зеркало спасает как раз от поломки винта, при этом Вы имее полную копию своей инфы и софта.
У Вас даже работа не остановится если один винт из зеркала умрет.
Бекап Вам не поможет в таком случае.

aik 3 июл 2017 в 06:59

Смотря как у вас винт помер. Если одномоментно пропал — то да, поможет. А вот в случае протяженной деградации есть шансы отзеркалить битые файлы на второй винт.

У Вас даже работа не остановится если один винт из зеркала умрет.

Вот это и называется «обеспечение бесперебойности».

Бекап Вам не поможет в таком случае.

Как настроите, так и будет.

mickvav 1 июл 2017 в 08:13

А с показаниями смарта на ssd-ных дисках есть какой-то опыт работы?
От себя добавлю к списку атрибутов, которые неплохо бы мониторить, собственно температуру дисков — позволяет на ранних стадиях заметить засоренную вентиляцию, предсмертное состояние кулеров и т.п.

hddmasters 1 июл 2017 в 08:22

А с показаниями смарта на ssd-ных дисках есть какой-то опыт работы?

Есть, но пока предпочту пособирать статистику проблем и показаний, а после будет выражено в виде небольшой заметки-рекомендации.

От себя добавлю к списку атрибутов, которые неплохо бы мониторить, собственно температуру дисков

данный атрибут я не описывал, так как это единственный атрибут, который основная масса пользователей, получивших показания SMARТ, адекватно оценивает.

НЛО прилетело и опубликовало эту надпись здесь

Dmitri-D 1 июл 2017 в 15:07

смертны внезапно,
хуже того, бывают смертны группой — два подряд или три. Это из-за общих причин и главная — плотная установка, плохой обдув и в результате — перегрев.
40С — импирически установлено — критическая температура для HDD. Нельзя ее превышать никак.
Для SSD — пока нет статистики. Судя по технологии и росту отказов флеш памяти при нагреве — я так же не даю SSD нагреваться выше 40С.
По SMART — каждый производитель пихает туда всё что угодно. Нужен обзор и разъяснения производителей. Пока выглядит как мусор. Некоторые программы ставят цветовое сопровождение — типа зеленый — ок, желтый — предупреждение и красный — кирдык. У одного винта с рождения был один показатель желтый. Так он до сих пор желтый уже столько лет. А у недавно сдохшего — всю дорогу всё было зеленое. Сдох — там рассыпался подшипник шпинделя. Судя по дате производства — я как раз попал на «после фукусимы».

hddmasters 1 июл 2017 в 15:45

Сдох — там рассыпался подшипник шпинделя.

Не совсем корректно «рассыпался». Заклинивать гидродинамический подшипник может из-за перегрева. Устройство подшипника простое: вал (втулка) с каналами для циркуляции смазки и корпус подшипника. Тонка пленка смазки — изолирующий слой уменьшающий потери на трение. Заклинивание вала обычно происходит из-за ударов, которые могут спровоцировать образование некой мини стружки + хорошая температура в итоге происходит практически закупоривание протоков и начинается хорошее трение с большим выделением тепла внутри подшипника, в некоторых случаях доходит чуть ли не до приваривания вала. При мгновенном заклинивании просходит резкая остановка с деформацией вала.

plin2s 4 июл 2017 в 08:12

Не могу согласиться. Дискам вредны перепады температур.
Из примеров:
Были много десктопных сигейтов работавших при 45-47 градусов (никогда не опускалась ниже 40 во включенном состоянии). Для них по даташиту максимальная рабочая температура была то ли 50, то ли 55.
До сих пор работает 2.5" Toshiba 1Tb, налет больше 20тыс. часов. Режим 24х7 с редкими отключениями. Температура средняя 53-55 грудусов (по даташиту максимум 55). Были довольно продолжительные периоды до 63 градусов в летнее время.

Temtaime 10 ноя 2019 в 09:52

У меня есть несколько таких тошиб. Тоже макс температура 55 градусов.
Практика показала, что при нагревании до 44 система через пару дней рандомно зависает.
Поставил принудительное охлаждение и температура выше 37 не растёт, аптайм стал до 200 дней(больше не проверял, ребутался для обновлений).
Для себя сделал вывод, что лучше не допускать выше 40 градусов.

plin2s 4 июл 2017 в 08:03

Спасибо за статьи! Буду с нетерпением ждать про SSD.
Но пока что меня все еще мучает вопрос, на который не получилось найти адекватного ответа.
Может у вас найдется ответ? https://toster.ru/q/155183

hddmasters 4 июл 2017 в 11:14

Признаки того, что появляются дефекты, обычно намекает на износ NAND памяти. Но при малом количестве исключенных (блоков, страниц) совсем необязательно, что проблема серьезная. Рекомендация — скопировать данные. Выполнить Security Erase и заново попробовать использовать. Если износ не носит массовый характер, то изделие еще поработает.

По поводу современных жестких дисков могу сказать, что при первых признаках дефектов в 0x05 и 0xС5 лучше не ждать больших цифр, а скопировать информацию заблаговременно.

plin2s 4 июл 2017 в 11:37

Естественно. В вопросе я не уточнял, но речи конечно не идет о ценных данных.
Спасибо.

НЛО прилетело и опубликовало эту надпись здесь

hddmasters 1 июл 2017 в 09:30

Температура один из показателей, который стоит досматривать. Также необходимо помнить, что не только на температуру нужно смотреть.

И стоит учитывать, что некоторые проблемы развиваются лавинообразно. Особенно это касается накопителей у которых состоялся неудачный контакт слайдера с поверхностью (например из-за внешних факторов).

НЛО прилетело и опубликовало эту надпись здесь

hddmasters 1 июл 2017 в 10:00

Скажем так, изредка повышенная температура винта может говорить о том, что механике кранты и боржоми пить, собственно, уже поздно.

при живом накопителе — это обычно говорит о том, что стоит подумать над организацией системы охлаждения или очистить от пыли текущую.

НЛО прилетело и опубликовало эту надпись здесь

hddmasters 1 июл 2017 в 10:37

У нас тут кажется полное взаимопонимание ;)

Чуть более развернутый ответ про еще живые накопители.

НЛО прилетело и опубликовало эту надпись здесь

satter 1 июл 2017 в 11:53

hddmasters нет ли у вас опыта работы с новыми сериями seagate? посматриваю на ironwolf серию для домашнего хранилища

hddmasters 1 июл 2017 в 11:58

Новинки пока требуют обстоятельного исследования и сбора статистики. Как правило в первый год после выхода того или иного накопителя немного их попадает в наши застенки. Сегодня давать комментарии про Ironwolf преждевременно.

periskop 1 июл 2017 в 11:53

Спасибо! Читаю все статьи как хорошие детективы, особенно про грех админа понравилось.

Есть ли интересные данные про серию Constellation ES.3? Например, про ST2000NM0033?

hddmasters 1 июл 2017 в 12:02

Бывали и такие накопители в работе. Семейство Megalodon. Чего-то особо интересного в них не наблюдалось. Типичные проблемы, как и у всех жестких дисков. Учитывая чуть более высокую цену менее распространены, посему попадаются к нам реже.

periskop 1 июл 2017 в 12:30

Спасибо.

Если можно, еще вопрос. Есть 2 диска WD Green серии WD15EADS-00P8B0, которым уже много лет (точно больше 7). Парковка головок каждые 10 секунд отключена, показатели смарт в норме, ошибка были давно только в UDMA_CRC_Error_Count, после переподключения кабеля все ок. Имеет ли смысл переставать их использовать и заменять на новые или можно использовать, если мониторить SMART?

SMART 1

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   186   179   021    Pre-fail  Always       -       5700
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       384
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   028   028   000    Old_age   Always       -       53108
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       378
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       271
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       122
194 Temperature_Celsius     0x0022   120   101   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART 2

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   181   176   021    Pre-fail  Always       -       5933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       377
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   029   029   000    Old_age   Always       -       52205
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       373
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       269
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       116
194 Temperature_Celsius     0x0022   121   100   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

hddmasters 1 июл 2017 в 13:03

Имеет ли смысл переставать их использовать и заменять на новые или можно использовать, если мониторить SMART?

Я бы продолжил использование с контролем показаний. В профилактических мерах бы рассмотрел бы тест чтения всего логического пространства (обязательно наблюдая за ним)

periskop 1 июл 2017 в 13:06

Спасибо! Например, копирование файлов с последующим сравнением с исходником или что-то другое имеете в виду?

hddmasters 1 июл 2017 в 13:11

Можете использовать бесплатный PC3000DiskAnalyzer и выполнить тест чтения от 0 сектора до последнего.

periskop 1 июл 2017 в 13:36

А, понял, спасибо, тогда викторией прогоню. Меня смутило, что речь шла о логическом пространстве.

hddmasters 1 июл 2017 в 14:28

Так все сектора с 0 по последний — это и есть логическое пространство для доступа к которому используется Logical Block Adressing, Как можете узреть во многих публикациях карты мини зон по физическим головкам реализующие тот или иной участок логического пространства. Реальная ж адресация с учетом размеров зон, деления на минизоны, резервных треков в каждой зоне, исключенных (дефектных) треков или секторов слишком сложна и слишком сильно отличается у разных накопителей. Посему и придумалось в свое время в АТА стандарте понятие LBA, чтобы дать больше воли производителям устройств. В итоге современные накопители достаточно интересные устройства живущие своей жизнью и реагирующие на запросы из внешнего мира, только в случае, если в работе внутренней микропрограммы, обслуживающей запросы извне, все гладко.

periskop 1 июл 2017 в 19:02

Спасибо за хорошее объяснение. Хоть новых фактов не узнал, но по полочкам уже известные хорошо разложили.

dmxrand 1 июл 2017 в 14:28

Немного офтопик. НО. Это не экономя на спичках. Это некомпетентность. Для хранения изображений полученных с медицинских аппаратов используют DICOM сервера. Да есть например OpenSource варианты http://www.orthanc-server.com/ Если говорить о коммерческих системах, то цена может легко переплюнуть 10000$

Почему я говорю о некомпетентности. Я сам слышал такую беседу: «А что насчет компьютеров? А что насчет них? Тут все просто. Компьютер в ДНС стоит 8000р. Если что даже мой сын подскажет — он вон учится на физмате и там ничего сложного нет». И все.

hddmasters 1 июл 2017 в 14:32

Немного офтопик. НО. Это не экономя на спичках. Это некомпетентность.

в данном случае на комплексных решений от производителя сэкномили. А хватило бы одного простого NAS'а с ежедневным резервным копированием. Чтобы подобная неприятность не побеспокоила. И в этом случае изначально задумывались о простых решениях, но из-за постоянного откладывания решения произошло то, от чего нужно было застраховаться.

Retifff 1 июл 2017 в 14:32

Интересно, а сколько из этих 3-х терабайт было заполнено?

hddmasters 1 июл 2017 в 14:44

Предварительно можно сделать вывод, что данный диск использовался только в границах первых 2ТБ, оставшиеся 794,52ГБ не использовались в процессе эксплуатации.

Заполнение используемых 2ТБ было более, чем на 80%

vlad49 1 июл 2017 в 14:45

Что касается медицинских учреждений — давно нужно обязать их сгружать первичную документацию, снимки, анализы, заключения, истории — всё до последнего в одно общее облако, с возможностью доступа как для самого пациента, так и из других клиник. Такой гос. проект действительно пошел бы на благо, с учетом нынешнего состояния медицины.

khim 1 июл 2017 в 15:37

До общего облака — как пешком до луны. Было бы неплохо для начала научиться передавать данные хотя бы внутри одной больницы. Меня пару лет назад в 17ю по ОМС положили, а когда я оклемался и позвонил в страховую — на ДМС перевели. Так мне анализы заново пришлось сдавать! Это внутри одного отделения! Из одного бокса в другое перешел!

А вы говорите — облако.

vlad49 1 июл 2017 в 16:53

Имеется ввиду гос. проект, с обязательным требованием к клиникам пользоваться облаком по любому чиху. Это автоматически наладит передачу данных и внутри них.

НЛО прилетело и опубликовало эту надпись здесь

hddmasters 1 июл 2017 в 17:44

Со скрипом, но внедрится. Первые годы будет так, как Вы говорите, а через 10 лет уже никто и не вспомнит про бумажки.

nerudo 1 июл 2017 в 19:27

Без серьезной централизованной проработки это наладит лишь регулярную утечку данных. А профукать их в «обюлаке» не сильно сложнее чем в своем шкафу.

zerg59 2 июл 2017 в 09:00

Сделают за многократно завышенный прайс из чего-попало и палок. Это же госпроект.

Bonio 1 июл 2017 в 14:46

А можно у вас проконсультироваться?
Есть один диск, этой мой системный диск, и однажды, то ли в результате отключения питания, то ли сам по себе, он выключился с нехарактерным щелчком, после чего в smart появилась вот такая запись (uncorrectable sector count). Это было примерно пол года назад, диск, как работал, так и работает, скорость отличная, переназначенных секторов нет, этот счетчик тоже не увеличивается. Что означает эта ошибка и стоит ли из за нее волноваться? Стоит ли что то предпринимать?
Жесткий диск WD, серия, кажется, RE, вот полное его название: WD2502ABYS.
Ну и попутно вопрос, что можно сказать про smart моего диска? На какие вообще параметры smart обращать внимание в дисках WD?

Скриншот CrystalDiskInfo

hddmasters 1 июл 2017 в 14:52

Жесткий диск WD, серия, кажется, RE, вот полное его название: WD2502ABYS.

Полное название на скриншоте «WD2502ABYS-01B7A0»

Есть один диск, этой мой системный диск, и однажды, то ли в результате отключения питания, то ли сам по себе, он выключился с нехарактерным щелчком, после чего в smart появилась вот такая запись (uncorrectable sector count).

если из-за аварийного отключения питания, то возможно ничего страшного. Рекомендация скопировать информацию, а после выполнить тест записи всего логического пространства, потом тест чтения, если проблем не будет обнаружено, то можно пользоваться накопителем далее (заново создать раздел(ы) и скопировать информацию обратно)

Bonio 1 июл 2017 в 15:08

Спасибо за ответ. А чем можно такой тест произвести?
Копировать диск (для последующего восстановления) лучше программой Acronis True Image или посоветуете что то другое?
И хотелось бы, хотя бы в общих чертах, услышать ответ на это: На какие вообще параметры smart обращать внимание в дисках WD?
Извините за кучу вопросов.

hddmasters 1 июл 2017 в 15:49

Общие рекомендации по анализу SMART есть. Отдельного акцента на WD нет нужды делать.

А чем можно такой тест произвести?

можно использовать бесплатный PC3000 DiskAnalyzer

Копировать диск (для последующего восстановления) лучше программой Acronis True Image или посоветуете что то другое?

Это как Вам удобнее. Можете просто файловую копию, можете использовать средства вроде Acronis True Image

НЛО прилетело и опубликовало эту надпись здесь

periskop 1 июл 2017 в 19:06

Ага, реклама отличная. До этого знал, что в случае чего можно обращаться к Сергею Казанцеву (кстати, он тоже из Минска), автору программы Victoria. Теперь вот еще 1 контакт есть.

Taciturn 2 июл 2017 в 07:49

Толку от этой рекламы? Очень далеко не все читатели этих статей живут в Минске.

hddmasters 2 июл 2017 в 08:47

Так не реклама это. См. ниже

periskop 2 июл 2017 в 19:30

Ага, но из Москвы доехать просто. Конечно, это увеличит полную стоимость восстановления, но, например, мне будет спокойнее обратиться к профи, в которых уверен.

hddmasters 1 июл 2017 в 16:21

Ну идеальная жеж реклама! Я теперь знаю, к кому обращаться если что)

На Хабрахабр преследуется иная цель. Слишком уж много становится жертв youtube, где демонстрируются неразумные способы восстановления данных. Данный цикл статей альтернативная точка зрения. Пытаюсь донести немного теоретической + практической части, чтобы у некоторых был выбор: прислушиваться к мнениям многих авторов видеороликов на youtube и совершать незамысловатые движения с огромным риском безвозвратного уничтожения или все же более ответственно подходить к вопросу.

Есть статистика по этому Seagate'у?

все умирают и Ваше не будет исключением. Контролируйте SMART, как именно, указано в публикации про SMART. При первых признаках — копируйте данные, так как эти признаки будут началом конца.

Crash13 1 июл 2017 в 21:54

Благодарю Вас!
Очень интересно и познавательно.

НЛО прилетело и опубликовало эту надпись здесь

hddmasters 2 июл 2017 в 08:45

Здравствуйте. Я не пользуюсь подобным ПО, в силу наличия немалого числа профессиональных комплексов. Но если глянуть в поиск то из более свежего можно попробовать HDAT2

А вообще не пугайтесь тестировать под Windows. Можно в нулевом секторе 510/511 байты c 0x55 0xAA сменить на любое другое значение и после перезагрузки диск для ОС будет неразмеченым и влияение ОС на результаты тестирования будет минимальным. Можно обойтись и без перезагрузки выполнив нужные действия в панели управления дисками. Страхи про то, что многозадачная ОС повлияет на результаты тестирования преувеличены. Небольшие задержки могут возникать в некоторых случаях, но наша задача на скане найти дефекты, а они с одинаковым успехом будут найдены, что под DOS, что под Windows. Для того чтобы вернуть разделы обратно, достаточно будет в нулевом секторе вернуть обратно 0x55 0xAA. Если не было тестов с записью, то данные отобразятся вновь.

НЛО прилетело и опубликовало эту надпись здесь

Stalkeros 8 июл 2017 в 14:43

А подскажите, для чего нужны пластины на рис.2, захватывающий наполовину верхний блин и проходящие далее между остальными блинами? Я так понимаю, чаще встречаются они в серверных решениях, чем в бюджетных. Недавно разбирал старенький scsi диск, там тоже были эти «полукруги». Очень интересна их функция. Спасибо.

hddmasters 8 июл 2017 в 14:57

Их основное назначение — направить поток воздуха, так как это нужно накопителю (кроме этого уменьшится и шум). В накопителях, где эти сепараторы выполнены из алюминия они еще и помогают в отводе тепла.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий