Как стать автором
Обновить

Комментарии 135

Может конечно и руководство виновато, но я понятия не имею как оправдать админа у которого 2 года назад сдох рейд, и он никаких действий не предпринял. Ну кроме как начать вешать лапшу на уши начальству (кстати может по этому начальник такой нервный у него был?).
У меня даже для домашних ПК и ноутов настроен мониторинг с отсылкой на почту уведомлений об изменении важных показателей S.M.A.R.T. (и это помогло своевременно обменять проблемное устройство по гарантии, когда начало неуклонно расти число переназначенных секторов). А тут человек, которому за это платят деньги, не почесался организовать простейший контроль…
А можете подробнее описать процесс мониторинга?
Я на Windows, так что через CrystalDiskInfo: Сервис → Особенности уведомлений → Уведомление по эл. почте

Настройки почты на примере Gmail:

To: логин@gmail.com
From: логин@gmail.com
Host: smtp.gmail.com
Port: 587
ID: логин
Password: пароль (если включена 2-этапная авторизация, сюда нужно вводить пароль приложения, созданный здесь)
SMTP/SSL: Yes

Там же в меню «Сервис» включить автозапуск и запуск агента.
для уведомлений, отправляемых одному человеку, не нужны никакие пароли.
достаточно указать его адрес, и MX его почты на 25 порту.
для «своих» клиентов любой почтовый сервис, включая Gmail, принимает почту без авторизации.
Очень велик шанс попасть под спам-фильтр, если отправлять письма без авторизации. Одно время долго не могли понять в чем же дело, почему, казалось бы безобидные, письма уходят в спам — оказалось именно из-за этого (и кажется дело было именно с GMail).
Спасибо за подсказку, настроил у себя.
Это не всегда помогает. Сегодня безпроблемный S.M.A.R.T, а завтра хард уже не читается.
В такой ситуации, когда вскрылось систематическое невыполнение обязанностей системным администратором руководство может его уволить и нанять другого, но нет гарантии, что не будет повторения подобной картины. Важно чтобы руководитель осознавал, какие именно управленческие ошибки допустил в организации рабочих процессов.
Может конечно и руководство виновато, но я понятия не имею как оправдать админа у которого 2 года назад сдох рейд, и он никаких действий не предпринял.
Собственно вопрос сводится к тому — было ли у этого системного администратора это в обязанностях и извещал ли он ситуации руководство.

При этом попытка скрыть проблему и решать ее самостоятельно так-то не обязательно свидетельствует о прямой вине администратора, real politik понимаешь.

Достаточно типичный кейз.
Сисадмин на зарплате 50к из которых 15к белые (или 35к премиями выдается).
Рейд ставил предыдущий админ и этому админу сказали не лезть туда… или же рейд полетел — сисадмин написал служебную записку, которую положили в купленный вместо нового хдд шредер.
Когда полетели все данные окончательно — начальство включило дурачка мол «ничего не знаю, данные слетели ты виноват» (с какой поры кстати сисадмин за свой счет должен восстанавливать данные?! это лишний раз показывает что что-то там в начальстве не так), и предъявило что следующая зарплата будет 15к, а не 50к если не починит за свой счет.
Сисадмину в принципе ничего другого и не оставалось, как выкручиваться по ситуации.
Сисадмину в принципе ничего другого и не оставалось, как выкручиваться по ситуации.

это как раз таки понять можно
15 июня в середине рабочего дня снова появляется данный клиент (он же системный администратор), но уже не один, а в сопровождении своего прямого руководителя. Сходу была озвучена претензия, что после наших диагностик накопителю стало намного хуже, что он теперь стучит и не определяется в BIOS.

Как оправдать такое поведение администратора, когда он точно знает, что это после его действий усугубилась ситуация, но он достаточно нагло и цинично обвиняет в этом нас?
Не очень поняли — это прямой вопрос или косвенное возражение?

Если возражение, то не принимается, т.к. мы отвечали по поводу "понятия не имею как оправдать админа у которого 2 года назад сдох рейд, и он никаких действий не предпринял", поэтому эту фразу и сцитировали.

Если вопрос, то тут конечно админ не прав чуть более чем полностью, вопросов в этом плане нет. Хотя мы, честно говоря, несколько удивлены что Вы никак не наказали админа за подобные обвинения, утвердив его во мнении о том, что такое можно проделывать безнаказанно. Сообщение владельцу фирмы истинной ситуации наказанием тут считаться не может, т.к. владелец фирмы наказал его за обман себя, а не за обвинение Вас.
Если вопрос, то тут конечно админ не прав чуть более чем полностью, вопросов в этом плане нет. Хотя мы, честно говоря, несколько удивлены что Вы никак не наказали админа за подобные обвинения, утвердив его во мнении о том, что такое можно проделывать безнаказанно.

Почему безнаказанно? Попытка обвинения провалилась, себя он дискредитировал в глазах непосредственного начальника. Подобная попытка оклеветать законом не наказуема, если сходу инициировать процесс с нашей стороны в силу слабой доказательной базы наличия факта клеветы, кроме озвученной претензии в нашем офисе.
Сообщение владельцу фирмы истинной ситуации наказанием тут считаться не может, т.к. владелец фирмы наказал его за обман себя, а не за обвинение Вас.

Пускаться в мелкие «разборки» потенциально убыточное направление. Мы не стремились, что-либо сообщать кому-то. На территории нашего офиса предоставили подтверждение своей невиновности в произошедшем, чтобы потом не пришлось этого делать в суде и тратить на это массу своего времени, ради наказания лица оклеветавшего нас перед своим руководством.

Не очень поняли — это прямой вопрос или косвенное возражение?
это дополнение к образу администратора, который совершил, мягко говоря, некорректный поступок в попытках снять с себя груз ответственности.

Ну если бы не тот факт, что и бекапы были просрочены на год, и если бы не пренебрежительное отношение к сервису то это все можно было предположить. Но сдается мне, что это просто тот тип админов у которых только на словах всегда все хорошо.

А можно без спекуляций на тему того, как «могло быть»?
Про то, что нельзя лезть в гермозону в домашних условиях, без чистой комнаты, должен знать даже новичок. Такая самоуверенность «одмина» выдает дилетанта.
Всегда виноват руководитель — работа у него такая.
А оправдывать сисадмина не надо — человек явно не своим делом занимается.
Интересно, сисадмина просто уволили, или всёж определили в рабы, работающие за еду на пару месяцев (Дабы компенсировать стоимость восстановления данных и упущенную прибыль из-за простоя)?
На данный вопрос ответа нет. Но в качестве курьера приносящего подписанные со стороны Заказчика акты выполненных работ выступал все тот же системный администратор.
Есть мнение, что админ и так работал «за еду». Ибо других факторов, оправдывающих такое раздолбайство, я не знаю.
Даже это не оправдание, я даже бесплатно так не работаю.
Не нравится оплата — иди в другое место.
Работать за еду и бесплатно — это совершенно разные вещи.
Бесплатно, как правило, я делаю что-то либо своим, либо просто хорошим людям. И тут я сделаю хорошо.
А вот если мне платят зарплату, которой только на еду и хватает (и по каким-либо причинам нету возможности сейчас сменить работу) — некоторые люди и не такую свинью подкладывали работодателю. Предыдущий админ подложил свинью, не настроив уведомления о состоянии массива, следующий — не проверил работу предыдущего. Как вариант.
Если он работает «за еду», то это повод поговорить с начальством о повышении з.п. или найти другую работу.

Одно можно сказать, сисадмин даун и полный неуч. Имяи репутация дороже любых денег.
Да, можно ошибиться, признай это и компенсируй. Тем более первоначальная цены была не большая.
Еще раз спасибо вам за статью, поучительно и увлекательно.

А если руководство сказало: «Восстанавливай за свои», — а?
Хочется обратить внимание руководящего состава, что в подобных ситуациях срываться на эмоции – непозволительная роскошь. Куда более разумным решением будет анализ проблемы и оценка собственных возможностей для ее устранения и, если необходимо, поиска исполнителей. И лишь после решения основной проблемы разбираться в степени вины системного администратора и говорить о каких-либо взысканиях за нанесенный своим бездействием ущерб.

Как бы сказано, когда лучше обсуждать с работником вид и размер его наказания за прямое невыполнение обязанностей. Некоторые вопросы могут быть решены через суд.
Ваша позиция прозрачна и ясна. Не Вам вопрос задавался.

Прежде чем обвинять, кого-то в некомпетентности, можно было произвести оценку рисков. Что в случае необратимой потери данных потерял бы админ(максимум работу), и его работодатель(репутационные и финансовые потери были бы гораздо выше). Работодатель не учел этот момент и что админ в такой ситуации будет работать на спасение своей задницы, пусть и безуспешно, а не на интересы компании.

И что из этого? 250 белорусских рублей это примерно 8000 российских
Человеку платили за то чтобы сеть и данные были в рабочем состоянии он это не выполнил, пускай вернет хоть часть. Сисадмин должен еще сказать спасибо, он получил профессиональный урок.

Вот именно. Так, вообще, если эта работа была закреплена в его должностных обязанностях/инструкции, то работодатель теоретически все эти потери вполне может взыскать через суд.

Часто вы слышали чтобы были суды по данному поводу в снг?
Работадателю дешевле и проще дать пинка такому "спецу" и предупредить друзей чтобы с ним не имели дел.

Работадателю дешевле и проще дать пинка такому «спецу» и предупредить друзей чтобы с ним не имели дел.

В крупных городах и в компаниях с «белой» зарплатой — это несерьезная угроза.
И хватает судебных процессов между работниками и работодателями.

Мир IT тесен, даже в крупных городах послужной список специалиста узнать не составит труда.
Если компания достаточно адекватная вряд-ли она будет держать в штате одного специалиста с низкой квалификацией. Судебные тяжбы побольше по зарплате и прочем чем по убыткам сделанные работником, слишком муторно доказать что именно им и специально было сделано.

Вроде в российском законодательстве закреплено отсутствие личной материальной ответственности работника за ущерб, совершенный на рабочем месте. Наказание в рамках трудового договора, срезание премий — это пожалуйста. Взыскивать с сотрудника убытки, если он сам не подписал на бумаге таковую свою ответственность — нельзя. На сколько я знаю.
Так-то оно так, только стоит учесть, что абсолютно не важно каким образом этот админ оплатит восстановление данных — заплатит сам 8к, или его премию срежут на 8к, в любом случае это будет за его счет. Только вариант с наказанием в рамках договора скорее всего будет иметь для него еще такую не очень приятную вещь как запись об этом в трудовой, что потенциально намного более не приятно чем просто потеря 8к рублей.
Кому в 21 веке нужна трудовая? Может еще справку от помещика принести?

Да это так за исключением если работодатель сможет доказать что работник преднамеренно нанес ущерб, тогда тут включается другая статья и по ней возможно исковые требования.

По ТК РФ материальная ответственность ограничена в пределах месячного заработка сотрудника. Для материально ответственных — полное возмещение ущерба. Как-то так.
производим процедуры перестановки БМГ от накопителя донора с помощью специализированного инструмента

Можно фото? Вообще не представляю как такое выглядит, но очень интересно.
Приспособления незамысловатые, но требуется высокая точность изготовления.
примеры разных производителей можете посмотреть по ссылкам
http://er-tools.com/files/data-recovery-tools-catalog.pdf
http://hddsurgery.com/head-replacement-tools
http://www.hdrconline.com/buy_readwrite.php
И всю эту кучу вариантов вы держите у себя?
У нас разные варианты съемников и даже были попытки придумать свои. В целях защиты от пыли все запаковано по пакетикам и вскрывается только в ламинарном боксе с последующим возвратом в пакет в нем же.
А не существует какого-то универсального стенда-донора? Чтобы прикрутить к нему любой блин, и без геморроя с с подбором доноров и прошивок, пусть и очень медленно, но надежно, считать данные. Кто-нибудь да должен был что-то подобное придумать. Технически должно быть не намного сложнее разработки жесткого диска.

А вообще ситуация смешная: Потребовались данные о которых 2 года никто не чесался. Да и то, что отсутствие массива не заметили. Отсутствие каких-либо бэкапов. Админ мог работать новый, который мог вообще не знать о наличии этих массивов, на ком бы срывалось руководство?

У меня на работе недавно случился подобный инцидент. При мне случился не зависящий от меня технический сбой, я почти все разрулил за выходные, был некритичный простой внутренних сервисов, а виновным в итоге сделали меня и лишили премии. А мог бы вместо того, чтобы работать себе в ущерб в праздники сделать моську кирпичом, прийти после и бодро разгребать клиническую смерть ВСЕЙ! инфраструктуры в течение недели.

image
У меня на работе недавно случился подобный инцидент. При мне случился не зависящий от меня технический сбой, я почти все разрулил за выходные, был некритичный простой внутренних сервисов, а виновным в итоге сделали меня и лишили премии. А мог бы вместо того, чтобы работать себе в ущерб в праздники сделать моську кирпичом, прийти после и бодро разгребать клиническую смерть ВСЕЙ! инфраструктуры в течение недели.

Пишите служебную записку на имя прямого руководителя, опишите почему отсутствует Ваша вина и что именно послужило причиной возникновения проблемы. Если действительно Вашей вины нет, то решение о депремировании может быть отменено.
Не все так просто. Обвиняет именно прямой руководитель, который и принимает решение о премировании, которое в свою очередь составляет существенную часть зарплаты. Можно поднять вопрос о его компетентности, но тут лучше многозначительно промолчать. Вот у него прибомбит, если он это прочтет.
Прыгайте через голову. Иногда только так и можно.
Возможно, пора начинать искать новое место? Неадеквартное прямое рук-во — лучший способ гарантировать себе геморой в будущем. И что вы тогда себе скажете — «ведь знал же, что так и будет, чего раньше не ушел»?
Терпилой меня не назвать. И тому, что я еще не написал заявление есть свои причины. Да и работа реально нравится, за исключением одного момента.
Ага, только в итоге может оказаться, что ситуация повториться, а по итогам некоторые другие фирмы будут считать, что у вас низкая квалификация и вы вообще халтурщик, потому что именно так до них донесет мысль этот человек и у него будут даже подтверждения в виде того, что как-то раз вас уже лишали премии, а тут опять…
Как минимум сейчас по горячим следам опишите подробно своё видение проблемы и ситуации. Распечатайтете с проверяемой датой и пусть лежит. Пригодится.
Все было сделано сразу же, руководство в курсе ситуации.
А не существует какого-то универсального стенда-донора? Чтобы прикрутить к нему любой блин, и без геморроя с с подбором доноров и прошивок, пусть и очень медленно, но надежно, считать данные. Кто-нибудь да должен был что-то подобное придумать. Технически должно быть не намного сложнее разработки жесткого диска.

для этого придется купить всех производителей жестких дисков со всем патентами. И прочитав малую толику оных понять, что универсального метода не будет.
А вообще ситуация смешная: Потребовались данные о которых 2 года никто не чесался. Да и то, что отсутствие массива не заметили. Отсутствие каких-либо бэкапов. Админ мог работать новый, который мог вообще не знать о наличии этих массивов, на ком бы срывалось руководство?

Вы неверно интерпретировали мои слова. Говоря о том, что массива нет подразумевалось, что один диск был исключен из зеркала, а отказ второго произошел в июне 2017. В публикации сказано, что этот администратор выполнил последнее резервное копирование за пределы сервера в ноябре 2016. Также изначально администратор признал факт своего халатного отношения в вопросе резервного копирования за пределы сервера.

Я так понимаю магнитные головки деградируют из-за царапин на поверхности пластин, то есть они просто царапается об них? А нельзя как-либо отшлифовать или иначе обезвредить царапины?

Как происходит обеспыливание? Лет 10 назад я видео моды HDD у которых верхнюю крышку заменяли на прозрачный плексиглас. И делали это вроде бы обычные энтузиасты без специальных средств.
А нельзя как-либо отшлифовать или иначе обезвредить царапины?
От шлифовки еще больше данных убьется.
Поверхность пластин вращается с достаточно большой скоростью (7200rpm = 120 оборотов в секунду). Если пересчитать в линейную скорость по отношению к головке, то можно получить:
На крайних дорожках линейная скорость будет около С = 2 PI r; r = (95мм / 2 = 47.5мм) С = 47,5 * 2 * 3,14 = 298,3мм, округлим до 300 мм и домножим на обороты (120) = 36000мм/с.
А теперь вдумайтесь. Головка парит над поверхностью диска, которая проносится под ней со скоростью 36 метров в секунду (на внутренних секторах, естественно, меньше, порядка 10-15м/с).
Естественно, на такой скорости любая шераховатость будет делать сколы на поверхности головки, а так же, разлетаться в мелкую пыль и следовать в воздухе рядом с головкой, чтобы на следующем витке оказаться в пылеуловителе (белый мешочек) или врезаться в головку снова.
Далее. Отшлифовать поверхность так же нельзя. Магнитный слой тонок. И если на нём появляются сколы, то начинается процесс разрушения, особенно усиливаемый постоянными попытками чтения (за счёт как раз пролетающей головки и изменений давления рядом с повреждённым участком).
Представьте заусенец на пальце и попытку отшлифовать его. Примерно похоже должна ощущать себя поверхность диска.
Кстати, шлифовать тоже нельзя. Можно попытаться, но ферромагнитный материал будет только сильнее крошиться — это факт.

Просьба сильно не пинать, пытался описать всё понятными словами и аналогиями.
А теперь вдумайтесь. Головка парит над поверхностью диска, которая проносится под ней со скоростью 36 метров в секунду ...


И чтобы усилить понимание, насколько же это быстро — 36 м/сек — это 130 км/час!!!
А ведь есть диски на 10к RPM и на 15к RPM — что дает, соответственно (не вдавался в проверки Ваших расчетов, просто экстраполяцией):

  • 7 200rpm — 36 м/сек — 130 км/час
  • 10 000rpm — 50 м/сек — 180 км/час
  • 15 000rpm — 75 м/сек — 270 км/час


270 км/час!!! И на такой скорости 5 блинов крутятся, и 10 головок их читают и пишут. И все это работает. Надежно и годами. Круто!
А ведь есть диски на 10к RPM и на 15к RPM — что дает, соответственно (не вдавался в проверки Ваших расчетов, просто экстраполяцией)
Подвела вас экстраполяция, однако. Достаточно просто взгляруть на внутренности (на даже на рекламном буклете, чтобы понять, что скорость, с которой двигается головка над диском что на пресловутом Bigfoot'е, что на 3.5" HDD, что на 2.5" блока HDD на 15 000 rpm — примерно одинаковые…

Меняется диаметр диска и скорость вращения, а не максимальная скорость…
Я думаю имелась в виду скорость движения поверхности диска под головкой, а не головки в поперечном направлении. При равном диаметре — больше оборотов, больше скорость.
При равном диаметре — больше оборотов, больше скорость.
Об чём и речь. При равном диаметре диска, а не при равном размере корпуса.

Вот пара фоток (рекламных, но они, в общем, близки к настоящим):
imageimage

Догадаетесь с одного раза — у какого из них 7200 RPM, а у какого 15 000 RPM?
Догадаетесь с одного раза — у какого из них 7200 RPM, а у какого 15 000 RPM?

Если бы не сегодняшние возможности поисковиков интересно было бы сыграть в игру — угадайте производителя и семейство по картинке без крышки.
Вы еще вспомните какая высота полета головки над поверхностью диска — около 10 нм, что многократно меньше длины волны видимого света. И при этом диски работают годами, в том числе — в ноутбуках.
Я так понимаю магнитные головки деградируют из-за царапин на поверхности пластин, то есть они просто царапается об них? А нельзя как-либо отшлифовать или иначе обезвредить царапины?

в этом направлении относительно успешно работает одна иностранная компания, которая судя по заявлениям восстанавливает полимерное покрытие, но стоимость ее услуг выше 10 000 евро и восстановленный накопитель не возвращается. Подробнее рассказать о технологии восстановления не получится.

Как происходит обеспыливание?

продувка воздухом не содержащим пыли и иных частиц, в некоторых случаях мойка пластин (но чаще это приходится делать с целью удаления жировых следов).

Лет 10 назад я видео моды HDD у которых верхнюю крышку заменяли на прозрачный плексиглас. И делали это вроде бы обычные энтузиасты без специальных средств.

энтузиасты публиковали лишь положительный опыт.
о стоимость ее услуг выше 10 000 евро и восстановленный накопитель не возвращается

Стоп. Не понял, а зачем его восстанавливать тогда?
Стоп. Не понял, а зачем его восстанавливать тогда?

чтобы была возможность произвести частичное вычитывание с поврежденной поверхности без мгновенной деградации слайдеров и дальнейшего разрушения поверхности пластины.
WD Raptor X серийно производился с прозрачной крышкой лет 10 назад.
Есть еще живое напоминание об этих винтах в донорской базе.
Western Digital WD1500AHFD-00RAR0 Семейство — Odyssey.
НЛО прилетело и опубликовало эту надпись здесь
Что ж он такого сделал что головы залипли?

полагаю это можно узнать только у самого администратора.
И вообще, интересно: почему они залипают? По идее должны уноситься энергией останавливающегося шпинделя.

Иногда даже небольшим внешнем воздействии можно спровоцировать залипание БМГ
При вычитке дефектных зон происходят деградации как слайдеров, так и поверхностей пластин

А почему так? С ними в этот момент физически что то происходит?

А излишнюю эмоциональность руководства, я считаю, можно запросто поставить в один ряд с халатностью системного администратора в данном случае. Ибо по себе знаю, что под прессингом и постоянным ором начальства производительность труда падает, и рациональность принимаемых под этим прессингом решений тоже падает.
А почему так? С ними в этот момент физически что то происходит?

физический контакт краев задиров на пластине (высота которых зачастую выше высоты полета слайдера) со слайдером на высокой скорости. Именно поэтому любители «лечить» диски ремапами зачастую доводят из до запилов.

Так ведь многие компании не желают менять диски по гарантии пока ремапов мало. Так что полноценная смерть может быть даже благом.
Так ведь многие компании не желают менять диски по гарантии пока ремапов мало. Так что полноценная смерть может быть даже благом

Если бы добивали накопители только с целью возврата по гарантии, но увы хватает деятелей, которые выполняют ремап в надежде далее использовать ПО автоматического восстановления данных (зачастую этим грешат мелкие универсальные сервисы по ремонту и обслуживанию ПК и ноутбуков) или линейно пытаются получить посекторную копию, а в итоге усугубляют проблему и рискуют оставить пользователей без данных.

Большое спасибо за статью. Очень интересен процесс, удовлетворил своё любопытство.
Не соглашусь с мнением, что виноват руководитель, если он не директор по ИТ. Ну конечно кроме эмоций. Эмоции никогда не приводили ни к чему хорошему.
Откуда рядовой руководитель знает про такие вещи, даже если он связан с разработкой ПО? Он и нанимает соответствующих людей, которые должны знать ньюансы.

Виноват именно руководитель.
Правильный руководитель не стимулировал бы админа добивать хард, а сразу бы обратился к спецам.
Проводя аналогию — уборщица задела кабель и сломала коннектор — будем заставлять её переобжимать, или всё-таки поручим это тому, чья это работа?

Так я и пишу, что "кроме эмоций". Выводя сотрудника из себя эмоциональном наездом ничего не добьёшся.
Я имел в виду, что не он должен был организовывать контроль. Он должен был организовывать людей, которые наладили бы необходимый контроль.

Я лично работая типасисадмином подал служебку, в которой указал, что надо купить пару дисков для того, что бы делать на них бекапы. На что начальник посмотрел на эту сумасшедшую сумму в 10-20к (точно не помню, но тогда зп у меня была около 15к, а сам начальник разъезжал на рейнж ровере) и сказал — давай не сейчас, а сильно позже.
Сильно позже, то бишь через полгода — я работал уже давно в другом месте, а у них улетел диск с данными за пару лет, ибо хранить их было тупо негде (из разряда, что даже на ноуты смог выбить новые жесткие только после того, как система гарант перестала туда умещаться, то есть превысила 30 гигов).
Что дальше — я, честно, без понятия, ибо их в тот момент уже аутсорсила какая-то контора и это было исключительно их дело.

Поэтому да, зачастую в подобных ситуациях виноват именно руководитель. Который не считал риски нанимая дешевого админа, не считал риски урезая бюджеты на покупку, не слушал профессиональные советы или еще как пробовал из этой шкуры семь шапок сшить.
Не соглашусь с мнением, что виноват руководитель, если он не директор по ИТ. Ну конечно кроме эмоций. Эмоции никогда не приводили ни к чему хорошему.

Назначая ответственных за что-либо несете ответственность за назначение.
Откуда рядовой руководитель знает про такие вещи, даже если он связан с разработкой ПО? Он и нанимает соответствующих людей, которые должны знать ньюансы.

То что были созданы условия, при которых администратор мог длительное время не выполнять свои прямые обязанности говорит о серьезном просчете руководства. Пока руководитель этого не поймет, то истории будут повторяться.

Не соглашусь.
Есть такое понятие, как делегирование ответственности. Хороший пример — главбухи. Главный бухгалтер согласно приказу и должностной инструкции несёт ответственность. И если придёт проверка, а там проблемы, то вина будет за ним, а не за руководителем.
Ваш подход возможен в небольших компаниях, где работает небольшое количество человек. А в компаниях из 500 человек? А из 1000? Как руководитель может знать всё, организовывать всё, следить за всеми? Да он не все процессы то знает. Но у него есть штат заместителей, которые несут ответственность за свои участки. И тогда руководитель должен только назначить правильных людей. Вот тут вина руководителя в описываемом случае, вполне могла быть. А о проблемах руководитель узнает только когда придёт проверка, или случится такая ситуация.
Почему так случилось, можно только гадать, может сотрудник такой, может денег мало платили, может…

Ваш подход возможен в небольших компаниях, где работает небольшое количество человек. А в компаниях из 500 человек? А из 1000? Как руководитель может знать всё, организовывать всё, следить за всеми? Да он не все процессы то знает.

А разве где-то была речь, что именно генеральный директор крупной корпорации должен следить за работниками? Есть иерархия руководителей разного звена и какой-то из руководителей делит ответственность в итоге с рядовым администратором, а не только один лишь администратор, который под чьим-то руководством не выполнял свои обязанности.

Мне кажется мы об одном и том же. Я и пишу, что "если это не директор по ИТ"

А в конторе, в котором все руководство лишь генеральный директор?
Тогда что?
Вообще-то руководителем часто называют именно вышестоящего над какой-либо группой или кем-то. То есть либо начальник IT-отдела, либо директор IT (или зам.директора по IT), либо непосредственно генеральный директор компании, если ниже него нет никого.
Есть такая вещь, как делегирование полномочий, ответственности, обязанностей и т.д.
Гендир не может знать всего, поэтому он делегирует кому либо, директору по ИТ (если есть) или сисадмину, где пишет его ответственность: например «Отказоустойчивые функционирование ИТ ландшафта...» А делегирование оформляет приказом или должностной инструкцией.
При этом формулировку обычно согласовывает со знающими людьми, юристами, ИТ ишниками и т.д.

Но это теория, а в конкретном случае, кто такое руководитель, не известно, автор статьи не упомянул, поэтому спорить про конкретный случай — бессмысленно. А в жизни разные ситуации бывают, что я и попытался описать в своем комментарии.

А сколько примерно «ходят» wd green? У меня, судя по s.m.a.r.t, наездил уже 50400 часов при 117 запусках. Может их пора списывать и ставить новые?

Все зависит от условий эксплуатации. Нет вибрации, все в порядке с температурой, нет высокой нагрузки — может еще работать и работать. И желательно учитывать, что WD GREEN — это множество разных семейств, которые сильно отличаются друг от друга (справедливо и для накопителей с другими цветами этикеток)
Я ничего не понимаю в этой теме, но черт, это круче любого детектива. Обожаю подобные истории на хабре. Переживал за администратора как за себя.

А я за хард :) и за руководителя.
Ибо за этим стоит много народа, и для компании это могло бы быть крахом, а значит безработице для кучи человек.
Да и жалко трудов своих лишатся таким дурацким образом.

НЛО прилетело и опубликовало эту надпись здесь
Читаю все Ваши статьи, очень интересно, спасибо большое. Все хотел понять — обратил внимание, на всех фотографиях дисков Вы всегда замазываете серийный номер (и/или его bar-code) — а зачем? Я понимаю, когда замазывают на скринах сайтов персональные данные — e-mail, ФИО, адрес, какие-то финансовые данные (номер счета/кошелька). Но какой риск несет уход в массы серийного номера HDD? Кому от этого может стать хуже / какую информацию можно разыскать/связать/найти кроме данных конкретного диска на сайте производителя — вроде даты создания, версии прошивки, еще может каких-то сугубо привязанных к этому конкретному диску данных — вроде даты окончания гарантии, каких-то данных по конкретной серии — вроде известных проблем, отзывов серии (мало ли) — и т.д.
обратил внимание, на всех фотографиях дисков Вы всегда замазываете серийный номер (и/или его bar-code) — а зачем?
в договоре с клиентом может содержаться серийный номер накопителя и публикация изображения накопителя может расцениваться клиентом как разглашение личных данных.

Хоть и вероятность этого события крайне ничтожная, но я предпочитаю замазать номер, чем потом тратить время на судебные прения. Так как замазывание номера не влияет на информативность публикации, то и впредь предпочту замазывать номера.
а отказ второго произошел в июне 2017. В публикации сказано, что этот администратор выполнил последнее резервное копирование за пределы сервера в ноябре 2016. Также изначально администратор признал факт своего халатного отношения в вопросе резервного копирования за пределы сервера

ну просто классика

системные администраторы делятся:
— на тех, кто еще не делает резервное копирование
— на тех, кто уже делает резервное копирование
— и на тех, кто уже делает резервное копирование и проверяет резервные копии

Но это надо умудриться не знать почти год, что в рейде выпал один из дисков. И да, если непосредственный начальник никогда не проверял или хотя бы не спрашивал, о бекапах и восстановлении, то это говорит только о его уровне. У меня на одном из мест работы начальник периодически требовал восстановление информации за определенный период. Так сказать держал в форме :)

2 hddmasters
я правильно понимаю, что рейд был программным, т.е. mdadm? Если так, то что было бы в случае использования аппаратного или т.н. недо рейдов, дешевые рейд контроллеры, которые идут на материнских платах. В таком случае восстановление усложнилось бы и было бы возможным вообще?
я правильно понимаю, что рейд был программным, т.е. mdadm?

Да, в данном случае RAID 1 создавался средствами mdadm.
Если так, то что было бы в случае использования аппаратного или т.н. недо рейдов, дешевые рейд контроллеры, которые идут на материнских платах. В таком случае восстановление усложнилось бы и было бы возможным вообще?

лично я для себя не вижу какой-либо сложности.
А есть ли у Вас какая-нибудь статистика по надежности производителей(или конкретных моделей)?
Т.е. модели которые лучше не брать или наоборот.
Хорошая статистика есть у Backblaze
https://www.backblaze.com/b2/hard-drive-test-data.html
К сожалению не совсем полезна для домашнего пользователя.
1. условия эксплуатации отличаются от тех, что в домашних и офисных ПК
2. Выборка затрагивает сравнительно небольшое число семейств.
3. О надежности некоторых изделий выводы делаются на основании скромной выборки.
При глубоком анализе вышедших из строя накопителей в подавляющем случае находим свидетельства «помощи» извне. Хотя снаружи накопители визуально без повреждений и в случае возвратов по гарантии были бы заменены производителем.

На сегодняшний день выразить каких-то очень ярких аутсайдеров не получится. Примерно одинаковое качество изделий у разных производителей.
Статья — супер! Очень интересно читать, спасибо. Разве что хочется больше технических подробностей.

Конкретнее:
Читаем 0 сектор.

Обнаруживаем, что в нем содержатся записи для трех разделов.

Какой программой можно из этой мешанины байт увидеть записи из трёх разделов? Или это намётанный глаз специалиста, который идеально знает стандарт разметки?

А вот тут:
Выполнив пересчет транслятора с учетом P-list получим оригинальный 0x31 модуль за счет работы самой микропрограммы накопителя.

Вообще магия какая-то, на мой взгляд =)
Какой программой можно из этой мешанины байт увидеть записи из трёх разделов? Или это намётанный глаз специалиста, который идеально знает стандарт разметки?


мне достаточно взглянуть в шестнадцатиричный редактор, чтобы это увидеть. Устройство таблицы разделов достаточно простое.
Как слышал от одного специалиста по восстановлению данных: «самые простые случаи — это когда диск в системе не определяется, тогда хозяин диска обычно ничего не может испортить».
Само собой, не речь шла не про случаи вида «запустил undelete — восстановил удалённое». :)
Как слышал от одного специалиста по восстановлению данных: «самые простые случаи — это когда диск в системе не определяется, тогда хозяин диска обычно ничего не может испортить».

Справедливо лишь частично. Например в случае описанном в данной публикации многократные попытки старта привели бы к окончательному зацарапыванию поверхностей пластины и шансов на восстановление не стало бы.

Само собой, не речь шла не про случаи вида «запустил undelete — восстановил удалённое». :)
А потом присмотрелсь, а вместо части данных мусор. В качестве примера одна из публикаций про восстановление фрагментированных dbf файлов. Работы по пересадке БМГ с дальнейшим вычитыванием покажутся цветочками на фоне работ по восстановлению фрагметированных файлов без опоры на файловую систему.
мне достаточно взглянуть в шестнадцатиричный редактор, чтобы это увидеть.

сразу вспоминается Матрица — "Информации, получаемой из Матрицы, гораздо больше, чем ты можешь расшифровать. Ты привыкнешь к этому. Я уже даже не вижу код. Я вижу блондинку, брюнетку, рыжую."
А бывало ли так, что размер диска уменьшен программно?
А бывало ли так, что размер диска уменьшен программно?

да иногда бывает.

например возьмем WD семейство Trails. 1 пластина 1 или 2 головки.
Старшая модель 1Тб, 2 головки. 750Gb -2 головки, 500Гб 1 или 2 головки, 320Гб 1 или 2 головки. Так вот если брать в расчет двухголовые модели 750Гб, 500Гб и 320Гб то среди них можно отыскать немало экземпляров, которые можно после некоторых циклов селфскана превратить в 1ТБ. Разумеется далеко не все.
Прошу прощения, что немного не по теме. Так вот, есть у меня три USB-HDD Seagate Expansion, два по 1 ТБ и один на на 2 ТБ, и у всех трех есть один и тот же нюанс — там, где кабель входит в диск, периодически пропадает контакт, в итоге, диск отваливается, и нужно шевелить кабель, чтобы он снова заработал. Так вот велики ли шансы мне стать клиентом ваших коллег в такой ситуации и что можно сделать, чтобы тот чертов кабель не болтался в 3.0 разъеме? А также, если диск помрет, что не нужно делать будет? Периодически проверяю диски SeaTools и Crystal Disk info, пока все ок.
Офф: Вот сейчас Seagate все ругают, а я их люблю, и пользуюсь их HDD еще со времен первой Барракуды в первом компьютере.
Прошу прощения, что немного не по теме. Так вот, есть у меня три USB-HDD Seagate Expansion, два по 1 ТБ и один на на 2 ТБ, и у всех трех есть один и тот же нюанс — там, где кабель входит в диск, периодически пропадает контакт, в итоге, диск отваливается, и нужно шевелить кабель, чтобы он снова заработал.Так вот велики ли шансы мне стать клиентом ваших коллег в такой ситуации и что можно сделать, чтобы тот чертов кабель не болтался в 3.0 разъеме?

если от БП идут стандартные 4 пиновые разъемы и на них надеты переходники для питания накопителей SATA, то попробуйте сменить переходники или целиком БП.

Был немного невнимателен. В случае накопителей подключаемых по USB начинаем проверки с подключеним к другому ПК, а также проверяемя работоспособность накопителей вне бокса. Если проблемы только в USB_SATA мостах или разъемах, то лучше подумать о новых боксах.
НЛО прилетело и опубликовало эту надпись здесь
Была аналогичная ситуация. Дело усугублялось тем, что накопитель стоял на машине с каким то классом безопасности и резервных копий не делали. Обратились ко мне. Я сразу с клиентом поехал в спецконтору где нам озвучили сумму 15000р и срок до недели. После беседы с руководством было решено не сдавать накопитель ибо там секретка. Руководство сказало, что у них есть «связи» где надо и эти «связи» умеют восстанавливать данные после пожара даже. Прошло 3 недели накопитель вернули. Там были следы вскрытия — данные восстановить не удалось. Поехали в контору, те после диагностики оценили вероятность восстановления данных не более 10%
При повышенной секретности всегда можно договорить о выполнении работ на территории заказчика. Предоставите помещение с необходимыми условиями, где можно будет развернуть лабораторию. Цена в такой случае будет учитывать и разворачивание лаборатории на территории заказчика и всю бюрократическую проволочку. И надо понять, что в данном случае пребывание специалиста на территории заказчика оплачивается а любом случае (при положительном исходе больше, при отрицательном меньше, а при выполнении работ на территории исполнителя оплачивается только положительный исход)
Я про разгильдяйство :-)
У меня есть три вопроса:
!.. Имеется WD7500AAKS.
По SMART здоров, при чтении через викторию все читается, доступ к каждому по 5 мс, но попадаются пачки секторов (примерно 400-600 штук подряд) со временем доступа до полсекунды и больше, примерно 1/15, 1/20, которые разбросаны по всему диску.
Был бы на гарантии, можно было бы довести его до инфаркта и в сервис, но ему лет 7-8, да и магазин давно приказал жить.
Можно ли заставить диск отметить эти участки как неиспользуемые, или же логически назначить их в конец диска?
2. Про тот же SMART: на опыте, из порядка около 100 прошедших через мои руки дисков, однажды случилось так, что диск начал плохо читаться, при том по смарту здоров, а при обращении через викторию быстро деградировала поверхность. Важных данных не было, был за пределами гарантии, потому был быстро разобран на магниты. Так вот вопрос: как так смарт «скрыл» состояние диска?
3. В таблице смарт есть параметр UDMA CRC Errors/
На трех из моих дисков там ненулевое значение по вине кабеля. Диски не виноваты, но визуально это доставляет мне дискомфорт. Как можно обнулить это значение?
Можно ли заставить диск отметить эти участки как неиспользуемые, или же логически назначить их в конец диска?

именно так как вы описываете — нет.
Так вот вопрос: как так смарт «скрыл» состояние диска?

В некоторых случаях разрушение пластин и слайдеров развивается весьма стремительно. Банально не дойдет до обновления показаний SMART.
В таблице смарт есть параметр UDMA CRC Errors/
На трех из моих дисков там ненулевое значение по вине кабеля. Диски не виноваты, но визуально это доставляет мне дискомфорт. Как можно обнулить это значение?

Рядовому пользователю эти возможности недоступны.
Можно ли заставить диск отметить эти участки как неиспользуемые, или же логически назначить их в конец диска?
именно так как вы описываете — нет.

Как в этом случает по-Вашему грамотнее поступить?
Как в этом случает по-Вашему грамотнее поступить?

если бы ремонт накопителей был бы целесообразным — выполнил бы процедуры селфскана. Если проблем с БМГ нет, то накопитель бы еще пожил бы некоторое время.

В Вашем случае рекомендовал бы:
1. скопировать всю информацию на другой накопитель.
2. удалить все разделы.
3. провести запись всего логического пространства (от 0 и до последнего сектора)
4. провести чтение с ремапом (если ремапы были повторить с пункта 3), если дефектов и затруднений в чтении нет, то перейти к дальнейшему тестированию.
5. записать накопитель некими данными на 100%. отложить на недельку и повторить тест чтения, если затруднений не будет — допустить к эксплуатации. Если проблемы есть, то локализовать их и создать разделы на диске так, чтобы проблемная зона с окрестностями в несколько гигабайт не попадала в границы используемых разделов.

тогда проблемные накопители некоторое время еще можно поэксплуатировать
Так как диск большей частью в отличном состоянии, хочется его использовать, пусть и в меньшем размере.
Вопрос вдогонку: так как медленные области идут примерно через одинаковые промежутки, правильно ли сделал вывод, что проблема в поверхности одной из пластин, либо в одной из головок?
так как медленные области идут примерно через одинаковые промежутки, правильно ли сделал вывод, что проблема в поверхности одной из пластин, либо в одной из головок?

если замедления циклично повторяются на протяжении всего логического диапазона, то проблема в одной из головок. Если лишь небольшой участок (относительно к размеру диска), то могут иметь место как проблемы на поверхности, так и проблемы с какой-то из головок.
Извиняюсь, что на ночь глядя сыплю вопросами.
Что можете порекомендовать из софта для мониторинга состояния дисков (если будет уметь не только SMART читать, но и тестировать поверхность при простое, было бы замечательно) под линукс (Debian) и Windows 7?
Под линуксом отправка отчета на e-mail не требуется, а вот для Windows было бы неплохо.
Есть некоторые идеи, как сделать, но не хочется изобретать еще один велосипед, если есть готовые решения.
Вопросы по ПО для постоянного мониторинга не ко мне. Все такие немного не мое направление.
Stablebit scaner для этого использую.
Кроме чтения отчетов различного ПО, которое во многих случаях начинает слать уведомления, только если накопитель согласно своих критериев оценки выставляет Smart status BAD на команду 0xB0 0xDA рекомендовал бы профилактическое наблюдение, хотя бы за основным набором атрибутов.
Очень интересная и поучительная история, спасибо! А на рисунке 3 черная квадратная штука — это собственно головка чтения-записи?
Черный параллелепипед — это слайдер. Его реальный размер по большей стороне около 1мм.
Посмотрел ролики приборов для съёма головок — заметил, что способ парковки головок у дисков различается. Либо это область вне пластин с держателем для БМГ, либо головки паркуются прямо на пластинах, в месте без данных ?! тогда почему в этом случае не происходит залипания?
Да есть накопители, где БМГ помещается на рампу, есть те, где БМГ помещается в парковочную зону, данная зона отличается «рельефом» и слайдеры там не залипнут.
класс
можно в жж ссылки на новые статьи размещать? и тогда я стану первый ваш читающий подписчик в жж :)
Не буду обещать, но рассмотрю эту возможность.
Вот потому, я никому из своих знакомых-работодателей не буду рекомендовать покупать WD. За 13 лет админства, сколько я видел убитых WD и не одного Seageta. Где-то в 2010 году, решил дать шанс WD купил в офис и пожалел.
Можете не придумывать себе лишнее убеждение, что мол накопители Seagate, чем-то лучше накопителей Western Digital. Я бы сказал, что они все примерно одинаково ненадежны, если говорить об офисной и домашней эксплуатации. В случае дата-центров статистика покажет цифры, которые будут явно не в пользу Seagate.
Конкретно эту серию (blue) можно советовать врагам, это продукт экономии совершенно на всём. Все остальные серии у них достойные, и даже нелюбимые многими green — просто надо выключить постоянную парковку и они так же будут молотить годами в большинстве своём. А незначительный брак есть у всех.
Ну и никогда не хранить важное в 1 экземпляре и на 1 диске.
Конкретно эту серию (blue) можно советовать врагам, это продукт экономии совершенно

обычный накопитель, который ничем не хуже конкурирующих решений, по крайней мере был таким в свое время.
и даже нелюбимые многими green — просто надо выключить постоянную парковку и они так же будут молотить годами в большинстве своём

Нужно ли увеличивать интервал между парковками — это еще весьма спорный вопрос. На время жизни накопителя серьезным образом не повлияет. Обследование многих накопителей в том числе с огромным количеством парковок не выявляет каких-то деформаций рампы или подвесок из-за большого числа парковок. Все неисправности, как правило лежат в другом поле.

му-ха-ха, ошибка выжившего как она есть.
серия баракудки с известным браком прошивки, который кирпичивал ее через какое-то время — прям можно вешать значок о получении данного достижения.
куча сдохших баракудок, хотя вдшки и, особенно, хитачи тех времен — живее всех живых.
у вас так себе статистика, видимо.
ну и известная статистика одной фирмы, где сегейты тоже не блещут процентами. причем там и объемы большие за счет хороших скидок при покупке.
Ну если ты админ, то ты крутишся в сфере IT и до тебя доходит новости о всяких проблемах и путях их решений. Мне ничего не мешало найти среди сигейтов проблемный и поменять прошивку. Это не повод слать segate куда подальше. А косяки есть у всех, и у интела и у майкрософта и тп.
Угу, а на обычных пользователей всем «а нас рать». Что они не узнают до того момента, как все их данные превратятся в тыкву.
Плюс проблемы иногда доходят уже позже. Не всем везет.

Ну и да, остальные трупы это не объясняет. Хотя это больше к обычным сериям относится, а не тем же сасам.

Хотелось бы спросить, учитывая очень маленький зазор между головкой и блинами, как это все работает в ноутбуках, которые постоянно испытывают физические нагрузки (перемещения и тд)?
Насколько сложно/ легко убить диск просто шевеля/ двигая/переворачиваясь во время работы?

Насколько сложно/ легко убить диск просто шевеля/ двигая/переворачиваясь во время работы?
если постоянно шевелите и двигает ноутбук во время работы, то у Вас повышенные риски отказа жесткого диска именно из-за повышенной вероятности контакта слайдера с поверхностью пластины. Так как на поверхности пластины присутствует полимерный лубрикант, то многие контакты не будут катастрофичными.

В следующей публикации имеется рисунок, на котором чуть-чуть показано устройство пластины
Спасибо, можно еще вопрос в догонку:
имеет ли значение как установлен HDD (крышкой вверх\вниз\вперед\назад) с точки зрения вероятности отказов или износа каких либо механизмов?
В тестах с небольшой выборкой не удалось выявить каких-либо закономерностей отказов из-за разного положения в пространстве.
имеет ли значение как установлен HDD (крышкой вверх\вниз\вперед\назад) с точки зрения вероятности отказов или износа каких либо механизмов?
Неважно. Что важно — чтобы пластины не были «под углом». То есть HDD должен быть установлен горизонтально или вертикально (да, так тоже нормально), но не под углом в 30 или 40 градусов как бывает в некоторых «моддерских» корпусах…
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.