Выжить в Долине Смерти и на дне рифа: контроль качества Seagate

    Помните старую шутку про то, что часам на 19 камнях не хватает двух: на один положить, другим ударить? Но что для обычных пользователей юмор, для производителей техники — серьёзный подход к тестированию и контролю качества. Краш-тесты, суровые испытания, высоко- и низкотемпературные эксперименты позволяют выводить на рынок устройства, которые не удивятся, если окажутся в океане, на Эвересте, в песчаной буре или в жаркой пустыне. Просто потому, что они обязаны работать вместе с владельцем, где бы тот ни находился.


    Во время испытаний вид у инженеров Seagate гораздо сдержанней, но эмоции примерно такие же

    Сегодня расскажем о том, как подходим к работе с качеством продуктов.

    У каждого продукта есть жизненный цикл и заявлять, что что-то вечно как минимум нечестно. Однако в силах производителя делать так, чтобы продукт отличался высокими качеством и надёжностью на протяжении всего жизненного цикла. 

    Продукция нашей компании используется для хранения данных как на корпоративном рынке, так и среди частных пользователей, а значит устройства теоретически могут оказаться где угодно: не только в офисном ноутбуке или в огромном дата-центре, но и в более экзотических местах — на подводном батискафе, в жарких и влажных тропиках, на арктической исследовательской станции и т. д. Вне зависимости от сценариев и мест использования, объединяет их одно: люди доверяют накопителям самое дорогое — данные; будь то результаты исследований, важная коммерческая информация или уникальные фотографии — никто не захочет терять даже небольшой кусочек своей информации. 

    Поэтому сегодня поговорим о контроле качества, тем более что для нас это не пустой звук и не разовая процедура. Решения компании проходят более 160 строгих проверок, а некоторые продукты до выхода на рынок преодолевают полосу препятствий более чем из 500 тестов (ряд показателей измеряется буквально от задумки до окончания срока эксплуатации). Например, диски — об их испытаниях можно почитать в нашем блоге на Хабре — в далёком 2016 году был пост-экскурсия по лаборатории проверки качества Seagate. Мы поправили оформление публикации, хотя с тех пор в нашем производстве произошло немало изменений.

    Контроль качества. Как это происходит?


    В несколько этапов:

    1. Первым делом инженеры Seagate задают себе ключевой вопрос: достаточно ли проработана технология, чтобы выпускать миллионы таких изделий? Это не риторический вопрос или напрасный пафос: масштабирование производства — серьёзное дело и огромная ответственность. Поэтому продукт отправляется в производство только тогда, когда ответ на вопрос о проработанности технологий положительный.
    2. После этого принимается решение о реалистичности проекта и команда Seagate переходит к конструированию.
    3. Затем — многократные циклы доработки и переработки, куда ж без этого. Требования рынка и представления клиентов преобразуются в чёткие критерии, которые необходимо соблюсти — многочисленные тестирования при проектировании компонентов позволяют понять, что работает, а что нуждается в доработке. Именно на этом этапе продукты проходят более 160 всевозможных проверок. Из понятных «бытовых» тестов — шестинедельное тестирование надёжности для определения среднего времени наработки на отказ, измерения температуры в разных режимах работы, напряжения, коррозии, ударных нагрузок и вибраций, уровня шума и так далее.

      Диски тестируются в разных условиях влажности и температуры (в том числе при температурах до 75 °C — это больше, чем в Долине Смерти, где рекорд составляет 56,7 °C). Проверки в подобных условиях позволяют выявить риски коррозии, загрязнения и утечек гелия. Есть и высотные испытания — чтобы убедиться, что диск останется целым и невредимым на высоте до 12 000 м над уровнем моря (для сравнения, высота Эвереста составляет 8848 м).

      На этом этапе тестируется около 20 000 дисков, что суммарно занимает порядка 5 000 000 часов.
    4. Если у клиентов появляются особые потребности (например, из-за каких-то внешних факторов), то технические требования могут быть изменены или доработаны. Два наглядных примера: для влажного и тёплого климата стран Азии используется другая упаковка дисков, которая защищает от коррозии и иных негативных воздействий. Казалось бы, мелочь, незаметная стороннему наблюдателю, но не учитывать её мы не можем. Второй пример более масштабный: глобальное потепление влияет на бизнес поставщиков облачных услуг, которые двигаются в сторону экологичности и стремятся снижать количество энергии, затрачиваемой на охлаждение, а значит диски должны будут выдерживать более высокие рабочие температуры, что меняет требования к качеству. Уже сейчас Стивен Крошьер (Steven Crochiere, старший директор по материаловедению и контролю загрязнений Seagate) заявляет, что предвидя такое развитие событий, компания может изменить минимальные требования, скажем, с 85 °C на 100 °C (соответствующее оборудование уже готово).

    Только после всех испытаний продукты поступают на широкий корпоративный рынок и в ритейл.

    А вообще, безопасность данных начинается ещё раньше — до того, как диск произведён:

    • защита на уровне дизайна: процесс проектирования дисков Seagate полностью закрыт от всех, кроме допущенных проверенных сотрудников;
    • все компоненты устройств поставляются надёжными поставщиками;
    • каждый узел собирается на охраняемом предприятии;
    • доставка устройств Seagate Secure осуществляется только проверенными партнёрами;
    • несмотря на всю техническую сложность устройств разворачивать инфраструктуру хранения данных на их базе просто и понятно, риск ошибок сводится к минимуму;
    • функция мгновенного безопасного стирания позволяет удалить все данные за секунды для быстрого и безболезненного вывода устройства из эксплуатации.

    Всё это является лишь частью комплекса решений Seagate Secure. 

    Данные, которые нельзя потерять


    Надёжные системы хранения данных прежде всего важны для корпоративного сектора, который использует их для big data, систем видеонаблюдения с искусственным интеллектом на борту, интернета вещей, развёртывания сложным нагруженных приложений, систем аналитики и прочего. Это те задачи, с которыми наверняка ежедневно сталкивается многие пользователи Хабра.

    Но кроме корпоративного сектора есть ещё и частные пользователи, творцы, научные организации, которые доверяют Seagate не меньше. Собрали для вас несколько примеров из «живой», не корпоративной среды.


    Исследователь и его надёжный помощник. Кстати, в ходе исследования впервые за 30 лет был открыт новый вид кораллов.

    Океанологи используют данные для защиты находящегося под угрозой исчезновения Большого Барьерного рифа Австралии. Участки этого рифа погибают от перегретой морской воды — глобальное изменение климата добралось уже и туда. Учёные используют внешние накопители для сбора и анализа данных международной исследовательской экспедиции. Данные, собранные на дисках, дают понимание того, где, как и почему выживают (или не выживают) кораллы. Это даёт шанс получить ответ на ряд фундаментальных вопросов и спасти коралловые рифы.

    Собранные данные огромны: каждый день учёные делают более 20 000 фотографий с огромным разрешением, снимают гигабайты видео с подводных камер и с воздушных дронов (картографирование рифов), фиксируют данные. Информация должна собираться, обрабатываться и безопасно храниться — на корабле исследователей для этих целей используется сетевое хранилище (NAS) QNAP TS-1231XU-RP-4G на 12 отсеков. Эта система заполнена 12 дисками IronWolf Pro ёмкостью 12 ТБ, что в сумме составляет 144 ТБ памяти. Этот NAS большой ёмкости позволяет легко собирать, анализировать, обмениваться данными и сотрудничать в большой группе людей. Исследовательская группа также использует диск Seagate DJI Fly Drive для съёмки с дронов и мобильный диск для поддержки полевых исследований. Очевидно, что потерять такие данные категорически не хотелось бы. 


    Фото Ника Рейнса, известного фотографа, который также использует решения Seagate для хранения данных и считает, что забота о сохранности данных — правильная паранойя. 


    Фото Джонатана Айриша из путешествия по 59 паркам США

    Потерять ценный кадр — трагедия для каждого фотографа. Джонатан Айриш (Jonathan Irish) снимал в 59 национальных парках США (ссылка на сайт об этом цикле) — каждая его фотография — уникальное сочетание мгновения и взгляда автора-фотографа на него, застывшее впечатление, которое нужно сохранить и донести до зрителя. Так, за одно из путешествий по США автор снял ни много ни мало — 248 000 фотографий! В дополнение к своей камере Fujifilm X-T1 и некоторым объективам Джонатан также взял с собой два диска LaCie Rugged для сохранения изображений в полевых условиях — надёжность, прочность и небольшой форм-фактор стали идеальным решением для хранения данных во время поездки. «У меня никогда не случалось отказов дисковода LaCie, чего я не могу сказать о других брендах», — оставил отзыв фотограф. В конце огромной поездки по национальным паркам у него было 16 ТБ изображений и видеозаписей.

    Принципы качества Seagate


    В 2020 отчётном году Seagate отгрузил HDD суммарной вместимостью 409,9 Эбайт (эксабайт, 1018 или квинтиллион байт), тогда как годом ранее выпуск равнялся 347,4 Эбайт. Средний объём проданного устройства составил 3,7 Тбайт, что больше показателя 2019 года (2,5 Тбайт). Такие показатели обязывают компанию гарантировать корпоративному сектору и частным пользователям высокий уровень надёжности. У Seagate есть несколько важных принципов на этот счёт.

    • Seagate работает в контексте Индустрии 4.0 — четвёртой волны промышленной революции и, в частности, в контексте IT 4.0 — концепции, в основе которой лежит идея автоматизированной инфраструктуры данных. Мы выстраиваем эту инфраструктуру на всех уровнях: от клиентов до проектирования, производства и логистики. Именно в контексте IT 4.0 в режиме реального времени происходит обмен данными между клиентами, проектировщиками, поставщиками и заводом. 
    • У IT 4.0 есть ещё одно важное преимущество. Мы имеем возможность анализировать производительность наших приводов в клиентских системах в режиме реального времени и на основании этой аналитики подсказываем клиенту, как оптимизировать наши решения в их рабочих условиях. Такая оптимизация помогает снижать стоимость владения решениями, используя их более эффективно. 
    • Продолжая тему аналитики, важно сказать, что Seagate использует преимущества искусственного интеллекта, глубокого обучения и расширенной аналитики для обнаружения и исправления аномалий. У Seagate развёрнута инфраструктура больших данных, в которых в том числе используются показатели телеметрии, управления данными с производства, данными поставщиков и т. д. Для принятия решений на основе данных и пользы наших клиентов мы используем сквозную аналитику.
    • Для Seagate существует множество критериев качества, но одним из главных показателей остаётся обслуживания клиентов: компания нацелена предоставлять пользователям продукт, который неизменно соответствует их ожиданиям. Это доверие крайне важно по двум причинам: во-первых, производителей дисков и устройств такого уровня очень мало и важно не разочаровать потребителя, не оставить его без важных для его работы и хобби решений; во-вторых, доверие — краеугольный камень дальнейшего развития бизнеса.
    • Ключ к качеству мы находим во всестороннем понимании клиента. Изучаем всё: от температуры, влажности и рабочих нагрузок устройств до популярных приложений, сценариев использования, критических требований клиентов. Вся собранная информация составляет аналитическую базу для разработки внутренних требований к дискам. Таким образом, Seagate предлагает решения, способные отказоустойчиво работать в совершенно разных условиях. 

    Почему мы пишем об этом на Хабре? Отчасти чтобы рассказать о надёжности продуктов, но больше для того, чтобы обратить внимание всей IT-отрасли на проблему управления качеством.

    * * *


    Увы, как нет ничего вечного, так нет ничего идеального: претензии бывают и к Seagate — точно так же, как и ко всем остальным компаниям. Если имеет место какой-то производственный просчёт, то мы срочно принимаем решение внутри компании, но нередко причиной поломки становится совершенно варварская эксплуатация — настолько беспощадная, что ни одной из 160 проверок не снилась; для нас это уроки и пути дальнейшего развития. Важно помнить, что гипотетический предел прочности и срок службы есть даже у Земли и Солнца :)
    Seagate
    Лидирующий разработчик решений для хранения данных

    Комментарии 21

      +3
      По-доброму завидую таким историям. Я работал в российской «немного секретной» промышленности и мне было очень грустно от низкого уровня подхода к тестированию — такое ощущение, что вымерли даже традиции советского ОТК. За что я и ушёл в ИТ — здесь и с тестированием огонь, и разработке правильный вектор внимания.

      Ну а что касается дисков, у меня ваш миниатюрный SSD ультратачик живёт, полёт норм!
        +4
        Самый высокий процент отказа в работе среди конкурентов.
          0
          Полностью согласен, сигейтовские диски даже до срока гарантии не доживают. Вот Hitachi — молодцы, качественную продукцию выпускают.
          +1
          Т.е. с момента выхода в розницу ST3000DM001 что-то поменялось?
          Или как ложили клали болт на качество, так и продолжают?

          Я, конечно, уже давно смирился с потерей всей уникальной информации, которая хранилась на ST3000DM001 у меня когда-то (емнип, он гарантийный срок таки отслужил), но сигейты с тех пор больше не покупаю.
            +1
            Резервное копирование вам в помощь.
              0
              Машину времени не одолжите? Я слетаю, сделаю резервную копию и сразу верну.
                0
                Ну, а Seagate перед вами в чём виноват? Даже применение отказоустойчивого RAID-массива не отменяет необходимости резервного копирования. Разумеется, если данные на диске чем-то дороги и важны.
                  0
                  ничем, кроме выпуска ST3000DM001 в продажу
                    0
                    Просто есть такие производители, продукция которых выходит из строя аккуратно после конца гарантийного срока плюс пара месяцев. А есть годами работающие вещи. Поэтому и «любовь» к Seagate за это, вне зависимости от наличия или отсутствия резервной копии.
                      0
                      У меня на работе полшкафа забито дохлыми HDD-шниками. Любых производителей. Даже тех, которые на рынке десктопов уже не фигурируют. Seagate лишь один из нескольких производителей. Не самый плохой, на мой взгляд.

                      Потерю важных данных можно возложить, конечно, на производителя дисков, на рептилоидов, на мировое правительство и т.п. Но это не слишком конструктивный подход, поскольку не поможет избежать повторения ситуации. Грамотным и профессиональным подходом будет создание резервной копии, например, на флешке или внешнем диске.
                        0
                        Здесь важна куда более не потеря данных даже — тут бэкап спасёт в большинстве случаев, — а то, что претензии к Seagate появились не вчера. Вот, пост пятилетней давности, а претензии те же. Процитирую, прямо вот целиком, комментарий:
                        4… Повезло вам! Мы «удачно» купили 2 коробки именно этих дисков под бэкапы… 2 года гарантии. Четко через 2 года с момента даты выпуска (дата продажи +2-4 мес.) они один за другим начинают сыпаться — только успевай информацию переливать. Из всей партии спустя 3 года доживают свое (уже не без бэдов) штук 10-15. Проверенный поставщик, с которым работали уже 8 лет только пожал плечами — отказ по сроку гарантии, брак не признают. Написал официальное обращение, указал статью на habrahabr с расследованием причин отказа этой модели — ответили простыней вопросов — как, где, зачем, куда вы использовали, но первое — гарантия закончилась — всего хорошего, нас не волнует! Ок, спасибо вам за все, сэкономили!
                        Ради справедливости — другие модели Seagate на фоне других вендоров также совсем не блещут надежностью. Допотопные хитачи живее все живых после 50-60К часов. Во время потопа конечно были проблемы у всех, но тем не менее — сейчас, как и раньше:
                        1. Хитачи
                        2. Тошиба
                        3. WD

                        (Ссылка на комментарий.)

                        И никто в данном случае ни рептилоидов, ни мировое правительство не обвиняет. Вопросы — только к Seagate, ибо покупателям ожидаемо не нравится, что их используют, как дойную корову. Плюс грамотным и профессиональным подходом может быть не спонсирование ненадёжных производителей. Когда последний раз диск брал, обращался в три разных местных магазина, и все три посоветовали при выборе брать любой, кроме Seagate: им лишняя морока с (пост)гарантийными сроками и прочими разбирательствами тоже не нужна, как выяснилось.
                        Но то была личная, весьма малая выборка-статистика. А вот профессионалы, которые проверили куда больше дисков, тоже согласны: HGST — на местах с 1 по 5: Самые надежные HDD по версии Backblaze Q1 2020
                        Собственно, сама статистика
                        image

                        image
                        Важный момент, что показатели надёжности HGST хорошо доказуемы большим числом отработанных дней (цитата из статьи):
                        В течение отчетного квартала 4 модели HDD от трех производителей ни разу не сбоили. Нулевой показатель отказов продемонстрировали диски Toshiba объемом в 4 ТБ и Seagate объемом в 16 ТБ. Но у этих моделей наработка была небольшой — всего около 10 000 дней в совокупности за весь квартал. Соответственно, в случае отказа даже одного накопителя Seagate объемом 16 ТБ AFR составил бы 7,25% за квартал. При аналогичных условиях AFR накопителей Toshiba объемом 4 ТБ составил бы 4,05%.
                        Напротив, у моделей HGST гораздо больше отработанных дней, так что здесь AFR не настолько волатилен. Если бы отказала модель объемом 8 ТБ, то AFR составил бы всего 0,4%, в случае отказа 12 ТБ модели AFR вырос бы до 0,26% за квартал. Нулевой же показатель отказов что в первом, что во втором случаях впечатляет.


                0
                К сожалению тоже столкнулся с такой же проблемой, самое обидное, что продали мне его в 17 году, выпуск по моему 13-14 года, лавка закрылась, а хард умер через полгода… Seagate в гарантии отказали.
                  0
                  Сочувствую. Для себя решил: больше не возьму, даже если цена будет на 40% ниже; хватило двух «экспериментов» с ними.
                0

                Я отказался от Seagate не сразу. У меня вышло из строя два HDD на 1,5ТБ. Один начал при включении стучать и выключаться. Второй через 2 недели после покупки начал верещать в S.M.A.R.T., что я сейчас умру. Я его заменил по гарантии. Потом из строя вышел аналогичный винт у друга с теми же симптомами. Решил проверить все свои старые винты. Два на 250ГБ, один на 500ГБ и один на 640ГБ: вели себя нормально и S.M.A.R.T. говорил, что всё хорошо. А вот на 1ТБ винте уже появились перераспределённые сектора. С этого момента я перестал брать Seagate, по крайней мере мог взять меньше 1ТБ, но не нужны были. У меня был ещё один диск на 1,5ТБ. Позже он тоже умер, но всё не доходят руки его проверить, он может быть и рабочий. Есть ещё один в медиаплеере, который пришёл по гарантии. Но я его не включаю сейчас. Когда включал, он ещё был жив. Дискам от 1ТБ и выше от Seagate я не доверяю.

                  +2
                  Дискам от 1ТБ и выше от Seagate я не доверяю.


                  А зря, зря. Зря доверяете тому, что меньше 1Тб.

                  Погуглите «seagate муха cc error». У меня рейд ВЕСЬ однажды выключился и больше уже не включился. 640Gb. Массовый мор был
                  +1
                  Качество — это здорово! А работают ли в компании с фидбеком пользователей и продавцов?
                  Например, как тут выяснилось, уже пару лет всякие жулики массово вскрывают сигейтовские коробки и подменяют диски. Подробности есть вот тут: habr.com/ru/post/520402
                  Можно было коробки проклеивать, или еще что придумать. Но по факту воз и ныне там. Вдобавок на российском сайте даже контактов нет никаких, некуда писать (
                    +1
                    Ребятки, все это круто на словах, но есть реальность данная нам в ощущениях:
                    — 600Гб диски с CC error, когда сигейт несколько раз менял «показания», какие партии подвержены проблеме. В итоге, 3 раза проверял после апдейта информации на сайте, аж пока ВЕСЬ рейд из этих дисков однажды не откинулся. Благо админ со стажем и знаю, что рейд — не замена бекапу. Но 4 диска ушло и не вернулось. Поменял по гарантии на WD.
                    — были 4 х 3Тб HDD, так вышло, которые пошли бедами на границе гарантийного срока. Производственный брака партии, там у вас еще class-action жалоба была.
                    — были 2 х 4Тб External HDD. Сам дурак, решил рискнуть. ОБА не выдержали ОДНОЙ ПОЛНОЙ записи и чтения.

                    Поэтому вот давайте без этих маркетинговых соплей на очередной фейл — «надежность и безопасность данных пользователя — наш приоритет, проблема затронула малое количество пользователей».
                      +1

                      "Выжить в Долине Смерти и на дне рифа", и посыпаться в конце гарантии.
                      Плавали, знаем.

                        +1
                        Подтверждаю все seagate-ы что уменя были либо умерли либо были заменены т.к. начали сыпаться. Hitachi и WD тоже дохли, но гораздо реже.

                        ps: Может ваши винты массово подделывают, конкуренты?
                          0
                          У мну целая стопка дохлых сигейтов валяется)
                          0
                          Какую барракуду может покусать цеце?

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое