Отчёт Backblaze по надёжности HDD: диски Enterprise выходят из строя чаще, чем потребительские модели



    Компания Backblaze опубликовала обновленную статистику надёжности жёстких дисков за II кв. 2017 г. Компания периодически меняет парк HDD и обновляет статистику, которую она впервые опубликовала в январе 2014 г.

    Со времени предыдущего отчёта за I кв. 2017 года облачные хранилища Backblaze увеличились на 635 дисков, так что их общее количество достигло 83 151 штуки. Это не такое уже и значительное добавление. Для сравнения, в первом квартале база выросла более чем на 10 000 дисков. По сравнению с этим нынешние 635 «новичков» выглядят бледно. С другой стороны, уже сейчас мы можем подвести первые итоги по надёжности в том числе тех десяти тысяч HDD, которые были добавлены в первом квартале.

    Backblaze отмечает, что прибавка в 635 HDD — это относительная цифра. В реальности вступил в строй 4921 новый накопитель, а вышли из строя 4286 старых диска. Они не сломались, просто Backblaze планомерно проводит миграцию дисков с низкой плотностью на диски с высокой плотностью. Кроме того, количество Enterprise-моделей HDD увеличено на 3595 штук и достигло 6054 дисков.

    Итак, к статистике надёжности.

    Статистика отказов HDD в этой таблице покрывает период с 1 апреля по 30 июня 2017 года. Она содержит 17 разных моделей HDD формата 3,5" объёмом от 3 до 8 терабайт, которые работали в дата-центре компании в указанный период.


    таблица Excel

    При оценке надёжности специалисты рекомендуют смотреть на те модели, у которых в колонке «дискодней» (Drive Days) указано как минимум 50 000. То есть это минимальное количество примерно в 550 дисков, которые проработали целый квартал. В этом случае выборка достаточно большая, чтобы делать определённые выводы. Иаче вы рискуете сделать преждевременные выводы об исключительно низкой надёжности четырёхтерабайтных моделей Seagate ST4000DM001 и Seagate ST4000DX000, у которых процент выхода из строя составил 30,43% и 31,58%, соответственно. В реальности рано делать такие выводы, потому что у Backblaze совсем мало таких дисков: 400 и 157, соответственно. К тому же, Seagate ST4000DM001 в первый раз попали в таблицу. Это свеженькие диски, а ведь в первые месяцы работы всегда наблюдается максимальный выход из строя дисков. Остальные потом продолжат работу — и могут работать годами или десятилетиями. А сбой в первые месяцы не страшен, потому что всегда покрывается гарантией.

    С другой стороны, можно сделать такие же преждевременные выводы об исключительно высокой надёжности моделей HGST HUH728080ALE600, Toshiba DT01ACA300, Toshiba MD04ABA400V, Toshiba MD04ABA500V, WDC WD40EFRX и WDC WD60EFRX, которые за квартал ни разу не вышли из строя. Опять же, это объясняется слишком малым количеством таких дисков: например, дисков WDC WD60EFRX установлено всего 443 штуки. Хотя впечатляет, конечно, что все 443 диска безупречно проработали с апреля по июнь.

    В этом отчёте Backblaze впервые включили индикатор «месяц к месяцу» (последняя колонка). Он показывает, как изменилась статистика выхода из строя по сравнению с предыдущим месяцем. Зелёная стрелочка вниз указывает на улучшение показателя.

    В следующей таблице собрана кумулятивная статистика за период с апреля 2013 года по 30 июня 2017 года.


    таблица Excel

    Малой выборкой объясняется интересный феномен, что диски Enterprise выходят из строя чаще, чем потребительские модели (сравните показатели «корпоративной» модели ST8000NM005 и потребительской модели ST8000DM002). По определению, такого не может быть, ведь корпоративные диски гораздо дороже и должны быть надёжнее.

    Если брать общую выборку, то enterprise-модели наработали 363 282 дня и показали годовой уровень выхода из строя 1,61%. В то же время потребительские диски на 8 ТБ наработали 422 263 дня (статистика из отчёта за III кв. 2016 года) и показали годовой уровень выхода из строя 1,60%. То есть при сравнимом большом количестве дискодней выход из строя примерно одинаковый. Backblaze говорит, что рано подводить итог, нужно наблюдать дальше.

    В целом по всем моделям, судя по всему, ситуация не слишком изменилась с января 2014 года, когда Backblaze сделала такой вывод:

    • Hitachi — если бы не цена, весь их парк накопителей состоял бы исключительно из этих дисков.
    • WD — купленные в самом начале терабайтные накопители до сих пор служат верой и правдой. Из более новых трёхтерабайтных моделей хорошо зарекомендовали себя диски Western Digital Red 3TB (WD30EFRX).
    • Seagate — их главное преимущество заключается в низкой цене. Поначалу они показывают себя неплохо, но со временем доставляют всё больше проблем. Компания продолжает закупать эти диски, так как в целом их покупка себя оправдывает.

    Хотя нюансы есть, конечно. Постоянно выходят новые модели, а показатели надёжности зависят от конкретной модели и даже от конкретной партии HDD. Да и вместо надёжности многим важнее соотношение надёжность/цена.

    Со следующей недели Backblaze собирается начать закупки HDD на 12 ТБ.
    Поделиться публикацией
    Комментарии 51
      0
      Ну так enterprise диски и работают в других режимах совершенно. Или оценка производилась в одинаковых условиях работы?
        0
        Тоже такой же вопрос возник.
          +2
          Я так понимаю, что примерно в одинаковых. Они дают статистику по дискам, которые жужжат у них в стойках, в одном режиме — 24х7 с произвольной нагрузкой.
            0
            Конечно в одинаковых, фото ниже в комментарии.
            Учитывая, что это сервис бэкапов, редкая запись до заполнения, а затем еще более редкое чтение.
              0

              Тогда результат вполне понятен: нет высокой нагрузки на диски — нет и причин ожидать серьёзной разницы между enterprise и consumer моделями.

            0
            Малой выборкой объясняется интересный феномен, что диски Enterprise выходят из строя чаще, чем потребительские модели (сравните показатели «корпоративной» модели ST8000NM005 и потребительской модели ST8000DM002). По определению, такого не может быть, ведь корпоративные диски гораздо дороже и должны быть надёжнее.

            А эти диски работали в одинаковых условиях?
            Логично предположить, что потребительские диски обычно работают в существенно более щадящем режиме, чем корпоративные. Причем вторые часто работают просто непрерывно на износ.

              +1
              Я думаю, что просто в случае с Backblaze нагрузка на диски относительно небольшая и в основном на запись, так что диски не работают на износ. Поэтому им подходят обычные потребительские HDD и их больше волнует совокупная стоимость хранения 1Тб
                +2
                Я так понимаю, что все НЖМД работали примерно в одинаковых условиях. Примерно таких:
                www.backblaze.com/blog/wp-content/uploads/2014/08/blog-270TB-storage-pod.jpg
                www.backblaze.com/pics/home-b2-datacenter-pods.jpg
                То есть условия у всех НЖМД разные, но нет никаких storage pods которые специально ставят в более холодных или виброспокойных стойках.
                  +1

                  А разве корпоративные не предназначены именно для такой работы?
                  При таком невысоком сроке работы, 30% отказов это катастрофически много.

                  +3
                  Почему-то бытует миф, что Enterprise диски чем-то лучше в плане надёжности, потому что дороже. По факту — это те же диски, с той же механикой, той же электроникой. Отличия только в FirmWare и/или в интерфейсе. Естественно, исключение — это высокооборотистые 10 и 15к диски, там другая механика.
                  Поэтому будет странно если о отказам они будут меньше или больше чем обычные. Должны быть равны десктопным.
                    0
                    вообще где-то читал что энтерпрайз серии могут использовать более тяжелый в прямом смысле конструктив — для уменьшения вибраций при работе, и взаимного влияния когда у тебя их целые полки. кмк звучит правдоподобно, но насколько реально — хз.
                      0
                      Несмотря на одинаковый конструктив, механику и электронику, можно проводить совершенно различного уровня технический контроль, что в итоге непосредственно влияет как на себестоимость, так и на надежность.
                      Поэтому будет странно если о отказам они будут меньше или больше чем обычные

                      Ничуть не странно, если для энтерпрайзных дисков проводится гораздо более жесткий отбор по качеству.
                        0
                        Это не миф, читайте их спецификации.
                        «Отличия только в firmware и интерфейсе» были только в самом начале выпуска отдельных энтерпрайзных линеек, по фичам они сильно и давно разошлись с десктопными.
                        +2
                        Backblaze говорит, что рано подводить итог, нужно наблюдать дальше.
                        Но заголовок я всё равно сделаю максимально сенсационным!
                          +8
                          Наиболее правдоподобное объяснение, на мой взгляд, в том, что firmware enterprise дисков считает диск вышедшим из строя при более низком пороге, например, ошибок считывания. Для Enterprise куда более важно вовремя вывести диск из RAID и поменять его на исправный (все равно отказ будет отработан RAID и данные будут восстановлены) не доводя его до физической потери данных, как «замерцал» сектор — в корзину. Поэтому — да, логично предположить, что enterprise будут называть себя «вышедшими из строя» при определенных ошибках чаще, чем consumer, которые будут до конца ремапиться и клацать головами, пытаясь считать неустойчивый сектор.
                            +2
                            Нечто похожее и используется. Технология называется TLER (Time-Limit error recovery), диск просто не делает дополнительные попытки прочитать сектор, если ему это не удалось за отведённое время. Предполагается, что целостность данных обеспечивается уровнем выше — RAID или резервированием. Зато диск продолжит работать дальше. Обычный диск с большИми временнЫми допусками может слишком надолго задуматься над попыткой чтения сбойного сектора, как результат контроллер RAID выкинет этот диск из массива. Это по сути единственное реальное отличие дисков Enterprise от обычных. Ну и, конечно, мешок маркетинга, заливающего про время наработки, надёжность и прочее. Еще одно реальное отличие, не относящееся к железу — срок гарантии.
                              0
                              Ну, на самом деле не единственное, но про остальное достаточно сложно рассказать в рамках сколь-нибудь интересной популярной статьи.
                              А, не, можно рассказать про расширенный сектор, по спецификации T10-DIF.
                                0
                                Это по сути единственное реальное отличие дисков Enterprise от обычных

                                А можно пруф на то, что в технологическом процессе производства действительно ни одного отличия нет? Или пруф того, что фактические отличие между разными экземплярами из одной партии никак не влияют на конечное исполнение дисков? Что, вот прям берут и СЛУЧАЙНО на диски из одной партии лепят наклейки, определяющие серию диска?
                              –5
                              Филькина грамота. Нет статистики по тотал R и W
                                –1
                                Так и должно быть, чо. Домашний усер купит диск, он у него посыпется — так больше не купит. А ынтырпрайз покупает в больших количествах, да и в маневрах ограничен
                                  0
                                  А на сколько отличается по цене Enterprise и обычный потребительский?
                                  Не выйдет ли так что обычных дисков можно купить значительно больше?
                                  И просто планово их менять?
                                    0
                                    Собственно Backblaze так и делают — в большей части у них крутятся «потребительские» линейки — Seagate Desktop, WD Red, HGST DeskStar, HGST MegaScale
                                      0
                                      Цена отличается от 1.5 до 3 крат.
                                        0
                                        Не выйдет ли так что обычных дисков можно купить значительно больше?
                                        И просто планово их менять?

                                        Именно так обычно и есть. Enterprise-диски предназначены для тех покупателей, которые не слишком заморачиваются с оптимизацией расходов на ИТ. В компаниях, в которых стоимость железа составляет значительную часть издержек (всякие там VDS-хостинги, файлохранилки и т.д.), обычно используют потребительское железо, просто с большей степенью резервирования.
                                          0
                                          Вообще-то эта статистика BackBlaze серьезно расходится с гугловской.
                                          На самом деле, процент брака в Enterprise сериях — если сравнивать статистику гугла по ним и BackBlaze по десктопным — если не на порядок (то есть в десять раз) ниже, то примерно около того.
                                          0

                                          HGST — это совсем не Хитачи, это отдельный бред. Причем, сейчас уже в составе Western Digital.

                                            +1
                                            HGST = Hitachi Global Storage Technologies, купленное ВДвцами в 2012 году у Хитачи бывшее IBMовское подразделение по производству жестких дисков, причем с обязательством перед антимонопольщиками сколько-то там лет сохранять его как независимую конкурирующую продуктовую линейку. Конечно же, совсем не Хитачи, да.
                                              0

                                              И вам по секрету скажу, оно до сих пор укомплектовано в основном айбиэмовцами. Оттуда высокое качество, каковое было установлено в далекие уже времена принадлежности к собственно IBM.

                                                0
                                                К слову если мне не изменяет память часть подразделения передали тошибе за счёт чего их диски тоже показывают хорошие результаты в отчётах Backblaze
                                                  0

                                                  Мощности по производству 3.5" дисков отошли WD, а 2.5" и внешних дисков — Тошибе. Вроде так.

                                                    +1
                                                    Вроде наоборот так как после этого в продаже появились 3.5 диски Toshiba которые были по сути переименованными Hitachi и 2.5 диски HGST а 3.5 диски HGST вообще в продаже не встречались.
                                                      0

                                                      верно

                                                  +1
                                                  Да, IBMовский DTLA — инженерный шедевр своего времени
                                                    +1
                                                    Также эти диски если мне не изменяет память дятлами называли по причине высокой шумности.
                                                      0
                                                      Ну да, а с осыпающимися от любого чиха пластинами это конечно никак не связано :)
                                                        0
                                                        ЕМНИП, дятлами их назвали за прекрасные звуки, которые появлялись при посыпавшихся пластинах.
                                                        Каждое включение компа надо было прислушиваться — а не прилетел ли дятел?
                                                      0
                                                      Оттуда высокое качество, каковое было установлено в далекие уже времена принадлежности к собственно IBM.

                                                      Насчет далёких времен, [вытряхивая песок из калош и кряхтя:}
                                                      — IBM DLTA aka «Дятел» смотрит на вас с изумлением
                                                      :) Имел «счастье» работать с ними :) Вот уже позже, во времена не столь далёкие, стало лучше.
                                                        +1
                                                        Зря, между прочим, смотрит. Я вот там ниже про DTTA писал уже: ничего не говорит аббревиатура?
                                                        IBMовские диски до дятлов были божественны. Живучие, скоростные, объемные. Точно так же, как Fujitsu до серии MPG (говорят, что даже поздних MPF, но к ним лично у меня никаких претензий) были лучшим выбором по надежности для лоукост сегмента.
                                                          0
                                                          По скорости к ним претензий не было никаких. Действительно быстрые железки были. А вот в остальном…
                                                          Патч для алгоритма завершения работы, «а то он кэш не успевает записать». Микруха на плате с температурой за 70. Поэтому у меня он жил с собственным охлаждением, как процессор :) Поэтому и не застучал.
                                                            0
                                                            Простите, теряю нить: это вы про DTLA, или про более ранние модели?
                                                        0
                                                        И вам по секрету скажу, оно до сих пор укомплектовано в основном айбиэмовцами. Оттуда высокое качество, каковое было установлено в далекие уже времена принадлежности к собственно IBM.


                                                        Я вам по секрету скажу:

                                                        IBM продало это подразделение после череды неудач с несколькими моделями жестких дисков подряд.

                                                        Так что ожидать от него какого-то сверхвысокого качества по той причине, что там работают IBM-овцы, которые в свое время это подразделение и поставили на колени — по меньшей мере странно.

                                                        Думаю, что там уже давным давно все по другому: IBM продало это подразделение много-много-много лет назад.
                                                    0
                                                    Почему-то вспоминается легендарное качество IBM DTLA серии…
                                                      0
                                                      Это со стеклянными пластинами которые, что ли? :)
                                                        +1
                                                        А мне вспоминается качество серии DTTA. Вполне себе легендарное, кстати.
                                                        0
                                                        Они (диски) не сломались, просто Backblaze планомерно проводит миграцию дисков с низкой плотностью на диски с высокой плотностью.


                                                        То-есть высвобождаемые диски вполне себе работоспособные, как я понимаю. Тогда вопрос куда они потом исчезают? И перепродаются ли, как выходящие из оборота сервера Googl-а и других крупных IT-организаций? (Была тут статья об этом) Можно ли эти диски купить и где?
                                                          0
                                                          ну, наверно, тот же ибей и рефёрбишд
                                                            0
                                                            в дробилку/под пресс.
                                                            стоимость гарантированной затирки одного харда скорее всего превосходит возможные доходы от их перепродажи.
                                                              0
                                                              SSD имеют TRIM команду и, зачастую, шифрование — после сочетания одного и второго можно до морковкиного заговения расковыривать «сырьё», а чистка двухтерового HDD SATA II (трижды забитый нулями) — это 4 штуки обрабатываемых в сутки на пределе интерфейса. С учётом скорости с блинов — ну 2 с каждого физического интерфейса. Не думаю, что это прям такие дикие расходы. Можно прямо на рабочем месте «дожигать». Полсуток и всё старьё отправляется на перепродажу. Слив полезной информации с того же винта занимает явно никак не менее 6 часов (с учётом сегментации, вряд ли льют «сырьём», КМК. Хотя если у них есть дупликационные установки — на них и тереть можно)
                                                                0
                                                                Не подскажете какие конторы возьмутся за восстановление данных даже после однократного зануления? Второе и третье же не просто так, правда?
                                                                  0
                                                                  Наверно, некоторые могут попытаться. Но за большИе деньги либо ещё какие преференции :)
                                                            0
                                                            Как последние три колонки рассчитывались?

                                                            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                            Самое читаемое