Гибридные диски для Enterprise СХД. Опыт использования Seagate EXOS



    Пару месяцев назад компания «Рэйдикс» получила возможность поработать со свежими накопителями Seagate EXOS, разработанными для задач корпоративного класса. Их отличительная особенность заключается в гибридном устройстве накопителя — в нем совмещены технологии обычных жестких дисков (для основного хранилища) и твердотельных накопителей (для кэширования горячих данных).

    У нас уже был положительный опыт применения гибридных дисков от Seagate в составе наших систем — пару лет назад мы внедряли решение для частного ЦОДа совместно с партнером из Южной Кореи. Тогда на тестах использовался бенчмарк Oracle Orion, и полученные результаты не уступали All-Flash массивам.

    В этом материале мы посмотрим как устроены накопители Seagate EXOS с технологией TurboBoost, оценим их возможности для задач корпоративного сегмента, и проверим производительность на смешанной нагрузке.

    Задачи корпоративного сегмента


    Существует более-менее устойчивый круг задач, который можно обозначить как задачи хранения данных в корпоративном (или enterprise) сегменте. К ним традиционно относят: функционирование CRM-приложений и ERP-систем, работу почтовых и файловых серверов, операции резервного копирования и виртуализации. С точки зрения СХД, реализация таких функций характеризуется потоком смешанной нагрузки, с явным преобладанием случайных запросов.

    Помимо этого, в enterprise-сегменте активно развиваются такие ресурсоемкие направления как многомерная аналитика OLAP (Online Analytical Processing) и обработка транзакций в режиме реального времени (OLTP, Online Transaction Processing). Их особенность заключается в том, что они в большей степени опираются на операции чтения, чем на операции записи. Создаваемая ими нагрузка — интенсивные потоки данных с небольшим размером блока — требует высокой производительности от системы.

    Роль всех перечисленных функций стремительно возрастает. Они перестают быть вспомогательными блоками в процессах создания ценности и переходят в раздел ключевых составляющих продукта. Для многих форм бизнеса это становится важным компонентом формирования конкурентного преимущества и рыночной устойчивости. В свою очередь, это значительно повышает требования к ИТ-инфраструктуре компаний: техническое оснащение должно обеспечивать максимальную пропускную способность и минимальное время отклика. Для обеспечения необходимой производительности в таких ситуациях выбирают All-Flash системы или системы гибридного хранения с функцией SSD-кэширования или тиринга.

    Помимо этого возникает еще один характерный для enterprise-сегмента фактор — жесткие требования по экономической эффективности. Вполне очевидно, что приобретение и обслуживание All-Flash массивов могут позволить себе далеко не все корпоративные структуры, поэтому многим компаниям приходится немного уступать в производительности, но приобретать гораздо более выгодные по цене решения. Эти условия сильно смещают рыночный фокус в сторону гибридных решений.

    Принцип гибрида или технология TurboBoost


    Принцип использования гибридных технологий сейчас уже хорошо знаком широкой аудитории. Он говорит о возможности использования разных технологий для получения дополнительных выгод в итоговом результате. В гибридных СХД сочетаются сильные стороны твердотельных накопителей и классических жестких дисков. На выходе мы получаем оптимизированное решение, где каждый компонент работает со своей задачей: HDD используется для хранения основного объема данных, а SSD — для временного содержания «горячих данных».

    По данным агентства IDC, в регионе EMEA около 45.3% рынка составляют гибридные СХД. Такая популярность определяется тем, что при сравнительной производительности стоимость таких систем существенно ниже, чем у решений на базе SSD, а цена за каждый IOps отстает на несколько порядков.

    Этот же гибридный принцип может быть реализован непосредственно на уровне накопителя. Компания Seagate первой воплотила эту идею в виде SSHD (Solid State Hybrid Drive) носителей. Такие диски приобрели относительную популярность на потребительском рынке, но в b2b-сегменте они встречаются не так часто.

    Текущее поколение этой технологии в компании Seagate идет под коммерческим названием TurboBoost. Для корпоративного сегмента компания использует технологию TurboBoost в линейке дисков Seagate EXOS, которые имеют повышенные показатели надежности и оптимальное сочетание производительности и экономичности. Собранная на основе таких дисков СХД будет по итоговым характеристикам соответствовать гибридной конфигурации, при этом кэширование «горячих» данных происходит на уровне накопителя и выполняется за счет возможностей прошивки.

    В дисках Seagate EXOS для локального SSD кэша используется встроенная eMLC (Enterpise Multi-Level Cell) NAND-память объемом 16 ГБ, которая характеризуется значительно большим ресурсом перезаписи, чем MLC потребительского сегмента.

    Совместная полезность


    Получив в свое распоряжение 8 накопителей Seagate EXOS 10E24000 объемом 1.2 ТБ, мы решили проверить их продуктивность в составе нашей системы на базе RAIDIX 4.7.

    Внешне такой диск выглядит как стандартный HDD: металлический кейс 2,5-дюймового формата с фирменной этикеткой и стандартными отверстиями для крепежа.



    Накопитель оборудован SAS3 интерфейсом 12 Гбит/с, позволяющим эффективно работать с двумя контроллерами системы хранения. Также стоит отметить, что этот интерфейс обладает большей глубиной очереди, чем SATA3.



    Отметим, что с точки зрения управления такой диск в СХД представляется единым носителем, в котором пространство хранения не разделяется на области HDD и SSD. Это исключает необходимость использования программного SSD-кэша и упрощает конфигурацию системы.

    В качестве прикладного сценария для готового решения рассматривалась работа с нагрузкой от типовых корпоративных приложений.

    Главная ожидаемая выгода от создаваемой СХД — эффективность работы на смешанных нагрузках с преобладанием операций чтения. Программно-определяемые СХД RAIDIX отличаются высокой производительностью при работе с последовательной нагрузкой, а накопители Seagate с технологией TurboBoost помогают оптимизировать работу со случайными запросами.

    Для выбранного сценария это выглядит следующим образом: эффективность работы со случайной нагрузкой от баз данных и других прикладных задач будет гарантироваться SSD-элементами, а специфика программного обеспечения позволит сохранить высокую скорость обработки последовательной нагрузки от восстановления БД или загрузки данных.

    При этом, вся система выглядит привлекательной по соотношению цены и производительности: недорогие (относительно All-Flash) гибридные накопители хорошо сочетаются с гибкостью и экономичностью программно-определяемой СХД, построенной на стандартном серверном оборудовании.

    Тестирование производительности


    Тестирование проводилось при помощи утилиты fio v3.1.

    Последовательность минутных fio-тестов по 32 потока с глубиной очереди 1.
    Смешанная нагрузка: 70% чтения и 30% записи.
    Размер блока от 4k до 1MB.
    Нагрузка на зону размером 130 Гб.
    Серверная платформа AIC HA201-TP (1 шт.)
    CPU Intel Xeon E5-2620v2 (2 шт.)
    RAM 128GB
    SAS адаптер LSI SAS3008
    Накопители Seagate EXOS 10E24000 (8 шт.)
    Уровень массива RAID 6


    Результаты тестов










    Система на базе RAIDIX 4.7 с 8 накопителями Seagate EXOS 10e2400 показывает суммарную производительность до 220 000 IOps на чтение/запись блоком 4k.

    Заключение


    Накопители с технологией TurboBoost открывают новые возможности для пользователей и производителей систем хранения данных. Использование локального SSD-кэша значительно повышает производительность системы при несущественном увеличении затрат на приобретение накопителей.

    Проведенные тесты накопителей Seagate в СХД под управлением RAIDIX показали уверенно высокий уровень производительности на смешанном паттерне нагрузки (70/30), моделирующем приблизительные требования прикладных задач в корпоративном сегменте. При этом была достигнуты показатели в 150 раз превышающие предельные значения HDD накопителей. Здесь стоит отметить, что расходы на приобретения СХД по такой конфигурации составляют около 60% от стоимости сопоставимого All-Flash решения.

    Ключевые показатели


    • Уровень годовых отказов диска составляет менее 0.44%
    • На 40% дешевле All-Flash решения
    • В 150 раз быстрее HDD
    • До 220 000 IOps на 8 накопителях
    RAIDIX
    Компания
    Реклама
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее

    Комментарии 17

      0
      В 150 быстрее HDD

      В 150 чего?
      0
      Последовательность минутных fio-тестов

      Мне кажется, что тестить целую минуту — это слишком много.
        +2
        Нагрузка на зону размером 130 Гб.

        Специально, что бы в кэш умещалось аккуратненько? :))
          0
          Да, специально что бы в кэш попадало, т.к. тестировали именно возможность SSD-кэширования. Бьём в одну область, чтобы проверить работу кэша дисков и сравнить его с работой кэша в СХД. Тут есть подробности по этому вопросу.
            0
            сравнить его с работой кэша в СХД

            И с какой СХД вы это сравнивали?
          0
          Проводится серия тестов, каждый из которых длится одну минуту. Это делается для того, чтобы «прогреть» кэш
            0
            Так а смысл то в чём? Показать что кэш есть и он как то работает?
            Вы запустите тест, приближённый к реальной ситуации, так, что бы данных было больше, чем кэш и что бы они использовались не минуту. Иначе возьмите для сравнения 2x120Gb SSD в зеркало хоть коньсьюмерские и сравните. Иначе не понятно какой смысл сравнивать кэш с HDD.
              0
              Смысл был протестировать производительность SSD-части гибридных дисков, при условии 100% попадания в кэш, и как эти диски будут вести себя в RAID-6 в рамках СХД
                0
                Ну т.е. тест ни о чём. А вроде кажетесь такими серьёзными ребятами.
          0
          До 220 000 IOps на 8 накопителях

          А на вашем графике всего 185k
            0
            220 000 IOps — это смешанная нагрузка 70/30 блоком 4k
            +1

            Коллеги уже высказались, но вставлю и я 5 копеек.
            Сначала вы описываете типы нагрузки, а потом оп, и делаете просто синтетические тесты.
            Хотелось бы посмотреть живые примеры. Те же бэкапы. Когда кеш будет заниматься записью на медленную часть.
            Ведь вопрос не в том, как быстро работает кеш, а в том, успеет ли забэкапиться/развернуться система за определенное время.

              +2
              Да, очень странное тестирование. Очень синтетическое, четко чтобы протестить только SSD часть этих дисков.
                +1
                Сейчас Intel® SSD D3-S4510 такого же объема стоят тех же денег, как и SFF SAS диски.
                Смысл ставить SSHD?
                Apache pass DIMM + SATA SSD один из самых оптимальных вариантов для SDS или HCI.
                  0
                  Полностью согласен, сейчас планирую замену части отработавших свой ресурс SFF SAS HDD на SSD MICRON 5200 MAX (intel как то еще дороговато). Ранее уже менял диски в EMC ScaleIO (VxFlex OS)на серию EXOS думал, что будет ощутимый рост производительности, но при наличии кэширования в памяти и RFCache — Iometer показывает вообще неадекватную информацию (при 30 дисках sas(сырой объем 12 ТБ) ,ram cache 16Gb, ssd cache (rfcashe) 1,2Тб — показал 44Kiops- уперлось в производительность сети 1 Gb/s(28Kiops).
                  Рост есть, но при сервисных процедурах Rebalanse /Rebuild(добавление и заполнение нового диска, на объем больше чем размер кэша внутри диска- разницы c обычным HDD нет вообще)
                  Ранее действительно планировал замену дисков на EXOS, но сейчас рентабельней заменять на SSD, правда есть накладные затраты в части сети 10G. Но про это распишу отдельно, давно собирался поделится 10 летним опытом перехода от Starwind ISCSI к EMC ScaleIO, и сопутствующих этому танцев с бубном.
                  0
                  Ключевой задачей этих тестов было понимание максимальной производительности гибридных дисков при 100% cache hit и сравнение ее с максимальной производительностью гибридного пула с использованием кэша на чиcтых SSD.

                  Этим тестом мы опровергли гипотезу о том, производительность кэша на дисках даже в лучшем случае будет отставать от производительности кэша на отдельном накопителе.

                  Конечно, при реальном использовании результат будет иным и он будет зависеть от конкретного паттерна нагрузки, локальностей данных, алгоритмов вытеснения и префетча.

                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                  Самое читаемое