Тестируем массив OceanStor Dorado V3: настолько обычный, что прямо вообще


    OceanStor Dorado5000 V3

    В общем, это массив как массив. На нём новые NVMe-диски. Получаешь хорошую производительность «за те же деньги». Но есть два нюанса. Нюансы такие: он хорош в соотношении «стоимость за ГБ + производительность» и он не американский, то есть подходит тем, кто под санкциями.

    Мы его спокойно себе тестировали, когда вдруг на горизонте показался очень взволнованный заказчик. У него была гибридная СХД с кончившейся поддержкой, где вылетел контроллер. СХД не самая новая и дисков за сотню. Без контроллера производительность очень упала. Ждать новый шесть недель. Коллеги бились в панике, попутно умоляя нас, каким-то неведомым образом сократить сроки поставки нового контроллера. КРОК может все. Иногда даже больше.

    У нас на тестах была новая железка Дорадо. Толком обкатать не успели, но вроде нормальная. Объяснили, переглянулись — и дали погонять как раз на то время, пока будет плыть новый контроллер. За сутки все смигрировали, но оставили старую систему в качестве резерва.

    Новый контроллер таки приплыл даже немного раньше, чем ожидалось. Пришло время меняться обратно. Сообщили о том, что готовы провести работы по замене. Нам в ответ рассказали удивительную историю про то, что отчеты теперь генерятся на порядок быстрее, и он рассмотрел бы эту железку насовсем. И старое им уже как бы и не надо. У клиента есть стандартные операции с БД: закрытие дня, отчет за месяц и т. д. Эти операции ускорились не на порядок, конечно, но по нашим замерам чуть меньше чем в три раза.

    Мы в целом были не против отдать пациента, но хотели довести тесты до конца. Поэтому, когда приехал контроллер, забрали его на две недели к себе, подёргали запчасти, поиздевались, сделали переоценку и вернули заказчику. Пользователи, успевшие привыкнуть к хорошему, к этому моменту закончили доклёвывать тело админа. Посчитали всё. Получается довольно в рынке. В общем, нормальные деньги, конкурентное решение, но клиент бюджет на этот год уже спустил. Мы ему и предложили массив с рассрочкой платежа на три года. Бизнес одобрил, бухгалтерия одобрила, вопрос уже на финише.

    Теперь почему Дорада дешевле рынка? Дешевле массив потому, что Хуавей делает половину чипов своими собственными трудовыми руками. Street-price цена такая же, как на конкурентов, но скидки больше — благодаря собственному производству вендора есть куда падать.

    В линейке два массива:



    Массивы двухконтроллерные Active\Active (дисковые полки подключаются по SAS3.0). При желании, контроллеров может быть даже больше (в данный момент – до шести, а после НГ обещают аж восемь).

    FlashLink обеспечивает до 4 млн IOPS при стабильной задержке не более 500 мкс. Функционал HyperMetro обеспечивает растянутый логический диск функционирующий в режиме «Active-Active», гарантирующий доступность данных на уровне 99,9999% с задержкой 1 мс.
    Разработчики дисков на этом проекте (как аппаратной части, так и прошивки) работали совместно с разработчиками СХД. В результате оптимизирована прошивка под железо и под логику работы — эффект виден не только в производительности: все стало работать с меньшим влиянием на продуктив, но и в допфункционале, таком как репликация и мгновенные снимки.

    Отказоустойчивость тоже стала выше. Вылет трёх дисков позволяет продолжить работу без прерывания сервиса.

    Слайды


    Масштаб:


    OceanStor Dorado5000 V3

    Начинка:


    Контроллер массива

    NVME диск

    Блок питания и UPS (батарейка)


    OceanStor Dorado6000 V3


    OceanStor Dorado6000 V3 Disk Enclosure


    OceanStor Dorado5000 V3

    Расширенный функционал массива


    1. Дедупликация и компрессия
    2. Тонкое выделение лунов
    3. Виртуализация сторонних массивов (в том числе тиринг на массивы с более медленными дисками)
    4. Мгновенные снимки
    5. Active\Active Metro-кластер (замена синхронной репликации)
    6. Репликация (асинхронная). ПО OceanStor BCManager интегрируется с прикладом и позволяет делать асинхронную репликацию в application-consistent режиме.

    Тесты


    Тестирование производилось на системе хранения OceanStor Dorado5000 V3 с 25 SSD дисками. Два луна размером 2 Тб с массива были отданы виртуальной машине на ESX хосте. Перед тестами луны заполнялись на 100% случайными данными.

    По результатам тестирования массив показал отличную производительность для любых типов доступа.



    Результаты:

    • отличная производительность;
    • приятный и отзывчивый интерфейс;
    • присутствует практически весь необходимый функционал (кроме синхронной репликации), есть метрокластер, компрессия и дедупликация;
    • инсталляция за 5 минут.

    СХД подходит для решения 99% задач, требующих Full FLASH СХД. На тестах и в бою проявила себя на отлично. А ещё Хуавей можно проводить как импортозамещение, что идет еще одним хорошим плюсом.

    Железка отлично подходит для высоконагруженных приложений. Основной упор при ее создании был сделан на высокую производительность, надежность и низкое время отклика.

    У нас, кстати, появилась еще одна такая железка в нашем демо-фонде. С радостью предоставим возможность протестировать всем желающим.

    Вот тут ещё есть видео.

    КРОК

    220,00

    №1 по ИТ-услугам в России

    Поделиться публикацией
    Комментарии 29
      +1
      тесты с включенной дедупликацией и компресией не проводили?
      нам заявляли, что производительность сильно проседает, так же нельзя на томе отключить дедупликацию, данные придётся мигрировать на другой том.
        0
        Тесты с дедупликацией сложноповторимы из-за разного набора данных и, как следствие, разного коэффициента дедупликации. У кого-то производительность будет хороший, у кого-то совсем плохой. Поэтому обычно тестируем без нее.
          0
          Думаю вопрос был не в уровне компрессии, а как включение дедупа/компрессии сказывается на общей производительности системы
            0
            Ситуация здесь абсолютно общая со всеми решениями данного класса. Просадка производительности зависит от данных и может быть различной на разных наборах данных. Где-то массив может даже быстрее работать.
              0
              Почему тогда на AFF дедупликация с компрессией не влияют на производительность?
          0
          Проводили тесты по эффективному хранению данных, компрессия для тома с БД MS SQL была от 2:1 до 2.5:1, дедупликация отработала как и должна (копия большого файла не заняла места). Именно на NVMe дедупликация не отключается и включена всегда как и тонкое выделение, можно включить\выключить компрессию и вот с компрессией деградация производительности около 15-20%. Избыточный запас мощности — основной метод обхода проблем с производительностью в этой системе хранения.
            0
            НА самом деле тестирование без дедупа и компрессии — это действительно не протестировать самое интересное. Потому как система изначально создавалась под использование этих фич. В данный момент есть глобальная промо программа: гарантия 3:1 заказчику поставляется в три раза меньше дисков чем он собирается хранить данных и лицензия дедупа и компрессии в комплекте. Если данные не влазять Huawei добавляет диски бесплатно.
            Дедуп и компрессию нельзя включить и отключить на лету это выбирается только при создании LUN. Из виденных мной результатов разница между результатами 3-6 процентов. Достигается большим кэшем и резервированием ядер в процессорах, в современных моделях стоят 14 ядерные ксеоны. Соответственно если не включен дедуп и компрессия, часть ядер просто простаивает и ничего не делает.

            +1
            Содержим у себя на предприятие OceanStore 5500 V3, за полтора года использования 2 раза угроза потери данных, массив удавалось восстановить только заплатками и заменами дисков при этом массив не показывал, что диски дохлые, здесь также?
              0
              Мы на тестах с таким не сталкивались.
                0
                Звучит как-то странно. Что значит заплатками и заменами дисков? Не ребилдился или что? Ошибки?
                0

                Мне на тест пришла 2800v3.
                Впечатление положительное, правда на экстремальных нагрузках пока ещё не гоняли.
                Впервые столкнулся с возможностью поднятия виртуальных машин прямо на контроллере, ресурсы под них конечно сильно зарезаны, как полноценный гипервизор ее использовать не получится, но функционал забавный.

                  0
                  Эта модель предназначена для видеонаблюдения, чтобы камеры подключать. В обычных моделях такой фичи нет.
                    0

                    Йес, мы как раз и занимались интеграцией софта для видеонаблюдения/аналитики внутрь этого океанстора. Две недели общения с китайским RnD дались конечно с трудом но позитивно и продуктивно.

                  0
                  >Массивы двухконтроллерные Active\Active
                  ALUA?
                    0
                    125к иопс на нвме дисках. Это шутка какая-то?
                      0

                      А что удивительного? Наружу то тут смотрит все тот же FC. Пока еще нет массивов с поддержкой NVMe over FC, хотя Brocade уже FC свитчи с таким функционалом выпустил. Соответственно с одного порта FC вы вряд ли снимите больше ~60k-65k IOPS в данной ситуации. Т.е. то что тут NVMе по большому счету не является каким-то конкурентным преимуществом по сравнению с просто SSD дисками :). Просто видимо удобно писать маркетинговые брошюры ;). Ну и возможно в будущем в следующих моделях вендору будет проще реализовать NVMe полностью от сервера до дисков массива. Хотя и это не факт :).

                        0
                        А почему 60-65к? Тот же qlogic на 16Gb заявляет по 500к на порт.
                          0

                          Потому что на практике в живую я больше с одного порта не видел. Если у вас есть другой опыт, то поделитесь.

                            0
                            К сожалению нет СХД с такой производительностью. Но есть контроллеры и свитчи 16Gb. Если расскажите как можно без СХД это по тестировать, то я бы попробовал.
                            Я бы понял расхождение в проценты, но не на порядок…
                              0

                              Насколько понимаю, как раз таки современные midrange (тем более all flash) СХД уже давно перешагнули порог в 100k IOPS. Так что в теории можно собрать стенд с СХД и попытаться получить хотя бы 100k-200k IOPS на один порт HBA в сервере. Но я на практике и в тестах такой производительности не видел на один порт. По этому и предложил вам опытом поделится, если вы таковой имеете. А так в маркетинговых целях вендора могут писать, что угодно.

                                0
                                Но 60к это же совсем не много. Вы уверены, что упирались именно в производительность интерфейса?
                                  0
                                  VMware выжимали лимит HBA из даташита на Виолинах.
                                    0

                                    Интересно. Но даже там это 5 двухпортовых hba. Т.е. около 100k iops на порт. И две скрипки. Хотя судя по даташиту должно быть 200k IOPS на порт указанной HBA. Для чего тогда их 5 брали? Если можно было меньшим числом обойтись в таком случае.

                            0
                            Был же NetApp с NVMe-oF или вам его упоминать запрещает кодекс самурая?
                              0

                              Честно говоря я не знал о такой модели у Netapp. Кодексы тут совершенно не причем :). Погуглил, насколько я понял, там была реализация NVMe через фабрику InfiniBand. По моему мнению это вряд ли станет стандартом в индустрии. Доводы можно почитать тут в Chapter 4. Но это всего лишь мое мнение :).

                                0
                                Ещё Брокейд собирал PoC на FC с AFF A700, но это пока не продают и все брошюры куда-то пропали.
                          +2

                          Когдя я фэндовал на Huawei:


                          • В OceanStor с vmware vvol не работала половина функционала.
                          • Не было балансировки LUN по контроллерам. В 4-8 контроллерных конфигурациях балансировать LUN вручную ещё та обезьянья работа. Один LUN на несколько контроллеров не делился.
                          • Решения проблем уровня L3 можно было ждать месяцами. Помню плата аппаратной акселерации компрессии херила данные. Потом её просто сняли с продажи.
                          • Надо ставить софт Multipathing. Но если сервер подключен к СХД разных вендоров, весь MPIO софт не поставишь. А дефолтного иногда недостаточно. А виртуальные WWN OceanStor делать не умел...

                          Чипы памяти Huawei не производит, это основная статья затрат на SSD/NVMe. Чипов для контроллеров на рынке и так навалом.
                          x86 серверы для HW собирает Foxconn, дизайн конечно их)


                          Минусите)

                            0
                            Когдя я фэндовал на Huawei

                            Насколько давно это было?

                              0

                              Год назад.

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое