Новый лидер в price-performance среди СХД?

    Если вы интересуетесь системами хранения данных, то сайт Storage Performance Council (SPC) вам наверняка знаком. Многие производители, в соответствии с принятыми методиками, проводят тесты своих систем и публикуют их результаты. Конечно, как в любых других синтетических тестах, можно критиковать и методику, и точность опубликованных ценовых характеристик, но на текущий момент это, пожалуй, наиболее объективный открытый источник данных о производительности СХД.

    Недавно опубликованные результаты тестов системы DataCore SANsymphony-V 10 демонстрируют серьезный прорыв программно-определяемых СХД (Software Defined Storage).

    Речь идет даже не об абсолютных значениях интегральной производительности — протестированная система оказалась позади первой десятки победителей с результатом порядка 450тыс IOPs, хотя и это далеко не самый плохой результат. Прорыв случился в таком важном показателе, как стоимость одной операции ввода-вывода ($/IOPs) — производитель сумел достичь величины в 0.08$/IOPs (8 центов(!) за IOPs). Это действительно великолепный результат, учитывая, что ближайший конкурент (Infortrend EonStor DS 3024B) демонстрирует результат в 3 раза худший — только 0.24$/IOPs. Для большинства же классических систем хранения, результат оказывается еще в несколько раз больше.

    Кроме того, при 100% нагрузке время отклика составило 0.32мс, что тоже является замечательным показателем — для многих All Flash СХД вполне приемлемым считается результат меньше 1мс.

    Низкая стоимость IOPs достигнута, разумеется, за счет того, что система имеет весьма демократичную цену — весь комплект из железа и лицензий стоит 38400$ (с учетом не очень большого дисконта). Детально стоимость решения расписна в самом отчете и любой желающий может с ней ознакомиться.

    Что же, пришла пора новых технологий и уже нужно выводить из обслуживания все старые СХД, заменяя их на SDS?

    Да, на первый взгляд, получить схожий результат конкурентам будет очень сложно (если вообще возможно в рамках имеющихся технологий). Дело в том, что SANsymphony-V это программное решение, которое работает внутри сервера и, как следствие, ему не требуется никакая коммутация (FC/Ethernet) со всеми связанными задержками. Кроме того, в версии 10 реализована технология многопоточного параллельного доступа (parallel I/O) к данным и здесь современные многоядерные процессоры дают заметное преимущество. (Почему многопоточный доступ становится актуальным можно прочитать здесь)

    Но давайте более внимательно посмотрим на конфигурацию системы, которая участвовала в тестах. Это всего один сервер Lenovo x3650M5 с двумя процессорами Intel Xeon E5-2695v3 и 544GB оперативной памяти (из которой чуть меньше 409GB было выделено для работы SANsymphony-V). Для размещения данных использовались 16 SSD и 8 HDD общим объемом 10TB. Реальный полезный объем составил 2.9ТБ (29% от общей “сырой” емкости).
    image

    Довольно интересно отметить полученные величины производительности для раздела ASU-3 (он размещался на обычных HDD дисках) — более 120тыс IOPs, что однозначно свидетельствуют о том, что данные реально отдавались из кэша (которого в системе было очень много). Поэтому я не очень понимаю, зачем эти диски вообще поставили в систему — если только показать возможность создания гибридного решения.

    Что касается архитектуры, то конечно бросается в глаза отсутствие какой-либо отказоустойчивости на уровне всей “системы хранения”. Сами данные зеркалируются внутри одного сервера, но сам сервер не защищен ничем. Насколько изменится производительность, когда мы захотим обеспечить нормальную отказоустойчивость? Вот здесь и начнут играть сетевые протоколы, от которых мы так удачно избавились раньше, и вопрос задержек вернется на повестку дня.

    Не использовались “фичи” по оптимизации хранения — компрессия, дедупликация. Конечно, никто в здравом уме не будет их включать во время тестов, но стоит помнить, что в реальной жизни они могут пригодиться. Хотя конечно и без того низкая стоимость как одного IOPs, так и всей системы в целом может позволить отказаться от этих возможностей.

    А что предлагают конкуренты? Возьмем тоже не так давно опубликованный результат для IBM FlashSystem 900 — 440тыс IOPs, 0.49ms время отклика при 100% нагрузке (почти на 50% хуже, чем у DataCore) и целый 1.61$/IOPs (в 20 раз больше, чем у DataCore). Но что мы имеем с точки зрения заказчика? Полноценную СХД, подключаемую по FC (один файберный коммутатор даже входит в расчетную стоимость), которая обладает базовым функционалом по отказоустойчивости — не только по отношению к дисковым модулям, но и к контроллерам. Используя такую классическую СХД, заказчику не нужно настраивать и следить за работоспособностью операционной системы в системе хранения (в случае с DataCore использовался Windows Server 2008R2). Немаловажный фактор для пользователя это объем системы — в FlashSystem 900 использовалось 34ТБ (50% от полной емкости). А это в 10 раз больше, чем для теста SANsymphony-V. Сейчас, когда сотни тысяч IOPs перестали быть недостижимым пределом, для ряда решений полезная емкость системы снова выходит на первый план. И разница в цене гигабайта получается совсем не такая большая. Конечно, можно начать спорить, что производительность SANsymphony-V вырастет вместе с объемом, но есть определенные сомнения — кэш системы не получится пропорционально увеличить, а использование параллельно нескольких серверов с ПО DataCore вызовет снижение производительности за счет все тех же проблем с задержками в сетевых протоколах и интерфейсах.

    Решение DataCore безусловно интересное и может быть успешно использовано для построения программно-определяемых систем хранения для задач, требующих максимальную производительность. Стоимость решения, особенно в эти непростые дни, может стать определяющим фактором для многих заказчиков. Но при проработке решения не стоит забывать про отказоустойчивость системы и правильно сравнивать цены различных вариантов, учитывая все особенности системы целиком, а не только абстрактную производительность или стоимость IOPs.

    Сделать сайзинг системы, подобрать и сравнить варианты реализации и, конечно, подготовить проект всегда рады специалисты Тринити. Наша цель — помочь заказчику выбрать наиболее подходящее решение стоящих перед вами задач.

    Другие статьи Тринити можно найти в блоге и хабе Тринити. Подписывайтесь!
    Тринити
    Системный интегратор. ИТ-решение бизнес задач.
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 17

      0
      Хотелось бы понять отличие между «бросающимся в глаза отсутствием какой-либо отказоустойчивости у DataCore» и «полноценной СХД IBM FlashSystem 900, обладающей базовым функционалом по отказоустойчивости». Как видно из спецификации с сайта storageperformance.org, решение с DataCore имеет дублированные блоки питания, процессора и контроллеры. Если необходим Fibre Channel — докупаем 2 FC адаптера, что повысит стоимость решения на 10%, но не в 20 раз как у FlashSystem 900.
        0
        «Дублированные процессоры» — они не дублированные, их просто 2 :) И, если сдохнет один, то от второго толку будет не слишком много. И это совсем не то, что второй контроллер. А вот, если захотим «второй контроллер» для DataCore, то это будет второй сервер, второй набор дисков и второй набор лицензий — система станет ровно в 2 раза дороже.
          0
          Ну не ровно в два, если мы добавляем третий контроллер то на треть. И в зависимости от «вилки» по объему в которую мы попадаем, эти лишние террабайты могут лицензироваться не слишком дорого.
          Вообще Datacore выглядит ну очень круто, мы сейчас серьезно думаем об организации на его основе небольшого хранилище на 20 TB на разные нужды.
            0
            если мы добавляем третий контроллер то на треть

            это если четвертый, то на треть :)
            Но у нас тут только один, поэтому мы добавляем второй, а значит будет в два раза дороже.
              0
              Ой, в половину если третий. Конец дня не способствует математическим вычислениям.
              Я не уверен, что в конфигурации с одним контроллер это вообще будет работать. Вендором точно рекомендовано от двух. Один — слишком опасно же, отказоустойчивости никакой, упал сервер — весь ваш массив как минимум не доступен.
                0
                Один — слишком опасно же, отказоустойчивости никакой, упал сервер — весь ваш массив как минимум не доступен.

                Так именно про это и написано же!
        0
        Если выйдет из строя процессор, то DataCore продолжит работать в том же режиме, что и классический массив на одном контроллере — с 50% уменьшением вычислительной производительности. Только при этом в классическом массиве выйдут из строя 50% портов, а в DataCore все порты останутся в рабочем режиме.
          0
          Кажется, процессор датакору нужен меньше всего. Потеряется отказоустойчивость по сути только.
            0
            Отказоустойчивость от процессора вообще никак не зависит. Она зависит от наличия нескольких серверов.
              0
              А, вы реально про физические процессоры внутри сервера. Я как-то нить разговора утратил. Я думал, что речь о двух серверах-контроллерах и выходе одного из них из строя.
                0
                Это скорее не я, а beststoragename про реальные процессоры :)
                А процессор конечно ему нужен — весь функционал-то в софте. Такие штуки как тиринг, дедупликация, компрессия и т.п. даром не даются — приходится часть тактов занять полезной работой :)
                  0
                  Ну, речь о том что это не супер процессороёмкое приложение. Оперативка тут реально важна, а проц это конечно не последнее, на что вы будете смотреть при проектировании такой системы, но точно одно из последних.
            0
            Какая чушь, прости господи! Ну попробуйте выдернуть из любого современного сервера процессор CPU0 и я посмотрю, как у вас он продолжит работать «в том же режиме». А даже если CPU1 кончится, то потеряете гораздо больше, чем половину процессорной мощности (если вообще взлетит после ребута).
              0
              Конечно DataCore будет работать. Более того, можно поставить процессора с большей частотой, количеством ядер, расширить до 32-х узлов наконец. Такая масштабируемость и отказоустойчивость достижима у IBM FlashSystem 900? А по поводу непревзойденной отказоустойчивости IBM — это маркетинг. Я знаю десяток случаев, когда массивы теряли данные после перезаливки firmware, отказа компонентов… Да что там говорить, даже добавление дисков может вывести из строя двухконтроллерный массив. У меня такое было с DS4700. После разборок IBM вынес вердикт, что диски добавляли быстрее, чем требовалось по инструкции.
                0
                Ну да, сервер работать перестанет, а DataCore в вакууме продолжит работать! Конечно!
                Еще раз (по полочкам):
                1. Сходите и выдерните CPU0 из любого своего сервера (желательно «на ходу») — посмотрим на результат. После этого обсудим что и как будет работать.
                2. Да, можно поставить процессоры с большей частотой. Можно взять 32 узла, можно памяти добавить. Можно что угодно сделать. Но протестирована конфигурация с одним сервером. Одним, Карл! Следовательно отказоустойчивости нет. Точка. Нет отказоустойчивости. Ее можно получить, но это будет другая конфигурация с другой ценой. И у этой конфигурации будут другие результаты по производительности.

                Если нужно масштабировать FlashSystem, есть другое решение — FlashSystem V9000. И, да, проблемы могут быть на любом оборудовании. Но это не повод отказываться от базовых принципов отказоустойчивости. Нет смысла переходить дорогу на красный свет, мотивируя это тем, что и без того многих сбивают, когда они на зеленый переходят.
                  0
                  В конфигурации использовалось 2 CPU по 14 ядер, DataCore достаточно одного CPU с 2 ядрами. Маловероятно, что администратор вообще захочет вынимать 14-ти ядерный процессор на работающем сервере, а вот потерять данные на двухконтроллерном массиве, дернув не тот битый диск или устанавливая новый, более реально.
                  И вообще, у нас отличие по стоимости IBM и DataCore в 20 раз! В 20 раз, Карл! Поэтому мы можем легко добавить второй и третий сервер и решение будет все равно значительно дешевле IBM FlashSystem 900. При этом автору не нужно гадать, как измениться производительность — протестированные конфигурации опубликованы на сайте DataCore www.datacore.com/products/proven-design-reference-architectures.
                  Я, конечно, понимаю логику системного интегратора — лучше впарить одному заказчику FlashSystem 900, чем 20-ти заказчикам решение с DataCore. Но в конечном итоге будущее за программно-определяемыми СХД.
                    0
                    DataCore достаточно одного CPU с 2 ядрами

                    Для получения тех результатов, которые опубликованы? :) Уж конечно!

                    И вообще, у нас отличие по стоимости IBM и DataCore в 20 раз!

                    Точно! Все правильно пишете — вот поэтому ниже и написано, что считать нужно правильно, а не только "гросс" суммы и гросс иопсы. Только объем системы у IBM в 10 раз больше, контроллеров два (а на самом деле есть еще много других "но" и "если"). И эти "но" и "если" далеко не так однозначны (в пользу разных решений) и зависят от конкретной задачи.
                    Цель не продать дорого, а подобрать решение, которое будет выполнять поставленные задачи. Но если из всех достижений проекта будут только красивые результаты синтетических тестов (а они могут получиться и там, и там), то можно считать проект провальным.

                    протестированные конфигурации опубликованы на сайте DataCore

                    Ой ли! А читали сами спеки и результаты вдумчиво? Линейно растет производительность при добавлении узлов — отлично (наверное репликация за счет святого духа работает). Памяти вот прямо 100% в compute доступно (про кэш случайно наверное забыли написать). Marketing bullshit нужно очень аккуратно читать и верить далеко не всему.

                    SDS часто оправдан. Часто очень финансово привлекателен (особенно на первый взгляд). Но далеко не всегда. И выбирать систему, руководствуясь только оптимистичным рекламным листком конечно можно, но часто это заканчивается не очень хорошо. И обычно для всех участников проекта.

          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

          Самое читаемое