Сервер Huawei KunLun – наше тестирование

    Сначала несколько слов об архитектуре KunLun – информации о ней в русскоязычном сегменте практически нет. KunLun создавался как High-End-платформа, соответственно все его компоненты дублируются (включая модули управления и контроллеров NUMA-узлов). Впрочем, дублированием компонентов High-End’ность сервера не ограничивается: решение позволяет без остановки ОС заменять не только PCIe-платы (это в принципе не ново), но и процессоры с памятью. Система проактивно даст знать, какие компоненты скоро могут выйти из строя, не дожидаясь самого сбоя. Заменить их можно будет без остановки ОС. На сегодня горячая замена процессоров и модулей памяти предусмотрена только в ОС EulerOS (CentOS от Huawei). Поддержку «из коробки» обещают в скором времени для RHEL и SLES.

    Серверные системные платы включающие по 1 процессору и по 24 модуля памяти, через систему коммутации объединяются в физические партиции с 4, 8, 16 или 32 процессорами. Меньшую гранулярность можно получить лишь применяя логическое партиционирование (гипервизор).

    Сервер также оснащен встроенными дисками – до 4 корзин по 12 дисков в каждой – с возможностью создавать аппаратный RAID внутри каждой корзины. В некоторых случаях это позволит обойтись без внешнего дискового массива.

    В чем основная особенность KunLun? В возможности объединить до 32 процессоров Intel Xeon и до 24 ТБ памяти в одной партиции. Ну и в качестве бонуса: система использует BIOS от Huawei, и вендор готов предоставить исходные коды для сертификации ПО.

    Почему не каждый производитель может предложить 32-процессорную систему?


    Штатными средствами процессоров Intel можно объединить не более 8 процессоров в одном сервере. Объединенить больше можно только за счет создания специальных устройств – контроллеров NUMA-узлов (node controller). Intel их не производит, но возможность применения данного функционала заложена в шину QPI. Этим воспользовались HP, SGI и Huawei – каждый производитель сделал свой контроллер. Понятно, что за созданием такого контроллера стоит масштабная научная деятельность и соответствующие затраты. У Huawei, например, разработка заняла 8 лет.

    Остальные вендоры (и Intel в их числе) отказались от разработки своих контроллеров. Причины? Во-первых, увеличение числа процессоров ведет к снижению скорости работы с памятью. Во многом это связано с необходимостью синхронизации состояния кэшей процессоров: чем больше процессоров закэшировали участок памяти, тем больше потребуется оповещений при его изменении одним из процессоров. Вторая причина – для подавляющего большинства вычислительных задач хватает от одного до четырех процессоров.

    EulerOS


    Производитель заявляет о возможности замены процессоров и памяти «на лету». Для этого требуется специализированная ОС – EulerOS. В интернете информация о ней очень скудная и касается в основном сертификации по последней версии Linux Standard Base. На поверку оказалось, что EulerOS собрана из исходников RHEL – Red Hat Enterprise Linux (по аналогии с CentOS). Huawei кастомизирует ее для своего оборудования, в частности добавляя драйверы горячей замены ЦПУ/ОЗУ.

    Помимо EulerOS, в KunLun заявлена поддержка RHEL, SLES 11&12, Windows Server 2012.

    Тест производительности SPECint/SPECfp


    С арифметикой в KunLun все хорошо. При проведении SPECint процессы привязываются к конкретным ядрам и работают только с локальной памятью.

    Сервер

    SPECint

    SPECfp

    SGI UV 300 (32x, Intel Xeon E7-8890 v3)

    22600

    15700

    KunLun 9032 (32x — Intel Xeon E7-8890 v3)

    22900

    16300

    IBM Power E880 (16 x Power8 4.0 GHz, 192 core)

    14400

    11400

    KunLun 9016 (16x — Intel Xeon E7-8890 v3)

    11700

    8050

    SGI UV 300 (16x, Intel Xeon E7-8890 v3)

    11400

    7880

    Integrity Superdome X (16x, Intel Xeon E7-8890 v3)

    11100

    7670


    Интересным оказалось сравнение KunLun с топовым IBM Power E880 (также 16-процессорным) – разрыв между ними не так уж велик. То есть в области вычислений Intel Xeon сервер Huawei – вполне себе конкурент Power8.

    Тест производительности SLOB (Oracle)


    Здесь в большей степени измерялась скорость не самих вычислений, а доступа к памяти. Процессы СУБД не привязаны к NUMA-узлам, для теста вся память считается равноудаленной от процессоров. Результаты теста подтвердили: зависимость производительности сервера от добавления ресурсов нелинейная.

    Увеличение процессорных мощностей в семь раз (с 16 до 144 ядер, с учетом понижения частоты) приводило к 5-кратному росту производительности сервера (КПД 71%). При 4-кратном увеличении количества ядер – с 16 (4 ЦПУ) до 64 (16 ЦПУ) производительность выросла в 2,7 раза (КПД 68%).

    Области применения KunLun


    Основное достоинство KunLun – внушительный объем памяти на борту (24 ТБ сейчас, 32 ТБ в будущем). Это особенно актуально для In-Memory аналитики, когда вся БД помещается в оперативную память. Использование KunLun позволяет на 3 порядка сократить время доступа к данным по сравнению с жесткими дисками, то есть ускорить выполнение запросов к БД. KunLun хорош для задач SAP HANA и SAP S/4HANA. Объем памяти позволяет использовать HANA даже в одноузловой конфигурации KunLun. Oracle Database (особенно с In-Memory option) и QlikView также хорошо смотрятся в китайском суперсервере.

    Ритейлеры могут использовать данное решение в качестве платформы для SAP HANA для анализа больших объемов данных о клиентском спросе на те или иные товары, о складских остатках и т.д. Банкам связка Oracle In-Memory Option и KunLun поможет «на лету» оценивать кредитоспособность клиентов, рассчитывать нормативы по достаточности капитала банка и т.д. Телеком-операторы на базе этого решения смогут реализовать управление лояльностью абонентов – формирование их профилей, таргетирование.

    Кроме того, KunLun может замещать RISC-системы на x86. Для некоторых компаний актуальны вертикально масштабируемые задачи, переросшие x86-серверы прошлого и выполняемые на RISC. При этом между стоимостью KunLun и ценой годового обслуживания RISC-системы можно поставить знак равенства. KunLun не уступает им с точки зрения надежности и выигрывает по разнообразию прикладного ПО. Примечательно, что у себя на родине KunLun активно применяется для импортозамещения, в основном как платформа для миграции с RISC-систем.

    Статья подготовлена Дмитрием Глушенком, системным архитектором Центра проектирования вычислительных комплексов компании «Инфосистемы Джет». Мы будем рады вашим конструктивным комментариям.
    Инфосистемы Джет
    764,00
    Системный интегратор
    Поделиться публикацией

    Комментарии 8

      0
      Даже фоточки не вставили, не интересно :(
        0
        А можно ли увидеть подтверждение серфикации для SAP HANA? На официальном сайте SAP никаких упоминаний об этом сервере нет.
        0
        а где тестирование проходило?
          0
          Сам сервер находился в Китае, первичное тестирование мы проводили удаленно.
            0
            спасибо
            а в Китае где? в Шеньчжене?
              0
              Да
                0
                Спасибо, Илья =)

        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

        Самое читаемое