CUDA и другая новая начинка для сверхмасштабируемых серверных комплексов

    Шасси HP ProLiant SL6500Прошлой осенью HP представила новое семейство своих серверов стандартной архитектуры ProLiant SL6000. Оно было разработано специально для построения сверхмасштабируемых вычислительных комплексов и обеспечивает максимально плотную упаковку процессорной мощности. Это прежде всего достигается за счет использования шасси, в котором размещены общие для всех серверных модулей блоки питания и вентиляторы.

    В начале октября вышло уже второе поколение — ProLiant SL6500, имеющее на борту новейшие процессоры Intel Xeon и, опционально, GPU на базе архитектуры nVidia CUDA. На основе опыта использования SL6000 в нем было внедрено несколько изменений. Высота шасси теперь составляет 4U вместо прежних 2U, шасси поддерживает горячую замену серверных модулей (и как опция — блоков питания), а сами серверные модули оборудуются заменяемыми в горячем режиме жесткими дисками. Кроме того, в зависимости от начинки шасси для него можно выбрать блоки питания на 460, 750 и 1200 Вт, что позволяет оптимизировать энергопотребление больших серверных комплексов.

    В шасси ProLiant SL6500 устанавливается три модели серверных модулей: ProLiant SL390s G7, ProLiant SL170s G7, а также ProLiant SL390s G7 с установленным GPU nVidia Tesla. Все они по ширине занимают половину шасси, причем допускается комбинация одно- и двухюнитовых модулей.

    Двухюнитовый ProLiant SL390s G7Обе модификации ProLiant SL390s G7 — высотой 1U и 2U — выпускаются с одной и той же системной платой, поддерживающей два Xeon 5600, до 12 модулей памяти DDR3 и оборудованной одним 10-гигабитным и двумя гигабитными портами Ethernet (как опция поддерживается порт InfiniBand).

    Дополнительный 1U в двухюнитовой модификации ProLiant SL390s G7 рассчитан на установку от одного до трех GPU Tesla M2050 или Tesla M2070. Каждый GPU состоит из нескольких сотен ядер, благодаря чему при их использовании скорость расчета в зависимости от конкретного приложения возрастает до 36 раз. В частности, существенно улучшается производительность суперкомпьютерных вычислений, связанных с поиском месторождений нефти и газа, исследованиями в области естественных наук, построением финансовых моделей, криптографическими и другими приложениями, хорошо поддающихся распараллеливанию. В тесте Linpack, по результатам которого составляется рейтинг 500 самых мощных суперкомпьютеров Top500, система с двумя CPU и двумя GPU обгоняет в восемь раз ту же систему без GPU.

    Вычислительную мощность при операциях с плавающей точкой двухюнитового ProLiant SL390s с помощью GPU удается довести до 1 Тфлопса. В настоящее время в Токийском Технологическом Институте TiTech на базе кластера из полутора тысяч ProLiant SL390s G7 с GPU Tesla M2050 создается суперкомпьютер, расчетная мощность которого превышает два петафлопса. А в американском университете Georgia Tech на этой же платформе HP уже в конце этого года будет запущен петафлопсный суперкомпьютер.

    Шасси HP ProLiant SL6500 с восемью одноюнитовыми модулями ProLiant SL390s G7
    Шасси HP ProLiant SL6500 с восемью одноюнитовыми модулями ProLiant SL390s G7

    Третий серверный модуль ProLiant SL170s G7 по форм-фактору аналогичен одноюнитовому ProLiant SL390s G7, но поддерживает не 12, а 16 модулей оперативной памяти. Для сокращения в стоимости из его конфигурации исключен 10-гигабитный порт, а для удаленного управления используется iLO 100, вместо полнофункционального контроллера версии iLO 3. Эта модель, кроме суперкомпьютерных вычислений, найдет применение у поставщиков услуг хостинга сайтов и приложений.
    Hewlett Packard Enterprise
    Компания

    Комментарии 10

      +1
      сразу скажу, что HP Blade таки плотнее :) но в целом CUDA это да!
        0
        А теперь вопрос на засыпку, как в бизнес приложениях помогает мощность графических карт и ускорителей?

        Потому, что LinPack- это извините, тест на перемножение матриц. Покажите пожалуйста веб-сервер, файлошару, да хоть сервер виртуальных машин, которому нужно использовать перемножение матриц, хотя бы тысячу на тысячу.

        Большая часть бизнес задач на gpgpu бонально не лягут. Ограничение по памяти на карте сейчас 6гб если правильно помню. Сначала из памяти скопировать надо данные, потом посчитанные забрать с карты- это уже не быстро.

        А еще нужно, что бы задача была массивно-параллельная. Т.е. что бы были тысячи-миллионы операций не зависимых друг от друга. Вот как раз матрицы прекрасно перемножаются. там ни одна операцию от другой не зависит. Те, кто считают такие задачи думаю- не самая обширная часть аудитории покупателей серверов.

        Так, что мощность мощностью, но Вы уж оговорите сразу, что она в 99% случаев бесполезно. И что писать придется на расширении языка С, что нужны специальные алгоритмы, задачи и вообще требуется обалденная квалификация программиста, что бы все это сделать. И самая большая загвоздка, что задачи то на такую архитектуру не лягут!

        А так, реклама рекламой
          +1
          Вот именно поэтому мы написали:

          В частности, существенно улучшается производительность суперкомпьютерных вычислений, связанных с поиском месторождений нефти и газа, исследованиями в области естественных наук, построением финансовых моделей, криптографическими и другими приложениями, хорошо поддающихся распараллеливанию.


          Но дело-то в том, что SL6500 можно купить и без CUDA — вы вольны выбирать. И если вас интересует веб-сервер, то выбирайте ProLiant SL170s G7.
            +1
            Критерий применимости в 1 приложение банально теряется в обилии остальных букв. Я понимаю, что задача продать, это вполне естественно и ничего плохого в этом нет.
            Но такие кричащие заголовки и лозунги- это откровенная реклама и пропаганда.
            Я видел и как gpgpu и выигрывали 117 раз у обычных вычислителей, и как они им безбожно проигрывали. Так, что фраза про 36 раз можно получить ускорение- это как пальцем в небо.

            Расчет слоев в геологоразведки- это понятно, что там все хорошо.
            А вот в финансовой математике- это бабушка на двое сказала. Есть разная математика финансовая.
            Естественные науки- это сразу уточните задачи- численное интегрирование различное, методы конечных разностей, конечные элементы и тп. Но в них вероятность получить 36 ускорение практически нулевая. 2-4 раза уже шикарно.

            Критерий применимости теряется, на фоне остального в статье.
              +1
              Статья эта далеко не только о CUDA, хоть это слово и есть в заголовке (такой уж он кричащий?..) О самой платформе и ее применимости было сказано уже очень много в других местах, поэтому мы не собирались делать на ней главный акцент. Здесь о CUDA сказано лишь как об одной из опций, которая может пригодиться пользователям четко очерченного круга приложений.
          +2
          Вот не понимаю я комментирующих тут. Ну не всем нужна CUDA. И что теперь, надо забросать говном весь топик?
          Все, по-моему, и так отлично понимают, что это подходит только для некоторых задач, которые хорошо параллелятся.

          По теме — круто, что появилось серверное решение с GPU. На мой взгляд, эта ниша безусловно есть. Даже не смотря на желание некоторых покидаться какашками лишь от того, что именно им GPU не подходит.
            +1
            На сайте HP не нашёл цен на эти GPU-модули Tesla.
            Автор, укажите цены, ибо всё это писание без цен не имеет особого смысла.
              0
              цены в России говорит дилер… или интегратор…
                0
                Ну на сами сервера на сайте HP всё же есть цены.
                  0
                  На сайте HP Россия?

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

            Самое читаемое