ARM как основа для новых суперкомпьютеров

    image
    Испанский центр BRC (Barcelona Supercomputing Center) провел исследование, согласно которому в будущем ARM-чипы, подобные тем, что используются в современных смартфонах, смогут заменить в суперкомпьютерах и серверах более дорогие и энергоемкие процессоры x86-архитектуры. Результаты исследования были изложены в статье «Are mobile processors ready for HPC?», представленной публике на выставке EDAworkshop13, прошедшей в этом месяце в Дрездене.

    В своей работе исследователи прогнозируют повторение истории конца 20 века, когда RISC-чипы вытеснили более дорогие векторные процессоры, использовавшиеся в подавляющем количестве суперкомпьютеров. RISC в свою очередь были заменены со временем x86-процессорами типа Intel Xeon или AMD Opteron, которые до сих пор служат основой более 400 из 500 самых мощных суперкомпьютеров мира. Специалисты BRC утверждают, что при прогнозировании развития технологий, применяемых в высокопроизводительных системах, следует уделять внимание не только мощности, но и цене чипа, а также его размерам. «Мобильные процессоры не быстрее… но они значительно дешевле», пишут исследователи.


    Сравнительная динамика развития x86 и ARM-чипов



    Дешивизна ARM-чипов во многом обусловлена их распространенностью: они используются почти в каждом современном смартфоне или планшете. Исключение составляет разве что Atom, разработанный Intel на архитектуре x86. Интерес крупных компаний к использованию в серверах мобильных процессоров также вызван попыткой увеличить их энергетическую эффективность. Принято считать, что мощные Xeon и Opteron отлично подходят для сложных вычислений, связанных с большими базами данных или ERP-системами, однако для обработки большого количества мелких задач, таких как обработка результатов поиска или «лайков» в социальных сетях, по мнению исследователей, больше подходят экономичные ARM.

    Одной из задач Barcelona Supercomputing Center является создание прототипа вычислительной системы, обладающее большим показателем эффективности вычислений по отношению к израсходованной энергии (performance-per-watt). Уже сейчас, при финансовой поддержке испанского правительства и ЕС, компания создает серверы на базе четырехъядерного NvidiaTegra 3 и двухъядерного Samsung Exynos 5250.


    Результаты бенчмарков многоядерных ARM-чипов от Nvidia и Samsung



    Помимо испанских исследователей, идеей применения мобильных процессоров для высокопроизводительных вычислений прониклась, к примеру, HP, разрабатывающая вторую версию своей мобильной серверной системы Moonshot с использованием ARM-чипов от Calxeda и Texas Instruments. Dell также разработала прототип сервера на ARM-чипов и рассматривает использование экономичных чипов в суперкомпьютерах.
    Поделиться публикацией
    Комментарии 49
      +10
      А как же Intel Atom Z-серии с TDP 0.65-2.5Вт, которые используются в планшетах и телефонах? Производительность у них заметно выше ARM, цена и тепловыделение сравнимое. С таким подходом к анализу можно сказать, что уже совсем скоро велосипеды вытеснят автомобили, потому как меньше загрязняют атмосферу. Вроде как и правда, но вывод сомнительный.
        +1
        Но Atom при всех обозначенных достоинствах все же не так распространен, как ARM, или я ошибаюсь?
        К слову, узнал Ваш ник и аватар и, пользуясь случаем, говорю спасибо за прошивку, на которой до сих пор благополучно работает моя старушка Nook Wi-Fi.
          +4
          Распостранен или нет, это для серверов не так актуально — главное, что цена и нагрев уже не критичны, да и работы в этом направлении идут, Intel не стоит на месте. Конечно, это все домыслы, может у ARM чипов есть еще другие плюсы, например, отличная распараллеливаемость или возможность их графический потенциал использовать для дешевых вычислений. В любом случае, я бы не торопился с выводами и не ставил крест на «старых» архитектурах только из-за того, что новые заняли свою нишу.

          P.S. Грустно, но я работу с прошивками Nook забросил совсем — меня устроил полученный функционал, потому дальше не стал двигаться.
            +3
            Думаю дело еще в том что Атом Z-серии стоит около 50 баксов (поправьте, если ошибаюсь). Топовый ARM-процессор как минимум вдвое дешевле.
            +4
            Эту сказку про
            Производительность у них заметно выше ARM, цена и тепловыделение сравнимое.

            Intel рассказывает уже не первый год и на реальных тестах выясняется что это как-то не так :)
              +2
              Можно пример теста?
                +1
                Вот сравнение Atom Z2460, Tegra3, Exynos 4412 и Snapdragon S4 pro.
                Atom конечно смотрится неплохо, но если учесть что два из четырех его соперников уже даже не middle-end сегмент, то становится ясно, что пока единственное преимущество Atom'ов это x86 архитектура.
                  0
                  Ну и согласно этим тестам в перерасчёте на одно ядро — Atom победил. Кроме того у остальных процессоров было 2 или 4 ядра и, даже при этом, они не смогли в большем количестве тестов существенно оторваться от Atom.
                    –1
                    Гипертрейдинг то никуда не делся опять же. Плюс пока у Intel есть проблема с тепловыделением. Оно больше при полной загрузке чем у ARM. По этой причине они в своих пресс-релизах рассказывают про малое потребление в режиме сна и меньшее среднее потребление.
                      +2
                      Гипертрейдинг не бесплатный (увеличивает производительность не в 2 раза).
                        –1
                        Про добавление ядра тоже самое можно сказать
                          +1
                          Да, но накладные расходы у HT гораздо выше. По некоторым оценкам, HT — это всего лишние 30% производительности.
                –1
                Ну например, тесты майнинга показывают, что Intel Atom имеет 1-2 МХеша, тогда как ARM только еле, еле подползает к 1 МХешу.
                  +1
                  Да ладно а это что:
                  Cortex-A9 2 1.3??? 1.2 GHz pooler's cpuminer 2.2.3 Samsung Galaxy S II — CFLAGS="-O3 -mfpu=neon"


                  Опять же в этом списке идут именно десктопные Atom которые несколько горячее типичного ARM да и не для всех разрыв в два раза. А тесты же телефонов на процессорах Intel никаких особых ух не показывали. Вот тут www.mobile-review.com/review/megafon-mint-sp-a20i.shtml можно посмотреть тесты mint
                    0
                    Во-первых: там не только десктопные. Вот например:
                    Atom Z520 1/2 1.20 2 1.7 ufasoft 1.18 Asus Eee 1101HA with overclocking capabilities

                    Во-вторых: в приведённых вами тестах двуядерный Intel проигрывает 4-хядерному HTC One X (NVIDIA Tegra 3) в полтора раза.
                    А вот уже 2-хядерному HTC One XL (Qualcomm MSM8960) он проигрывает уже в 2 раза. Но возможно это из-за того, что в этом процессоре мощнее графика, а тест меряет совокупную производительность.
                      +1
                      Во-первых: там не только десктопные. Вот например:
                      Atom Z520 1/2 1.20 2 1.7 ufasoft 1.18 Asus Eee 1101HA with overclocking capabilities

                      Ага и TDP — 2 Ватта

                      Во-вторых: в приведённых вами тестах двуядерный Intel проигрывает 4-хядерному HTC One X (NVIDIA Tegra 3) в полтора раза.
                      А вот уже 2-хядерному HTC One XL (Qualcomm MSM8960) он проигрывает уже в 2 раза. Но возможно это из-за того, что в этом процессоре мощнее графика, а тест меряет совокупную производительность.

                      Гипертрейдинг там же есть. И там есть отдельные строки для CPU
                        –1
                        Согласен. Мой вывод:
                        В перерасчёте на одно ядро — ATOM круче. Но он и жрёт больше и врядли будет 2 полноценных ядра, а уж тем более больше чем 2. Тогда как у ARM`а возможностей для роста гораздо больше.
                          +1
                          В перерасчёте на одно ядро — ATOM круче.

                          Если не брать в расчет TDP то круче Xeon ;) Если брать в расчет TDP то лучше ARM так-как дает лучшую производительность на ватт.
                            0
                            Ну это естественно, TDP увеличивается в следующем порядке:
                            ASIC->FPGA->MISC->RISC->CISC
                            и x86 как CISC всегда будет проигрывать.
                +1
                совсем скоро велосипеды вытеснят автомобили, потому как меньше загрязняют атмосферу. Вроде как и правда, но вывод сомнительный.

                Ничего сомнительного, к этому все и идет.
                +4
                В наше время 32битная адресация памяти — это ниша встраиваемых компьютеров, а не цифромолотилок. А пока и гибридные суперкомпьютеры с Nvidia-GPU в качестве RISC-ядер проложили себе дорожку на олимп TOP-500.
                Вот выплеснется на рынок ARM-v8, вот тогда будет очередной взрыв, а пока это шапкозакидательство.
                  +2
                  Уже есть прототипы 64 битных ARM чипов.
                    +2
                    Вообще готова 64 битная архитектура Cortex-A15 в этом году будут первые серийные чипы. Там есть и адресация больше 4 гигов памяти и поддержка виртуализации
                      +1
                      Адресация больше 4 гигов памяти и 64-битная архитектура — это не одно и то же. На x86 ещё Pentium Pro (в 1995 году) мог адресовать 64 Гб памяти, хотя до 64-битности было ещё далеко.
                      Cortex-A15 — обычный 32-битный ARMv7 (кстати, первые серийные чипы вышли ещё в прошлом году).
                        0
                        Да попутал пишу про Cortex-A15 а думаю про ARMv8
                          0
                          на один процесс?
                            0
                            Как это сейчас в ARM/Linux устроено не знаю. В Windows можно было использовать больше 4 Гигов на один процесс, но через такую задницу, что почти никакой софт это не поддерживал.
                          0
                          Наверно имелось ввиду:

                          ARM Cortex-A53, ARM Cortex-A57
                      +1
                      С одной стороны без разницы (в разумных приделах) какая архитектура на процессоре, если все бинарники под неё есть. С другой — некоторые привычные по x86 модели могут оказаться очень неэффективными из-за особенностей архитектуры. Или наоборот намного более эффективные. Прежде всего в голову приходит стоимость переключения между процессами. В x86 довольно дорогая операция. Кто в курсе, как с этим у ARM'ов?
                        +2
                        От архитектуры зависит количество тактов на сравнимые операции, что в итоге влияет на производительность на ватт.
                          +1
                          Переключение между процессами это редкая операция. На топовых суперкомпьютерах ОС считалок максимально обрезанная или вообще самописная и иногда прибита гвоздями к выделенному ядру, а пользовательские программы прибиваются теми-же гвоздями к другим ядрам.
                            0
                            Речь, насколько я понимаю, прежде всего об обычных серверах, а не суперкомпьютинге.
                              +1
                              В названии статьи суперкомпьютеры («Are mobile processors ready for HPC?»), да и странно было-бы, если бы суперкомпьютерный центр прогнозировал развитие чего-либо другого.

                              А сервера на ARM и сейчас есть. В этом никакой новости нет, но вот там, где нужно обрабатывать много данных или много считать они не конкуренты x86_64 и Power (справедливости ради и Tesla'м с Phi).
                          +1
                          Во всём этом не хватает одного простого сравнительного графика: джоулей на миллиард операций (пусть стандартизированных, которые в LINT'е).

                          Пока что интел уделывает всех по этому показателю на несколько голов. Говорить «у нас выше скорость роста производительности на ватт мощности» глупо, потому что сначала надо достигнуть хотя бы сравнимых показателей.

                          А сейчас для того, чтобы посчитать то, что интел считает на 30% одного ядра, нужно пару ядер тегры загрузить под потолок. И intel в это время ест много меньше, чем тегра, ибо большую часть времени вообще спит, иногда отвекаясь, чтобы «чуть-чуть поработать».

                            +1
                            У вас есть такой актуальный график?
                              0
                              нету. Ибо точный учёт потребляемой мощности сложная задача. Зато есть эмпирическое наблюдение, когда планшет и ноутбук живут разное время при одинаковой значительной нагрузке. Не в пользу планшета.
                                0
                                А емкость батареи в планшете во сколько раз меньше? В Ватт-часах естественно.
                                  0
                                  Ноутбук — батарея 62 Вт*ч
                                  Планшет (с пристёгнутой клавиатурой-батарейкой) — 45Вт*ч

                                  При невинном потоке в 1МБ/с шифрованного ssh ноутбук едва-едва выходил из состояния «ничего не делаю», а планшет нагрелся так, как будто его заставили расшифровывать мегабайт тяжёлой криптографии в секунду.
                                    +1
                                    Может проц в ноуте аппаратно поддерживает шифрование?
                                      0
                                      Нет, разумеется. Речь про обычный scp.
                                        +1
                                        Не в курсе внутренностей scp, но openssl точно поддерживает аппаратное ускорение шифрования, если оно есть в процессорах и, прежде всего, в интеловских.
                                      0
                                      Странный у вас планшет.
                                      Сейчас замерил сколько потребляет торентокачалка и медиасервер на MK802 II.
                                      7 Ватт, при том что от нее питается 3Тб WD Green.
                                      Она постоянно отдает 50-70Мбит/сек.

                                      Atom N2600 с подобным диском потребляет 20-30 Ватт., замеряли у себя в ДЦ.
                                      При всем при этом в MK802II стоит мягко говоря не свежий процессор и далеко не самый экономичный.
                                        0
                                        Обычный планшет. Попробуйте не торренты качать, а прогнать через scp файлы и посмотреть на потребление в этот момент.
                                          +1
                                          Выше вам уже ответили про аппаратное ускорение в процессоре.
                                          0
                                          Мне кажется, что стоит еще упомянуть техпроцесс и количество ядер. Atom N2600 — 2 ядра, 32нм; Allwinner A10 — 1 ядро, 55нм.
                                0
                                … следует уделять внимание не только мощности, но и цене чипа ...
                                Интересно, имеется ввиду в пересчёте на всю платформу или действительно самого чипа?
                                  +2
                                  Я что-то пропустил — а о каких операциях идет речь? Целочисленная арифметика? С плавающей точкой?
                                  Или просто сферические такты в вакууме?
                                    +7
                                    Barcelona Supercomputing Center — давние партнёры ARM, ещё бы они кого-то другого стали рекламировать :-)

                                    А обстановка у них бесподобная — серверными стойками заставлена бывшая при каталанском политехническом университете церковь:



                                      +9
                                      Храм айтишника.

                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                    Самое читаемое