Обновление списка TOP500: впервые лидером стал суперкомпьютер на процессорах ARM

    Опубликована 55 редакция рейтинга самых высокопроизводительных суперкомпьютеров мира.
    О новых лидерах списка и возможностях суперкомпьютеров экстра-класса читайте под катом.



    Предыдущий лидер списка — суперкомпьютер Summit (OLCF-4) Ок-Риджской национальной лаборатории — стал вторым, уступив почетное первое место новой японской топ-системе Fugaku, которая показала результат High Performance Linpack (HPL) равный 415,5 петафлопс. Данный показатель превосходит возможности Summit в 2,8 раза. Fugaku оснащен 48-ядерным процессором A64FX SoC от Fujitsu, таким образом, японская разработка стала первой в истории системой №1 в списке ТOP500, оснащенной процессорами ARM. При одинарной или более низкой точности, которая часто используется для задач машинного обучения и искусственного интеллекта, пиковая производительность Fugaku составляет более 1000 петафлопс (1 экзафлопс). Новая система установлена в Центре вычислительных наук RIKEN (R-CCS) в Кобе, Япония.

    Упомянутый выше Summit, суперкомпьютер, созданный IBM, показывает в тесте HPL производительность в 148,8 петафлопс. Система имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими ускорителями NVIDIA Tesla V100. Узлы объединяет сеть InfiniBand EDR. Summit остается самым быстрым суперкомпьютером в США.

    На третьем месте тоже оказался американец — суперкомьютер Sierra Ливерморской национальной лаборатории им. Лоуренса (LLNL), Калифорния, показавший результат в 94,6 петафлопс. Его архитектура очень похожа на Summit: он оснащен двумя процессорами Power9 и четырьмя графическими ускорителями NVIDIA Tesla V100 в каждом из 4320 узлов. Sierra использует тот же InfiniBand Mellanox EDR, что и Sunway TaihuLight, суперкомпьютер, разработанный Китайским национальным исследовательским центром параллельной вычислительной техники и технологий (NRCPC). Он, к слову, опустился на четвертое место в списке. Система полностью основана на 260-ядерных процессорах Sunway SW26010. Его отметка HPL в 93 петафлопс осталась неизменной с момента его установки в Национальном суперкомпьютерном центре в Уси, Китай, в июне 2016 года.

    На пятом месте также находится китайская разработка — Tianhe-2A (Milky Way-2A), реализованная Китайским национальным университетом оборонных технологий (NUDT). Его производительность HPL 61,4 петафлопс является результатом гибридной архитектуры с использованием процессоров Intel Xeon и специально созданных сопроцессоров Matrix-2000. Он развернут в Национальном суперкомпьютерном центре в Гуанчжоу, Китай.

    Новичок в списке, HPC5, занял шестое место, показав производительность HPL 35,5 петафлопс. HPC5 — это система PowerEdge, созданная Dell и реализованная итальянской энергетической фирмой Eni S.p.A, что делает ее самым быстрым суперкомпьютером в Европе.

    Еще одна новая система, Selene, находится на седьмом месте с показателем HPL 27,58 петафлопс. Selene установлена на NVIDIA в США.

    Frontera, система Dell C6420, установленная в Техасском вычислительном центре (TACC) в США, занимает восьмое место в списке. Его 23,5 HPL петафлопс достигается с помощью 448,448 ядер Intel Xeon.

    Второй итальянский суперкомпьютер в топ-10 — Marconi-100, он установлен в исследовательском центре CINECA. Marconi-100 работает на процессорах IBM Power9 и графических ускорителях NVIDIA V100, его производительность равна 21,6 петафлопс, он занял девятое место в списке.
    Завершает топ-10 с показателем 19,6 петафлопс система Cray XC50, установленная в Швейцарском национальном суперкомпьютерном центре (CSCS) в Лугано. Он оснащен процессорами Intel Xeon и графическими ускорителями NVIDIA P100.

    Российская разработка — суперкомпьютер «Кристофари» (Christofari) на базе Xeon Platinum, Nvidia DGX-2 и Tesla V100 — набирает в тесте HPL 6,67 петафлопс, занимая пока лишь 36 место.





    Результаты Green500


    Самая энергоэффективная система в списке Green500 — это MN-3, основанная на новом сервере от Preferred Networks. Суперкомпьютер достиг рекордного показателя в 21,1 гигафлопс /ватт при производительности 1,62 петафлопс. Система обладает превосходной энергоэффективностью благодаря чипу MN-Core, ускорителю, оптимизированному для матричной арифметики. Занимает 395 место в списке TOP500.

    На втором месте новый суперкомпьютер NVIDIA Selene, DGX A100 SuperPOD, работающий на новых графических ускорителях A100. На третьем месте находится система NA-1, система PEZY Computing / Exascaler, установленная в NA Simulation в Японии. Суперкомпьютер достиг 18,4 гигафлопс / ватт и находится на позиции 470 в TOP500.

    Основные тренды


    • Совокупная производительность списка теперь составляет 2,23 экзафлопс, по сравнению с показателем в 1,65 экзафлопс всего шесть месяцев назад. Львиная доля такого бурного роста является заслугой нового суперкомпьютера Fugaku, занявшего 1е место в списке.
    • Общее количество новых систем в списке составляет всего 51, что является антирекордом с самого начала создания списка TOP500 (с 1993 года).
    • Китай продолжает доминировать в TOP500 по количеству систем (226), США по количеству суперкомпьютеров в списке занимает втрое место (114), Япония- третье (30).;
    • В общей сложности 144 системы из списка используют ускорители или сопроцессоры. Как и раньше, большинство систем, используют графические ускорители NVIDIA.
    • X86 продолжает оставаться доминирующей архитектурой процессора, присутствуя в 481 из 500 систем. Intel используется на 469 из них, AMD установлен в 11, Hygon — в оставшихся.
    • Китайские производители доминируют в списке: на Lenovo (180), Sugon (68) и Inspur (64) приходится 312 из 500 систем.
    Цифровые Экосистемы
    Переводим бизнес в цифру

    Комментарии 20

      0
      Где-то в недрах Apple, читая эту новость, ликует Тим Кук.
        +3
        «Вот и все, вот и кончилось теплое лето. Вот и все, расставаться всегда тяжело»
        Но, похоже, расставаться с x86 архитектурой в суперкомпьютерах пока рановато — чемпион имеет одинаковые с системой №6 на Xeon Gold энергоэффективность и потребление на ядро, и незначительно лучшую производительность в расчёте на ядро. Да и частоты пока невысоки — 186 Вт на процессор рассеять для архитектуры ARM так же сложно, как и для x86. Так что вожделенного скачка производительности придётся подождать.
        Потребление системы на Xeon Platinum тактично умолчано.
          +1

          Ты не путай: все системы на Intel и Power имеют в составе специализированные ускорители вычислений (NVidia, или даже специальный ускоритель матриц, как в "самом зеленом").


          Fujitsu A64FX же справляется без внешних ускорителей (правда, с расширенным набором SIMD инструкций).


          Кроме того, другая система на таком же A64FX занимает четвертую строчку в рейтинге зелености.

            0
            Ну справляется и чего? Судя по всему, взяли банально брутфорсом. Количество ядер и энергопотребление зашкаливает. У меня вообще ощущение, что архитектура в подобных условиях не имеет никакого значения. Имеет значение возможность этой архитектуры масштабироваться, с чем нет никаких проблем ни у arm, ни у x86.
              0

              Зашкаливает? На 30% больше, чем у NVidia Tesla — это "энергопотребление зашкаливает"?

                +1
                Первое место 28,335 кВт
                Второе место 10,096 кВт
                Это называется взять силой. Никому не мешало накинуть еще миллион другой ядер и нвидий в кластер, чтобы быть на первом месте. Суперкомпьютеры эти скейлятся настолько, насколько хватит кошелька. Мой посыл был простой — тот факт, что система на арме, не имеет никакого значения. Энергоэффективность ничем не примечательна, производительность не из воздуха взялась, а ценой огромного энергопотребления и числа ядер в сравнении с прошлым лидером. Это просто еще один суперкомпьютер, ни больше, ни меньше.
                  0

                  Подожди, Green 500 — это не про общее потребление, а про ватт на террафлопс. На пример, первое место в Green 500 — это 395 место в Top 500 с эффективностью 21,1 гигафлопс /ватт. И для этого ему потребовался специальный ускоритель матричной арифметики.


                  У Fugaku же эффективность 14,665 гигафлопс/Вт, т.е. всего лишь на 32% меньше.
                  И это практически равно номеру 2 в Top 500 — Summit (14,719гфлопс/Вт).
                  Однако Summit, как и остальные восемь опередивших Fugaku в Green 500, — это гетерогенная система. А Fugaku — гомогенная. И она обогнала по эффективности еще 491 систему, из которых 136 используют ускорители.


                  Для гомогенной системы на ядрах общего назначения (пусть и с расширенным набором инструкций) это большое достижение.

              0
              Ok, в №8 NVidia нету же, от №6 отличий коренных нет.
                0
                Интересно, что шестое место по энергетической эффективности занимает система Dell HPC5 на процессорах Xeon Gold 6252 и ускорителях Nvidia Tesla V100, по производительности тоже являющаяся шестой.
                  0
                  Вопрос к оформлению результирующей таблицы.
                0
                Fujitsu A64FX же справляется без внешних ускорителей (правда, с расширенным набором SIMD инструкций).

                У процессоров Intel и Power давно реализована поддержка SIMD иструкций. MMX, SSE, AVX у Intel и VMX, VSX у Power.
                  0

                  Только почему-то чистых Intel/Power систем нет в топ Green 500. Только с ускорителями. А вот A64FX в ускорителях не нуждается.

                    0
                    Вот поэтому и нет, потому что GPU и спец ускорители намного эффективнее и производительнее и x86, и power, и армов. Если арм систему захотят сделать такой же эффективной, то придется точно так же добавлять спец ускорители и гпу. У вас посты такие, будто революция свершилась, хотя ее не наблюдается ни по каким параметрам. То, что арм серверы могут быть быстрыми, всем давно известно. Так же как известно, что ничего особо революционного они не принесли. Им давно предрекали захват серверного рынка, но они как были, так и остались нишевыми продуктами.
                      0

                      Так революция и свершилась: гомогенный суперкомпьютер, порвавший всех в клочья, и всего лишь на 30% уступивший по энергоэффективности специализированным ускорителям.


                      А про сервера, так Амазон выпустила Гравитоны 2, и даже по независимым тестам, они таки эффективнее на доллар арендной стоимости. Так что, до конца года многие примерятся к ним, а в следующем году будет массовая миграция. Ибо сэкономить 10-30 процентов денег захочется очень многим.


                      Конечно, вполне возможно, что Амазон выкатит и поколение на новых Эпиках, и оно по стоимости сравняется с Гравитонами. А еще, сделают ли они под гравитоны оптимизацию EMR, RDS, Aurora и прочего вовремя.
                      Вобщем, от Амазона сейчас очень многое зависит.

              0
              X86… Hygon — в оставшихся, в 1 системе. почему оставшихся, если система одна?
                +1
                Производительность выше в 2.8 раза, энергопотребление выше в 2.8 раза, количество ядер выше в 3 раза.
                Производительность на ватт сопоставимая.
                Не хватает строки со стоимостью суперкомпьютера, чтобы понять что выгоднее, т.к. это единственный параметр который не приведён. Тогда и станет понятно, а стоило ли оно того.
                  0
                  Если гугл меня не подвёл, то стоимость fugaku 1 миллиард долларов против 101.5 миллиона долларов у summit, итого имеем стоимость в 10 раз выше.
                  Итоги:
                  Мощность — 2.8
                  Энергопотребление — 2.8
                  Производительность — паритет
                  Стоимость — 10

                  Таким образом, при самых грубых оценках, суперкомпьютер с такой же мощностью как у fugaku, но на архитектуре summit стоил бы минимум вдвое дешевле, по всем остальным характеристикам они совпадали бы.
                  Не удалось найти занимаемую площадь, физически.
                  Полэкзофлопа по цене экзофлопа, так себе победа.
                    0
                    По другим данным, стоимость summit 200 миллионов, что всё ещё приводит нас к экзофлому за 1 миллиард, хотя intel на aurore обещает экзофлопа за вдвое меньшую цену, но этого нужно ещё дождаться.
                      0
                      Вероятно, со временем и увеличением тиража стоимость новой системы будет падать, но по энергоэффективности есть вопросы — частота невысокая, предпосылок к росту нет — потребление одного процессора и так высокое.
                      Т.е. масштабирование за счёт увеличения количества ядер. Также, возможно, отвязка от производственных проблем Intel, и, как следствие, в совокупности с удешевлением экзафлопа, ускорение темпа наращивания производительности, в результате — вытеснение Intel и AMD из топа. Но не революционно, а не спеша.
                      0
                      А в wikipedia пишут
                      The United States Department of Energy awarded a $325 million contract in November 2014 to IBM, Nvidia and Mellanox.
                      en.wikipedia.org/wiki/Summit_(supercomputer)
                      Fugaku — 130 billion yen, что за эти шесть лет выросло с $1053M до $1209M. Возьмём среднюю $1131
                      Получается, что Fugaku дороже всего в 3.5 раза. Удельная мощность (производительность) дороже 1.25 раза, т.е. на 25%.
                      Учитывая, что это была полностью новая разработка (не на базе «используемых всеми» компонентов), понятна завышенная стоимость разработки/пуска/наладки.

                      btw, я только сообразил: Mellanox не упоминается. Что же они использовали для соединения? Возможно, разработка нового транспорта тоже на стоимость повлияло.

                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                  Самое читаемое