Самые быстрые суперкомпьютеры мира

    Сколько существуют компьютеры, столько же существуют и их супер-родственники. Сегодня в статье пойдёт речь о «супер-семейке», или проще говоря, о 10 самых мощных компьютерах мира. Кто же станет победителем?



    На десятой позиции расположился окутанный дымкой неизвестности, таинственный Storm CS Cray (Mystery).

    Расположен он в США. Точное его месторасположение и цель существования неизвестны, так как является он не только суперкомпьютером, но и суперсекретным объектом.



    Обеспечивая 2386.42 мегафлопс на 1 ватт мощности, этот суперкомпьютером считается самым энергоэффективнный. Номинальная же мощность равна 3.57 петафлопс. В данном комплексе используются процессоры Intel Xeon E5-2660v2 10C 2.2ГГц, а суммарное число ядер составляет 72800.

    Девятым в списке идёт суперкомпьютер Vulcan

    Суперкомпьютер производства IBM из Ливерморской национальной лаборатории Калифорнийского университета, США. Начал свое существование еще в 2013 году. Используется в работе различных научных проектов Livermore's High Performance Computing (HPC) Innovation Center, который в свою очередь академически сотрудничает с Администрацией по Ядерной безопасности.



    Стойки: 24
    Ядра: 393216
    Производительность Linpack (Rmax): 4293.31 TFlop/s
    Теоритическая пиковая производительность: 5033.16 TFlop/s
    Мощность: 1972.00 kW
    Память: 393216 GB
    Процессор: Power BQC 16C 1.6GHz
    Интерконнект: Custom Interconnect
    ОС: Linux

    Восьмое место уже несколько лет подряд (с 2012 года) занимает JUQUEEN

    Был разработан компанией IBM специально для Исследовательского центра Юлиха, Германия. Данный суперкомпьютер, основанный на базе Blue Gene/P, успешно заменил своего предшественника JUBL, который создавался по более давней архитектуре.



    В момент активации JUQUEEN стал вторым по производительности суперкомпьютером в мире.

    Стойки: 28
    Ядра: 458752
    Производительность Linpack (Rmax): 5008.86 TFlop/s
    Теоритическая пиковая производительность: 5872.03 TFlop/s
    Мощность: 2301.00 kW
    Память: 458752 GB
    Процессор: Power BQC 16C 1.6GHz
    Интерконнект: Custom Interconnect
    ОС: Linux

    Седьмая позиция — Stampede

    Опять-таки родом из США. А точнее, из Техасского центра продвинутых вычислений, Техасский университет в Остине. Stampede является детищем компании Dell.



    Стойки: 182
    Ядра: 462462
    Производительность Linpack (Rmax): 5168.11 TFlop/s
    Теоретическая пиковая производительность: 8520.11 TFlop/s
    Мощность: 4510.00 kW
    Память: 192192 GB
    Процессор: Xeon E5-2680 8C 2.7GHz
    Интерконнект: Infiniband FDR
    ОС: Linux
    Компилятор: Intel
    Математическая библиотека: MKL
    MPI (интерфейс передачи сообщений): MVAPICH2

    На шестом месте разместился Piz Daint (Switzerland)

    Запущен в ноябре 2013 года в швейцарском городе Лугано. Располагается в Швейцарском национальном центре суперкомпьютеров (Swiss National Supercomputing Centre / CSCS), основанном еще в далеком 1991 году. Используется для большого числа различных проектов, в основном в сфере компьютерного моделирования. Piz Daint был создан компанией Cray Inc.



    Ядра: 115984
    Производительность Linpack (Rmax): 6271 TFlop/s
    Теоретическая пиковая производительность: 7788.85 TFlop/s
    Мощность: 2325.00 kW
    Процессор: Xeon E5-2670 8C 2.6GHz
    Интерконнект: Aries interconnect
    ОС: Cray Linux Environment

    Под номером пять у нас Mira

    Mira — суперкомпьютер IBM Blue Gene / Q, что располагается в здании Argonne Leadership Computing. Оснащен 786432 ядрами, 768 терабайт памяти и имеет пиковую производительность 10 петафлопс. 49152 вычислительных узлов (compute nodes) оборудованы процессором PowerPC A2 1600 МГц, содержащим 16 ядер, по 4 аппаратных потока в каждом. Частота процессора — 1,6 ГГц. 16 гигабайт памяти DDR3. Семнадцатое ядро используется для связи между библиотеками.



    Конфигурация интерконнекта 5D от IBM со скоростью chip-to-chip соединения в 2 Гб/с объединяет узлы, что позволяет значительно увеличить вычислительные возможности путем уменьшения среднего числа промежуточных узлов и задержек между вычислительными узлами. Система Blue Gene / Q также имеет систему из 4 модулей операций с плавающей запятой (FPU), которую можно использовать для выполнения скалярных вычислений с плавающей точкой, 4-мерных инструкций ОКМД (одиночный поток команд, множественный поток данных) или 2-мерных сложных арифметических вычислений ОКМД. Эти модули операций с плавающей запятой (FPU) обеспечивают более высокую вычислительную производительность одного линейного потока для некоторых приложений.

    Mira предоставляет доступ к файловой системе GPFS емкостью 24 ПБ и пропускной способностью 240 Гб/с. Пользователи также получат доступ к HPSS архивам данных и Tukey, новому кластеру анализа и визуализации. Все вышеупомянутые ресурсы доступны для использования через быстродействующие сети, включая ESnet, недавно модернизированную до 100 Гб/с.

    Стойки: 48
    Ядра: 786432
    Производительность Linpack (Rmax): 8586.61 TFlop/s
    Теоретическая пиковая производительность: 10066.3 TFlop/s
    Мощность: 3945.00 kW
    Память: 768000 GB
    Процессор: Power BQC 16C 1.6GHz
    Интерконнект: 5D Torus Proprietary Network
    ОС: Linux

    Четвёртое место K Computer

    Суперкомпьютер от компании Fujitsu, запущенные в 2011 году. Расположен в Институте физико-химических исследований, город Кобе, Япония.



    Стойки: 864
    Ядра: 705024
    Производительность Linpack (Rmax): 10510 TFlop/s
    Теоретическая пиковая производительность: 11280.4 TFlop/s
    Мощность: 12659.89 kW
    Память: 1410048 GB
    Процессор: SPARC64 VIIIfx 8C 2GHz
    Интерконнект: Custom Interconnect
    ОС: Linux

    Замыкает тройку лидеров Sequoia

    Суперкомпьютер, созданный компанией IBM в июне 2012 года. Используется Национальной администрации по ядерной безопасности для программы Advanced Simulation and Computing Program.



    Стойки: 96
    Ядра: 1572864
    Производительность Linpack (Rmax): 17173.2 TFlop/s
    Теоретическая пиковая производительность: 20132.7 TFlop/s
    Мощность: 7890.00 kW
    Память: 1572864 GB
    Процессор: Power BQC 16C 1.6GHz
    Интерконнект: Custom Interconnect
    ОС: Linux

    На втором месте Titan

    Суперкомпьютер, изготовленный компанией Cray Inc. в октябре 2012 года. Titan стал обновлением предыдущего суперкомпьютера Jaguar. Расположен в Национальной лаборатории Ок-Ридж Университета Теннесси (город Ок-Ридж, Теннесси, США). По большей части мощности Титана используются для программы Министерства энергетики США Innovative and Novel Computational Impact on Theory and Experiment program (INCITE). Данный суперкомпьютер позиционировался как аппарат для обработки любых проектов, однако из-за большого числа заявок было решено ограничить их количество до 6. Среди них: процессы сгорания топлива, наука о материалах, атомная энергия и изменения климата.



    Ядра: 560640
    Производительность Linpack (Rmax): 17590 TFlop/s
    Теоретическая пиковая производительность: 27112.5 TFlop/s
    Мощность: 8209.00 kW
    Память: 710144 GB
    Процессор: Opteron 6274 16C 2.2GHz
    Интерконнект: Cray Gemini interconnect
    ОС: Cray Linux Environment

    Первое мест возглавляет Tianhe-2 (China)

    Сложились стереотипы что в Поднебесной всё самое дешёвое и низкокачественное, это не всегда так.
    Суперкомпьютер Tianhe-2, спроектированный компанией Inspur совместно с Оборонным научно-техническим университетом Народно-освободительной армии Китайской Народной Республики, был запущен в 2013 году. Строительство этого гиганта обошлось в 200-300 миллионов долларов. Более 1300 ученых и инженеров трудились над созданием Tianhe-2, что в переводе означает «Млечный путь-2».

    .



    Стойки: 125
    Cores: 3120000
    Производительность Linpack (Rmax): 33862.7 TFlop/s
    Теоретическая пиковая производительность: 54902.4 TFlop/s
    Мощность: 17808.00 kW
    Память: 1024000 GB
    Интерконнект: TH Express-2
    ОС: Kylin Linux
    Компилятор: icc
    Математическая библиотека: Intel MKL-11.0.0
    MPI (интерфейс передачи сообщений): MPICH2 with a customized GLEX Channel
    ua-hosting.company
    658,00
    Хостинг-провайдер: серверы в NL / US до 100 Гбит/с
    Поделиться публикацией

    Комментарии 27

      0
      Что интересно, из интеловских все используют Xeon E5. А E7, видимо, стоит как космолёт даже для таких бюджетов.
        0
        Цена/производительность ниже, видимо.
          0
          Нет, вероятно проблема более глубока и дело не в цене, а в архитектуре процессора и какие типы операций на нем более эффективны.
            0
            Просто суперы на «обычных» х86 используют GPU NVIDIA Tesla K20x / K40 либо Xeon Phi для вычислений,
            о чём в статье по непонятной причине не упоминается. А ведь без них «попугаев» было бы на порядок меньше.

            Если взять тот же Titan, то из 27.1 PFlops пиковых, Opteron 6274 выдаёт 2.6 PF (141Gflops/16-ядерник) и оставшиеся 24.5 PF выдают 18688 карт Tesla K20x.
            Т.е. суммарный вклад трёхсот тысяч ядер х86 составляет чуть более 10%.
            GPU тоже не без идеальны и страдают от низкой утилизации, что можно увидеть по разнице показателей RMAX/RPEAK.
            Достигнутые результаты Linpack GPU/XeonPhi лежат в пределах ~60% от пиковой, в то время как у RISC (из топ 10) составляет ~85+% от пиковой.
            +6
            Хотелось бы услышать еще про их использование и достижения. А то есть и есть. Разное слышал, что и для медицины используют и для предсказания катаклизмов, а что конкретно делают, не понятно.
              +5
              Могу ответить в частности по поводу Stampede (University of Texas at Austin). Суперкомпьютер используется для более сотни различных проектов, включающих в себя электромагнитное моделирование, геологические исследования и биомедицинских системы — то, что мне близко. Разумеется, есть еще куча проектов из других областей www.tacc.utexas.edu/research-development/

              Например, было произведено электромагнитное моделирование для модели человека в сверхвысоком разрешении, разрешающееся в систему линейных уравнений из 1.2 миллиардов неизвестных (для решения использовалось 8192 процессоров).
              DOI: 10.1109/TAP.2013.2291564
              Это не задействовало весь суперкомпьютер сразу — но и ресурсы на весь суперкомпьютер тебе никто не даст. Чаще всего, параллельно работает много-много задач и еще большая куча стоит в очереди.
                +3
                Проекты в которых принимал участие Titan.

                S3D, проект, который моделирует молекулярную физику сгорания, проделан данный эксперимент для повышения эффективность механизмов биотоплива и дизеля.
                WL-LSMS моделирует взаимодействия между электронами и атомами в магнитных
                материалах при температурах близких к абсолютному нулю.
                Denovo моделирование ядерных реакций с целью повышения эффективности и сокращения траты топлива для ядерных реакторов.
                CAM-SE — комбинация двух кодов: модель атмосферы на местности, модель планетарной атмосферы и моделирование среды на высоком уровне.
                В проекте решались жидкие, термодинамические уравнения. CAM-SE увеличил точность моделирования климата.

                Titan участвовал в большом числе проектов нежели представлено здесь и все они были увлекательными.
                –6
                Прочитав название поста, сразу почему-то догадался об авторстве. ua-hosting.com.ua любит, почему-то, рассказывать не о трудностях и прелестях жизни хостинга, а писать научно-популярные статьи на около-датацентровскую тематику. Что характерно, им бы место на GT, но статьи регулярно появляются именно на Хабре. Хорошо хоть не в блоге DIY, ибо ни использовать описываемое ребятами из ua-hosting.com.ua, но реализовывать самостоятельно нечто подобное почти никто из аудитории Хабра никогда не будет — более того, темы тут такие «далекие», что даже «слюнки» не текут.
                  +4
                  Такие мы уж есть, некоторые из нашей команды являются дипломированными специалистами в физике, мы любим научно-популярные статьи. На GT мы также обязательно выйдем, но наверное с другим проектом, который соответствует тематике там.
                  +4
                  Расположен он в США. Точное его месторасположение и цель существования неизвестны, так как является он не только суперкомпьютером, но и суперсекретным объектом.

                  image
                    +2
                    Швейцарский Пиз Дэйнт внушает уже одним названием.
                      +3
                      RavenRA: PizDaint — швейцарский суперкомпьютер на 6м месте в мире с 6,27 PFLOPS. И, если судить по имени, должен заниматься либо расчётами последствий ядерных взрывов, либо лингвистическим анализом.
                      +1
                      ru.wikipedia.org/wiki/Эндшпильные_таблицы_Налимова

                      Интересно, если бы все компьютеры работали вместе, какое время понадобится для создания хотя бы 9-фигурных окончаний?
                        0
                        В эту субботу посчастливилось посмотреть на «наш» IBM Blue Gene/P (http://hpc.cmc.msu.ru/bgp/intro). На нём рассчитали окончания для 7 ми фигур.
                        0
                        Цифры производительности не впечатляют, учитывая, что на обычном потребительском рынке есть видеокарты с производительностью 11+ ТФлопс.
                          +2
                          Ну нарисовать можно хоть 100Тф, хоть пентафлоп…
                            +1
                            На картах циклы не особо попрограммируешь…
                              +2
                              Одно дело — пиковая производительность отдельно взятого девайса, а совсем другое — архитектура суперкомпьютера. Это невероятно сложная задача объединить гигантскую пачку компьютеров в быструю сеть, поддерживать работоспособность, охлаждение всего этого комплекса. Современный суперкомпьютер состоит из такого количество узлов, что просто по статистических законам что-то постоянно выходит из строя.
                              Кроме того, видеокарты все-таки очень ограничены в применениях, далеко не всякий алгоритм на них ложится.
                                +2
                                Если Вас больше не впечатляют такие мощности, я боюсь представить, что у Вас в качестве РС стоит дома.
                                +1
                                ух ты, пересказ top500.org
                                  0
                                  Stampede — Xeon E5-2680 8C 2.6GHz, 462462 cores, 5168.11 TFlop/s
                                  Piz Daint   — Xeon E5-2670 8C 2.6GHz, 115984 cores, 6271      TFlop/s

                                  Даже если не брать во внимание, что у E5-2680 базовая тактовая частота на самом деле 2.7GHz, то разница в производительности в пересчёте на одно ядро составляет image раза.
                                  Либо у инженеров Dell руки из жопы, либо кто-то тут Piz Daint.
                                    0
                                    Единичка потерялась.image
                                    Но в 5 раз тоже неплохая такая разница.
                                      0
                                      Рост производительности суперкомпьютера с увеличением количества ядер не является линейным. Думаю, это очевидно. В пять ли раз разница при том, что и ядер, грубо, в пять раз больше — вопрос к инженерам Dell.
                                        0
                                        Вглядитесь в цифры, ядер в 5 раз больше, а производительность на на 20% ниже.
                                        Архитектура ядер одна и таже (процессоры эти вообщее оличаются лишь базовой частотой), тест запускался один и тот же (Linpack).
                                          0
                                          Ах, вот в чём дело. Да, действительно странно. Возможно год постройки, тип соединения между нодами, ну и приврали на полкарася ;)
                                      0
                                      Вы не те попугаи считаете.
                                      Stampede из ~8.5PF пиковой (теоретически возможной) производительности, ~6.4PF обеспечивают Xeon Phi SE10P.
                                      Каждый узел состоит из пары 8 ядерников Xeon E5 и 1 XeonPhi (6400 x 1TFlops/карта).

                                      У Piz Daint Xeon E5 (8 ядерник) даёт ~1PF и ~6.8PF с Tesla K20X (5272 x 1.3TFlops/карта) при пике 7.8PF.
                                        0
                                        Тогда всё встаёт на свои места. В статье ни слова об этом.

                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                    Самое читаемое