Суперкомпьютеров не так уж и мало — они есть у многих стран и даже отдельных организаций. С течением времени производительность новых систем становится всё выше, а сами они стоят дороже. Но главное то, что суперкомпьютеры могут выполнять важную для человечества работу.
Именно такой системой является MareNostrum 5, суперкомпьютер из Барселоны, Испания, стоимостью в 202 млн евро. Он был запущен 21 декабря в Суперкомпьютерном центре Барселоны — Centro Nacional de Supercomputación (BSC-CNS). Его производительность составит 314 Пфлопс. Подробности о возможностях новинки — под катом.
Кто и зачем создал этот суперкомпьютер?
MareNostrum 5 — один из самых дорогих проектов в Европе и уж точно самый дорогой в Испании. Он реализован на средства, выделенные EuroHPC JU через Фонд ЕС «Соединение Европы» и программу исследований и инноваций «Горизонт 2020», а также государствами-участниками: Испанией (через Министерство науки, инноваций и университетов и правительство Каталонии), Турцией и Португалией.
Сотрудники Centro Nacional de Supercomputación проводят исследования в области информатики, наук о жизни и Земле, а также вычислительных систем для науки и техники. В ближайшем будущем MareNostrum 5 станет частью единого целого вместе с двумя другими системами — EuroHPC: Lumi (Финляндия) и Leonardo (Италия). Это тоже компьютеры предэкзафлопсного класса, единственные системы такого уровня в Европе. Теперь таких суперкомпьютеров три вместе с испанским.
В его разработке принимали участие компании Eviden (Atos) (основной поставщик), а также Lenovo, IBM, Intel, Nvidia и Partec. Разработчики называют архитектуру системы уникальной, по их словам, она создана для того, чтобы обеспечить максимум функций и возможностей.
Высокая производительность суперкомпьютера позволяет решать самые разные задачи. Одна из них — моделирование и прогнозирование климата. Модели такого рода получат более высокое разрешение, что позволит увеличить точность и самих прогнозов. Также можно будет решать гораздо более сложные проблемы в таких отраслях, как искусственный интеллект и Big Data. Отдельный фокус — на поддержку медицины, а именно — синтез новых лекарственных препаратов, создание вакцин, моделирование поведения эпидемий различных вирусов.
Также возможности суперкомпьютера будут применяться в материаловедении и инженерии. Например, в авиации, где безопасности никогда не бывает много. А ещё MareNostrum 5 задействуют в термояде — учёные будут исследовать новые нюансы термоядерного синтеза.
Особенности архитектуры и характеристики MareNostrum 5
Суперкомпьютер состоит из двух отдельных систем:
раздел общего назначения (GPP), предназначенный для классических вычислений
GPU-раздел (ACC), ориентированный на ИИ
Обе системы по отдельности входят в первую двадцатку TOP500, занимая 19-е и 8-е места соответственно. Что касается GPP, то это, по словам авторов проекта, крупнейший в мире x86-кластер на базе Intel Xeon Sapphire Rapids. Его максимальная производительность составляет 45,9 Пфлопс. Главным разработчиком модуля стала Lenovo, а сам он создан для решения широкого спектра комплексных научных задач с разделением ресурсов. Это обеспечивает большую гибкость, а также повышает эффективность системы, поскольку одновременно ресурсы распределяются между разными пользователями и проектами.
GPP имеет 6 408 стандартных узлов следующей конфигурации:
2 × Intel Xeon 8480+ (56 ядер, 2 ГГц)
256 Гб DDR5 (216 узлов с 1 Тб RAM)
NVMe SSD на 960 Гб
1 × InfiniBand NDR200, общий для двух узлов (SharedIO, 100 Гбит/с на узел)
Дополнительно система имеет 72 узла с двумя 56-ядерными Xeon Max (1,7 ГГц) и набортной памятью HBM2e объёмом 128 Гб.
GPU-раздел (ACC) — третья по мощности в Европе и восьмая в мире по версии TOP500. Пиковая производительность составляет 260 Пфлопс. Базируется система на
4 480 ускорителях Nvidia H100. Раздел имеет 1 120 узлов, каждый из которых включает:
2 × Intel Xeon 8460Y+ (32 ядра, 2,3 ГГц)
512 Гб DDR5
4 × Nvidia H100 с 64 Гб HBM3
NVMe SSD на 460 Гб
4 × InfiniBand NDR200
Что касается общей ёмкости файлового хранилища суперкомпьютера, то это 650 Пбайт, из которых 402 Пбайт приходится на LTO, 248 Пбайт — на HDD, а остальное — на NVMe SSD. Файловая система, конечно, специализированная — это ФС IBM Spectrum Scale. Для объединения нескольких тысяч узлов, всего их 8 000, применяется интерконнект InfiniBand NDR200.
Кстати, планируется, что в будущем добавится ещё один GPP-раздел на базе Nvidia Grace. При этом расширять ACC узлами с Xeon Emerald Rapids и Rialto Bridge не планируется.
А что в России?
На данный момент семь суперкомпьютеров из РФ входят в мировой рейтинг TOP500. Россия занимает в нём 12-ю строчку.
Здесь стоит упомянуть, что из семи этих систем три («Ляпунов», «Червоненкис» и «Галушкин») принадлежат Яндексу, два (Christofari и Christofari Neo) — СберБанку и по одному МГУ («Ломоносов») и МТС (GROM). Все они работают на графических ускорителях Tesla K, P-серия, A100.
Ну а самый мощный в мире суперкомпьютер находится в США. Это Frontier, его производительность составляет 1 194 петафлопса (данные рейтинга TOP500).