Как стать автором
Обновить

В МГУ готовится к запуску новый суперкомпьютер производительностью 400 петафлопс

Время на прочтение2 мин
Количество просмотров7.8K
Всего голосов 16: ↑14 и ↓2+12
Комментарии37

Комментарии 37

Мне всё больше кажется, что мы просто играем в RA3 на максималках. Только сила СССР будет не в том, что кто-то замочил Гитлера с Энштейном, а в том, что он как Феникс возродился.

Я просто списываю — слово в слово — то, что сегодня напечатано в Государственной Газете:
«Через 120 дней заканчивается постройка ИНТЕГРАЛА. Близок великий, исторический час, когда первый ИНТЕГРАЛ взовьется в мировое пространство. Тысячу лет тому назад ваши героические предки покорили власти Единого Государства весь земной шар.
Вам предстоит еще более славный подвиг: стеклянным, электрическим, огнедышащим ИНТЕГРАЛОМ проинтегрировать бесконечное уравнение вселенной. Вам предстоит благодетельному игу разума подчинить неведомые существа, обитающие на иных планетах, — быть может, еще в диком состоянии свободы. Если они не поймут, что мы несем им математически-безошибочное счастье, — наш долг заставить их быть счастливыми. Но прежде оружия — мы испытываем слово.

О характеристиках и марке под шильдиками что-то известно?

Ни в статье, ни в интернете нет ни слова про железо - это самое интересное, особенно с учетом санкций. Но 400 ПФлопс это круто, сейчас самый мощный суперкомпьютер в России у Яндекса:
Galushkin - YANDEX Y4N-GA1-TY25-ZB0, AMD EPYC 7702 64C 2GHz, NVIDIA A100 80GB​, Infiniband, YANDEX, NVIDIA , 27 место и всего 16 ПФлопс

википедия говорит Галушкин 46е место


27 место — Червоненкис, 21 ПФлопс

Там похоже лишний нолик в петафлопсах. Но 40 тоже неплохо. Главное употребить во благо.

Если действительно говорят про "тройку сильнейших в мире", то всё же 400

войти в тройку мировых лидеров среди систем такого класса

Класс - университетские суперкомпьютеры, например.

Нет, там не лишний нолик, там петафлопсы дутые. МГУ выкатил официальный прессрелиз - это "ИИ петафлопс", то есть bf16 or int8. Сколько настоящих петафлоп, МГУ не говорит, но должно быть где-то на порядок меньше.

60 терафлопс/с

операции в секунду в секунду?

Видимо от авторов аббревиатуры "АвтоВАЗ".

CD диск же.

Вполне нормальная единица измерения. Это ускорение вычислительной мощности. Показывает на сколько терафлопс разноняется за 1 секунду.

Тогда должно быть терафлопс/с^2 )

Смотрите, скорость вычислений это флоп/с, как м/с, следовательно ускорение вычислений это флоп/с/с, то есть флоп/с^2 :)

Ускорение получается

Новый суперкомпьютер МГУ должен войти общую систему с остальными суперкомпьютерами университета и вообще страны.РФ

Ссылка не рабочая. А что за сайт? Там можно будет от своего провинциального университета зарегистрироваться и получить вычислительные мощности и лицензии на расчётные ПО?

Это ошибка. Я поправил.

Текст по ссылке конечно совершенно замечательный:

"Решение основано на практиках и существующих разработках в области высокопроизводительных вычислений ведущих мировых производителей. За архитектурную основу решения брались реализованные суперкомпьютеры ведущих мировых университетов", - пояснили в вузе, уточнив, что в супервычислительный комплекс вошли в том числе новые системы энергообеспечения, охлаждения и коммуникации.

Вот это пояснили так пояснили :) Прямо как будто введение к такому стереотипному курсовику открыл, тому самому, который писался в последнюю ночь и срочно растягивался студентом до необходимого количества страниц.

это просто баг )
автор новости скопировал «войдет в общую систему с ведущими научными суперкомпьютерными центрами РФ», потом решил отредактировать, при замене «РФ» на «страны.» случился ляп. ну а хабр подсветил это как ссылку

Если этот новый модный компьютер действительно выдаст 400 ПФлоп/с Rpeak, то Россия в этой гонке ПФлоп/сов сможет почти догнать Финляндию наконец-то (там по данным Топ500 LUMI выдаёт 428 ПФлоп/с Rpeak) и обгонит Италию (304). В любом случае расстановка сил сохранится - гонку каждый год попеременно возглавляют США, Япония и Китай.

НЛО прилетело и опубликовало эту надпись здесь

Не сможет. МГУ выкатил официальный прессрелиз - это "ИИ петафлопс", то есть bf16 or int8. Сколько настоящих петафлоп, МГУ не говорит, но должно быть где-то на порядок меньше.

Так на чем же? Неужели на Эльбрусах?

В день запуска суперкомпьютера в вузе обсудят задачи, где будет задействован суперкомпьютер.

Мне казалось, обычно сначала обсуждают задачу, а потом подбирают оборудование для её решения, а не наоборот.

Сначала выделяется бюджет, потом осваивается

Настоящая задача у этого - выдать тфлопс побольше, попасть в рейтинги повыше, в общем показать всем кузькину мать. А что на нём ещё что-то считать можно - это вторично, но раз уж есть, то обсудят что с ним делать.
Те кто начинает с задач, меряют не тфлопсы. Для того же ИИ, о котором исходная статья говорит, есть совсем другие более релевантные бенчмарки.

МГУ ведь прогонит на нем LINPACK? И официально зарегистрирует результат?

Ох уж эти ваши синтетическия тестики, которые портят отчётности! Не требо такого!

Да, LINKPACK всегда прогоняют и в TOP 500 заявляют

Очень странная новость, честно говоря. Никаких деталей нигде нет. Какое железо, какая сеть, кто интегратор? Как вообще можно запустить такого размера суперкомпьютер без взаимодействия с поставщиками оборудования (а этого взаимодействия нет из-за санкций)?
Разве что какое-то китайское решение. Но я не слышал, чтобы Китай раньше строил машины на своём оборудовании где-то вне самого Китая. Очень мутно всё это

Более чем странная. Обычно задачи определяются заранее - за полтора-два года до запуска. ( не говоря уже о том - что самый общий круг задач определяется на этапе проекта. Сколько нужно памяти, какая скорость обмена с ней и кэшами, сколько понадобится внешнего хранилища - для разного класса задач - разные требования )

Создается тестовый кластер и на нем откатывается ПО для тестов, системное и для предполагаемых расчетов ( все-таки такие суперкомпьютеры всегда специфичны ).

По крайней мере Fugaku был запущен на 1/6 мощности, а только через год добавили остальную. Для Frontier, El Capitan и Aurora - сначала были запущены тестовые кластеры, которые так и останутся работать в качестве самостоятельных суперкомпьютеров и полигона ПО для "большого брата".

Для Frontier за два года работы на тестовом кластере ( год до запуска "большого брата", год после ) за счет оптимизации библиотек всех уровней удалось выжать ещё 10% быстродействия и результаты в рейтинге улучшили.

А тут - запустили штуку ценой 0,5-1 миллиард $ и начинают обсуждать - а какие задачи на ней будут решаться? Пока эта штука простаивает...

Что-то мне подсказывает - что запустят на 1/6 или 1/10 проектной мощности, как Fugaku . А потом планируют нарастить к 2030 году до полной ( если санкции позволят ).

Ну или запустили "голую" штуку чисто для пропаганды и попадания в рейтинги. Без оптимизаций ( или с оптимизацией именно под рейтинговые замеры ) - ну сколько тесты намеряют, столько и будет...

С нуля - и сразу на в топ 10 мирового списка.. ну-ну:)

Ну почему с нуля? Тут ещё с советских времен работает НИВЦ, в котором всякие БЭСМ-6 и Сетунь имелись. Это будет уже четвертый суперкомпьютер МГУ в 21 веке. После Чебышёва, Ломоносова и Ломоносова-2.

У людей из НИВЦ огромный опыт работы с этими системами (и борьбы с их глюками, всё тут было весьма не гладко) - что с хранилищем Lustre, c MPI, с NVIDIA-вскими карточками, с Infiniband сетью. Если что, учебник по CUDA на русском именно Боресков и Харламов из НИВЦа писали.


Насчёт топ-10:
Ломоносов-2 был 22-м в Top500 в 2014 году.
Ломоносов (первый) разобрали, в его машзале по всем признакам собрали новый суперкомпьютер. Сейчас там как раз возня с заменой и пусконаладкой новых чиллеров.

Что-то мне сомнительно - что 400 петафлопс можно впихнуть в масшзал первого Ломоносова.

И по мощности и по охлаждению и по месту ( с учетом систем хранения ). Особенно если учесть что у суперкомпьютеров Frontier, El Capitan и Aurora частично специализированные вычислительные модули ( а если делать на тех, что в свободном доступе - то энергопотребление будет много выше ). Пусть энергопотребление будет как у Frontier 20МВт. В Москве - чай отдельную подстанцию под него нужно строить. И насосную станцию - все-таки олимпийский бассейн за 30 минут перекачивать...

Вряд-ли такие строительные работы могли проходить без объявления ( и без разговоров среди студентов - какого монстра МГУ строит! ). Думаю даже сюда на hubr бы вылились.

А тут как чертик из табакерки - 1 сентября запускаем...

Это оказались "ИИ петафлопс", согласно официальному прессрелизу, то есть bf16 or int8. Сколько настоящих петафлоп, МГУ не говорит, но должно быть где-то на порядок меньше. 400 "ИИ" петафлопс это скажем половина pod (2000 чипов) у гугловского Cloud TPU. Можно рентануть в облаке, 13 тысяч зеленых в час где-то при долгосрочном контракте. Такое можно куда угодно впихнуть.

Я решил прикинуть, сколько будет стоить рентануть такой «суперкомпьютер» в Гугл-облаке. Проверьте, не ошибся?

В МГУ заявляют 400 AI петафлопс. В Гугле предлагают TPU — Peak compute per chip — 275 teraflops (bf16 or int8), это те самые «AI» флопсы. Можно взять от одного TPU до целого модуля (pod) в 4096 chips. Полный модуль даст почти в три раза больше петафлопс.

По стоимости, у МГУ вышло 10 млрд, то есть 100 млн $ по нынешнему курсу (хотя собирали по лучшему, но это мелочи). Чтобы получить сравнимую мощность, возьмем полторы тысячи TPU (чуть меньше половины модуля) у Гугла, будет 412 AI пф. 100 млн $ хватит на 5 лет 24x7 с 3х годичным минимальным контрактом. Правда, в Гугловскую цену включены стоимость обслуживания, замены поломок, электроэнергии, охлаждения, и тд, а к 10 млрд МГУ всё это надо будет добавлять. Обычно это примерно равно стоимости начальной покупки, так что полных затрат хватило бы наверное на 10 лет аренды в Гугле.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории