Как стать автором
Обновить

Комментарии 27

Что интересно, из интеловских все используют Xeon E5. А E7, видимо, стоит как космолёт даже для таких бюджетов.
Цена/производительность ниже, видимо.
Нет, вероятно проблема более глубока и дело не в цене, а в архитектуре процессора и какие типы операций на нем более эффективны.
Просто суперы на «обычных» х86 используют GPU NVIDIA Tesla K20x / K40 либо Xeon Phi для вычислений,
о чём в статье по непонятной причине не упоминается. А ведь без них «попугаев» было бы на порядок меньше.

Если взять тот же Titan, то из 27.1 PFlops пиковых, Opteron 6274 выдаёт 2.6 PF (141Gflops/16-ядерник) и оставшиеся 24.5 PF выдают 18688 карт Tesla K20x.
Т.е. суммарный вклад трёхсот тысяч ядер х86 составляет чуть более 10%.
GPU тоже не без идеальны и страдают от низкой утилизации, что можно увидеть по разнице показателей RMAX/RPEAK.
Достигнутые результаты Linpack GPU/XeonPhi лежат в пределах ~60% от пиковой, в то время как у RISC (из топ 10) составляет ~85+% от пиковой.
Хотелось бы услышать еще про их использование и достижения. А то есть и есть. Разное слышал, что и для медицины используют и для предсказания катаклизмов, а что конкретно делают, не понятно.
Могу ответить в частности по поводу Stampede (University of Texas at Austin). Суперкомпьютер используется для более сотни различных проектов, включающих в себя электромагнитное моделирование, геологические исследования и биомедицинских системы — то, что мне близко. Разумеется, есть еще куча проектов из других областей www.tacc.utexas.edu/research-development/

Например, было произведено электромагнитное моделирование для модели человека в сверхвысоком разрешении, разрешающееся в систему линейных уравнений из 1.2 миллиардов неизвестных (для решения использовалось 8192 процессоров).
DOI: 10.1109/TAP.2013.2291564
Это не задействовало весь суперкомпьютер сразу — но и ресурсы на весь суперкомпьютер тебе никто не даст. Чаще всего, параллельно работает много-много задач и еще большая куча стоит в очереди.
Проекты в которых принимал участие Titan.

S3D, проект, который моделирует молекулярную физику сгорания, проделан данный эксперимент для повышения эффективность механизмов биотоплива и дизеля.
WL-LSMS моделирует взаимодействия между электронами и атомами в магнитных
материалах при температурах близких к абсолютному нулю.
Denovo моделирование ядерных реакций с целью повышения эффективности и сокращения траты топлива для ядерных реакторов.
CAM-SE — комбинация двух кодов: модель атмосферы на местности, модель планетарной атмосферы и моделирование среды на высоком уровне.
В проекте решались жидкие, термодинамические уравнения. CAM-SE увеличил точность моделирования климата.

Titan участвовал в большом числе проектов нежели представлено здесь и все они были увлекательными.
Прочитав название поста, сразу почему-то догадался об авторстве. ua-hosting.com.ua любит, почему-то, рассказывать не о трудностях и прелестях жизни хостинга, а писать научно-популярные статьи на около-датацентровскую тематику. Что характерно, им бы место на GT, но статьи регулярно появляются именно на Хабре. Хорошо хоть не в блоге DIY, ибо ни использовать описываемое ребятами из ua-hosting.com.ua, но реализовывать самостоятельно нечто подобное почти никто из аудитории Хабра никогда не будет — более того, темы тут такие «далекие», что даже «слюнки» не текут.
Такие мы уж есть, некоторые из нашей команды являются дипломированными специалистами в физике, мы любим научно-популярные статьи. На GT мы также обязательно выйдем, но наверное с другим проектом, который соответствует тематике там.
НЛО прилетело и опубликовало эту надпись здесь
Швейцарский Пиз Дэйнт внушает уже одним названием.
НЛО прилетело и опубликовало эту надпись здесь
В эту субботу посчастливилось посмотреть на «наш» IBM Blue Gene/P (http://hpc.cmc.msu.ru/bgp/intro). На нём рассчитали окончания для 7 ми фигур.
Цифры производительности не впечатляют, учитывая, что на обычном потребительском рынке есть видеокарты с производительностью 11+ ТФлопс.
Ну нарисовать можно хоть 100Тф, хоть пентафлоп…
На картах циклы не особо попрограммируешь…
Одно дело — пиковая производительность отдельно взятого девайса, а совсем другое — архитектура суперкомпьютера. Это невероятно сложная задача объединить гигантскую пачку компьютеров в быструю сеть, поддерживать работоспособность, охлаждение всего этого комплекса. Современный суперкомпьютер состоит из такого количество узлов, что просто по статистических законам что-то постоянно выходит из строя.
Кроме того, видеокарты все-таки очень ограничены в применениях, далеко не всякий алгоритм на них ложится.
Если Вас больше не впечатляют такие мощности, я боюсь представить, что у Вас в качестве РС стоит дома.
ух ты, пересказ top500.org
Stampede — Xeon E5-2680 8C 2.6GHz, 462462 cores, 5168.11 TFlop/s
Piz Daint   — Xeon E5-2670 8C 2.6GHz, 115984 cores, 6271      TFlop/s

Даже если не брать во внимание, что у E5-2680 базовая тактовая частота на самом деле 2.7GHz, то разница в производительности в пересчёте на одно ядро составляет image раза.
Либо у инженеров Dell руки из жопы, либо кто-то тут Piz Daint.
Единичка потерялась.image
Но в 5 раз тоже неплохая такая разница.
Рост производительности суперкомпьютера с увеличением количества ядер не является линейным. Думаю, это очевидно. В пять ли раз разница при том, что и ядер, грубо, в пять раз больше — вопрос к инженерам Dell.
Вглядитесь в цифры, ядер в 5 раз больше, а производительность на на 20% ниже.
Архитектура ядер одна и таже (процессоры эти вообщее оличаются лишь базовой частотой), тест запускался один и тот же (Linpack).
Ах, вот в чём дело. Да, действительно странно. Возможно год постройки, тип соединения между нодами, ну и приврали на полкарася ;)
Вы не те попугаи считаете.
Stampede из ~8.5PF пиковой (теоретически возможной) производительности, ~6.4PF обеспечивают Xeon Phi SE10P.
Каждый узел состоит из пары 8 ядерников Xeon E5 и 1 XeonPhi (6400 x 1TFlops/карта).

У Piz Daint Xeon E5 (8 ядерник) даёт ~1PF и ~6.8PF с Tesla K20X (5272 x 1.3TFlops/карта) при пике 7.8PF.
Тогда всё встаёт на свои места. В статье ни слова об этом.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий