jeston13 сен 2012 в 16:05

«Суперкомпьютер» из 64 Raspberry Pi и Lego

1 мин

92K

Высоконагруженные системы *

+50

122

Комментарии 122

S1ashka 13 сен 2012 в 16:10

Интересна итоговая мощность

Shirixae 13 сен 2012 в 17:06

Думаю, не сравнится с 4к долларовым ПК )

ComodoHacker 13 сен 2012 в 17:31

Смотря на каких задачах

faddistr 13 сен 2012 в 20:51

И на каких задачах можно применить этот кластер?

6opoDuJIo 13 сен 2012 в 20:55

Если на 4к долларовом ПК использовать CUDA то тут никуда не деться — в таком случае комп будет круче этого кластера.

НЛО прилетело и опубликовало эту надпись здесь

stoune 14 сен 2012 в 10:06

Решение на Rasbery Pi будет хуже хотя бы через большие затраты на инттерконект отдельных узлов через Ethernet.

ComodoHacker 13 сен 2012 в 20:58

Будем следить за новостями от Саймона.

smind 14 сен 2012 в 09:05

на задачах ОБУЧЕНИЯ!

dotsquid 13 сен 2012 в 17:10

Вообще странно всё это. Такое впечатление, что сделали ради лулзов. Больше всего поражает, что даже в пресс-релизе университета ни слова о производительности, лишь упоминание того, что первым тестом было вычисление числа пи.

trikadin 13 сен 2012 в 17:30

Нет, ну что вы. Конечно же, это было сделано абсолютно серьёзно. Было задействовано множество ученых, инженеров и программистов.

Можно сказать, это наше будущее.

dotsquid 13 сен 2012 в 17:37

Ваш сарказм не уместен.
В пресс-релизе говорится, что такая система вполне себе неплохое средство для обучения студентов высоко-производительным (читайте «распараллеленным») вычислениям.
А для того, чтобы прогнать несколько тестов, собрать результаты и отобразить их в сравнительной таблице, «множество ученых, инженеров и программистов» и ни к чему.

1inuxoid 13 сен 2012 в 18:48

Наверное, имеется в виду обучению принципам, подходам и технологиям. Просто в масштабе.

lolken 13 сен 2012 в 20:41

Demosfen 13 сен 2012 в 17:35

А что им еще для тестов было на нем считать? Linpack гонять не вариант. Интерконнект между узлами всего 100 Мегабит. Памяти на каждом узле кот наплакал. То есть даже тест с нормальным размером матрицы не погоняешь, а если с мелкими запустишь, так интерконнект все результаты испортит. Вот и тестируют на вычислениях числа Pi :)

dotsquid 13 сен 2012 в 17:41

Т.е. 256МБ рамы — это уже кот наплакал?
У меня в университете был предмет, связанный с распараллеленными вычислениями. И на практических занятиях мы гоняли те же матрицы по 100mbps сети — никто не умер.

Demosfen 13 сен 2012 в 17:46

Ага. Был у нас первый кластер на альфах 21164 (533 MHz). Памяти на каждой было как раз по 256Мб и 100 Mbit интерконнект. Году так в 99. По нынешним меркам у него ооочень чахлая производительность была. Его уже лет 5 как музейный экспонат только используют. Даже студентов учить уже слишком медленный он.

nick4fake 13 сен 2012 в 21:00

У нас такие на офисе. На них работают люди. Работают. Люди. Это не музей.

Смотря для каких задач. Для офиса — этого достаточно.

Aldekein 13 сен 2012 в 22:54

Бедный-бедный-бедный офис =(

FIZIK 14 сен 2012 в 03:23

Не обязательно, может это тонкие станции.

nick4fake 14 сен 2012 в 04:45

Нет.

Да вы чего, люди? Зачем нужно что-то мощнее? Они офис тянут, работают, им нужно до восьмерки обновляться? Или офис2010 ставить? Пока они справляются со своей задачей, смысла их менять нет.

Renius 14 сен 2012 в 05:49

ChiWriter? :)

vogel 14 сен 2012 в 07:53

Лексикон!

nick4fake 14 сен 2012 в 12:05

office97

kostik450 14 сен 2012 в 19:45

Слово и дело

Renius 14 сен 2012 в 03:56

Офис у которого нет интернет-эксплореров, маил агентов и прочей ереси видится мне гораздо богаче некторых.

nick4fake 14 сен 2012 в 04:44

Они там даже не запускаются. :)

Demosfen 14 сен 2012 в 03:13

А почему бы им не работать на таких машинах, если они справляются с поставленными задачами? У меня есть знакомые, которые и на 286-х работают. На этих машинках бегают программки для управления станком. Собственно зачем их менять, если все и так прекрасно работает.
У нас эти машины перестали справляться и были списаны.

nick4fake 14 сен 2012 в 04:44

Ну вот, и я о том же.

gribozavr 13 сен 2012 в 19:43

К сожалению, да. Сегодня на настоящих HPC машинах минимальным является 1 Gb RAM на ядро, а чаще всего — 2 Gb. А про интерконнект вообще даже не стоит сравнивать — стоимость Infiniband доходит до половины стоимости всей системы и счёт идёт на микросекунды задержки.

zeliboba 14 сен 2012 в 11:01

кстати, вы не знаете откуда такие цифры появились?

gribozavr 14 сен 2012 в 12:48

Из практики. Столько требуется средней задаче из разных областей. Конечно, кому-то больше, кому-то меньше.

zeliboba 14 сен 2012 в 13:24

ну да, я такие же характеристики обычно видел, думал вдруг вы знаете каки-нибудь обзоры на эту тему.

Sap_ru 13 сен 2012 в 19:07

А причём тут производительность? На такой системе студенты могут пробовать и обкатывать полноценные кластерные проекты. Настоящий кластер из 64 компов обошёлся бы на порядок-два дороже,

Demosfen 14 сен 2012 в 03:15

Дело в том, что для обучения можно наклепать виртуалок и получить близкую производительность на современной машине. Поэтому для обучения тоже не очень интересный вариант. Например, студенты некоторые задачки компилировать сдохнут на R-Pi.

mayorovp 14 сен 2012 в 03:51

Кросс-компиляцию вчера запретили?

Demosfen 14 сен 2012 в 04:00

Представил себе лабы по программированию для mpi. «А сейчас, господа, мы с вами будем учить что такое кросс-компиляция» :) Немного не по профилю предмета — это раз.
Каждый раз после исправления ошибки в коде таскать код с рабочей станции на кластер — это два.
Зачем изобретать трудности, а потом их преодолевать? :(

mayorovp 14 сен 2012 в 04:02

Во-первых, код таскать в любом случае придется, потому что в кластере-то 64 узла, и код должен быть на каждом из них.
А во-вторых, «таскание кода» прекрасно поддается автоматизации.

Demosfen 14 сен 2012 в 04:03

Ну ок. Будем считать что убедили. Начинайте проводить лабы по mpi на R-Pi :)

gribozavr 14 сен 2012 в 12:49

Кластерные ФС уже не в моде, да.

mayorovp 14 сен 2012 в 13:37

Пожалуйста, читайте ветку с начала, а не с конца.
Я не утверждал, что «таскание» кода на все 64 узла — это сложная задача. Я утверждал, что эта задача не проще «таскания» кода с рабочей станции на сервер.

Кластерная ФС решает сразу обе задачи, за что ей честь и хвала.

gribozavr 14 сен 2012 в 13:58

Проще. Кластерную ФС должен настроить администратор кластера. А за таскание кода и данных с рабочей станции на кластер отвечает каждый самостоятельно.

mayorovp 14 сен 2012 в 14:03

В любом случае, один раз настроить кросс-компиляцию проще, чем регулярно «сдыхать компилировать некоторые задачки на R-PI»

gribozavr 14 сен 2012 в 14:12

… а потом ещё настроит и эмулятор, потому что всё равно придётся бинарник копировать. Я считаю что если есть компьютер целевой платформы достаточной мощности для разработки, то лучше разрабатывать нативно.

mayorovp 14 сен 2012 в 14:13

Ась? А эмулятор-то зачем?!

gribozavr 14 сен 2012 в 14:18

1. Кросс-компиляция, копирование на девайс, запуск.

2. Копирование на девайс, компиляция, запуск.

3. Кросс-компиляция, запуск под эмулятором.

4. Компиляция, запуск. (Всё на девайсе.)

Выбирайте какой вариант проще. Я считаю что если уже возиться с кросс-компиляцией, то лучше вариант (3). А если запускать на девайсе, (а мы говорим о ресурсоёмких задачах), то можно и компилировать там же — вариант (2). Вариант (1) сочетает недостатки всех подходов.

mayorovp 14 сен 2012 в 14:48

Это все я понял.
Но недостатки-то какие?

gribozavr 14 сен 2012 в 14:52

И кросс-компиляция, и копирование.

Swappp 14 сен 2012 в 17:00

Вы вообще что-нибудь разрабатывали с использование кросс-компиляции? В этом нету ничего сложного. Более того, руками ничего копировать не надо. Все один раз настраивается (запустить специальный сервис на целевой и вбить адрес на инструменталке), далее из IDE запускается либо отладка, с подключение к удаленному отладчику, либо просто запуск. Исполняемые файлы заливаются сами. Так например это все происходит при разработки под QNX. При том, что там целевые машины могут быть вполне приличными, просто разработчики перестали делать IDE непосредственно под QNX, наверно она просто не пользовалась особой популярность.

gribozavr 14 сен 2012 в 17:09

Вот в только таких хорошо отлаженных случаях кросс-компиляция работает хорошо — когда этот юзкейс предусмотрен и оттестирован разработчиками тулчейна и IDE.

Swappp 15 сен 2012 в 09:17

Целевая платформа все-таки ARM, тут все же наверно в большинстве своем и так используется кросс-компиляция. Основная проблема это все один раз настроить. Далее сама кросс-компиляция практически ничем не отличается от обычной, за исключение того, что используются другие пути. Вот доставить какие-нибудь библиотеки для дальнейшего использования на целевой платформе, да, может быть сложно.

Yan_Alex 13 сен 2012 в 19:37

Честно говоря, не могу представить проект НЕ для лулза из ЛЕГО, помоему два этих слова в одном анонсе исключают любую серьезность, ну и как же можно не обрптить внимание на кавычки в слове Суперкомпьютер?

zeliboba 14 сен 2012 в 11:08

не нужно кавычек, лего часто используется для прототипирования девайсов в лабах.

Yan_Alex 14 сен 2012 в 11:40

Я думаю если бы они делали суперкомпьютер без кавычек, то лего было бы совсем неуместно. Предлагаю взглянуть на реальный СК (http://habrastorage.org/storage1/478c60c2/5ec9e42f/adb8d0e4/0052ebc6.jpg), ну и сколько по времени и деньгам уйдет сборка корпуса для нашего суперкомпьютера? Лего то нынче не дешевый.

zeliboba 14 сен 2012 в 12:06

суперкомпьютеры видел, спасибо. по существу (про прототипирование) есть что возразить?

Yan_Alex 14 сен 2012 в 12:18

Ну хотя бы то что именно суперкомпьютер прототипировать из лего это фейл =), а то что лего удобный инструмент, для мелочей то вполне согласен. Но опять же прошу обратит внимание я не о лего в частности говорил а о том что слова Суперкомпьютер и Лего в одном анонсе исключают любую серьезность.

zeliboba 14 сен 2012 в 13:18

прототипы чего угодно из чего угодно это по большей части фейл, просто потому что это прототипы, поиск решений. про «ислючает серьезность»: вы просто играете словами или действительно считаете, что прототипирование это несерьезно? или с лего несерьезно? а с липкой лентой типа скотч?

Yan_Alex 14 сен 2012 в 13:22

Не, я говорил что прототипировать что то громоздкое и навороченное вроде суперкомпьютера из лего это фейл, поэтому обратил внимание на кавычки, вместе с ними эти понятия более менее уживаются, так как для простых вещей лего самое то.

zeliboba 14 сен 2012 в 13:48

у вас, по-моему, искаженное представление о research and development.

НЛО прилетело и опубликовало эту надпись здесь

dotsquid 13 сен 2012 в 17:23

Ну да, конечно. Если так считать, то можно еще разделить на суммарное расстояние между ядрами.

НЛО прилетело и опубликовало эту надпись здесь

BupycNet 13 сен 2012 в 17:41

Вы не учли один интересный факт. В i7 6 ядер. А тут 64 ядра + свое отдельное железо. Правда тут будет выгодно параллелить задачу вроде подбора хэша. Хотя машинка выбрана не особо. Сейчас можно например собрать компьютер из 128 каких нибудь Snapdragon S4 с 4 ядрами на частоте 1.5 ггц. Вот это будет мощь. И по идее вполне уместится в большую сумку.

Xazzzi 13 сен 2012 в 18:11

Только реактор с собой не забульте.

equand 13 сен 2012 в 18:32

Мощь будет 4 компьютера, каждый с 4мя топовыми видеокартами.
Вот там подбор хеша будет быстрый и исчисляться будет производительности многофлопсами.

1inuxoid 13 сен 2012 в 18:50

вы не учли «графические ядра» (: в броадкомовском чипе, имеется в виду

Demosfen 13 сен 2012 в 17:38

Ну это в теории. Также как значения пиковой производительности больших супер-компьютеров. Просто берут и суммируют производительность всех узлов. Но в реальности хорошо если на линпаке процентов 70-80 от пика получится выжать. На реальных задачах и того меньше. Точнее говоря на реальных задачах после определенного числа узлов или прироста нет, или наоборот падение идет.

НЛО прилетело и опубликовало эту надпись здесь

6opoDuJIo 13 сен 2012 в 16:41

Azya 13 сен 2012 в 16:16

Судя по 3-ей фотографии он еще и 64 монитора заказал)

mayorovp 13 сен 2012 в 16:38

KVM уже запретили?

Azya 14 сен 2012 в 13:58

К чему Вы KVM вспомнили? Я про мониторы на заднем плане.

mayorovp 14 сен 2012 в 14:00

Только сейчас их заметил…

AlexAdskiy 13 сен 2012 в 16:38

Дак вот почему на Raspberry большая очередь была.

iru 13 сен 2012 в 17:24

Щас еще пара людей такой собирет, и вообще своего Raspberry недождусь!!!

mdevils 13 сен 2012 в 17:49

Соберет*

alexeibs 14 сен 2012 в 07:53

Там уместнее «собирает», скорее всего просто опечатка

SLY_G 13 сен 2012 в 22:48

Вы пока учебник русского закажите, скоротать время.

6opoDuJIo 13 сен 2012 в 16:45

Игрушечный суперкомпьютер по стоимости неплохого обычного.
Хотя, может по характеристикам ВНЕЗАПНО обогнал и десктоп.

Firz 13 сен 2012 в 17:09

А это идея, нужно делать суперкомпьютер из LM4F120, пока они копейки с доставкой стоят.
Единственный минус — почти все ресурсы «супер компьютера» уйдут на взаимодействие плат друг с другом)

6opoDuJIo 13 сен 2012 в 17:17

Если следовать вашей логике и дальше, монжо назаказывать тысячь 16 микрух pic16, собрать в кучу, и… вернуться к компьютерам, размером с комнату.
А если серёзно, то у 64 RPI есть шансы уменьшить расходы на взаимодействие если использовать алгоритмы, предназначенные для операций над матрицами, векторами и прочим, что можно безболезненно распараллелить (прямо как в GPU).
И сколько там у rpi памяти?
256 мегабайт?
256*16 = 16 384
по сути — 16 гигабайт памяти

quantum 13 сен 2012 в 22:47

По факту меньше — на каждом своя кушающая ось стоит

Demosfen 14 сен 2012 в 03:17

Еще не стоит забывать про максимум 240 Мб под нужды юзера. Минимум 16 метров жрет GPU. Так что даже еще меньше :(

djmorgan 13 сен 2012 в 16:55

Вот почему их поначалу не хватало. Так как один кадр сразу 64 штуки купил)

Lici 13 сен 2012 в 17:10

А как у них с выделением тепла? Поскольку с отводом оного, я смотрю, тут туговато будет.

celen 13 сен 2012 в 20:39

Не подплавился бы пластик лего.

quantum 13 сен 2012 в 22:47

Расплавится — получится литой пластиковый корпус:)

НЛО прилетело и опубликовало эту надпись здесь

6opoDuJIo 13 сен 2012 в 17:22

Теоретически — да.

jstudent 13 сен 2012 в 17:25

Постройка игрушечного дата-центра

trikadin 13 сен 2012 в 17:32

И запуск на нём игрушечного гугла. Легугла.

6opoDuJIo 13 сен 2012 в 17:35

Запуск на нём игрушечных сайтов!
За право списать на контрольной.

wowscheg 13 сен 2012 в 17:53

А на третьей фотографии, соответствующий админ.

Vovanys 13 сен 2012 в 19:28

сервака майнкрафта тогда уж)

trikadin 13 сен 2012 в 19:33

Гениально) Лего-игра на лего-сервере)

DrZugrik 13 сен 2012 в 17:25

Вот что такое… у когото 64 Raspberi, а ктото одну никак не дождется…

sergpenza 13 сен 2012 в 17:27

Уважаю профессора Кокса. С таким папой не соскучишься :)

kopch 13 сен 2012 в 17:39

Чувак какими-то связями 64 RPI сынуле поиграться раздобыл, но на это насрать вообще. Он за счёт универа ещё и Lego 64 коробки сынуле достал, в каждой коробке минимум по 4 лего-человечка( я бы в детстве убил за такую армию). Молодец чё..))…

6opoDuJIo 13 сен 2012 в 17:41

Они будут админами игрушечного датацентра.

6opoDuJIo 13 сен 2012 в 18:03

Профессора нужно подружить с этим чуваком:
www.youtube.com/watch?v=qWkUFxItWmU&feature=related

Xazzzi 13 сен 2012 в 18:15

Лучше с этим, у вашего как-то не очень.

6opoDuJIo 13 сен 2012 в 18:18

Согласен.
Жалко что я пока не могу найти никакого металла, исполненного на флоппи-дисководах.

6opoDuJIo 13 сен 2012 в 20:46

меня одного прикололо то что на авке у Xazzzi Дарт Вейдер?
1347569153-clip-10kb

Demosfen 13 сен 2012 в 18:05

Ну на счет использования мануала как how-to по R-Pi это громко сказано. В нем подробно расписано как собрать mpich, но вот по оптимизации системы инфы ноль. Раз уже хотим использовать R-Pi как вычислительные ноды, то надо как минимум по памяти оптимизацию сделать, т.е. вырубить все ненужное и отдать GPU минимум оперативки, заменить ssh на dropbear, проц разогнать и т.п.
Ну и плюс не повредило бы хотя бы C3 прикрутить, а то рулить зоопарком из 64 узлов это еще то удовольствие будет. Запустить например одну и ту же команду на всех узлах, или скопировать один и тот же конфиг. На самом деле у него еще куча заморочек вылезет — тут я точно могу сказать, т.к. ковыряюсь с кластерами уже лет 15, в основном как админ конечно, но все же… :)