exeditor May 22 2012 at 12:00

Команда Microsoft Research побила мировой рекорд по сортировке

2 min

Hadoop*High performance*Search engines*

+61

Comments 41

antaries May 22 2012 at 12:05

На фотке Чак Норрис, да?

TheShock May 22 2012 at 12:58

Чак Норрис минуснул тебя на -20 за такое оскорбление

antaries May 22 2012 at 13:17

Боюсь, это не предел. Так что да, ляпнул, так ляпнул. )

Lisio May 22 2012 at 13:59

Смотрите-ка, живой еще.

namespace May 23 2012 at 12:14

Отличные комментарии по теме «Сортировки»! Отличный юмор! Отличный Хабр!

Error_403_Forbidden May 22 2012 at 19:19

В присутствии Чака Норриса алгоритм сортировки работает в 40 раз быстрее.

GreyCat May 23 2012 at 09:52

Несмотря на то, что товарищ похож много на кого (тут коллеги уже предложили версии и про Чака, и про Брюса Шнайера, и даже зачем-то Марка Руссиновича вспомнили), на самом деле это относительно неизвестный широкой публике Джереми Элсон, занимающийся тихонько параллельными вычислениями еще со времен Microsoft Virtual Earth.

Ваш К.О.

rocket May 22 2012 at 12:14

А если устремить количество дисков и серверов к бесконечности — можно ли достигнуть ещё более лучших результатов при прежних алгоритмах?

DjPhoeniX May 22 2012 at 12:18

Думаю, тут всё упрётся в пропускную способность одной из составных частей — жёсткие диски, сеть, память… Хотя запас, думаю, ещё есть.

sdramare May 22 2012 at 12:19

Ну насколько закон Амдала позволит, я думаю.

UFO landed and left these words here

stalkers May 22 2012 at 12:25

Как-то «обычные компьютеры из магазина» слабо соотносится с кластером из 250 машин, пусть даже и собранным из этих самых обычных компьютеров, нет? Я просто не в теме, но интересно — разве категория Daytona не должна отображать результаты, которых сможет добиться обычный юзер на обычном компьютере, а не на запредельно мощном железе?

UFO landed and left these words here

biz May 22 2012 at 12:50

А что Вам мешает купить в магазине 250 серверов или ПК и собрать из них кластер? (кроме финансов конечно)

Caravus May 22 2012 at 15:23

Ну даже при условии что это будут 1U сервера, это потребует ОЧЕНЬ много места, хорошую вентиляцию (хотя бы), много электричества, сетевого оборудования, проводов и т.д.

biz May 22 2012 at 15:29

В любом случае никто не обещал условий реализации в рамках квартиры. Сказано только про оборудование которое можно купить в свободной продаже.

А 250 с серверов это уже небольшой ДЦ — действительно. Около 10 стоек, учитывая инфраструктуру и не 100%ую плотность размещения

GreyCat May 22 2012 at 23:37

Это вы как-то сильно загнули. Стандарт для 1U — порядка 37-40 серверов в стойке — то есть 7 стоек.

biz May 23 2012 at 10:31

ну это зависит от охлаждения — это больше 10кВт на стойку, далеко не стандартный ДЦ.

+ для коммутации понадобится куча сетевого оборудования которое может занять не одну даже стойку. С округлением не меньше 10 )

GreyCat May 23 2012 at 11:56

Для коммутации требуется по одному 48-портовому свичу на стойку. Занимает 1-1.5-2 юнита.

Впрочем, к обсуждаемому топику это все вряд ли относится: я с трудом могу сказать, что даже 10 гигабит сейчас заняли сколько-нибудь часто встречающееся и доступное положение. До сих пор мейнстрим все-таки «гигабитные порты, транк из n*10-гигабит для интерконнектов». Вендоров, у кого есть доступные 48-портовые 10-гигабитные свичи можно пересчитать по пальцам (например, Niagara), стоит оно относительно космических денег. У тех же Cisco, поправьте меня, если я ошибаюсь, 10-гигабитные свичи будут на порядок более громоздкие, дорогие и в стоять будут в отдельных стойках фактически.

SychevIgor May 22 2012 at 13:11

когда говорят, что кластеры собираются из доступных компонентов, не имеют ввиду из мусора. Эти компоненты не должны быть штучными самое главное. Партии от 1000 единиц какого либо элемента, уже наверное будут считаться доступными.

ivan2kh May 23 2012 at 05:32

Our cluster’s computers are a mix of HP and Dell sys-tems with a range of RAM (24GB to 96GB) and CPUs (2 to 12 cores). The compute nodes had a single local
disk, used only for operating system files. Storage nodes had one operating system disk plus between 5 and 16 FDS data disks used for sort data. These disks had a
range of capabilities: primarily (78%) 10K RPM dual-port SAS disks, but with some 22%) 7,200 RPM SATA disks. Each computer is networked using 10G (10 giga-bit/sec) Ethernet connected in a full-bisection-bandwidth CLOS network [5]. The interconnect is 22×Blade G8264 switches, each of which has 64×10G Ethernet ports. Most computers had a dual-port 10G NIC (an In-tel X520 or HP NC522SFP), though some of the storage nodes used only a single port. All computers run Win-dows Server 2008 R2 SP1.

Говорят, что высокий результат в соревновании был обеспечен в основном высокоскоростной сетью, то есть благодаря 10G.

ANtlord May 22 2012 at 12:27

У меня на все это нашлось только слово. «Круто!»

int_index May 22 2012 at 12:32

Так беден ваш словарный запас?

nZeus May 22 2012 at 13:50

Это называется лаконичность… или даже лапидарность.

eugenius_nsk May 23 2012 at 14:22

Помнится, Ильф и Петров это называли по-другому.

gricom May 22 2012 at 12:40

А почему результат в Indy получился меньше, чем в Daytona, если там нет ограничений по железу?

UFO landed and left these words here

jinxal May 22 2012 at 13:18

Указан старый рекорд для Daytona — 1353 Гб. А ребята сделали 1401 Гб на Indy. Сколько у них получилось бы на Daytona можно только гадать )

jinxal May 22 2012 at 13:21

То есть они побили Daytona, совершенно не предпологая это делать )

kuber May 22 2012 at 13:22

1353 Гбайт это прошлогодний рекорд установленный Калифорнийским университетом

Monnoroch May 22 2012 at 13:19

А я когда увидел название топика почему-то представил зал, полный ~~китайцев~~ рабочих, сортирующих миллионы распечатанных листков с цифрами :)

UFO landed and left these words here

davinchi May 22 2012 at 13:43

А сеть сортировки про одновременность думает иначе: ru.wikipedia.org/wiki/Сеть_сортировки

taliban May 22 2012 at 14:10

И причем тут сеть сортировки?

bachin May 22 2012 at 15:42

"… в котором необходимо за минуту прочитать с диска и сортировать как можно большее число записей и сохранить результат в файл..."

Простите, с одного диска и в один файл?