skobeltsyn2 сен 2014 в 19:41

Параллельная сортировка методом пузырька на CUDA

5 мин

17K

Высоконагруженные системы * Алгоритмы * GPGPU *

Туториал

-8

Комментарии 11

maksqwe 2 сен 2014 в 20:07

Похоже, после обнуления кармы сегодня некоторые люди достали из закромов лабораторные(курсовые или дипломные), сдули пыль и закопипастили текст на хабр. Хоть оформили бы по-человечески код, есть же теги.

maksqwe 2 сен 2014 в 20:11

У самого где-то курсовик валяется на винте где проводил анализ производительности поразрядной сортировки с другими ее реализациями(из других пакетов). Еще на первых версиях, гонял на своей 9800печ.

prizzrak 2 сен 2014 в 20:38

Подпишите, пожалуйста, оси на графике. Y — время выполненеия, X — число элементов? Почему тогда для однопоточного варианта тесты начинаются с 32-х элементов, а для многопоточного — с одного?
И в самом деле больше похоже на каую-то лабу, только оформленную не так уж и аккуратно :-/

onto 2 сен 2014 в 21:32

Наверное стоит параллельный алгоритм описать подробнее, ибо ваша реализация у меня не сортирует.

halyavin 3 сен 2014 в 03:57

if (array_device[idx]<array_device[idx+1]){
    int buffer = array_device[idx];
    array_device[idx]=array_device[idx+1];
    array_device[idx+1] = buffer;
}

Это рейс кондишен в чистом виде.

sandello 3 сен 2014 в 04:12

Параллелить лучше какой-нибудь mergesort или quicksort. Они из «коробки» под это заточены. Пузырек с его O(N²) подходит только под мелочь, которую параллелить смысла не имеет.

YourChief 3 сен 2014 в 07:04

Поддерживаю, статья просто мусор.

Автор апеллирует к незначительному выигрышу при сортировке больших массивов, но при большом количестве элементов время работы пузырька и сортировки Хоара или сортировки слиянием (и им подобных) различается на порядки. Таким образом просто использование «нормального» алгоритма сортировки оставляет позади сортировку с параллелизмом практически в любое количество ядер.

beeruser 3 сен 2014 в 14:10

Для GPU основными методами сортировки являются Radix и Bitonic

KvanTTT 3 сен 2014 в 05:59

Зачем нужны такие большие таблицы в статье?

prizzrak 3 сен 2014 в 09:52

Чтобы отчет по лабораторной работе в универе выглядел внушительнее =)

Vest 3 сен 2014 в 08:46

Мне вообще не нравится то, что в цикле происходит выделение памяти для устройства, и потом опять же в цикле вызываются операции перемещения элементов. Я думаю, что это затратный код — надо бы его попрофилировать…
А так, NVIDIA предоставляет библиотеку Thrust со своими алгоритмами. Сортировка там, кстати, есть: docs.nvidia.com/cuda/thrust/#sorting

Зарегистрируйтесь на Хабре, чтобы оставить комментарий