skobeltsyn Sep 2 2014 at 19:41

Параллельная сортировка методом пузырька на CUDA

5 min

17K

High performance*Algorithms*GPGPU*

Tutorial

-7

Comments 11

maksqwe Sep 2 2014 at 20:07

Похоже, после обнуления кармы сегодня некоторые люди достали из закромов лабораторные(курсовые или дипломные), сдули пыль и закопипастили текст на хабр. Хоть оформили бы по-человечески код, есть же теги.

maksqwe Sep 2 2014 at 20:11

У самого где-то курсовик валяется на винте где проводил анализ производительности поразрядной сортировки с другими ее реализациями(из других пакетов). Еще на первых версиях, гонял на своей 9800печ.

prizzrak Sep 2 2014 at 20:38

Подпишите, пожалуйста, оси на графике. Y — время выполненеия, X — число элементов? Почему тогда для однопоточного варианта тесты начинаются с 32-х элементов, а для многопоточного — с одного?
И в самом деле больше похоже на каую-то лабу, только оформленную не так уж и аккуратно :-/

onto Sep 2 2014 at 21:32

Наверное стоит параллельный алгоритм описать подробнее, ибо ваша реализация у меня не сортирует.

halyavin Sep 3 2014 at 03:57

if (array_device[idx]<array_device[idx+1]){
    int buffer = array_device[idx];
    array_device[idx]=array_device[idx+1];
    array_device[idx+1] = buffer;
}

Это рейс кондишен в чистом виде.

sandello Sep 3 2014 at 04:12

Параллелить лучше какой-нибудь mergesort или quicksort. Они из «коробки» под это заточены. Пузырек с его O(N²) подходит только под мелочь, которую параллелить смысла не имеет.

YourChief Sep 3 2014 at 07:04

Поддерживаю, статья просто мусор.

Автор апеллирует к незначительному выигрышу при сортировке больших массивов, но при большом количестве элементов время работы пузырька и сортировки Хоара или сортировки слиянием (и им подобных) различается на порядки. Таким образом просто использование «нормального» алгоритма сортировки оставляет позади сортировку с параллелизмом практически в любое количество ядер.

beeruser Sep 3 2014 at 14:10

Для GPU основными методами сортировки являются Radix и Bitonic

KvanTTT Sep 3 2014 at 05:59

Зачем нужны такие большие таблицы в статье?

prizzrak Sep 3 2014 at 09:52

Чтобы отчет по лабораторной работе в универе выглядел внушительнее =)

Vest Sep 3 2014 at 08:46

Мне вообще не нравится то, что в цикле происходит выделение памяти для устройства, и потом опять же в цикле вызываются операции перемещения элементов. Я думаю, что это затратный код — надо бы его попрофилировать…
А так, NVIDIA предоставляет библиотеку Thrust со своими алгоритмами. Сортировка там, кстати, есть: docs.nvidia.com/cuda/thrust/#sorting