Комментарии 2
Как и указал автор оригинальной статьи, это его "проба пера", чтобы разобраться в программировании CUDA.
Сортировка слиянием - не самый оптимальный способ сортировки на GPU. Самый быстрый известный алгоритм сортировки на CUDA — Onesweep, который использует множество сложных методов для использования преимуществ параллелизма GPU и обхода его ограничений.
(Это информация - для контекста ссылок, приведенных в разделе "Дополнительные источники")
Жаль, что рассмотрение массивов размера 10^8 не попало в эту статью, график выглядит как некая интрига пока)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Сортировка слиянием на CUDA