Comments 6
Существуют ли какие-либо среды отладки, например плагины для Linux+Eclipse или что-то непосредственно от Nvidia. И насколько сильно отличается CUDA/CuDNN, например, от OpenCL, который (?) подойдёт и для других ускорителей поддерживающих этот стандарт. Также, может будет удобнее использовать PyCUDA даже если он чуть (?) медленнее. И есть ли некие фичи которые позволяют работать с многоядерными загрузчиками. Например OpenGL - исключительно однопоточное формирование сцены, Vulkan - уже можно в параллель. (образно говоря, cuMemAllocManaged вызывается в пуле а не последовательно, включая макросы OpenMP)
Существуют ли какие-либо среды отладки, например плагины для Linux+Eclipse или что-то непосредственно от Nvidia
NVIDIA Nsight ?
OpenGL можно и многопоточно использовать - шарится контекст и вперед.
CUDA для NVidia дает значительно больше возможностей чем OpenCL.
Смысла особого параллелить потоки для CUDA нет, если только много мелких взаимодействий с ускорителем, а для конкурентного исполнения, там есть стримы.
NVRTC - правильно, а NVCC - как ни крути что-то в этом остается вечно неправильно )
Спасибо переводчику (и автору, но он не узнает)! Очень интересно!
Тройным скобкам я удивлялся, вроде у нас С++, а тут какие-то сильно новые штуки - и главное непонятно зачем. Почему не что-то типа э... ну пусть... CUDA_Run_Kernel(...
Ну кстати - всё ж описано!
https://books.google.ru/books/about/Менеджер_мафии.html?id=7zpxkgAACAAJ&redir_esc=y
Как правильно вызывать CUDA