Разделяемая (shared) память является очень эффективным средством оптимизации за счет очень быстрого доступа (в 100 раз быстрее чем глобальная память). Однако, при неправильном использовании ее возможны конфликты банков, которые существенно замедляют быстродействие. В данной статье пойдет речь о том, как эти конфликты возникают, и как их избежать.
Денис @denglide
User
Обзор генераторов псевдослучайных чисел для CUDA
5 min
7.8KПо специфике работы часто приходится заниматься симуляциями на GPU с использованием генераторов псевдослучайных чисел. В результате накопился опыт, которым решил и поделиться с сообществом.
+37
Information
- Rating
- Does not participate
- Location
- California, США
- Date of birth
- Registered
- Activity