ThisIsZolden Jan 8 2018 at 19:45

Вычисления на видеокарте, руководство, лёгкий уровень

3 min

35K

Programming*GPGPU*C#*Concurrent computing*Unity3D*

Tutorial

+30

Comments 12

Korhog Jan 9 2018 at 11:41

Супир. Обожаю подобные статьи.

-1

Korhog Jan 9 2018 at 11:55

Для полноты не хватает разве что анимированных гифок

ser-mk Jan 9 2018 at 17:03

Спасибо за статью!
а что вы имелли ввиду за «маленькую область 2х2 пространства фрактала»? Для чего она нужна?
И еще момент непонятный остается. Программа просчитывает один раз текстуру и выходит? или периодически вызывается и обновляет тестуру?
Можно и самому проверить, но пока нет возможности поставить здоровенный Unity.

ThisIsZolden Jan 9 2018 at 17:14

Фрактал Мандельброта ограничен координатами от -1 до 1 по х и у. А у пикселей координаты от 0 до 1023. Нужно проецировать, чтоб фрактал на весь экран был.

Программа перерисовывает фрактал каждый раз, как пользователь изменит масштаб или позицию выводящего прямоугольника. Так что можно путешествовать по красочным прядям фрактала.

leshabirukov Jan 9 2018 at 17:19

cuda программируется точно также, только выходные данные идут не на рендеринг, а выгружаются обратно в память.

Внимательный, но неопытный в вопросах вычислений на GPU читатель перебьёт: позвольте! А откуда следует, что количество потоков 32x32? И как понимать «id.xy»?

Вопрос скорее, зачем бить на квадраты 32x32. А дело в том, что пачка данных одновременно обрабатываемых мультипроцессором это 32 треда в одном варпе (разделение по вычислительным блокам) Х 32 варпа (разделение по времени), и важно кормить эту гидру синхронизированными данными, к примеру читать память так:
var = mem[ id.x ]
хорошо, а так:
var = mem[ id.x *1000 ]
плохо.

ThisIsZolden Jan 9 2018 at 17:27

Я этого не знал, но вы вероятно правы. Хотя, иногда нет другого выхода, кроме как делать примерно так:
var = buffer[id.x * height + id.y]
потому что буфферы одномерные, а данные частенько двумерные, а структуру потоков делать одномерной вроде бы тоже не очень эффективно, да и лимиты есть по каждой оси.

SmallSnowball Jan 9 2018 at 18:35

Можно поменять местами id.x и id.y внутри kernel'а и делать так:
var = buffer[id.y * height + id.x]

Правда, в таком случае надо об этом везде помнить, да и разные алгоритмы могут требовать разной укладки многомерного буффера в памяти. В некоторых случаях выгода от локальности данных внутри варпа может быть настолько большой, что имеет смысл в рантайме менять раскладку данных внутри буффера.

ser-mk Jan 10 2018 at 00:00

cuda программируется точно также, только выходные данные идут не на рендеринг, а выгружаются обратно в память.

Так здесь разве нельзя так же поступить? в последней строчке вместо

textureOut[id.xy] = colors[itn];

записать значения в какой-нибудь буфер и потом уже работать с этим буфером.

leshabirukov Jan 10 2018 at 14:31

Я имел в виду, записываются обратно в память процессора из памяти видеокарты. Всё что вы видите в kernel-части, происходит внутри видеокарты, и к примеру, на диск вы результат работы шейдера не запишете.

alexoron Jan 9 2018 at 18:16

Да кому интересно делать какие-то «пустые» вычисления, если можно майнить с одной видеокарты от $2,5 в сутки.
А поставь таких видях с десяток и на работу не нужно ходить.

midday Jan 9 2018 at 18:53

Так не ходи.

avtor13 Jan 9 2018 at 19:12

прочитав заголовок и первый абзац решил, что речь пойдет о GPGPU

Show the best of all time