Результаты поиска по запросу «[GPGPU]» / Хабр

Публикации Хабы Компании Пользователи Комментарии

BrainHacker 27 фев 2012 в 16:32

AMD APP SDK: Intermediate Language (IL)

8 мин

14K

Высокая производительность*GPGPU*

Из песочницы

ATI Stream SDK было переименовано в AMD Accelerated Parallel Processing (APP) SDK, на смену основного языка программирования GPGPU вычислений Brook+ пришел OpenCL. Однако, не многие догадываются, что писать код для ATI-шных карточек можно при помощи другой технологии: AMD Compute Abstraction Layer (CAL) / Intermediate Language (IL). Технология CAL предназначена для написания кода, взаимодействующего с GPU и выполняющегося на CPU, в то время как технология IL позволяет писать код, который будет выполняться непосредственно на GPU.

В данной статье будет рассмотрена технология IL, ее область применения, ограничения, преимущества по сравнению с OpenCL. Кому интересно, прошу под кат.

Follow the white rabbit

+23

fyodorser 14 мар 2012 в 18:35

Быстрое сжатие изображений по алгоритму JPEG на CUDA

13 мин

20K

Высокая производительность*GPGPU*Обработка изображений*

Краткое содержание: Создан быстрый кодер FVJPEG для сжатия изображений по алгоритму JPEG на видеокартах NVIDIA. Значительное ускорение получено при распараллеливании алгоритма, его реализации и оптимизации с помощью технологии CUDA. По скорости сжатия кодер FVJPEG превосходит все существующие в настоящее время программные и аппаратные решения для компрессии изображений по алгоритму Baseline JPEG.

Читать дальше →

+44

Zubr 5 апр 2012 в 10:31

Рендеринг наоборот. Преобразование Хафа на GPU

10 мин

19K

Алгоритмы*Обработка изображений*

Из песочницы

Преобразование Хафа служит для поиска на изображении фигур, заданных аналитически: прямых, окружностей и любых других, для которых вы сможете придумать уравнение с небольшим количеством параметров. О преобразовании Хафа написано немало, и данная статья не ставит цели подробно осветить все аспекты. Я лишь объясню общий принцип, останавливаясь на особенностях, мешающих его реализации на GPU «в лоб» и, конечно же, предложу решение. Те, кто знают проблемы и хотят сразу видеть решение, могут пропустить пару-тройку разделов.

Читать дальше →

+75

Marchevsky 23 апр 2012 в 14:47

Nvidia для профессиональных 3D приложений

6 мин

179K

Высокая производительность*

Пол года назад я искал себе видеокарту, на которой я смог бы заниматься 3d моделированием, и рендерингом на GPU. В связи с появлением на рынке большого числе рендеров на CUDA мне не терпелось приобрести видеокарту с поддержкой CUDA, а именно Nvidia.

Как некоторые уже знают, Nvidia выставляет на продажу видеокарты нескольких моделей Geforce, Quadro, Tesla, ION, Tegra. В этом коротком сравнении упустим ION и Tegra, т.к. предназначены для мобильных устройств и слабые по производительности.

Нам нужна мощь!

Nvidia power...

Читать дальше →

+31

ZaWarudo 3 июл 2012 в 10:45

Используем OpenCL в Python

6 мин

31K

Python*GPGPU*

Из песочницы

В последнее время параллельные вычисления прочно входят в жизнь, в частности, с использованием GPU.

Здесь было много статей на эту тему, поэтому ограничусь лишь поверхностным описанием технологии. GPGPU — использование графических процессоров для задач общего назначения, т.е. не связанных напрямую с рендерингом. Пример — библиотека Nvidia PhysX для расчёта физики в некоторых современных играх. Эта технология выгодна тем, что GPU хороши на параллельном выполнении с множеством потоков. Правда, потоков должно быть много, иначе производительность сильно упадет. Ещё из-за особенностей работы с памятью приходится несколько хитрить с передачей данных из оперативной памяти в видеопамять. Известные реализации: CUDA (Nvidia, только для видеокарт), OpenCL (Khronos Group, для гетерогенных систем) и AMD FireStream. Здесь будет обсуждаться только OpenCL.

Итак, приступим к практике. В качестве языка основной программы выберем Python. Он, конечно, не очень быстр сам по себе, зато отлично работает как «клей» — во многих применениях основной расчёт идёт в OpenCL, а код на Python только «подносит патроны». Существует отличная библиотека PyOpenCL, которой и будем пользоваться.

Читать дальше →

+28

Akson87 2 июл 2012 в 07:26

Первые шаги с OpenCL или сказ о том как одинаковый код на GPU и CPU запускать

15 мин

58K

Высокая производительность*Программирование*GPGPU*

Итак, прошел почти год с момента моего первого поста о программировании видеокарт и страшилок о том, как это все сложно. Теперь настала пора показать, что все не так плохо и как пользоваться этой странной штукой по имени OpenCL, да еще и использовать его главное преимущество, то есть возможность запускать один и тот же код на разных девайсах. А еще я покажу как можно получить на порядок большую производительность обычного процессора практически бесплатно.

За деталями под кат...

+51

V_oron 21 сен 2012 в 00:00

CUDA: синхронизация блоков

12 мин

43K

GPGPU*

Из песочницы

При использовании средств параллельных вычислений весьма вероятно может сложиться ситуация, когда алгоритм содержит два таких последовательных этапа: i) каждый j-ый поток сохраняет некоторый промежуточный результат вычисления в j-ой ячейке памяти, а, затем, ii) этот поток должен использовать результаты одного или более «соседних» потоков. Очевидно, что необходимо организовать в коде программы некий барьер по времени, который каждым потоком преодолевается уже после того, как все сохранят свои промежуточные результаты в соответствующих ячейках памяти (этап (i)). В противном случае, какой-то поток может перейти к этапу (ii), пока какие-то другие потоки еще не завершили этап (i). Как это ни прискорбно, но создатели CUDA посчитали, что такой специальный встроенный механизм синхронизации любого числа потоков на одном GPU не нужен. Так как же можно бороться с этой напастью? Хотя Google, судя по подсказкам, и знаком с данным вопросом, но готового удовлетворительного рецепта под свою задачу найти не удалось, а на пути к достижению желаемого результата для новичка (которым я и являюсь) имеются некоторые подводные камни.

Читать дальше →

+29

fuzz 2 окт 2012 в 10:24

Unbiased DirectX Рендеринг на GPU, CPU и в облаке

9 мин

44K

GPGPU*

Как создать рендерер, который бы работал даже на компьютере вашей бабушки? Изначально перед нами стояла немного другая задача — создать unbiased рендер для всех моделей GPU: NVidia, ATI, Intel.
Хотя идея такого рендера для всех видеокарт витала в воздухе давно, до качественной реализации, тем более на Direct3D, дело не доходило. В своей работе мы пришли к весьма дикой связке и дальше расскажем, что нас к ней привело и как она работает.

renderbro resource combined

Читать дальше →

+75

zboris 21 ноя 2012 в 17:35

Intel поглощает разработчика ARM-чипов — компанию ZiiLabs

3 мин

11K

Обработка изображений*

Корпорация Intel сообщила о сделке с компанией Creative Technology по приобретению за 50 млн.$ компании ZiiLabs — дочернего предприятия Creative Technology, занимающегося разработкой многоядерных ARM-чипов ZMS-40 и ZMS-20, которые до сих пор применялись в различных Android-устройствах: планшетах, медиа-плеерах таких как Creative Zii Egg и других аппаратах.

ZiiLabs известна тем, что в январе 2012 года представила 100-ядерный SoC-чип ZMS-40. И на рынке мобильных устройств, GPU-решения ZiiLabs конкурируют с графическими чипами PowerVR разрабатываемыми компанией Imagination Technologies.

Согласно условиям достигнутого соглашения, из 50 млн.$, около 30 млн заплачены за основные фонды и инженерные ресурсы ZiiLabs, а остальные — за патенты и лицензии на GPU-технологии ZiiLabs.

Читать дальше →

+20

zboris 14 дек 2012 в 21:21

Руководителем Intel может стать гендиректор Nvidia Джен-Сен Хуан

2 мин

10K

Обработка изображений*

Ресурса Bright Side Of News ссылаясь на свои источники пишет, что новым руководителем Intel может стать один из основателей и генеральный директор Nvidia — Джен-Сен Хуан (Jen-Hsun Huang).
И тогда сама компания Nvidia может быть приобретена корпорацией Intel.

Известно, что ранее Intel уже делала попытки поглотить Nvidia (после того как AMD поглотила компанию ATI), но сам Джен-Сен Хуан, пользующийся широкой поддержкой совета директоров, не соглашался на условия предлагаемые Intel. Кроме того были большие сомнения, что антимонопольные органы США разрешат данное слияние.
Возможность же получения должности гендиректора Intel может изменить позицию Джен-Сен Хуана.

Читать дальше →

+13

1 2 3