nexx27 окт 2009 в 15:17

OpenCL. Практика

8 мин

45K

Высоконагруженные системы *

+33

Комментарии 44

moadib 27 окт 2009 в 16:33

Спасибо. Жалко видеокарта у меня старая, обязательно пощупал бы.

>про различные тонкости и особенности OpenCL приложений и OpenCL для Nvidia GPU можно будет написать отдельную статью

Опять у Nvidia/Ati всё по-разному работает?

nexx 27 окт 2009 в 16:59

Работает, я надеюсь, все же одинаково. В целом.
Но ведь на производительность сильно влияет конкретная архитектура устройства. И вот тут уже могут вылезти особенности и даже ошибки.
Пример: на моей видеокарте NVidia 8192 регистра, то есть если задать размер группы 512 элементов (максимум для моей видеокарты), то на каждый из них по 16 регистров. Если 16 регистров недостаточно для выполнения kernel — полетит ошибка во время исполенния kernel.
То есть если ужать kernel в 16 регистров не выйдет — прийдется задействовать карту не на полную мощьность.

Для чипов AMD, возможно, такое ограничение будет более сильное или слабое, а может его и вовсе не будет, все зависит от архитектуры.

Такие вещи специфичны для конкретного устройства и знание некоторых может помочь ускорить работу приложения, а, иногда, и сберечь нервы)

Alaunquirie 27 окт 2009 в 18:45

Если не секрет, как вы посчитали регистры? Взяли из ТТХ?

BarsMonster 27 окт 2009 в 19:03

Да, это из ТТХ.
В 260-х и старше — регистров больше…
Рамер группы 512 — не обязательно так много, можно и меньше, если много работы с памятью нет, падение будет крайне незначительное.

Alaunquirie 27 окт 2009 в 20:38

У меня сейчас валяются N260GTX и 4870 ZT.

Alaunquirie 27 окт 2009 в 22:08

Комментарий оборвался. Так вот, у меня сейчас валяются 260-ка и 4870, если есть идеи, как можно погонять тестами монстров — готов выслушать (или в ПМ). Величайшим достижением для вас будет запуск аппаратной Phys-X на 4ххх или 5ххх, как уже один раз делали на 3870. Все пользователи АТИ на вас молиться будуь.

nexx 28 окт 2009 в 04:19

можно было бы, например, сравнить производительность драйверов OpenCL Nvidia и AMD. При примерно равных условиях: какой-нибудь простой пример из SDK запустить с одинаковыми global size и work-group size и посмотреть что быстрее… ну это из совсем тривиального…
Только сдается мне одновременно они не заработают — конфликтовать драйверы начнут друг с другом. Хотя это только догадки, конечно.

Alaunquirie 28 окт 2009 в 14:46

Стоят и не конфликтуют. Просто нужны дрвоа нвидии версии не выше 186, иначе при наличии АТИ в системе видеокарта переходит в состояние «оффлайн».

nexx 28 окт 2009 в 17:38

Не конфликтуют именно драйверы OpenCL? Ну то есть то, что карты разных производителей в одной системе работать могут это факт известный, а вот как там с использованием OpenCL при этом? Хотя по идее должны работать… ведь для того все и задумывалось)

Если будете проводить тесты — напишите пожалуйста, что из этого вышло — очень интересно)

Alaunquirie 28 окт 2009 в 21:57

Не конфликтуют, проблемы с n260gtx, капризная, с радеоном работает через раз.

nexx 28 окт 2009 в 06:13

Число регистров итп. для конкретной карты Nvidia можно посмотреть в Nvidia OpenCL Programming Guide (Appendix A) — на него есть ссылка в статье.
Там написано какая карта имеет какую версию Compute Capability, там же и расшифровка, что в себя включает каждая версия Compute Capability.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 27 окт 2009 в 19:04

OpenCL и Java — разные инструменты для решения разных задач. OpenCL никогда не будет иметь такого набора библиотек.

НЛО прилетело и опубликовало эту надпись здесь

Frosty 27 окт 2009 в 19:57

Человек постарался избавить вас от феерической каши в голове, а вы решили, что самый умный.

НЛО прилетело и опубликовало эту надпись здесь

splix 28 окт 2009 в 07:53

Человек и написал что они настолько разные что указать различия невозможно, это как различия между подводной лодкой и букетом роз.

НЛО прилетело и опубликовало эту надпись здесь

Frosty 1 ноя 2009 в 12:48

Тогда из этого утверждения у малознакомого с темой человека вырисуется определение: «Подводная лодка — средство для транпортировки цветов по морским каналам».

don 27 окт 2009 в 19:23

тут смысл не столько в общей среде выполнения, сколько в унифицированном доступе к ресурсам GPU

НЛО прилетело и опубликовало эту надпись здесь

don 27 окт 2009 в 19:35

вообще-то не имеет

don 27 окт 2009 в 19:37

тут также как и с OpenGL, насколько я помню можно

Wolverine 27 окт 2009 в 20:46

Есть Java обертка для OpenCL code.google.com/p/nativelibs4java/wiki/OpenCL

Alaunquirie 28 окт 2009 в 14:49

Java = Виртуальная машина, OpenCL = доступ к железу через среду разработки на достаточно низком уровне. Так понятно?

НЛО прилетело и опубликовало эту надпись здесь

nexx 29 окт 2009 в 06:48

Java может использовать драйвер OpenCL.
Чуть выше давали ссылку на java-обертку для OpenCL API.
Насколько я понимаю, это не освобождает от написания kernel на С-подобном языке, а оборачивает только вызовы OpenCL API, описанные в статье.

НЛО прилетело и опубликовало эту надпись здесь

tegger 27 окт 2009 в 19:32

OpenCL — это компилятор плюс библиотека функций для общения с целевым устройством. Они разные для каждого устройства. О бинарниках, способных выполняться на любых устройствах, о виртуальной машине на GPU и даже о привычной работе с памятью речи (пока) не идет.
OpenCL можно сравнивать разве что с обычным C, но никак не с Java.

НЛО прилетело и опубликовало эту надпись здесь

tegger 27 окт 2009 в 19:53

Стандартизован язык, на котором можно писать собственно вычислительные функции, а также набор и поведение функций OpenCL API. Один и тот же исходник можно (теоретически, конечно) скомпилировать и запустить на любой платформе, для которой есть подходящий драйвер и компилятор.
А почему функции нецелевые-то?

НЛО прилетело и опубликовало эту надпись здесь

halyavin 28 окт 2009 в 07:49

Сегодня нецелевая, а завтра выйдет реклама «покупайте наши графические ускорители, чтобы быстрее ломать пароли!» и станет целевая ;).

nexx 28 окт 2009 в 07:56

Уже почти так и есть. Новая архитектура Nbidia Fermi (которая в железе пока в числе 7 уникальных чипов существует) была анонсирована как отлично подходящая под вычисления.

Позже рекламщики Nvidia срочно бросились исправлять перегибы и рассказывать, что для 3D графики архитектура тоже очень подходит и покупать ее для игр тоже имеет смысл.

Alaunquirie 28 окт 2009 в 21:59

Ферми пока не существует на потоке, у руля (временно) ATI 5870, по бумажным характеристикам 300-ое поколение нвидии — монстры, очень хочется узнать, что же будет в деле…

shifttstas 27 окт 2009 в 20:08

OpenCL можно сравнить с CUDA только OpenCL для всех а Cuda только для Nvidia но там с совместимостью по круче…

andoriyu 28 окт 2009 в 03:02

все пора менять названия видеокартам, на другое.

hmage 28 окт 2009 в 10:48

Переименовать на nVidia Fermi?

nexx 28 окт 2009 в 11:04

Интересно, что они подразумевают под поддержкой С++ в этой архитектуре?
С++ kernel'ы в CUDA?

tegger 28 окт 2009 в 18:26

Боюсь, что да. Спасибо унифицированной памяти.

andoriyu 28 окт 2009 в 19:04

нет на, что-о типо йаСчиталко!

DanielVartanov 12 янв 2010 в 10:19

> ВНИМАНИЕ!!! oclLoadProgSource — не является функцией OpenCL API, а находятся в вспомогательной библиотеке, поставляемой вместе с Nvidia Computing SDK.

oclGetMaxFlopsDev — тоже оттуда

kovalexius 28 янв 2015 в 00:58

К сожалению по ссылке не удалось скачать NVidia OpenCL SDK. Login требует, кнопки «зарегистрироваться» не лицезрел.

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий