Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Khronos выпустил предварительные спецификации стандарта OpenCL 3.0

Высокая производительность *Программирование *C++ *GPGPU *API *
image
Khronos Group опубликовала предварительные спецификации стандарта вычислений общего назначения с использованием GPU и других процессоров OpenCL 3.0. Эта последняя версия вычислительного API позволяет поставщикам самостоятельно решать, какие функции они будут поддерживать помимо основных спецификаций на базе OpenCL 1.2 2011 года.
Читать дальше →
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 1.9K
Комментарии 1

Google: внедрение OpenCL вдвое ускорило механизм логического вывода в TensorFlow

Высокая производительность *Облачные вычисления *API *TensorFlow *
image

Google представила новый механизм логического вывода на мобильных ускорителях через OpenCL для своей платформы TensorFlow на Android. По словам представителей компании, он удвоит скорость вычислений по сравнению с существующим модулем на основе OpenGL при исполнении моделей ИИ «разумного размера».
Читать дальше →
Всего голосов 6: ↑6 и ↓0 +6
Просмотры 2.4K
Комментарии 1

OpenCL от nVidia

GPGPU *

Как известно, технология CUDA доступна только для видеокарт nVidia. Из-за этого факта часто возникают вопросы: как быть владельцам видеокарт ATI Radeon, и стоит ли вообще использовать решения, доступные на аппаратных средствах только одного производителя.

В связи с этим, я решил немного уточнить, что же из себя представляет CUDA,
Читать далее...
Всего голосов 44: ↑40 и ↓4 +36
Просмотры 18K
Комментарии 16

GPU от nVidia будет ускорять Apple Leopard и Windows

Софт
Руководитель направления линейки продуктов Tesla с гордостью сообщил прессе, что будущие модели графических ускорителей nVidia будут ускорять не только 3D-графику в играх, но и некоторые задачи в операционных системах Mac OS X Snow Leopard и Windows 7.

В новой «анти-интеловской» терминологии nVidia графические процессоры следующего поколения следует называть не GPU, а GPGPU, то есть «универсальные графические процессоры» (General Purpose GPU). Это новая платформа, на которой возможно эффективное распараллеливание задач на сотни и тысячи вычислительных ядер CPU и GPU с помощью среды программирования OpenCL (Open Computing Language), основанной на языке C, которую в чём-то можно считать аналогом DirectX. Кстати, о поддержке OpenCL упоминает даже Apple на своём сайте в списке преимуществ новой операционной системы Snow Leopard.

Таким образом, новые ОС станут первыми, которые смогут полноценно использовать GPU в качестве нормального вычислительного юнита.
Всего голосов 29: ↑25 и ↓4 +21
Просмотры 697
Комментарии 40

OpenCL. Что это такое и зачем он нужен? (если есть CUDA)

Высокая производительность *


Здравствуй, уважаемое хабра-сообщество.

Многие, наверное, слышали или читали на хабре об OpenCL – новом стандарте для разработки приложений для гетерогенных систем. Именно так, это не стандарт для разработки приложений для GPU, как многие считают, OpenCL изначально задумывался как нечто большее: единый стандарт для написания приложений, которые должны исполняться в системе, где установлены различные по архитектуре процессоры, ускорители и платы расширения.
Читать дальше →
Всего голосов 59: ↑54 и ↓5 +49
Просмотры 114K
Комментарии 37

JVM on OpenCL

Чулан

Здравствуйте, уважаемое сообщество хабрахабра !


Читал тут обзор OpenCL, нашел упоминание множества оберток, в том числе, для Java.
image
Но еще до прочтения топика, при виде заголовка появилась мысль: «А если все так хорошо, то почему бы не сделать Java Virtual Machine, написанную под OpenCL! Это же, наверняка, позволило бы выполнять байт-код быстрее на определенных конфигурациях».
image
Нашел только один проект, да и тот в зачаточном состоянии, автор которого, видимо, подумал о том же, что и я.
Встречайте: JRE on OpenCL

Как Вы думаете, оправдана ли затея, есть ли смысл и почему никаких движений в этой области?
Всего голосов 17: ↑12 и ↓5 +7
Просмотры 406
Комментарии 4

OpenCL. Подробности технологии

Высокая производительность *


Здравствуй, уважаемое хабрасообщество.

В предыдущей статье про OpenCL был сделан обзор этой технологии, возможностей, которые она может предложить пользователю и ее состояния на настоящий момент.
Теперь рассмотрим технологию более пристально. Постараемся понять, как OpenCL представляет гетерогенную систему, какие предоставляет возможности по взаимодействию с устройством и какой предлагает подход к созданию программ.

читать дальше
Всего голосов 45: ↑43 и ↓2 +41
Просмотры 33K
Комментарии 10

OpenCL. Практика

Высокая производительность *


Здравствуй, уважаемое хабрасообщество.

В предыдущих статьях мы рассмотрели OpenCL в целом, потом подробно вникли в суть стандарта и разобрали на каких идеях базируется эта технология.
OpenCL. Что это такое и зачем он нужен? (если есть CUDA)
OpenCL. Подробности технологии
Теперь настало время пощупать эту технологию живьем.
Читать дальше →
Всего голосов 41: ↑37 и ↓4 +33
Просмотры 41K
Комментарии 44

AMD Brook+: Rest in Peace

Компьютерное железо
Казалось, еще вчера я писал статью о высокопроизводительных вычислениях на видеокартах AMD с использованием технологии Brook+. Тогда она выглядела оптимистично, хоть и с некоторыми детскими проблемами…

В начале этого года AMD выпустила релиз 2-й версии своего Stream Computing SDK. Я радостно пошел обновляться и перекомпилировать свой софт в надежде получить устранение некоторых проблем, которые мне мешали, но…

Читать дальше →
Всего голосов 27: ↑22 и ↓5 +17
Просмотры 546
Комментарии 10

Сравнение OpenCL с CUDA, GLSL и OpenMP

Высокая производительность *
image
На хабре уже рассказали о том, что такое OpenCL и для чего он нужен, но этот стандарт сравнительно новый, поэтому интересно как соотносится производительность программ на нём с другими решениями.

В этом топике приведено сравнение OpenCL с CUDA и шейдерами для GPU, а также с OpenMP для CPU.

Тестирование проводилось на задаче N-тел. Она хорошо ложится на параллельную архитектуру, сложность задачи растёт как O(N2), где N — число тел.
Читать дальше →
Всего голосов 95: ↑94 и ↓1 +93
Просмотры 38K
Комментарии 43

Выпущен Inkscape 0.48

Работа с векторной графикой *
Выпущена новая версия свободного многоплатформенного редактора векторной графики Inkscape. В последние годы основная часть изменений в Inkscape реализуется за счёт участия в программе Google Summer of Code и совместной работы с лионским политехом, и эта версия не стала исключением. Кроме того, в этот раз часть работы по улучшению программы была оплачена самим сообществом пользователей через организацию LinuxFund.
Читать дальше →
Всего голосов 60: ↑54 и ↓6 +48
Просмотры 2K
Комментарии 33

OpenCL: Как заставить эту штуку работать

Высокая производительность *
Из песочницы
image

Очень многие, пробовавшие «на вкус» технологию использования графических ускорителей CUDA/OpenCL получили не слишком хорошие результаты. Да, тесты идут и простые примеры показывают впечатляющее ускорение, но вот когда дело доходит до реальных алгоритмов, хороший результат получить очень непросто.
Как же заставить эту технологию работать?
В данной статье я постарался обобщить свой полугодовой опыт бодания с технологией OpenCL под Mandriva linux и MacOS X 10.6 на задачах сложного поиска строковых данных для биоинформатики. OpenCL был выбран т. к. для Мака он является «родной» технологией (часть маков комплектуется видеокартами AMD и CUDA под ними недоступна даже теоретически), но предлагаемые рекомендации достаточно универсальны и подходят в том числе и для NVIDIA CUDA.

Итак, что необходимо, чтобы графический ускоритель заработал?
Читать дальше →
Всего голосов 51: ↑43 и ↓8 +35
Просмотры 8.6K
Комментарии 20

Суперкомпьютеры: третья мировая гонка

Высокая производительность *
Только что вернулся с конференции ПАВТ 2011 и хотел бы познакомить уважаемое хабрасообщество с современным состоянием дел в области высокопроизводительных вычислений.
Постараюсь по возможности ссылаться на первоисточники — а именно, на статьи из журнала "Суперкомпьютеры" и материалы конференции.

Зачем это все нужно


Суперкомпьютеры традиционно использовались в военных и научных целях, но в последние годы в их применении произошли революционные изменения, связанные с тем, что их мощность «доросла» до моделирования реальных процессов и предметов при доступной для бизнеса стоимости.
Все, наверное, знают, что в автомобилестроении расчеты на суперкомпьютерах используются для повышения безопасности, например так получил свои 5 звезд Ford Focus. В авиапромышленности выпуск нового реактивного двигателя по традиционной технологии — дорогостоящее удовольствие, например создание АЛ-31 для СУ-27 заняло 15 лет, потребовало создать и разрушить 50 опытных экземпляров и стоило 3,5 млрд. долларов. Двигатель для Сухой Супержет, спроектированный уже с участием суперкомпьютеров, сделали за 6 лет, 600 млн евро и было построено 8 опытных экземпляров.
Нельзя не отметить и фармацевтику — большая часть современных лекарств проектируется с помощью виртуального скрининга , который позволяет радикально снизить затраты и повысить безопасность лекарств.
Дальше — больше.
Сегодня в развитых европейских странах:
47,3% высокотехнологической продукции производится с использованием имитационного моделирования фрагментов проектируемых сложных систем или изделий;
32,3% продукции производится с использованием имитационного моделирования мелкомасштабных аналогов проектируемых систем и изделий;
15% продукции производится с использованием полномасштабного имитационного моделирования проектируемых систем и изделий;
и лишь 5,4% проектируемых сложных систем и изделий производится без имитационного моделирования.

Суперкомпьютерные технологии в современном мире стали стратегической областью, без которой невозможно дальнейшее развитие. Мощность национальных суперкомпьютеров сейчас так же важна, как мощность электростанций или количество боеголовок.
И сейчас в мире началась
Читать дальше →
Всего голосов 62: ↑57 и ↓5 +52
Просмотры 6.6K
Комментарии 43

Ускорение ядра Linux с помощью графического процессора GPU

Настройка Linux *
Перевод
Исследования Университета штата Юта, спонсированные частично компанией NVIDIA, направлены на изучение ускорения ядра Linux с использованием ускорения графического процессора GPU. Вместо того чтобы просто позволить приложениям пользователя использовать огромную силу предлагаемых современных графических процессоров, исследователи надеются ускорить части ядра Linux запустив его прямо на GPU.

Из страниц исследования: «Идея проекта KGPU состоит в том, чтобы графический процессор GPU рассматривался в качестве вычислительного сопроцессора для операционной системы, позволяющего производить параллельные вычисления внутри ядра Linux. Это даст возможность использовать SIMD (или SIMT в CUDA) для ускорения функциональности ядра Linux и внести новые функциональные возможности, которые ранее считались слишком интенсивными вычислениями для ядра. Проще говоря, проект KGPU делает возможными векторные вычисления внутри ядра».
Читать дальше →
Всего голосов 78: ↑71 и ↓7 +64
Просмотры 5.7K
Комментарии 64

WebCL показал первые демки

Браузеры
Перевод
image

WebGL прекрасен и все такое, но, в эру GPU вычислений, мы знаем, что наши видеокарты способны намного большее чем просто игры. WebCL — новый стандарт, который внедряет обработку OpenCL браузеру, используя мощь Вашей графической карты для выполнения сложных вычислений. Samsung и Nokia выпустили прототипы плагинов, от Samsung'a, работает только в Safari на OS X используя видеокарты NVIDIA, а Nokia, сосредоточилась на 32-битной Версии под Windows для Firefox 4 и видеокарты AMD. В настоящее время, новая технология не предлагает много среднему пользователю, но демонстрационные версии показывают, насколько более быстрый OpenCL может быть чем JavaScript — в некоторых тестах он показал себя быстрее в 10 раз.
Читать дальше →
Всего голосов 37: ↑34 и ↓3 +31
Просмотры 2.6K
Комментарии 30

Использование GPGPU для сжатия данных (Часть I)

Высокая производительность *
Из песочницы
Здравствуй, уважаемое хабра-сообщество.

Многие, наверное, уже слышали о вычислениях на GPGPU(видеокартах), на текущий момент существует много реализаций этой техники программирования. Мы остановимся на двух из них — это небезызвестная CUDA от компании Nvidia, и я думаю чуть менее популярный, но также известный фреймворк OpenCL. На хабре уже есть достаточное количество статей, в которых описан основной принцип работы этих технологий, поэтому мы не будем заострять на этом внимание. В статье я хочу поделиться результатами, полученными при использовании GPGPU в сравнении с CPU для сжатия данных.
Читать дальше →
Всего голосов 28: ↑27 и ↓1 +26
Просмотры 9.7K
Комментарии 25

OpenCL под C# это просто

Высокая производительность *
Из песочницы
Хотя технология OpenCL появилась ещё в 2008 году, большого распространения она не получила до сих пор. Плюсы технологии несомненны: ускорение вычислений, кроссплатформенность, способность исполнять код как под GPU, так и под CPU, поддержка стандарта целым рядом компаний: Apple, AMD, Intel, nVidia и некоторыми другими. Минусов не так много, но и они есть: более медленная работа на nVidia, чем через CUDA, сложность использования. Первый из минусов влияет только при серьёзной разработке, где скорость программы важнее кроссплатформенности. Второй и является основным препятствием на пути разработчиков, делающих выбор в пользу того или иного метода разработки. Чтобы разобраться в куче хэдэров, драйверов и стандартов требуется куча времени. Но не всё так плохо. Темой этой статьи будет короткий guide по тому, как наиболее простым способом можно запустить OpenCL под C# и получить удовольствие от параллельного программирования.

Читать дальше →
Всего голосов 27: ↑23 и ↓4 +19
Просмотры 37K
Комментарии 7

Введение в OpenCL

Высокая производительность *
Эта статья посвящена основам программирования на OpenCl. OpenCl -это язык программирования на GPU/CPU, по своей структуре близкий к стандарту c99. Его развитием занимается Khronos Group, где на их сайте доступна полная документация. Во избежание полемики на тему «ну это же всё тривиально, достаточно покопаться в инете» сразу оговорюсь: в рунете информация на эту тематику практически полностью отсутствует, а в западном инете доступна весьма в разрозненном состоянии на десятке сайтов. Здесь будет приведена некоторая компиляция базовых принципов, максимально упрощающая начинающему программисту жизнь, а так же позволяющая с самого первого проекта максимально задействовать вычислительные мощности видеокарты. Людям написавшим 2-3 серьёзных программы на OpenCl это будет уже неинтересно. Статья в некотором смысле является продолжением моей прошлой статьи.
Читать дальше →
Всего голосов 47: ↑46 и ↓1 +45
Просмотры 49K
Комментарии 26

OpenCL: универсальность и высокая производительность или не так все просто?

Высокая производительность *
Из песочницы
На Хабре уже были статьи об OpenCL, CUDA и GPGPU со сравнениями производительности, базовыми понятиями и примерами, поэтому рассказывать об основах и принципах работы я тут не буду, даже код не покажу. Но я хочу описать в чем заключаются реальные трудности при использовании GPU (про ограничения и их последствия), почему нельзя сравнивать производительность CPU и GPU, а также про то насколько “универсален” OpenCL на самом деле.
Читать дальше →
Всего голосов 78: ↑77 и ↓1 +76
Просмотры 9.4K
Комментарии 55

OpenCL: мы дождались — версия 1.1 от nVidia, а что нового?

Высокая производительность *

Немного истории или обещанного три года ждут


Чуть больше года назад Khronos Group представила новую версию OpenCL 1.1 и nVidia сразу похвасталась тем, что у нее уже готов пре-релиз драйвер с поддержкой нового стандарта. Все бы хорошо, да только пре-релиз — это не рабочий инструмент (тут и в официальных драйверах багов хватает, а в тестовой версии уж подавно), поэтому разработчики честно ждали релиза новой версии. Вышла CUDA 4, а OpenCL'а все не было и не было. Причем из новой версии драйверов исключили даже пре-релиз версию OpenCL, т.е. приходилось выбирать между старый драйвер с CUDA 3 + OpenCL 1.1 или новый драйвер с CUDA 4 + OpenCL 1.0. Но сегодня свершилось! Разработчикам пришло письмо о том, что финальная версия уже доступна в официальных драйверах 280.13, правда пока что бета версии, но это не надолго.

Итак, я решил вспомнить о том, что же там такого нового и хорошего в новой версии, поделиться комментариями о том зачем та или иная функция может понадобится и есть ли подводные камни о которых надо знать.
Читать дальше →
Всего голосов 24: ↑23 и ↓1 +22
Просмотры 2.4K
Комментарии 7