Как стать автором
Обновить

Приложения CUDA запустили на встроенной графике Intel GPU

Время на прочтение 1 мин
Количество просмотров 14K
Open source *Софт


Польский разработчик Анджей Яник опубликовал очень полезную утилиту Zluda, которая запускает приложения для CUDA на Intel GPU с весьма приличной производительностью.
Читать дальше →
Всего голосов 29: ↑28 и ↓1 +27
Комментарии 13

Открытый вебинар «The Python Packaging»

Время на прочтение 1 мин
Количество просмотров 1.4K
Python *C++ *Конференции

"The Python packaging has a reputation of a somewhat black box from the early days. There are many unknown parts, and people mostly get by with just copying other projects, build configurations, and roll with them.” (c) Bernat Gabor - the maintainer of both the virtualenv and tox project, occasionally contributing to both setuptools and pip.

Попытаемся исправить эту ситуацию и разобраться, как устроено построение пакетов в питоне (а точнее, как оно было устроено раньше и как предлагается делать сейчас). А также, рассмотрим более сложный случай - построение пакетов с нативными модулями (С++/CUDA).

Технические вебинары компании Xperience AI проходят регулярно в свободном доступе. Чтобы получить приглашение на доклад Григория Серебрякова, а также получать приглашения на будущие выступления, оставьте свой адрес здесь. Часть лекций появляется на youtube-канале Xperience AI.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Суперкомпьютер из настольного ПК: это реально?

Время на прочтение 2 мин
Количество просмотров 2.4K
Компьютерное железо Суперкомпьютеры
Возможно ли превратить персональный компьютер в мощное решение для специализированных нужд — суперкомпьютер? Да, такая возможность появилась, правда, это не совсем тот путь, который предсказывали аналитики в конце прошлого столетия. За последние пять-шесть лет видеокарты ушли от основных расчетных модулей — центральных процессоров существенно вперед. Это привело к тому, что их начали использовать для несвойственных ранее нужд.
Читать дальше →
Всего голосов 23: ↑21 и ↓2 +19
Комментарии 34

Астрофизики тоже нашли применение для NVidia GPU

Время на прочтение 1 мин
Количество просмотров 1.7K
Компьютерное железо
Вслед за российскими хакерами мощь графических процессоров NVidia Tesla постепенно осваивают и зарубежные учёные. Собственно, именно для учёных, а не для взломщиков, компания NVidia и выпустила полгода назад специальный компилятор CUDA, позволяющий писать программы, которые напрямую обращаются к графическому процессору. За счёт встроенного параллелизма процессоры Tesla работают как идеальные «числодробилки» в массивных параллельных вычислениях.

Для астрофизиков со всей Америки компания NVidia организовала специальное мероприятие AstroGPU, которое начало работу сегодня в Принстоне. Там специалисты и учёные обсудят возможности компилятора CUDA, а также наилучшие сферы применения Tesla для научных вычислений.

На графике снизу указана вычислительная мощность в гигафлопах для процессоров на видеокартах NVidia GeForce.



via NVidia
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 0

Настройка Ubuntu 8.10 для кодинга под NVIDIA CUDA

Время на прочтение 4 мин
Количество просмотров 8.7K
Настройка Linux *
image

Решил я всерьез заняться программированием распределенных вычислений с использованием этой технологии. Не буду подробно рассказывать, что она из себя представляет, скажу только, что CUDA предназначена для проведения распределенных вычислений не на процессоре, а на чипе видеокарты, что позволяет производить неграфические вычисления с феноменальной скоростью (производительность чипа GeForce 8800 GTX при математических расчетах примерно равна производительности 180(!)-ядерного Pentium 4 1,5 ГГц). В основном это используется для решения научных задач, вроде моделирования различных сложных систем. Кстати, данную технологию использует последняя версия Adobe Photoshop (CS4) — рендеринг картинок и многие эффекты обрабатываются именно с помощью CUDA. Технология поддерживается видеокартами на чипах NVIDIA начиная с 8 серии и новее, включая, само собой, Quadro и Tesla.

Сказано — сделано. Буду настраивать свою убунту под это дело, а заодно и о своем опыте расскажу ;)
Поехали!
Всего голосов 55: ↑54 и ↓1 +53
Комментарии 66

NVIDIA CUDA(сиквел) — Настройка PyCUDA

Время на прочтение 4 мин
Количество просмотров 17K
Python *
image
В продолжение темы Настройка Ubuntu 8.10 для кодинга под NVIDIA CUDA, я решил наладить себе рабочее место для использования одного из моих любимых языков программирования — Python. Для этого существует отличный набор библиотек PyCUDA, позволяющий реализовывать все прелести NVIDIA CUDA API с помощью удобного и красивого кода.
Читать дальше →
Всего голосов 41: ↑38 и ↓3 +35
Комментарии 67

CUDA: с места в карьер

Время на прочтение 5 мин
Количество просмотров 28K
GPGPU *
Многие видели моё введение в современные технологии высокопроизводительных вычислений и оценки производительности, теперь я продолжу тему более подробным рассказом о технологии CUDA.
Для тех кто не смотрел предыдущие серии: CUDA позволяет писать и запускать на видеокартах nVidia(8xxx и выше) программы написанные на С++ со специальными расширениями. На правильных задачах достигается значительное превосходство по производительности на $ по сравнению с обычными CPU.
Достижимая производительность — 1 трлн и выше операций в секунду на GTX295.

NB: Статья — краткое введение, покрыть все ньюансы программирования под CUDA в одной статье вряд ли возможно :-)
Читаем дальше CUDA crash course
Всего голосов 39: ↑37 и ↓2 +35
Комментарии 26

CUDA: Начало

Время на прочтение 4 мин
Количество просмотров 69K
GPGPU *

Это первая публикация из цикла статей об использовании GPGPU и nVidia CUDA. Планирую писать не очень объемно, чтобы не слишком утомлять читателей, но достаточно часто.
Читать далее...
Всего голосов 53: ↑44 и ↓9 +35
Комментарии 62

CUDA: Как работает GPU

Время на прочтение 9 мин
Количество просмотров 130K
GPGPU *
Внутренняя модель nVidia GPU – ключевой момент в понимании GPGPU с использованием CUDA. В этот раз я постараюсь наиболее детально рассказать о программном устройстве GPUs.
Читать далее...
Всего голосов 52: ↑52 и ↓0 +52
Комментарии 22

CUDA: Работа с памятью. Часть I.

Время на прочтение 12 мин
Количество просмотров 63K
GPGPU *
В процессе работы с CUDA я практически не касался вопросов об использовании памяти видеокарты. Настало время убрать этот пробел.
Читать далее...
Всего голосов 24: ↑23 и ↓1 +22
Комментарии 22

OpenCL от nVidia

Время на прочтение 2 мин
Количество просмотров 19K
GPGPU *

Как известно, технология CUDA доступна только для видеокарт nVidia. Из-за этого факта часто возникают вопросы: как быть владельцам видеокарт ATI Radeon, и стоит ли вообще использовать решения, доступные на аппаратных средствах только одного производителя.

В связи с этим, я решил немного уточнить, что же из себя представляет CUDA,
Читать далее...
Всего голосов 44: ↑40 и ↓4 +36
Комментарии 16

CUDA: Работа с памятью. Часть II.

Время на прочтение 5 мин
Количество просмотров 21K
GPGPU *
Основная тема этой части – оптимизация работы с глобальной памятью при программировании GPU.

У GPU есть ряд особенностей, игнорирование которых может стоить многократной потери производительности при использовании глобальной памяти. Но если учесть все тонкости, то можно получить действительно эффективные CUDA-программы.

Приступаем.

Читать далее...
Всего голосов 18: ↑16 и ↓2 +14
Комментарии 22

GPU от nVidia будет ускорять Apple Leopard и Windows

Время на прочтение 1 мин
Количество просмотров 1.3K
Софт
Руководитель направления линейки продуктов Tesla с гордостью сообщил прессе, что будущие модели графических ускорителей nVidia будут ускорять не только 3D-графику в играх, но и некоторые задачи в операционных системах Mac OS X Snow Leopard и Windows 7.

В новой «анти-интеловской» терминологии nVidia графические процессоры следующего поколения следует называть не GPU, а GPGPU, то есть «универсальные графические процессоры» (General Purpose GPU). Это новая платформа, на которой возможно эффективное распараллеливание задач на сотни и тысячи вычислительных ядер CPU и GPU с помощью среды программирования OpenCL (Open Computing Language), основанной на языке C, которую в чём-то можно считать аналогом DirectX. Кстати, о поддержке OpenCL упоминает даже Apple на своём сайте в списке преимуществ новой операционной системы Snow Leopard.

Таким образом, новые ОС станут первыми, которые смогут полноценно использовать GPU в качестве нормального вычислительного юнита.
Всего голосов 29: ↑25 и ↓4 +21
Комментарии 40

Быстро и тихо: Видеокарты с пассивным охлаждением. Применение вне игр

Время на прочтение 4 мин
Количество просмотров 41K
Компьютерное железо Видеокарты
Производители современных видеокарт постепенно смещают акцент в сторону неграфических вычислений на GPU. По всей видимости, им надоело ограничивать сферу применения для своих мощных сверхсложных устройств лишь узкой сферой игр. Именно поэтому появились NVIDIA CUDA и ATI Stream. Выходит в свет все больше приложений, использующих данные технологии и получающих в результате большой прирост производительности.

Если вы не увлекаетесь современными играми, то до появления вышеназванных технологий мощная видеокарта была практически бесполезна, и вполне можно было обойтись встроенной в чипсет графикой. Но ситуация потихоньку меняется, о чем более подробно расскажу ниже.

Для меня еще одной преградой в использовании современных видеокарт является неприемлемый уровень издаваемого ими шума. Если необходимо полное отсутствие шума, то любая система охлаждения, в которой есть вентилятор, окажется неподходящей. Даже если большую часть времени она не будет издавать громких звуков, все равно под большой нагрузкой вы начнете ее слышать, иначе зачем вообще там вентилятор.

Поэтому я попытался найти варианты с полностью пассивным охлаждением. К сожалению, топовые модели в список не попадают – похоже, охладить их обычным радиатором невозможно. Но все же удалось найти неплохие варианты. Итак, по порядку.
Читать дальше →
Всего голосов 40: ↑37 и ↓3 +34
Комментарии 37

Adobe+nVidia или аппаратное ускорение flash-видео силами GPU

Время на прочтение 2 мин
Количество просмотров 8.9K
IT-компании
image

Привет хабровчане!

Сегодня 5-е октября, значит эмбарго на публикование этой информации снимается. На пресс-брифинге nVidia помимо прочего, как одна из ключевых фишек, была продемонстрирована альфа-версия Adobe Flash Player 10.1, который отличается от 10-ой версии поддержкой CUDA. В особенности это будет приятно любителям Youtube и их HD-контента.

Подробности и полная презентация пресс-брифинга далее...
Всего голосов 72: ↑61 и ↓11 +50
Комментарии 65

Итоги конкурса Jetpack 0.5

Время на прочтение 1 мин
Количество просмотров 486
IT-компании
image

Подведены результаты конкурса Jetpack и назван победитель. О Jetpack уже писалось на Хабре — это разработка Mozilla Labs, которая позволяет создавать аддоны для Firefox. После выхода программы, Mozillа запустила конкурс на лучшее дополнение и вот подводит итоги.

Я рад сообщить, что победителем конкурса признан россиянин Александр Мильцев (Alexander Miltsev) из Москвы, который разработал очень интересный аддон позволяющий задействовать в Firefox мощь вычислений графического процессора через CUDA, используя простой javascript. Любой может посмотреть на проект на странице автора. Там же можно найти документ с описанием проекта и некоторыми примерами (английский язык). Таким образом, Firefox с помощью аддона Александра, получил поддержку вычислений на GPU. В награду автор получит новый нетбук ASUS Eee PC.

Браво, победителю!
Всего голосов 49: ↑46 и ↓3 +43
Комментарии 18

NVIDIA RealityServer – облачные вычисления в 3D

Время на прочтение 2 мин
Количество просмотров 1.4K
Работа с 3D-графикой *
image

Про Облачные вычисления уже многое сказано в теории. Крупные компании осознают преимущества этой технологии, и настало время переходить от теории к практике. Компания NVIDIA, совместно с производителем решений для рендеринга Mental images представила RealityServer. Это серверная аппаратная платформа с мощным графическим ускорителем и специальной программной средой, благодаря которой фотореалистичное трёхмерное изображение можно получить на любом компьютере, ноутбуке, и даже смартфоне.
Читать дальше →
Всего голосов 40: ↑35 и ↓5 +30
Комментарии 20

Настольный суперкомпьютер производительностью 12 терафлопс

Время на прочтение 1 мин
Количество просмотров 12K
Компьютерное железо Суперкомпьютеры
Fastra II

Инженеры из бельгийского университета Антверпена показали свету свой компактный суперкомпьютер Fastra II. Внешне он представляет из себя обыкновеннный системный блок, но заключает в себе по истине колоссальные вычислительные мощности в 12 терафлопс.
Читать дальше →
Всего голосов 62: ↑56 и ↓6 +50
Комментарии 126

Конвертация музыки в формат FLAC с использованием CUDA

Время на прочтение 2 мин
Количество просмотров 4.2K
Звук
Недавно я наткнулся на энкодер, работающий с форматом FLAC и перекладывающий часть процесса кодирования на GPU, используя CUDA. Программа называется FlaCuda и взять её можно здесь. Несмотря на то, что написана с использованием .NET, она прекрасно работает при участии Mono. Во всяком случае, никаких трудностей с её использованием на Ubuntu 9.10 amd64 у меня не возникло.

Программка работает довольно шустро, при сжатии одного и того же аудиофайла flac, flake и flacuda показали следующие результаты (amd x2 4200+, geforce 9800 GT):
Читать дальше →
Всего голосов 62: ↑58 и ↓4 +54
Комментарии 64

Сравнение OpenCL с CUDA, GLSL и OpenMP

Время на прочтение 3 мин
Количество просмотров 42K
Высокая производительность *
image
На хабре уже рассказали о том, что такое OpenCL и для чего он нужен, но этот стандарт сравнительно новый, поэтому интересно как соотносится производительность программ на нём с другими решениями.

В этом топике приведено сравнение OpenCL с CUDA и шейдерами для GPU, а также с OpenMP для CPU.

Тестирование проводилось на задаче N-тел. Она хорошо ложится на параллельную архитектуру, сложность задачи растёт как O(N2), где N — число тел.
Читать дальше →
Всего голосов 95: ↑94 и ↓1 +93
Комментарии 43