Как стать автором
Обновить

Khronos выпустил предварительные спецификации стандарта OpenCL 3.0

Время на прочтение 2 мин
Количество просмотров 2.5K
Высокая производительность *Программирование *C++ *GPGPU *API *
image
Khronos Group опубликовала предварительные спецификации стандарта вычислений общего назначения с использованием GPU и других процессоров OpenCL 3.0. Эта последняя версия вычислительного API позволяет поставщикам самостоятельно решать, какие функции они будут поддерживать помимо основных спецификаций на базе OpenCL 1.2 2011 года.
Читать дальше →
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 1

NVIDIA показала GPU на Ampere для облачных вычислений и обучения систем на ИИ

Время на прочтение 2 мин
Количество просмотров 8.4K
GPGPU *Облачные вычисления *Big Data *Искусственный интеллект Процессоры
image

NVIDIA на днях продемонстрировала графические процессоры с архитектурой Ampere. Они предназначены для дата-центров, способны выполнять научные расчеты и обрабатывать большие данные.
Всего голосов 14: ↑13 и ↓1 +12
Комментарии 11

HOSTKEY предлагает GPU-серверы с RTX A5500

Время на прочтение 2 мин
Количество просмотров 1.8K
Блог компании HOSTKEY Хостинг Видеокарты

HOSTKEY продолжает расширять парк GPU-серверов и предлагает конфигурации с профессиональными графическими картами RTX A5500. Новинка построена на архитектуре Ampere с RT-ядрами второго и тензорных ядер третьего поколений. Видеокарта выделяется наличием 24 Гбайт памяти GDDR6 с функцией коррекции ошибок ECC. Пиковая пропускная способность памяти достигает 768 Гбайт/с.

Узнать подробности
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Миллион партиклов. Часть 1

Время на прочтение 6 мин
Количество просмотров 22K
Высокая производительность *Алгоритмы *
Из песочницы
imageХочу рассказать как я создавал, и потом переводил собственную систему частиц на GPU. Как я наивно думал просто будет сделать (мол чо там, двигать частицы, тююю). На самом деле о нюансах, возникающих при реализации, можно говорить очень много и долго, поэтому далее я расскажу только об решении проблем «узких» мест.

История вопроса


Заказчик разрабатывает динамические музыкальные фонтанные комплексы, которые управляются через dmx контроллеры по сценарию. Редактор сценариев он сделал самостоятельно. Но на практике создавать сценарии оказалось неудобным, потому что для того, чтобы видеть как получается нужно иметь целиком построенный и запущенный фонтан. Кроме того, если вдруг дизайнеру хореографу захотелось добавить дополнительные сопла для фонтана — то этого сделать уже практически невозможно. Поэтому заказчик захотел обзавестись модулем для моделирования фонтанов, чтобы хореограф мог без настоящего фонтана разрабатывать сценарии. В целом у меня вышло что-то в таком духе: вот видео того что было смоделировано Hawaii50.wmv, а вот то, что вышло в реале после конструирования фонтана: H5OClip.wmv
Читать дальше →
Всего голосов 90: ↑86 и ↓4 +82
Комментарии 35

Еще один алгоритм для восстановления смазанных изображений

Время на прочтение 5 мин
Количество просмотров 18K
Обработка изображений *Математика *Matlab *
Из песочницы
Доброго времени суток. Уже столько сказано о методах деконволюции изображений, кажется добавить больше нечего. Однако всегда найдется алгоритм лучше и новее предыдущих. Не так давно был описан итерационный алгоритм, имеющий линейную скорость сходимости при малых затратах памяти, стабильный и хорошо распараллеливаемый. А через некоторое время он был улучшен еще и до квадратичной сходимости. Встречайте: (Fast) Iterative Shrinkage-Thresholding Algorithm.


Читать дальше →
Всего голосов 46: ↑42 и ↓4 +38
Комментарии 44

Вычисления на GPU – зачем, когда и как. Плюс немного тестов

Время на прочтение 12 мин
Количество просмотров 69K
Блог компании Технологический Центр Дойче Банка Высокая производительность *Алгоритмы *GPGPU *Видеокарты
🔥 Технотекст 2020
Всем давно известно, что на видеокартах можно не только в игрушки играть, но и выполнять вещи, никак не связанные с играми, например, нейронную сеть обучить, криптовалюту помайнить или же научные расчеты выполнить. Как так получилось, можно прочитать тут, а я хотел затронуть тему того, почему GPU может быть вообще интересен рядовому программисту (не связанному с GameDev), как подступиться к разработке на GPU, не тратя на это много времени, принять решение, нужно ли вообще в эту сторону смотреть, и «прикинуть на пальцах», какой профит можно получить. 


Читать дальше →
Всего голосов 33: ↑33 и ↓0 +33
Комментарии 29

Game of Life с битовой магией, многопоточностью и на GPU

Время на прочтение 8 мин
Количество просмотров 13K
Высокая производительность *C++ *Алгоритмы *Видеокарты
🔥 Технотекст 2020

Всем привет!


Недавняя статья на Хабре в очередной раз показала неостывающий интерес к игре «Жизнь» в частности и всевозможным оптимизациям в общем. Статья и комментарии к ней, особенно любопытство к вычислениям на GPU, вдохновили меня на то, чтобы поделиться своими изысканиями на данном поприще и, забегая вперёд, скажу, что повествование пойдёт о расчётах на GPU, битовой магии, многопоточности и огромных полях для игры «Жизнь», порядка миллиарда клеток.


Читать дальше →
Всего голосов 31: ↑30 и ↓1 +29
Комментарии 18

Я вам графония принес! Как нейросеть может улучшить разрешение в старых играх до HD

Время на прочтение 7 мин
Количество просмотров 19K
Работа с видео *Python *Машинное обучение *


UPDATE: нашел баг при обучении, исправил, результаты стали существенно лучше, поэтому заменил картинки

Данная статья является вольным переводом моей статьи на Medium.

В детстве я любил играть на компьютере. Совсем маленьким я застал несколько игр на кассетном ZS Spectrum, однако настоящим открытием стали красочные DOS игры 90x годов. Тогда же и зародилось большинство существующих жанров. Немного поностальгировав, я решил вспомнить молодость и запустить одну из старых игр на эмуляторе Dosbox и был неприятно поражен гигантскими пикселями и низким разрешением. Хотя в крупнопиксельной старой графике может быть свое очарование, многих сейчас не устраивает такое качество.

Для повышения разрешения и избавления от угловатости в играх в настоящее время используются различные алгоритмы постпроцессинга и сглаживания (подробно можно почитать, например тут zen.yandex.ru/media/id/5c993c6021b68f00b3fe919c/kak-rabotaet-sglajivanie-v-kompiuternyh-igrah-5c9b3e76d82a083cc9a0f1a7 ), но алгоритмы сглаживания приводят ко всем ненавистной «мыльной» картинке, которая часто еще менее предпочтительна, чем угловатость больших пикселей.
Всего голосов 28: ↑24 и ↓4 +20
Комментарии 35

Boost.Compute или параллельные вычисления на GPU/CPU. Часть 2

Время на прочтение 4 мин
Количество просмотров 4.6K
C++ *
Туториал

Вступление


Привет, Хабр!

Предыдущая часть понравилась многим, поэтому я снова перелопатил половину документации boost и нашёл о чем написать. Очень странно что вокруг boost.compute нету такого же ажиотажа как и вокруг boost.asio. Ведь достаточно, того эта библиотека кроссплатформенная, так ещё и предоставляет удобный (в рамках c++) интерфейс взаимодействия с параллельными вычислениями на GPU и CPU.

Читать дальше →
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 28

Сравнение времени выполнения алгоритма на CPU и GPU

Время на прочтение 12 мин
Количество просмотров 6.6K
C++ *GPGPU *Параллельное программирование *
Recovery mode

Использование CUDA Runtime API для вычислений. Сравнение CPU и GPU вычислений


В данной статье я решил провести сравнение выполнения алгоритма написанного на C++ на центральном и графическом процессоре(выполнение вычислений с помощью Nvidia CUDA Runtime API на поддерживаемом GPU Nvidia). CUDA API позволяет выполнение некоторых вычислений на графическом процессоре. Файл c++ использующий cuda, будет иметь расширение .cu.
Схема работы алгоритма приведена ниже.



Задача алгоритма состоит в том, что найти возможные числа X, при возведении которых в степень degree_of, будет получатся исходное число max_number. Сразу отмечу, что все числа которые будут передаваться GPU, будут хранится в массивах. Алгоритм, выполняемый каждым потоком, имеет приблизительно следующий вид:
Читать дальше →
Всего голосов 17: ↑6 и ↓11 -5
Комментарии 41

Могут ли десктопные видеокарты сравниться с серверными? Исследуем бенчмарки GPU от NVIDIA

Время на прочтение 7 мин
Количество просмотров 10K
Блог компании Selectel Высокая производительность *Работа с видео *Видеокарты

В этом материале мы рассмотрим несколько профессиональных видеокарт NVIDIA, а также расскажем, в чем разница с их десктопными «аналогами». Поговорим о производительности, бюджетном тестировании и о том, как подобрать GPU под свой проект, чтобы не переплачивать.
Читать дальше →
Всего голосов 56: ↑53 и ↓3 +50
Комментарии 17