fuzz2 окт 2012 в 06:24

Unbiased DirectX Рендеринг на GPU, CPU и в облаке

9 мин

44K

GPGPU *

+74

Комментарии 55

LeeMiller 2 окт 2012 в 06:39

Шикарно! ждем под другие редакторы. Молодцы!

НЛО прилетело и опубликовало эту надпись здесь

fuzz 2 окт 2012 в 07:24

все верно :)
своего bro-шара для тестовых рендеров пока нет

XaocCPS 2 окт 2012 в 07:02

очень круто!

petergreen 2 окт 2012 в 07:16

Молодчага. Бетатестером возьмёте?) И у меня еще есть желающие

datacompboy 2 окт 2012 в 07:17

Мощный проект! Позволит ли это использовать реалтайм Unbiased рендеринг высочайшего качества для игр, собирая «домашние облака»?

fuzz 2 окт 2012 в 07:30

У последних поколений видеокарт NVIDIA и AMD есть фича, которая позволяет одному GPU перекидывать память в другой минуя системную память. Если собрать ящик из 6-8 таких GPU, то фреймрейты будут что надо, и картинка будет хорошей. Вопрос только зачем это? Для студии анимации это имеет смысл, чтобы сократить время на настройку сцен. Для игр — не понять. Установка слишком дорога, чтобы найти масс-маркет.

AlexSelivanoff 2 окт 2012 в 08:03

ну 2-3 видюхи народ ставит для игр. Вобщем не жуть как дорого получается

nshopik 2 окт 2012 в 08:31

Да вот пример 2xGT580 www.youtube.com/watch?v=gZlCWLbwC-0

fuzz 2 окт 2012 в 10:38

да, это движок Brigade. Подразумевается, что он будет игровым. Наша разработка тоже в эту сторону движется, но лишь как очень-очень ранний прототип. До игр еще далеко.

fuzz 2 окт 2012 в 10:37

для игр multi-GPU используют через SLI или Cross-Fire, когда устройства логически объединяются в одно. Чтобы делать рендеринг на нескольких картах, надо значительно перерабатывать игровой движок и тратить много сил на коммуникацию между GPU. На старых поколениях это был гемор. На новых намного легче, но мало кто это будет делать в ближайшее время, рынка нет для этого.

AlexSelivanoff 2 окт 2012 в 08:02

Еще б не под 3д макс, вобще б хорошо было

AlexSelivanoff 2 окт 2012 в 08:17

в смысле, я за standalone версию с привязками к разным пакетам. О кроссплатформенности речи не идет пока, как я понимаю?

ne_kotin 2 окт 2012 в 08:29

Я б тоже пощупал консольно-автономную версию.
Эх, была б под Linux — я б на нашей GPU-ферме накатил 8(

fuzz 2 окт 2012 в 10:40

Пока будет на Direct3D, то это, конечно, только Windows. С++ AMP поправит положение дел, но еще нужно убедиться, что на нем рендер будет так же быстр.

AlexSelivanoff 2 окт 2012 в 10:53

Ну на самом деле интересна скорее именно standalone версия, операционная система дело десятое

fuzz 2 окт 2012 в 10:39

Есть наработки для Google SketchUp, он на очереди после 3ds Max.

AlexAdskiy 2 окт 2012 в 11:16

А для Blender ожидается?

fuzz 2 окт 2012 в 12:10

Думаю, нет. Создание плагина под редактор – огромная работа. Над этим проектом всего 2.5 человека работает :) Если есть желание им заняться, присоединяйтесь!

bukt 2 окт 2012 в 08:08

Волшебно.
Одно только интересно — а насколько реальны перспективы облачного рантайм рендеринга?

fuzz 2 окт 2012 в 10:42

Поясните пожалуйста, что такое рантайм? Работать в 3ds Max'е, и получать моментальный отклик рендера, который рассчитывается в облаке? Не совсем понял.

bukt 2 окт 2012 в 11:50

Я имел в виду интерактивные миры и игры, разумеется.

fuzz 2 окт 2012 в 12:20

Тут возникает несколько проблем:
1) Precompute. Создание качественного BVH или Kd-дерева для сцены с большим количеством полигонов – не быстрый процесс. У нас на создание BVH для сцены с 2млн полигонов уходит 300-600 ms. А что если сцена намного больше и меняется каждый фрейм, что и происходит в играх? Тут с фреймрейтом все плохо. А ведь мы еще и до рендеринга не добрались. Мы сейчас работаем над распределением построения BVH на все ядра CPU. Это должно ускорить процесс, но не так значительно, как хочется.
2) Rendering. Можно очень быстро отрендерить несколько самплов и получить шумную картинку. Если хочется лучшего качества, нужно увеличивать количество самплов рендеринга. Это линейно увеличивает время. Тут можно применять умные техники фильтрации, которые, к слову, тоже не самые быстрые.

Если грамотно распределить эти задачи между устройствами, то можно добиться хороших результатов. Тут важно, чтобы устройства в облаке были очень близко или имели быстрый доступ друг к другу. Но передача изображения по узкому каналу пользователя сведет на нет работу даже очень близко расположенных сильных устройств. В этом можно убедиться на примере сервиса OnLive.

adminimus 2 окт 2012 в 14:54

>У нас на создание BVH для сцены с 2млн полигонов уходит 300-600 ms. А что если сцена намного больше и меняется каждый фрейм, что и происходит в играх?
в играх сцена между фреймами меняется далеко не полностью, поэтому BVH не нужно строить с нуля каждый раз, достаточно обновлять

fuzz 2 окт 2012 в 18:03

Всю сцену – да. У многих объектов анимация, их надо перестраивать, а остальную сцену обновлять. Это, конечно, намного быстрее.

SilentBob 2 окт 2012 в 08:24

А где можно достать модель Mech Octopus'а?

При долгом вычислении на GPU «Timeout Detection and Recovery» не приходит?

Как по качеству/скорости сравнимо с Octane/Cycles?

Не боитесь, что черемерное употребление «bro» на сайте отпугнет англоязычных пользователей?

fuzz 2 окт 2012 в 10:47

Если карта слабая или сцена очень тяжела, то Watchdog ругается и сбрасывает рендер. В таком случае Timeout Detection and Recovery можно отключить. При установке плагина сделаем опцию отключения. Но вообще не рекомендуют это делать. Хотя ничего страшного в этом нет, карта не сгорит :)
По факту, финальный рендер лучше осуществлять без интерактивного отображения в окно. Для этого можно отключить timeout и поставить карту работать. Проверено, что рендер в таком случае может быть до 2-2.5х раз быстрее.

novoselov 2 окт 2012 в 08:49

Есть ли сейчас возможность запустить распределенный рендер на нескольких машинах? Есть зоо-парк из почти 100 машин Core i7+GTX 570 и свободное время по ночам. Уже запускали рендер на 20 в течении недели, не очень удобно в установке и настройке, но быстрее на порядок.

fuzz 2 окт 2012 в 10:51

Ого) 100 Core i7 + GTX 570 звучит… дорого :)
Очень интересная возможность, но на разных машинах пока проблематично. Мы только проверили концепт, что так можно сделать, но до хорошего автоматизированного решения руки еще не дошли. Можно запустить рендер на всех машинах машинах, но результат пока придется собирать руками. Вот если у вас много GPU+CPU в одной машине, то тут без проблем.

novoselov 2 окт 2012 в 15:35

Это рабочие станции, пробовали делать обычный SLI, но он просто не поддерживается большинством программ. Несколько CPU (2 Xeon W5580) есть только на одном компьютере, но там только одна GPU (Quadro 5800). Когда посчитали время рендера получилось около месяца, собственно для этого и развернули распределенный вариант.

Gorthauer87 2 окт 2012 в 10:22

>> Работает на всем спектре видеокарт, эмулируется на всех моделях процессоров:

А также эмулируется на армах и мипсах, да? Не заметил что-то.

>> один и тот же шейдер работает везде
>> Именно спецификации Direct3D задают направление развития потребительского железа

Тут сильно спорить не стану, но сейчас быстрее развивается рынок мобильного железа, а а там направление развития задает OpenGL EL

>> Всегда первым получает самые свежие и стабльные драйверы
>> Остальные кросс‒вендорные технологии не стабильны, либо слабо поддерживаются

А чем поддержка OpenGL и OpenGL ES хуже то? Для целого спектра девайсов это единственное доступное API.

Я пока вижу в основном такой довод, что взяли то, что лучше всего умели и знали, остальное так сверху дописали чтобы убедительнее было.

AlexSelivanoff 2 окт 2012 в 10:41

Не дай нам боже рендерить на мобилах для продакшена

Gorthauer87 2 окт 2012 в 10:51

А Linux фермы, linux суперкомпьютеры? ARM и MIPS это весьма дешевые процессоры и из них можно весьма дешево насобирать очень мощный кластер, куда с D3D дороги никакой нет!

AlexSelivanoff 2 окт 2012 в 11:09

А что уже есть нормальные дешевые ARM платформы, пригодные для сборки ферм?

fuzz 2 окт 2012 в 10:55

На ARM без проблем, про мирсы речи не было. Так C++ AMP работает, берет GPU код и транслирует его на каждую поддерживаемую платформу (x86, x64, ARM). Эта фича WARP, заложенная в DirectX 11.

OpenGL, в том числе ES, можно использовать только для простых алгоритмов рендеринга. Они просто не были созданы для такой производительности, которая требуется для unbiased рендеринга.

beeruser 3 окт 2012 в 12:25

>> Они просто не были созданы для такой производительности, которая требуется для unbiased рендеринга.
О какой производительности идёт речь? Отрисовать 1 треугольник?

tangro 2 окт 2012 в 10:46

>плагин RenderBro для Autodesk 3DS Max, который, как и задумывалось, должен рендерить даже на бабушкином компьютере

и ниже комп с десятком вставленных Тесл в качестве примера :)

fuzz 2 окт 2012 в 10:56

бабушек не выбирают ;)

AlexSelivanoff 2 окт 2012 в 10:47

А анимацию не пробовали им рендерить? Было бы интересно посмотреть

fuzz 2 окт 2012 в 10:58

Анимацию пока нет. У нас со статикой-то проблемы возникают. Код Autodesk — такой кусок говна. 3ds Max SDK и создание плагина вызвало у нас больше проблем, чем создание самого рендера.

AlexSelivanoff 2 окт 2012 в 11:44

Да там еще с времен, когда макс принадлежал discreet, народ матерился на писание плагинов к нему )))

demOOn 2 окт 2012 в 19:00

Отличная статья!

demOOn 2 окт 2012 в 19:01

Но гибридные рендеры более перспективны. furryball.aaa-studio.eu/

fuzz 2 окт 2012 в 19:09

Гибриды бесконечно гибкие, чистые GPU о таком и не мечтают. Но у них разные задачи.

demOOn 2 окт 2012 в 21:48

Под «гибридными» имел ввиду не unbiased. Почему выбор пал на unbiased? Из-за простоты реализации? Какие конечные цели проекта?
Насчет физкорректности: можно осветить синим цветом оранжевый шарик? :)

fuzz 5 окт 2012 в 09:23

Промахнулся с ответом. См. ниже.

fuzz 5 окт 2012 в 09:22

Недопонял Вас значит. Под гибридом я подразумевал метод трассировки, а не сам рендер (когда GPU лишь помогают найти пересечения лучей, но не отвечают за шейдинг). Unbiased хорошо подходит для архитектуры GPU. Простота – довольно спорный момент. Качественная реализация Bi-Directional Path Tracing или Metropolis Light Transport на GPU не так проста.
Конечная цель – рендер, наилучшим образом работающий на широком классе GPU.
>Насчет физкорректности: можно осветить синим цветом оранжевый шарик? :)
Можно. Взять например голубоватое небо с теплотой цвета 7000 Кельвинов и выше.

demOOn 5 окт 2012 в 10:15

Не хотел нисколько принизить сложность реализации вашей работы, с вопросом про гибридность, просто думал это промежуточный этап. По ссылке что я привел — рендер с предварительными фильтрациями и трэйсингом. Он позволяет достичь очень высокой скорости на широком спектре аппаратных устройств.
Формулировка конечной цели все равно ускальзывает от меня — какова область применения? Архитектура, анимация или прокачка своих скилов?
>Можно. Взять например голубоватое небо с теплотой цвета 7000 Кельвинов и выше.
Тут вопрос с подвохом был. если взять источник синего цвета (0,0,1) и оранжевый шарик (1, 1, 0) то при при просчете диффуза он станет черным, т.к. в подавляющем большинстве даже «физкорректно» названные рендеры работают с RGB пространством покомпонентно. т.е. (0*1, 0*1, 1*0) что дает 0.
Но вообще вы молодцы что взялись за такое — буду наблюдать с интересом.

fuzz 5 окт 2012 в 13:31

Про черноту первый раз слышу, не знал, что анбиасы таким болеют. Для теста: куб цвета (1, 1, 0), освещение цвета (0, 0, 1).

demOOn 5 окт 2012 в 13:55

Нужен дифуз колор, который реагирует на лайт. Я не знаю как в максе — по виду на скриншоте это констант — которые не зависят от освещения.

demOOn 5 окт 2012 в 14:37

это проблема не анбиаса, а RGB пространства.

FenixArt 13 окт 2012 в 00:37

Друзья раз пока вопрос не стоит о коммерческой выгоде, может зарелизите публично альфу? так и фидбеков будет больше :)

fuzz 13 окт 2012 в 04:50

Пока нет. На данный момент у нас уже очень много заявок на альфа тест, который будет проходить закрыто.

vicnaum 21 окт 2012 в 18:25

О, дык Бро это еще и наши придумали! Молодцы!
На днях как раз оставлял вам заявку на тест.

p1ayer 28 ноя 2012 в 16:09

заявку отправил а ответа нет(
когда релиз?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий