Применение интегрирования Монте-Карло в рендеринге / Хабр

Все мы изучали в курсе математики численные методы. Это такие методы, как интегрирование, интерполяция, ряды и так далее. Существует два вида числовых методов: детерминированные и рандомизированные.

Типичный детерминированный метод интегрирования функции $inline$ в интервале $inline$ выглядит так: мы берём $inline$ равномерно расположенных в интервале точек $t_0 = a, t_1 = a + \frac{b - a }{n}, \ldots, t_n - b$ , вычисляем $inline$ в средней точке $\frac{t_i + t_{i + 1}}{2}$ каждого из интервалов, определяемых этими точками, суммируем результаты и умножаем на ширину каждого интервала $\frac{b -a}{b}$ . Для достаточно непрерывных функций $inline$ при увеличении $inline$ результат будет сходиться к верному значению.

Вероятностный метод, или метод Монте-Карло для вычисления, или, если точнее, приблизительной оценки интеграла $inline$ в интервале $inline$ , выглядит так: пусть $X_1, \ldots, X_n$ — случайно выбранные точки в интервале $inline$ . Тогда $Y = (b - a) \frac{1}{n}\sum_{i = 1}^{n}f(X_i)$ — это случайное значение, среднее которого является интегралом $\int_{[a,b]}f$ . Для реализации метода мы используем генератор случайных чисел, генерирующий $inline$ точек в интервале $inline$ , вычисляем в каждой $inline$ , усредняем результаты и умножаем на $inline$ . Это даёт нам приблизительное значение интеграла, как показано на рисунке ниже. $\int_{-1}^{1}\sqrt{1 - x^2} dx$ с 20 сэмплами аппроксимирует верный результат, равный $\frac{\pi}{2}$ .

Разумеется, каждый раз, когда мы будем вычислять такое приблизительное значение, то будем получать разный результат. Дисперсия этих значений зависит от формы функции $inline$ . Если мы генерируем случайные точки $inline$ неравномерно, то нам необходимо слегка изменить формулу. Но благодаря использованию неравномерного распределения точек мы получаем огромное преимущество: заставив неравномерное распределение отдавать предпочтение точкам $inline$ , где $inline$ велика, мы можем значительно снизить дисперсию приблизительных значений. Такое принцип неравномерной дискретизации называется выборкой по значимости.

Так как за последние десятилетия в методиках рендеринга произошёл масштабный переход от детерминированных к рандомизированным подходам, мы изучим рандомизируемые подходы, применяемые для решения уравнений рендеринга. Для этого мы используем случайные величины, математическое ожидание и дисперсию. Мы имеем дело с дискретными значениями, потому что компьютеры дискретны по своей сути. Непрерывные величины имеют дело с функцией плотности вероятности, но в статье мы не будем её рассматривать. Мы поговорим о функции распределения масс (probability mass function). PMF обладает двумя свойствами:

Для каждого $s \in S$ существует $p(s) \geq 0$ .
$\sum_{s \in S}p(s) = 1$

Первое свойство называется «неотрицательностью». Второе называется «нормальностью». Интуитивно понятно, что $inline$ представляет собой множество результатов некоторого эксперимента, а $inline$ — это результат вероятности $inline$ , член $inline$ . Исход — это подмножество пространства вероятностей. Вероятность исхода является суммой PMF элементов этого исхода, поскольку

$Pr\{E\} = \sum_{s \in S} p(s)$

Случайная переменная — это функция, обычно обозначаемая заглавной буквой, ставящая в соответствие пространству вероятностей вещественные числа:

$X: S \rightarrow \boldsymbol{R}.$

Учтите, что функция $inline$ — это не переменная, а функция с вещественными значениями. Она также не является случайной, $inline$ — это отдельное вещественное число для любого результата $s\in S$ .

Случайная переменная используется для определения исходов. Например, множество результата $inline$ , для которого $inline$ , то есть если ht и th — это множество строк, обозначающих «орлы» или «решки», то

$E = {s \in S : X(s) = 1}$

$display$

это исход с вероятностью $\frac{1}{2}$ . Запишем это как $Pr\{X=1\} = \frac{1}{2}$ . Мы используем предикат $inline$ как укороченную запись для исхода, определяемого предикатом.

Давайте взглянем на фрагмент кода, симулирующий эксперимент, описанный представленными выше формулами:

headcount = 0
if (randb()): // first coin flip
    headcount++
if (randb()): // second coin flip
    headcount++
return headcount

Здесь мы обозначаем как ranb() булеву функцию, которая возвращает true в половине случаев. Как она связана с нашей абстракцией? Представьте множество $inline$ всех возможных выполнений программы, объявив два выполнения одинаковыми значениями, возвращаемыми ranb, попарно идентичными. Это значит, что существует четыре возможных выполнений программы, в которых два вызова ranb() возвращают TT, TF, FT и FF. По своему опыту мы можем сказать, что эти четыре выполнения равновероятны, то есть каждое встречается примерно в четверти случаев.

Теперь аналогия становится понятнее. Множество возможных выполнений программы и связанные с ними вероятности — это пространство вероятностей. Переменные программы, зависящие от вызовов ranb, — это случайные переменные. Надеюсь, теперь вам всё понятно.

Давайте обсудим ожидаемое значение, также называемое средним. По сути это сумма произведения PMF и случайной переменной:

$E[X] = \sum_{s\in S} p(s)X(s)$

Представьте, что h — это «орлы», а t — «решки». Мы уже рассмотрели ht и th. Также существуют hh и tt. Поэтому ожидаемое значение будет следующим:

$display$

$= \frac{1}{4}. 2 +\frac{1}{4} . 1 + \frac{1}{4} . 1 + \frac{1}{4} .0$

$= 1 \text{QED}$

Вы можете задаться вопросом, откуда взялся $inline$ . Здесь я имел в виду, что мы должны назначать значение $inline$ самостоятельно. В данном случае мы присвоили h значение 1, а t значение 0. $inline$ равно 2, потому что в ней содержится 2 $inline$ .

Давайте поговорим о распределении. Распределение вероятностей — это функция, дающая вероятности различных исходов события.

Когда мы говорим, что случайная переменная $inline$ имеет распределение $inline$ , то должны обозначить $X \sim f$ .

Рассеяние значений, скопившихся вокруг $inline$ , называется её дисперсией и определяется следующим образом:

$\boldsymbol{Var}[X] = E[(X - \bar{X})^2]$

Где $\bar{X}$ — это среднее $inline$ .

$\sqrt{\boldsymbol{Var}}$ называется стандартным отклонением. Случайные переменные $inline$ и $inline$ называются независимыми, если:

$Pr\{X = x \text{ and } Y = y\} = Pr\{X = x\}.Pr\{Y = y\}$

Важные свойства независимых случайных переменных:

$inline$
$\boldsymbol{Var}[X + Y] = \boldsymbol{Var}[X] + \boldsymbol{Var}[Y]$

Когда я начал с рассказа о вероятности, то сравнивал непрерывную и дискретную вероятности. Мы рассмотрели дискретную вероятность. Теперь поговорим о разнице между непрерывной и дискретной вероятностями:

Значения непрерывны. То есть числа бесконечны.
Некоторые аспекты анализа требуют таких математических тонкостей, как измеряемость.
Наше пространство вероятностей будет бесконечным. Вместо PMF мы должны использовать функцию плотности вероятностей (PDF).

Свойства PDF:

Для каждого $s \in S$ у нас есть $p(s) \geq 0$
$\int_{s\in S}p(s) = 1$

Но если распределение $inline$ равномерно, то PDF определяется так:

При непрерывной вероятности $inline$ определяется следующим образом:

$E[X] := \int_{s\in S} p(s)X(s)$

Теперь сравним определения PMF и PDF:

$\mathbb{PMF} \rightarrow p_y(t) = Pr\{Y = t\} \text{ for } t \in T$

$\mathbb{PDF} \rightarrow Pr\{a\leq X \leq b\} = \int_a^bp(r)dr$

В случае непрерывной вероятности случайные величины лучше называть случайными точками. Потому что если $inline$ — пространство вероятностей, а $Y : S \rightarrow T$ отображается в другое пространство, отличающееся от $\mathbb{R}$ , тогда мы должны назвать $inline$ случайной точкой, а не случайной величиной. Понятие плотности вероятностей применимо здесь, потому что можно сказать, что для любого $U \subset T$ мы имеем:

Теперь давайте применим то, что мы узнали, к сфере. Сфера имеет три координаты: широту, долготу и дополнение широты. Долготу и дополнение широты мы используем только в $\mathbb{R}^2$ , двухмерные декартовы координаты, применённые к случайной величине $inline$ , превращают её в $inline$ . Получаем следующую детализацию:

$Y : [0, 1] \times [0, 1] \rightarrow S^2 : (u, v) \rightarrow (\cos(2\pi u)\sin(\pi v), \cos(\pi v) \sin( 2\pi u) sin(\pi v))$

Мы начинаем с равномерной плотности вероятностей $inline$ при $[0, 1] \times [0, 1]$ , или $inline$ . Посмотрите выше формулу плотности равномерной вероятности. Для удобства мы запишем $inline$ .

У нас есть интуитивное понимание, что если выбирать точки равномерно и случайно в единичном квадрате и использовать $inline$ для преобразования их в точки на единичной сфере, то они будут скапливаться рядом с полюсом. Это означает, что полученная плотность вероятностей в $inline$ не будет равномерной. Это показано на рисунке ниже.

Теперь мы обсудим способы приблизительного определения ожидаемого значения непрерывной случайной величины и его применения для определения интегралов. Это важно, потому что в рендеринге нам нужно определять значение интеграла отражающей способности:

$L^{ref}(P, \omega_o) = \int_{\omega_i \in S_{+}^{2}}L(P, - \omega_i)f_s(P,\omega_i,\omega_0)\omega_i . \boldsymbol{n}d\omega_i,$

для различных значений $inline$ и $\omega_0$ . Значение $\omega$ — это направление падающего света. Код, генерирующий случайное число, равномерно распределённое в интервале $inline$ и берущий квадратный корень, создаёт значение в интервале от 0 до 1. Если мы используем для него PDF, поскольку это равномерное значение, то ожидаемое значение будет равно $\frac{2}{3}$ . Также это значение является средним значением $f(x) = \sqrt{x}$ в этом интервале. Что это означает?

Рассмотрим теорему 3.48 из книги «Computer Graphics: Principles and Practice». Она гласит, что если $f : [a, b] \rightarrow \mathbb{R}$ является функцией с вещественными значениями, а $X \sim \boldsymbol{U}(a, b)$ является равномерной случайной величиной в интервале $inline$ , то $inline$ — это случайная величина, ожидаемое значение которой имеет вид:

$E[(b-a)f(x)] = \int_a^b f(x)dx .$

Что это нам говорит? Это значит, что можно использовать рандомизированный алгоритм для вычисления значения интеграла, если мы достаточно много раз выполним код и усредним результаты.

В общем случае мы получим некую величину $inline$ , как в показанном выше интеграле, которую нужно определить, и некий рандомизированный алгоритм, возвращающий приблизительное значение $inline$ . Такая случайная переменная для величины называется эстиматором. Считается, что эстиматор без искажений, если его ожидаемое значение равно $inline$ . В общем случае эстиматоры без искажений предпочтительнее, чем с искажениями.

Мы уже обсудили дискретные и непрерывные вероятности. Но существует и третий тип, который называется смешанными вероятностями и используется в рендеринге. Такие вероятности возникают вследствие импульсов в функциях распределения двунаправленного рассеяния, или импульсов, вызванных точечными источниками освещения. Такие вероятности определены в непрерывном множестве, например, в интервале $inline$ , но не определены строго функцией PDF. Рассмотрим такую программу:

if uniform(0, 1) > 0.6 :
    return 0.3
else :
    return uniform(0, 1)

В шестидесяти процентах случаев программа будет возвращать 0.3, а в оставшихся 40% она будет возвращать значение, равномерно распределённое в $inline$ . Возвращаемое значение — это случайная переменная, имеющая при 0.3 массу вероятности 0.6, а его PDF во всех других точках задаётся как $inline$ . Мы должны определить PDF как:

В целом, случайная переменная со смешанной вероятностью — это такая переменная, для которой существует конечное множество точек в области определения PDF, и наоборот, равномерно распределённые точки, где PMF не определена.