Свойство симметричности отношения коинтеграции / Хабр

Цель данной статьи — поделиться парадоксальными результатами в исследовании коинтеграции временных рядов: если временной ряд $inline$ коинтегрирован с рядом $inline$ , ряд $inline$ не всегда коинтегрирован с рядом $inline$ .

Если мы исследуем коинтеграцию чисто теоретически, то легко доказать, что если ряд $inline$ коинтегрирован с $inline$ , то и ряд $inline$ коинтегрирован с $inline$ . Однако если мы начнём исследовать коинтеграцию эмпирически, окажется, что теоретические выкладки подтверждаются не всегда. Почему так происходит?

Симметричность

Отношение $inline$ называется симметричным, если $A \subseteq A^{-1}$ , где $A^{-1}$ — обратное отношение, определяемое условием: $x A^{-1} y$ равносильно $inline$ . Иначе говоря, если выполнено соотношение $inline$ , то выполнено и соотношение $inline$ .

Рассмотрим два $inline$ ряда $inline$ и $inline$ , $t=0,\dots,T$ . Коинтеграция симметрична, если $y_t = \beta_1 x_t + \varepsilon_{1t}$ влечёт $x_t = \beta_2 y_t + \varepsilon_{2t}$ , то есть если наличие прямой регрессии ведёт к наличию обратной.

Рассмотрим уравнение $y_t = \beta_1 x_t + \varepsilon_{1t}$ , $\beta_1 \neq 0$ . Поменяем левую и правую часть местами и вычтем $\varepsilon_{1t}$ из обоих частей: $\beta_1 x_t = y_t - \varepsilon_{1t}$ . Так как $\beta_1 \neq 0$ по определению, разделим обе части на $\beta_1$ :

$x_t = \frac{1}{\beta_1} y_t - \frac{\varepsilon_{1t}}{\beta_1}.$

Заменим $1 / \beta_1$ на $\beta_2$ , а $-\varepsilon_{1t} / \beta_1$ на $\varepsilon_{2t}$ , получим $x_t = \beta_2 y_t + \varepsilon_{2t}$ . Следовательно, отношение коинтеграции является симметричным.

Отсюда следует, что если переменная $inline$ коинтегрирована с переменной $inline$ , то переменная $inline$ должна быть коинтегрирована с переменной $inline$ . Однако тест Энгла-Грэнджера для коинтеграции не всегда подтверждает это свойство симметричности, поскольку иногда переменная $inline$ не коинтегрирована с переменной $inline$ в соответствии с этим тестом.

Я тестировала свойство симметричности на данных 2017 года Московской и Нью-Йоркской бирж с помощью теста Энгла-Грэнждера. На Московской бирже было 7975 коинтегрированных пар акций. Для 7731 (97%) коинтегрированных пар свойство симметричности подтвердилось, для 244 (3%) коинтегрированных пар свойство симметричности не подтвердилось.

На Нью-Йоркской бирже было 140903 коинтегрированные пары акций. Для 136586 (97%) коинтегрированных пар свойство симметричности подтвердилось, для 4317 (3%) коинтегрированных пар свойство симметричности не подтвердилось.

Интерпретация

Данный результат можно интерпретировать низкой мощностью и высокой вероятностью ошибки второго рода теста Дики-Фуллера, на котором основан тест Энгла-Грэнджера. Вероятность ошибки второго рода можно обозначить через $\beta = P(H_0 | H_1)$ , тогда величину $1 - \beta$ называют мощностью теста. К сожалению, тест Дики-Фуллера не способен различить нестационарные и около-нестационарные временные ряды.

Что такое около-нестационарный временной ряд? Рассмотрим временной ряд $x_t = \phi x_{t-1} + \varepsilon_t$ . Стационарным временным рядом называется такой ряд, в котором $0<\phi<1$ . Нестационарным временным рядом называется такой ряд, в котором $\phi=1$ . Около-нестационарным временным рядом называется такой ряд, в котором значение $\phi$ близко к единице.

В случае около-нестационарных временных рядов мы часто не способны отклонить нулевую гипотезу нестационарности. Это означает, что у теста Дики-Фуллера высокий риск ошибки второго рода, то есть вероятность не отклонить ложную нулевую гипотезу.

Тест KPSS

Возможным ответом на слабость теста Дики-Фуллера является тест KPSS, который обязан своим названием инициалам учёных Квятковского, Филлипса, Шмидта и Шина. Хотя методический подход этого теста полностью отличается от подхода Дики-Фуллера, главное различие следует понимать в перестановке нулевой и альтернативной гипотез.

В тесте KPSS нулевая гипотеза утверждает, что временной ряд является стационарным, против альтернативной о наличии нестационарности. Около-нестационарные временные ряды, которые с помощью теста Дики-Фуллера часто выявлялись как нестационарные, с помощью теста KPSS могут быть корректно выявлены как стационарные.

Однако мы должны сознавать, что любые результаты статистического тестирования являются всего лишь теоретико-вероятностными, и их не следует путать с неким истинным суждением. Всегда существует ненулевая вероятность, что мы ошибаемся. По этой причине в качестве идеального тестирования на нестационарность предлагается объединение результатов тестов Дики-Фуллера и KPSS.

Из-за низкой мощности тест Дики-Фуллера часто ошибочно выявляет ряд как нестационарный, поэтому результирующее множество временных рядов, выявленных тестом Дики-Фуллера как нестационарные, оказывается больше по сравнению с множеством временных рядов, выявленных как нестационарные с помощью теста KPSS. Следовательно, порядок тестирования важен.

Если временной ряд выявлен как стационарный с помощью теста Дики-Фуллера, то он, скорее всего, будет также выявлен как стационарный и с помощью теста KPSS; в таком случае мы можем предполагать, что ряд и в самом деле стационарный.

Если временной ряд был выявлен как нестационарный с помощью теста KPSS, то он, скорее всего, будет также выявлен как нестационарный и с помощью теста Дики-Фуллера; в таком случае мы можем предполагать, что ряд и в самом деле нестационарный.

Однако часто случается, что временной ряд, который был выявлен как нестационарный с помощью теста Дики-Фуллера, будет отмечен как стационарный с помощью теста KPSS. В таком случае мы должны быть очень осторожны с нашим окончательным заключением. Мы можем проверить, насколько сильно основание для стационарности в случае теста KPSS и для нестационарности в случае теста Дики-Фуллера и принять соответствующее решение. Конечно, мы также можем оставить вопрос о стационарности такого временного ряда нерешённым.

Подход теста KPSS предполагает, что временной ряд $inline$ , тестируемый на стационарность относительно тренда, может быть разложен на сумму детерминированного тренда $\beta t$ , случайного блуждания $inline$ и стационарной ошибки $\varepsilon_t$ :

$y_t = \beta t + r_t + \varepsilon_t,\\ r_t = r_{t-1} + u_t,$

где $inline$ — нормальный i.i.d. процесс с нулевым средним и дисперсией $\sigma^2$ ( $u_t \sim N(0,\sigma^2)$ ). Начальное значение $inline$ трактуется как фиксированное и играет роль свободного члена. Стационарная ошибка $\varepsilon_t$ может быть сгенерирована любым общим ARMA процессом, то есть, может иметь сильную автокорреляцию.

Аналогично тесту Дики-Фуллера возможность учитывать произвольную структуру автокорреляции $\varepsilon_t$ очень важна, потому что большинство экономических временных рядов сильно зависят от времени и, следовательно, имеют сильную автокорреляцию. Если мы хотим проверить стационарность относительно горизонтальной оси, то член $\beta t$ просто исключается из уравнения выше.

Из уравнения выше следует, что нулевая гипотеза $inline$ о стационарности $inline$ эквивалентна гипотезе $\sigma^2 = 0$ , из которой следует, что $inline$ для всех $inline$ ( $inline$ — константа). Аналогично, альтернативная гипотеза $inline$ о нестационарности эквивалентна гипотезе $\sigma^2 \neq 0$ .

Чтобы протестировать гипотезу $inline$ : $\sigma^2 = 0$ (стационарный временной ряд) против альтернативной $inline$ : $\sigma^2 \neq 0$ (нестационарный временной ряд) авторы теста KPSS получают одностороннюю статистику теста множителей Лагранжа. Они также вычисляют его асимптотическое распределение и моделируют асимптотические критические значения. Теоретические детали мы здесь не рассматриваем, а только кратко изложим алгоритм выполнения теста.

При выполнении теста KPSS для временного ряда $inline$ , $t = 1, \dots, T$ используется метод наименьших квадратов (МНК), чтобы оценить одно из следующих уравнений:

$y_t = a_0 + \varepsilon_t,\\ y_t = a_0 + \beta t + \varepsilon_t.$

Если мы хотим проверить стационарность относительно горизонтальной оси, мы оцениваем первое уравнение. Если мы планируем проверить стационарность относительно тренда, мы выбираем второе уравнение.

Остатки $inline$ из оценённого уравнения используются для вычисления статистики теста множителей Лагранжа. Тест множителей Лагранжа основан на идее, что при выполнении нулевой гипотезы все множители Лагранжа должны быть равны нулю.

Тест множителей Лагранжа

Тест множителей Лагранжа связан с более общим подходом к оценке параметров методом максимального правдоподобия (ML). Согласно этому подходу данные рассматриваются как свидетельство, относящееся к параметрам распределения. Свидетельство выражается как функция неизвестных параметров – функция правдоподобия:

$L(X_1,X_2,X_3,\dots,X_n;\Phi_1,\Phi_2,\dots,\Phi_k),$

где $inline$ — наблюдаемые значения, а $\Phi_i$ — параметры, которые мы хотим оценить.

Функция максимального правдоподобия представляет собой совместную вероятность наблюдений выборки

$L(X_1,X_2,X_3,\dots,X_n;\Phi_1,\Phi_2,\dots,\Phi_k) = P(X_1 \land X_2 \land X_3 \dots X_n).$

Цель метода максимального правдоподобия состоит в максимизации функции правдоподобия. Это достигается дифференцированием функции максимальной вероятности по каждому из оцениваемых параметров и приравниванием частных производных к нулю. Значения параметров, при которых значение функции максимально, и является искомой оценкой.

Обычно для упрощения последующей работы сначала берётся логарифм функции правдоподобия.

Рассмотрим обобщённую линейную модель $Y = \beta X + \varepsilon$ , где предполагается, что $\varepsilon$ нормально распределены $N(0,\sigma^2)$ , то есть $Y - \beta X \sim N(0,\sigma^2)$ .

Мы хотим проверить гипотезу о том, что выполнена система $inline$ ( $inline$ ) независимых линейных ограничений $R \beta = r$ . Здесь $inline$ — известная $q \times k$ матрица ранга $inline$ , а $inline$ – известный $q \times 1$ вектор.

Для каждой пары наблюдаемых значений $inline$ и $inline$ будет существовать при условии нормальности функция плотности вероятностей следующего вида:

$f(X_i,Y_i) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{1}{2} \left( \frac{Y_i - \beta X_i}{\sigma} \right) ^2}.$

При условии $inline$ совместных наблюдений $inline$ и $inline$ общая вероятность наблюдений всех значений в выборке равна произведению индивидуальных значений функции плотности вероятности. Таким образом, функция правдоподобия задаётся следующим образом:

$L(\beta)=\prod \limits_{i=1}^n \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{1}{2} \left( \frac{Y_i - \beta X_i}{\sigma} \right) ^2}.$

Поскольку легче дифференцировать сумму, чем произведение, то обычно берётся логарифм функции правдоподобия, таким образом:

$\ln L(\beta)=\sum \limits_{i=1}^n \left( \ln \frac{1}{\sqrt{2 \pi \sigma^2}} - \frac{1}{2 \sigma^2}(Y_i - \beta X_i)^2 \right).$

Это полезное преобразование не влияет на конечный результат, потому что $\ln L$ — это возрастающая функция $inline$ . Таким образом, то значение $\beta$ , которое максимизирует $\ln L$ , также будет максимизировать $inline$ .

ML-оценка для $\beta$ в регрессии с ограничением ( $R \beta = r$ ) получается максимизацией функции $\ln L(\beta)$ при условии $R \beta = r$ . Чтобы найти эту оценку, запишем функцию Лагранжа:

$\psi(\beta) = \ln L(\beta) - g'(R \beta - r),$

где через $g = \left( g_1, \dots, g_q \right) '$ обозначен вектор $inline$ множителей Лагранжа.

Статистика теста множителей Лагранжа, обозначаемая через $\eta_\mu$ в случае стационарности относительно горизонтальной оси и через $\eta_\tau$ в случае стационарности относительно тренда, определяется выражением

$\eta_{\mu / \tau} = T^2 \frac{1}{s^2(l)} \sum \limits_{t=1}^T S_t^2,$

где

$S_t = \sum \limits_{i=1}^t e_i$

$s^2(l) = T^{-1} \sum \limits_{t=1}^T e_t^2 + 2 T^{-1} \sum \limits_{1}^l w(s,l) \sum \limits_{t=s+1}^T e_t e_{t-s},$

где

$w(s,l) = 1 - \frac{s}{l+1}.$

В приведённых выше уравнениях $inline$ — процесс частичной суммы остатков $inline$ от оценённого уравнения; $inline$ — оценка долгосрочной дисперсии остатков $inline$ ; а $inline$ — так называемое спектральное окно Бартлетта, где $inline$ — параметр усечения лага.

В данном приложении спектральное окно используется для оценки спектральной плотности ошибок для определённого интервала (окна), который перемещается по всему диапазону ряда. Данные за пределами интервала игнорируются, так как оконная функция является функцией, равной нулю вне некоторого выбранного интервала (окна).

Оценка дисперсии $inline$ зависит от параметра $inline$ , а так как $inline$ увеличивается и больше 0, оценка $inline$ начинает учитывать возможную автокорреляцию в остатках $inline$ .

Наконец, статистика теста множителей Лагранжа $\eta_\mu$ или $\eta_\tau$ сравнивается с критическими значениями. Если статистика теста множителей Лагранжа превышает соответствующее критическое значение, то нулевая гипотеза $inline$ (стационарный временной ряд) отклоняется в пользу альтернативной гипотезы $inline$ (нестационарный временной ряд). В противном случае мы не можем отвергнуть нулевую гипотезу $inline$ о стационарности временного ряда.

Критические значения являются асимптотическими и, следовательно, наиболее подходят для выборки большого размера. Тем не менее, на практике они также используются и для небольшой выборки. Более того, критические значения не зависят от параметра $inline$ . Однако статистика теста множителей Лагранжа будет зависеть от параметра $inline$ . Авторы теста KPSS не предлагают какой-либо общий алгоритм для выбора соответствующего параметра $inline$ . Обычно тест выполняется для $inline$ в диапазоне от 0 до 8.

При увеличении $inline$ мы с меньшей вероятностью отвергаем нулевую гипотезу $inline$ о стационарности, что частично приводит к снижению мощности теста и может дать неоднозначные результаты. Однако, в целом, можно сказать, что если нулевая гипотеза $inline$ о стационарности временного ряда не отвергается даже при малых значениях $inline$ (0, 1 или 2), мы заключаем, что проверенные временные ряды являются стационарными.

Сравнение результатов тестов

Для оценки вероятности симметричности была разработана следующая методология.

Все временные ряды проверяются на интегрируемость 1-го порядка с помощью теста Дики-Фуллера на уровне значимости 0,05. Далее рассматриваются только интегрируемые ряды 1-го порядка.
Из интегрируемых рядов 1-го порядка, полученных в п. 1, составляются пары путём сочетания без повторений.
Пары акций, составленные в п. 2, тестируются на коинтеграцию с помощью теста Энгла-Грэнджера. В результате выявляются коинтегрированные пары.
Остатки от регрессии, полученные в результате тестирования в п. 3, тестируются на стационарность с помощью теста KPSS. Таким образом, результаты двух тестов объединяются.
Временные ряды в коинтегрированных парах из п. 2 переставляются местами и снова проверяются на коинтеграцию с помощью теста Энгла-Грэнджера, то есть мы исследуем, является ли отношение между временными рядами симметричным.
Временные ряды в коинтегрированных парах из п. 4 переставляются местами и остатки от регрессии снова проверяются на стационарность с помощью теста KPSS, то есть мы исследуем, является ли отношение между временными рядами симметричным.

Все вычисления выполняются с использованием пакета MATLAB. Результаты представлены в таблице ниже. Для каждого теста у нас есть количество отношений, которые являются симметричными по результатам теста (отмечены $inline$ ); у нас есть количество отношений, которые не являются симметричными по результатам теста (отмечены $inline$ ); и у нас есть эмпирическая вероятность того, что отношение является симметричным по результатам теста ( $P(S) = \frac{S}{S + ¬S}$ ).

На Московской бирже:

Тест	ADF	ADF + KPSS
$inline$	7731	16
$inline$	244	1
$inline$	97%	94%

На Нью-Йоркской бирже:

Тест	ADF	ADF + KPSS
$inline$	136586	182
$inline$	4317	7
$inline$	97%	96%

Сравнение результатов бэктестов

Давайте сравним результаты торговой стратегии на исторических данных для коинтегрированных пар, отобранных с помощью теста Энгла-Грэнджера, и для коинтегрированных пар, отобранных с помощью теста KPSS.

Критерии	ADF	ADF + KPSS
Количество симметричных пар	6417	205
Максимальная прибыль	340,31%	287,35%
Максимальный убыток	-53,28%	-46,35%
Пар торговалось в плюс	2904	113
Пар торговалось в ноль	293	3
Пар торговалось в минус	3220	89
Среднегодовая доходность	13,51%	22,72%

Как можно видеть из таблицы, благодаря более точной идентификации коинтегрированных пар акций, удалось увеличить среднегодовую доходность при торговле отдельной коинтегрированной парой на 9,21%. Таким образом, предложенная методология может увеличить прибыльность алгоритмической торговли при использовании рыночно-нейтральных стратегий.

Альтернативная интерпретация

Как мы видели выше, результаты теста Энгла-Грэнджера — это лотерея. Кому-то мои мысли покажутся излишне категоричными, но я считаю, что есть большой смысл не принимать на веру нулевую гипотезу, подтверждённую статистическим анализом.

Консерватизм научного метода проверки гипотез заключается в том, что при анализе данных мы можем сделать лишь одно правомочное заключение: нулевая гипотеза отклоняется на выбранном уровне значимости. Это не означает, что верна альтернатива $inline$ — просто мы получили косвенное свидетельство её правдоподобия на основании типичного «доказательства от противного». В случае, когда верна $inline$ , исследователю также предписывается сделать лишь осторожное заключение: на основе данных, полученных в условиях эксперимента, не удалось обнаружить достаточно доказательств, чтобы отклонить нулевую гипотезу.

В унисон моим мыслям в сентябре 2018-го года вышла статья, написанная влиятельными людьми и призывающая отказаться от понятия «статистическая значимость» и парадигмы тестирования нулевой гипотезы.

Самое главное: «Такие предложения, как изменение уровня порогового $inline$ -значения по умолчанию, использование доверительных интервалов с акцентом на том, содержат они ноль или нет, или использование коэффициента Байеса наряду с повсеместно принятыми классификациями для оценки силы доказательств, которые исходят от всё тех же или подобных проблем, что и текущее использование $inline$ -значений с уровнем 0,05… представляют собой форму статистической алхимии, которая делает ложное обещание преобразовать случайность в достоверность, так называемое „отмывание неопределенности“ (Gelman, 2016), которое начинается с данных и заканчивается дихотомическими выводами об истинности или ложности — бинарными утверждениями о том, что „есть эффект“ или „нет эффекта“ — на основе достижения некоторого $inline$ -значения или другого порогового значения.

Критическим шагом вперёд станет принятие неопределенности и вариативности эффектов (Carlin, 2016; Gelman, 2016), признание того, что мы можем узнать больше (намного больше) о мире, отказавшись от ложного обещания определенности, предлагаемой такой дихотомизацией.»

Выводы

Мы увидели, что хотя свойство симметричности отношения коинтеграции, теоретически, должно выполняться, экспериментальные данные расходятся с теоретическими выкладками. Один из вариантов интерпретации данного парадокса — низкая мощность теста Дики-Фуллера.

В качестве новой методологии выявления коинтегрированных пар активов было предложено тестировать остатки от регрессии, полученные с помощью теста Энгла-Грэнджера, на стационарность с помощью теста KPSS и объединять результаты данных тестов; а также объединять результаты теста Энгла-Грэнджера и теста KPSS как для прямой, так и для обратной регрессии.

Были проведены бэктесты на данных Московской биржи за 2017 год. По результатам бэктестов, среднегодовая доходность при использовании предложенной выше методологии идентификации коинтегрированных пар акций составила 22,72%. Таким образом, по сравнению с идентификацией коинтегрированных пар акций с помощью теста Энгла-Грэнджера, удалось увеличить среднегодовую доходность на 9,21%.

Альтернативный вариант интерпретации парадокса — не принимать на веру нулевую гипотезу, подтверждённую статистическим анализом. Парадигма тестирования нулевой гипотезы и дихотомия, предлагаемая такой парадигмой, даёт нам ложное ощущение знания рынка.

Когда я только начинала свои исследования, мне казалось, что можно взять рынок, засунуть его в «мясорубку» статистических тестов и на выходе получить отфильтрованные вкусные ряды. К сожалению, сейчас я вижу, что эта концепция статистического брутфорса не сработает.

Есть ли на рынке коинтеграция или нет — для меня этот вопрос остаётся открытым. Большие вопросы у меня остаются и к родоначальникам этой теории. Раньше у меня был какой-то трепет перез Западом и теми учёными, которые развивали финансовую математику в то время, когда в Советском Союзе эконометрика считалась продажной девкой буржуазии. Мне казалось, что мы очень сильно отстали, и где-то там в Европе и Америке сидят боги финансов, которые познали священный грааль истины.

Сейчас я понимаю, что европейские и американские учёные мало чем отличаются от наших, разница только в масштабе шарлатанства. Наши учёные сидят в замке из слоновой кости, пишут какую-то ахинею и получают за это гранты размером 500 тысяч рублей. На Западе сидят примерно такие же учёные в примерно таком же замке из слоновой кости, пишут примерно такую же ахинею и получают за это «нобелевки» и гранты размером 500 тысяч долларов. Вот и вся разница.

На данный момент у меня нет однозначного взгляда на предмет моего исследования. Апеллировать к тому, что «все хедж-фонды используют торговлю парами» я считаю неправильным, потому что большинство хедж-фондов точно так же прекрасно банкротится.

К сожалению, думать и принимать решения всегда приходится своей головой, особенно когда мы рискуем деньгами.