KeKin Jun 13 2012 at 13:36

Копулы — что это такое и с чем их есть

5 min

17K

Algorithms*Mathematics*

From sandbox

+34

Comments 16

Cancel Jun 13 2012 at 15:49

«Случайные переменные» как калька с английского не очень звучит, в русской традиции, всё таки, приняты «случайные величины».

KeKin Jun 13 2012 at 17:07

Поправил. Спасибо за замечание.

UFO landed and left these words here

KeKin Jun 13 2012 at 17:25

Насчет неизвестных распределений — можно использовать эмпирическое распределение вместе с бутстреппингом.
Что касается малых выборок — тут я абсолютно согласен, что копулы дают мало информации. Хотя тут можно использовать имеющиеся точки, как центры притяжений и рассчитывать плотность, как суперпозицию влияния наблюдаемых точек. Но это, конечно, очень натянуто…

KeKin Jun 13 2012 at 17:13

Согласен, что тау Кендалла и корреляция Спирмена похожи по сути на копулы.

da0c Jun 13 2012 at 18:35

То есть, если зависимость между X и Y не линейная, а, допустим, квадратичная, то есть X=Y^2, тогда корреляция Пирсона покажет отсутствие зависимости.

Если y = x^2, то корреляция между ними будет и достаточно высокая!

Как пример, код на matlab

x = rand(1,10);

y = x.^2;

corrcoef(x,y)



ans =

 1.0000 0.9846

 0.9846 1.0000

Т.е. в нашем случае коэффициент корреляции 0.9846, что говорит о наличии зависимости с очень большой степенью достоверности.

UFO landed and left these words here

da0c Jun 14 2012 at 15:16

Если сделать x с нулевым средним, то операция возведения в квадрат будет съедать минус, соответственно, да, зависимость будет портится, но если учесть знак исходной выборки — то все починится. Пример —

x = rand(1,1000);

mean(x)



ans =

 0.5001



x1 = x - mean(x);

corrcoef(x1, x1 .^ 2)

ans =

 1.0000 -0.0316

 -0.0316 1.0000



corrcoef(x1, sign(x1) * x1 .^ 2)

ans =

 1.0000 0.9672

 0.9672 1.0000



corrcoef(x1, x1 .^ 3)

ans =

 1.0000 0.9141

 0.9141 1.0000

Как видно в последнем примере — возведение в куб знак не съедает и величина корреляции остается существенное.

da0c Jun 14 2012 at 15:19

Строчку
corrcoef(x1, sign(x1) * x1 .^ 2)
понимать как
corrcoef(x1, sign(x1) .* x1 .^ 2)
не тот кусок скопировал

KeKin Jun 14 2012 at 20:50

Так никто и не говорит, что корреляция Пирсона совсем не работает. Просто есть ситуации, в которых она не отображает реальной зависимости. В областях, где используются копулы, случайные величины распределены по всей области значений (то есть бывают и отрицательными), а взаимосвязи между ними гораздо сложнее, чем просто квадратичные.

paralon Jun 14 2012 at 08:38

Занятненько.
Расскажите, где практически может применяться?

KeKin Jun 14 2012 at 09:00

В скором времени напишу о практическом применении. Могу сказать так — финансы, страхование.

Deesy Jun 14 2012 at 09:17

С удовольствием послушаю. Дело в том что сейчас работаю у большого страхового брокера и приходится как раз копаться и строить «свои велосипеды» на предмет сравнения данных за прошлый месяц (свежие поступившие) с данными за прошлое время. В отделе все еще используют 45 degree, что на мой взгляд совсем не правильно.

В общем жду ;-)

Спасибо

KeKin Jun 14 2012 at 09:20

Хм… А я устраиваюсь на работу к большому страховому брокеру :)

Deesy Jun 14 2012 at 09:22

я в AON. а вы?

KeKin Jun 14 2012 at 09:26

Он же, но в Базеле