Pull to refresh

Comments 16

«Случайные переменные» как калька с английского не очень звучит, в русской традиции, всё таки, приняты «случайные величины».
Поправил. Спасибо за замечание.
UFO just landed and posted this here
Насчет неизвестных распределений — можно использовать эмпирическое распределение вместе с бутстреппингом.
Что касается малых выборок — тут я абсолютно согласен, что копулы дают мало информации. Хотя тут можно использовать имеющиеся точки, как центры притяжений и рассчитывать плотность, как суперпозицию влияния наблюдаемых точек. Но это, конечно, очень натянуто…
Согласен, что тау Кендалла и корреляция Спирмена похожи по сути на копулы.
То есть, если зависимость между X и Y не линейная, а, допустим, квадратичная, то есть X=Y^2, тогда корреляция Пирсона покажет отсутствие зависимости.

Если y = x^2, то корреляция между ними будет и достаточно высокая!

Как пример, код на matlab

x = rand(1,10);
y = x.^2;
corrcoef(x,y)

ans =
1.0000 0.9846
0.9846 1.0000

Т.е. в нашем случае коэффициент корреляции 0.9846, что говорит о наличии зависимости с очень большой степенью достоверности.
UFO just landed and posted this here
Если сделать x с нулевым средним, то операция возведения в квадрат будет съедать минус, соответственно, да, зависимость будет портится, но если учесть знак исходной выборки — то все починится. Пример —
x = rand(1,1000);
mean(x)

ans =
0.5001

x1 = x - mean(x);
corrcoef(x1, x1 .^ 2)
ans =
1.0000 -0.0316
-0.0316 1.0000

corrcoef(x1, sign(x1) * x1 .^ 2)
ans =
1.0000 0.9672
0.9672 1.0000

corrcoef(x1, x1 .^ 3)
ans =
1.0000 0.9141
0.9141 1.0000



Как видно в последнем примере — возведение в куб знак не съедает и величина корреляции остается существенное.
Строчку
corrcoef(x1, sign(x1) * x1 .^ 2)
понимать как
corrcoef(x1, sign(x1) .* x1 .^ 2)
не тот кусок скопировал
Так никто и не говорит, что корреляция Пирсона совсем не работает. Просто есть ситуации, в которых она не отображает реальной зависимости. В областях, где используются копулы, случайные величины распределены по всей области значений (то есть бывают и отрицательными), а взаимосвязи между ними гораздо сложнее, чем просто квадратичные.
Занятненько.
Расскажите, где практически может применяться?
В скором времени напишу о практическом применении. Могу сказать так — финансы, страхование.
С удовольствием послушаю. Дело в том что сейчас работаю у большого страхового брокера и приходится как раз копаться и строить «свои велосипеды» на предмет сравнения данных за прошлый месяц (свежие поступившие) с данными за прошлое время. В отделе все еще используют 45 degree, что на мой взгляд совсем не правильно.

В общем жду ;-)

Спасибо
Хм… А я устраиваюсь на работу к большому страховому брокеру :)
Он же, но в Базеле
Sign up to leave a comment.

Articles