Комментарии 1
Спасибо за статью! Но:
В некоторых учебниках можно встретить теорему, которая описывает приближение распределений выборочных квантилей: (...)
Да, но как видно из формулы, она неприменима при p=0 и p=1. Соответственно, можно ожидать, что и при значениях, близких к 0/1, приближение нормальным распределением будет очень плохим (очень медленная сходимость по мере роста N)
Сразу отмечу, что приближение нормальным распределением не будет верным для квантилей уровней 0 и 1.
Да, тут нужно брать распределение экстремумов (max-min). Кстати, зря Вы его не привели... Ведь именно эти крайние случаи (точнее, близкие к ним) обычно наиболее интересны на практике (наряду с квантилем 0.5, разумеется). Та же оценка значимости полностью лежит вблизи p=0/1, и т.д. Там аппроксимация нормальным распределением выглядит очень противоестественно, на мой вкус, т.к. в предельном случае точного равенства оно (нормальное распределение) принципиально отказывается работать. А значит и движение к этому пределу (по мере все более близкого к нему приближения) будет сопровождаться проблемами (скорость сходимости упадет в ноль и т.д.).
Я когда-то копал в этом направлении Большева и Смирнова [Таблицы математической статистики, 1983], но к ясному пониманию так и не пришел. Как от распределения квантилей прейти к распределению экстремальных значений? Был бы благодарен, если подскажете, на какие идеи можно тут опираться... Ну или хотя бы назовете те книжки, которые отличаются ясным изложением этого вопроса, на Ваш взгляд. Тот же Я.Галамбош [Асимптотическая теория экстремальных порядковых статистик. М.: Наука, 1984. 304с.] в меня тоже с трудом заходит... Еще мне как-то попалась работа Д.С.Кузнецова [Предельные теоремы для максимума случайных величин. Вестник МГУ, сер. Матем.механ., 2005, N3, с.6-9], но он какие-то частности разбирает. А что посоветуете почитать для формирования "базы", т.е. более-менее системное изложение основ, но простым языком ("для чайников")?
.
Для квантиля уровня 0.9, квантилей по краям (0.01, 0.99 и подобные), так же как и для оных подальше от медианы, ситуация одинакова – нормальное распределение начинает неплохо приближать распределение квантиля при .
Вам не кажется, что последнее утверждение (в части 0.01 и 0.99) немного противоречит двум первым? Я не оспариваю этот вывод, но как-то очень сложно поверить, что для медианы достаточно N=30, а для квантиля 0.99 - всего лишь в три раза больше. Навскидку, пропорция должна быть примерно такой же, как количество данных в "хвостах" квантиля. Если для медианы это 50%, то для квантиля 0.99 в "хвосте" окажется 1% от мощности выборки. То есть, на два порядка меньше. Соответственно, вместо 30 точек такое же качество аппроксимации должно получаться не при 100 значениях в выборке, а примерно при 1000? Если, конечно, мое предположение о линейной пропорции правильное.
Если Вы интересовались этим вопросом, можете привести более точные утверждения про квантили, близкие к 0/1? Какая там будет асимптотика при аппроксимации? Ну и как от квантильных статистик плавно перейти к экстремальным....
Что за распределение у выборочных квантилей?