Комментарии 6
отличной техникой для работы в средиземье, но не в крайнеземье.
Поясните, что это за термины? Или может кривой перевод?
Крайнеземье представляет собой крайнюю ситуацию, редкие, экстремальные события/наблюдения. К "крайнеземным" статистикам можно отнести, например, 1%, 5%, 95%, 99% процентили, потому что мы хотим оценить ситуацию на хвостах распределения. Туда же можно, в принципе, и куртозис отнести, так как на него в большей мере влияют хвосты распределения.
Средиземье же о том, где данные и модели ведут себя "типично" (предсказуемо). Например, мода, медиана, среднее, среднеквадратическое отклонение, коэффициент асимметрии и тд.
Надеюсь, что понятно объяснил)) Вообще, когда-то увидел именно эти термины и мне они показались весьма подходящими, хорошо описывают и передают суть, а альтернатив, как таковых, найти не смог. А статья не является переводом)
Странно, что не нарисовали эти доверительные интервалы на картинке. Картинка всегда нагляднее.
Вы не правы на счёт проблемы №2. Мы охватываем 63% исходной выборки в асимптотике по размеру исходной выборки, а не по количеству выборок. Такой результат может получиться только в случае, когда вероятность выбрать элемент из набора обратно пропорционален его размеру (см. второй замечательный предел). Если же делать бесконечное количество выборок фиксированной длины с фиксированной вероятностью взятия элемента, оказывается, что для каждого элемента вероятность быть выбранным хоть раз стремится к 1.
Абсолютно с Вами согласен на этот счет. Исправил. Изначально подразумевал контекст с одной бутстрап-выборкой, и хотел этим пунктом подвести мысль к тому, что мы не можем по бутстрап-выборкам оценивать крайние тенденции именно по этой причине, однако под конец рассудок видимо уплыл)
Большое спасибо за внимательность и за то, что прочитали статью до конца!
Бутстрап и доверительные интервалы: от теории к практике на Python