Как стать автором
Обновить

Бутстрап и доверительные интервалы: от теории к практике на Python

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров5K
Всего голосов 7: ↑7 и ↓0+11
Комментарии6

Комментарии 6

отличной техникой для работы в средиземье, но не в крайнеземье.

Поясните, что это за термины? Или может кривой перевод?

Крайнеземье представляет собой крайнюю ситуацию, редкие, экстремальные события/наблюдения. К "крайнеземным" статистикам можно отнести, например, 1%, 5%, 95%, 99% процентили, потому что мы хотим оценить ситуацию на хвостах распределения. Туда же можно, в принципе, и куртозис отнести, так как на него в большей мере влияют хвосты распределения.

Средиземье же о том, где данные и модели ведут себя "типично" (предсказуемо). Например, мода, медиана, среднее, среднеквадратическое отклонение, коэффициент асимметрии и тд.

Надеюсь, что понятно объяснил)) Вообще, когда-то увидел именно эти термины и мне они показались весьма подходящими, хорошо описывают и передают суть, а альтернатив, как таковых, найти не смог. А статья не является переводом)

Странно, что не нарисовали эти доверительные интервалы на картинке. Картинка всегда нагляднее.

Нет предела совершенству) Посчитал, что тут всего три доверительных интервала получилось и количественно они очень хорошо понятны и сопоставляются с тем, что было описано в теории. Но вообще, согласен, визуальные иллюстрации воспринимаются по-легче, может добавлю к статье. Спасибо за предложение!

Вы не правы на счёт проблемы №2. Мы охватываем 63% исходной выборки в асимптотике по размеру исходной выборки, а не по количеству выборок. Такой результат может получиться только в случае, когда вероятность выбрать элемент из набора обратно пропорционален его размеру (см. второй замечательный предел). Если же делать бесконечное количество выборок фиксированной длины с фиксированной вероятностью взятия элемента, оказывается, что для каждого элемента вероятность быть выбранным хоть раз стремится к 1.

Абсолютно с Вами согласен на этот счет. Исправил. Изначально подразумевал контекст с одной бутстрап-выборкой, и хотел этим пунктом подвести мысль к тому, что мы не можем по бутстрап-выборкам оценивать крайние тенденции именно по этой причине, однако под конец рассудок видимо уплыл)

Большое спасибо за внимательность и за то, что прочитали статью до конца!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории