Комментарии 9
Небесполезно, обстоятельно, аккуратно. Но вопрос - только одного меня анноит написание "бутстреп" для bootstrap?! Который и в британском, и в американском английском произносится совершенно одинаково в обсуждаемом моменте, как [ˈbuːt.stræp], и "е" там нет совсем никак
Это особенность всего русскоязычного сообщества. Так удобней. Люди чаще видят слово, а не слышат. И произносят как могут, а не как надо. Надо смириться. Я забил на это, когда в доте тиммейты просили меня сделать "свап" на венге, а в университете просили написать "свап" для сортировки. А по факту "своп".
Так работают заимствования в русском языке. Например, пюрЕ или кафЕ
Да, но
> Бутстрэп (англ. bootstrap) в статистике — практический компьютерный метод исследования распределения статистик вероятностных распределений
и "667 тыс. результатов" для "бутстреп", которому сразу был найден синоним "бутстрэп"
и "616 тыс. результатов" для "бутстрап"
Что делает решения как минимум равнозначными
пюрЕ или кафЕ
Неудачные примеры, потому как источники - французские, и оба
purеe
сafе
на хвосте имеют тот же звук (и букву), что и русское заимствование, а у бутстрапа по тем же признакам - "а". Вот "словотворчество" и шокирует
Спасибо за статью!
Вопрос: почему мы стандартное отклонение в самом начале поделили на sqrt(n)? Как-то слишком низким получается стандартное отклонение. В формуле несмещенной оценки под корнем в знаменателе должно быть просто (n-1), а не n(n-1)?
В numpy – np.std(ddof=1)
для несмещенной оценки
@yorko, здравствуйте.
Потому что мы исследуем не стандартное отклонение выборки, как в вашем примере, а стандартное отклонение выборочного среднего. Дисперсия выборочного среднего в раз меньше дисперсии случайной величины.
соответственно стандартное отклонение будет в раз меньше
Спасибо за статьи в цикле аб тестов, обе полезные!
А можно ли использовать бутстреп вкупе со стратифицированным средним?
@Hadron_coll, здравствуйте.
Бутстреп и стратификация решают две разные задачи. С помощью стратификации мы снижаем дисперсию, что приводит к увеличению чувствительности тестов, а с помощью бутстрепа оцениваем стандартное отклонение и строим доверительные интервалы.
Да, эти методы могут использоваться вместе, но стоит обратить внимание, что если вы используете бутстреп для стратифицированной выборки, то и бутстрепить следует стратифицированно.
Спасибо за ответ.
Я руководствуюсь следующей логикой: бутстреп на шумных данных дает сильную разбежку и широкий доверительный интервал, и лучше как-то работать с распределением перед тем, как использовать бутстреп. При уменьшении дисперсии имеем сужение доверительного интервала, а значит, показатели бутстрепа улучшатся, если считать его на стратифицированном среднем по сравнению с обычным.
Бутстреп и А/Б тестирование