Как сравнивать распределения. От визуализации до статистических тестов / Комментарии / Хабр

lea 4 июл 2022 в 23:27

Пермутационный тест даёт нам p-значение 0,053, а это подразумевает слабое отклонение нулевой гипотезы на уровне 5%.

В примере сгенерированы не все перестановки, а 1000 случайных. Полученное p-value является случайной величиной и гораздо разумнее смотреть на доверительные интервалы для него.

akhalat 5 июл 2022 в 07:28

Так лихо бахнули двувыборочный T-тест после того как сами же обговорили, что выборки имеют разные дисперссии. А в этом случае по хорошему надо хотя бы сделать несколько замечаний.
Во-первых, T-тест доказан только для выборок с одинаковой дисперсией. Чтобы в этом удостовериться сперва надо сделать тест Фишера, он для этого предназначен.
Если дисперсии неизвестные и отличаются, то точного значения статистики нет (проблема Беренса-Фишера). В этом случае можно лишь с оговорками полагаться на приближения.
Но для этого надо хотя бы убедиться, что выборка с бОльшей дисперсией по размеру превосходит «узкую» выборку (а т.к. контроль зачастую сильно превосходит пилот размером, то обычно это не так).
Надеюсь эти и другие тонкости рассказываются в рекламируемом курсе.

trashaque 6 июл 2022 в 00:13

Манн - Витни не проверяет равенство медиан. Он проверяет равенство средних рангов по выборкам

НЛО прилетело и опубликовало эту надпись здесь