Comments 3
t-тест не требует нормальности распределения самих данных, он требует нормальности распределения выборочных средних вокруг истинного среднего, если данных мало, то это выполняется только если сами распределения нормальные
В статье нет примеров вычислений, которые отвечают на вопрос: почему один критерий подходит лучше другого. Например, почему лучше использовать т-тест для анализа средних двух групп, а не бутстрап?
Ну бутстрап лучше использовать только в каких-то сложных случаях. Потому как интуитивно кажется, что он относительно медленно сходится и точно более вычислительно затратен.
А так кажется схема такая:
1. Т-тест для сравнения средних
2. Если есть частоты (т.е. данные дискретны, например продажи) - то хи2
2.1. Если частоты маленькие - точный тест Фишера
3. Если нужно найти есть ли разница между средними при множественном сравнении (хоть где-то) - то Анова.
4. Большие выбросы - Манн-Уитни
Вроде как-то так.
Как выбрать правильный стат тест для разных метрик