Pull to refresh
47
0
Анатолий Карпов @Anatoliy_Karpov

Пользователь

Send message
This fact explains why when we use a sample to estimate the mean squared error (or indeed the standard deviation) of a population, we divide the sums of squares by N — 1 rather than N alone" --Andy Field, Discovering Statistics Using IBM SPSS Statistics

Это довольно странно, N — 1 в выборочном стандартном отклонении возникает в результате нашей борьбы со смещенностью.
Я собственно в тексте об этом и говорю, просто неудачное обозначение ввел, подправил.
Да, конечно, должна быть выборочная оценка.
Да, согласен конечно, если подходить к задаче с ростом серьезно разумеется и выборка нужна больше и проверка допущений теста, тут просто для пример привел эту задачу.
Хорошее замечание! Действительно в знаменателе стоит выборочная sd, распределение которой может быть описано:


Но в процессе доказательства этого факта, мы сталкиваемся с n слагаемыми — для каждого наблюдения в выборке мы рассчитываем его квадрат отклонения от выборочного среднего. Но распределение этой суммы n слагаемых мы опишем распределение хи — квадрат с n — 1 степенью свободы.
Тут Вы конечно же правы, искать будем подтверждение именно альтернативной гипотезе! Собственно ничего не мешает, но это же пост не про оптимальный критерий работы с нечестными монетками, просто взял ее для примера, т.к. на двух исходах можно наглядно показать, почему несмотря на два слагаемых в формуле критерия мы используем распределение Хи — квадрат с df = 1.
не независимыми являются рассчитанные отклонения от ожидаемых частот для орла и решки
ну да, но в случае с монеткой или выборкой в t — тесте, это требование как и раз не выполняется.
Понял Вас, да тут с вами согласен, сам по себе верхний график с плотностью распределения — скорее просто эстетический. А вот уже нижний с доверительным интервалами показывает значимость различий.
При этом в примере с p < 0.05 все-таки заметно, что выборки скорее всего из разных распределений!)
Привет! А что значит не ассоциируется, значимые различия не обязательно должны сопровождаться очень большой разностью между самими средними значениями.
Да, тут с Вами согласен. Спасибо за замечание!
Но согласен с Вами, пожалуй, непараметрический критерий был бы здесь к месту!
Можно конечно и так, но критерий Фишера или критерий хи-квадрат все-таки используются для анализа таблиц сопряженности, т.е. в том случае, когда обе переменные номинативные. В примере же сравниваются два средних, что логичнее делать при помощи t-теста.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity