Как стать автором
Обновить

Комментарии 9

Ничего не понял.

Обратите внимание, что когда мы рассчитали все Z-баллы для каждого времени доставки пиццы и построили стандартную кривую нормального распределения

Где все эти расчёты? Как построили кривую?

Теперь, когда мы собрали несколько выборочных данных о времени доставки, мы выполнили расчет и обнаружили, что среднее время доставки больше на 10 минут с p-значением 0,03.

Где данные? Где расчёт? От куда все эти числа взялись?

Начиналось всё хорошо — лёгкий пример с пиццерией, понятные гипотезы с конкретными числами. А потом понеслось: пачка абстрактных определений, формулы с одними буквами, ни одного примера использования этих формул с подстановкой чисел. И в итоге: «Пиццерия нам врёт, потому что p=0.03 и это меньше чем 0.05».

А что бы понять нужно записаться на платный онлайн-курс ;)

Тэг: перевод.
Да, я это заметил. Мои вопросы были риторическими, т.к. очевидно, что автор на них не ответит.
Переводчик видимо специалист в этой области, и ему было не очевидно, что этот материал плоховато справляется с «объяснением на пальцах» для начинающих.
Скажем так, материал написан для западного читателя. Которому, чем проще, тем лучше. И лучше вообще без формул.

Вот что-то эти два утверждения режут мне слух и не кажутся тождественными.


Представьте, что мы живем в мире, где среднее время доставки всегда составляет 30 минут или меньше


Поскольку мы всегда верили пиццерии, что она может выполнить свое обещание доставить пиццу за 30 минут или меньше


Поэтому либо все же либо переводчик не сильно разбирается в теме, либо автор.
И что-то мне кажется, что P(налажал переводчик) > P(налажал автор | переводчик разбирающийся в теме выбрал материал с ошибкой)
В принципе здесь и нулевая гипотеза и альтернативная. Можно попробовать посчитать p значение :)

Ох, пожалуй я "за википедию":


  1. Статистическая гипотеза = предположение о виде распределения и свойствах случайной величины, которое можно подтвердить или опровергнуть применением статистических методов к данным выборки.
  2. p-значения полезны при оценке того, насколько несовместимы данные с некоторой статистической гипотезой.
  3. p-значения могут использоваться в качестве индикатора случайной ошибки в результатах экспериментов/измерений/выборок с известной/доказанной статистической гипотезой.

Чем больше "замеров" и чем лучше они "ложатся" на статистическую гипотезу, тем меньше p-значение в диапазоне от 1 до 0.
Однако, нулевое значение недостижимо и свидетельствует о принципиальной проблеме: величина не случайна, ошибки в расчетах и т.п.
Аналогично с p-value ≥ 0.5, причём 1 можно трактовать как "полный туман/неизвестность", включая факт наличия самого p-значения.

Если бы я не знал, что такое p-value, я бы не понял из этой статьи ничего. Более того, даже понимая смысл p-value, мне было очень трудно следовать за скачущей аки горный козел мыслью автора.
Сам текст тоже очень трудно читается, много лишнего:
Наконец… Здесь мы говорим о р-значение!

Все предыдущие объяснения предназначены для того, чтобы подготовить почву и привести нас к этому P-значению. Нам нужен предыдущий контекст и шаги, чтобы понять это таинственное (на самом деле не столь таинственное) р-значение и то, как оно может привести к нашим решениям для проверки гипотезы.

Если вы зашли так далеко, продолжайте читать. Потому что этот раздел — самая захватывающая часть из всех!

А мне понравилась статья. Я ничего не знала о p-value до прочтения статьи, но благодаря статье поняла по крайней мере концепцию, что он значит и для чего можно использовать. Спасибо автору)

Зарегистрируйтесь на Хабре , чтобы оставить комментарий