alisey 11 июл 2010 в 22:13

Ошибки в интерпретации экспериментов

1 мин

876

Научно-популярное

+44

Комментарии 26

НЛО прилетело и опубликовало эту надпись здесь

artemlight 11 июл 2010 в 22:42

Однозначно, хотим.

alisey 11 июл 2010 в 22:47

Я бы с радостью, только не все там понимаю. Надо подучить базовую статистику.

vizzzor 12 июл 2010 в 11:15

хотим сканировать Черновецкого!

max7 11 июл 2010 в 22:44

Вот очень интересное выступление на очень близкую тему

Почему мы мыслим как первобытные люди

Наше сознание противится ключевой идее науки: все можно рассчитать и проверить по теории вероятности, то есть все объясняет статистика. Как поймать себя на иррациональном мышлении? Почему мы ловимся на недостоверную информацию? Рассказывает математик из Оксфорда

max7 12 июл 2010 в 01:03

Хочу поделится ещё несколькими ссылками:

Уверен всем понравится: О том, что цифры знают о мире все (Ханс Рослинг, Чуть более подробно ) — яркий пример работы с данными, инфориацией.
О заговоре производителей детских автокресел
Миллион и триста тысяч причин изобрести одноразовый шприц заново
… и другие

VasilioRuzanni 12 июл 2010 в 03:42

Ох, круть. Спасибо за ссылки!

esten 11 июл 2010 в 23:29

Теория вероятностей…
В этом отрывке обыгрывается парадокс Байеса, если я не ошибаюсь.
Переводить всю статью не обязательно. Для тех, кого она заинтересовала, существуют книги:
1) Секей Г., «Парадоксы в теории вероятностей и математической статистике».
2) Кигайгородский А., «Невероятно — не факт».

Yanovsky 12 июл 2010 в 02:00

>Но когда дело доходит до Владимира Вольфовича, загорается надпись, что он марсианин. Вы поверите устройству?
ДА!!!

+14

Carry 12 июл 2010 в 02:16

Если я правильно помню, то это перемножение вероятностей.
Несмотря на это — я тоже марсианин (ну, или с другой планеты какой-нибудь звездной системы)

qmax 12 июл 2010 в 02:32

а можно тоже самое, но в цифирях?

qmax 12 июл 2010 в 02:32

всмысле — формулы! формулы!
ну или слайды хотябы.

math 12 июл 2010 в 03:52

ekzo 12 июл 2010 в 06:01

ru.wikipedia.org/wiki/Теорема_Байеса

obiwanus 12 июл 2010 в 08:34

Вам не кажется, что пример про врача не совсем корректный? Помимо теста с вероятностью 99%, у врача есть еще данные о симптомах и данные о том, что здоровый человек из того миллиона в больницу не придет.

Так что вероятность того, что Николай болен, гораздо больше 0,01%.

alisey 12 июл 2010 в 13:01

У врача нет данных о симптомах, это профилактический тест, как флюорография.

TimTowdy 12 июл 2010 в 14:32

Профилактические тесты обычно не проводят для болезней, которыми болеет один из миллиона, потому что вред от этих тестов будет больше, чем в случае, если просто дать этому одному человеку болеть без лечения.
Но в целом с тезисом статьи согласен, если у нас есть болезнь, которой болеет один из миллиона, то тест, точность которого менее чем 99.9999% бесполезен, потому что такой точностью обладает псевдотест, который будет любому человеку говорить что он здоров.

dovg 12 июл 2010 в 12:52

Мне показалось, что тут происходит подмена понятий.

В случае с марсианами мы делаем сплошную выборку, причем заведомо не репрезентативную (т.к. мы подозреваем, что среди депутатов нет ни одного марсианина, ага). А в случае с васкулитом мы обследуем только одного больного, у которого заведомо есть подозрение на васкулит.

В вышеупомянутой теореме байеса речь идет о зависимых событиях. А у нас вроде как измерения происходят независимо.

dovg 12 июл 2010 в 12:56

Про репрезентативные ошибки:
Искать марсиан среди депутатов — это тоже самое, что мерять интеллект отдельно взятой страны, проводя исследование в дурдоме :)

alisey 12 июл 2010 в 12:57

Вы несогласны с тем, что у больного вероятность васкулита 0.01% (на основе имеющихся данных) или с тем, что пример с марсианами — это пример из той же серии?

piatachki 13 июл 2010 в 12:49

Вероятность васкулита — 99%
Какая разница, какова частота этого заболевания, если эти два параметра ну никак друг на друга не влияют.

Вот представьте — мы таким образом нашли больного. По вашему — вероятность «правильности» 0.01%. Нашли следующего из другой миллионной группы больного. Абсолютно независимые события. Вероятность — по-вашему — опять 0.01%. И так пока наши группы-милионники не закончатся. В итоге вероятность определения тестом больного в группе всегда 0.01%. Это не соотносится с данностью о 99% барьере верности теста.

Чушь глубокую, в общем, вы пишете.

piatachki 13 июл 2010 в 12:55

ЗЫ. Максимум, что мы можем сказать — погрешность теста слишком высока для практического массового применения. Выше статистической погрешности по заболеваемости. Как раз тема про дупутатовю. То есть он в принципе для выявления больных из массы неприменим.

Но для подтверждения диагноза конкретного человека — вполне себе. И в случае с одним человеком — вероятность 99% вполне себе хороший показатель для подтверждения диагноза.

Или я как-то особо туплю?

alisey 13 июл 2010 в 22:09

Да. Попробуйте проследовать логике:

1) Есть миллион людей, вы каждого проверяете на васкулит. Сколько примерно человек будет с положительным результатом теста? (Не обязательно больных, просто с положительным результатом) Ответ: примерно 10 000.

2) Сколько из этих 10 000 действительно будут больны васкулитом? Примерно 1 человек. Потому что из миллиона лишь один болен васкулитом, и он вероятно попал в выборку.

3) Из этой группы в 10 000 подозреваемых берем одного случайного (Николая). Ключевой момент. Какова вероятность того, что он тот единственный больной? 1 к 10 000, то есть 0,01%

4) Теперь забываем про весь миллион подопытных, они действительно никак на Николая не влияют. Но тот факт, что мы забыли про остальных никак не может изменить вероятность васкулита у Николая, правильно? И она по прежнему 0,01%

Это чисто математическая задача, никаких допущений здесь делать не нужно. Ни о целесообразности теста, ни о симптомах заболевания, ни о квалицикации врача. Это все антураж, чтобы приблизить ситуацию к жизни.

Теперь по вашему сообщению:
> Вот представьте — мы таким образом нашли больного. По вашему — вероятность «правильности» 0.01%.

Нет, мы нашли не одного, а 10 000 подозреваемых. Вероятность, что конкретно взятый нами экземпляр из этой группы в 10 000 болен составляет 0,01%, это прекрасно соотносится с 99% точностью теста. Парадокс состоит в том, что люди это интуитивно не понимают, и говорят: «Ну как же может быть 0,01%, если ясно написано, что 99%, ну полная чушь».

> Максимум, что мы можем сказать — погрешность теста слишком высока для практического массового применения. Выше статистической погрешности по заболеваемости. Как раз тема про дупутатовю. То есть он в принципе для выявления больных из массы неприменим.

Это правильно, непригоден.

> Но для подтверждения диагноза конкретного человека — вполне себе. И в случае с одним человеком — вероятность 99% вполне себе хороший показатель для подтверждения диагноза.

А это будет правильно только в том случае, если у человека уже наблюдаются симтомы заболевания, и нам нужно только определиться васкулит это или гонорея.

Если объяснение не помогло, я не прошу вас принимать все это на веру. Но имейте в виду, что со мной в этом вопросе согласен автор оринигальной статьи — глава направления исследований в Google и бывший сотрудник NASA, человек, прекрасно знающий математику. Стоит быть аккуратнее, называя это чушью.

Насчет практической пользы понимания таких вещей: выше привели пример, когда из-за неправильного расчета вероятности событий женщину посадили в тюрьму за убийство ее детей. Сколько ложных диагнозов было поставлено из-за такой же ошибки я даже предполагать не стану.

piatachki 13 июл 2010 в 23:14

Вы правы. Суммарная вероятность независимых события определяется их произведением. Из-за драматически низкой вероятности болезни одного человека (одна миллионная) общая вероятность P(болезнь чеорвека) и P(провильное срабатывание маркера) равна 0,00000099. То есть для нормального использования маркера его точность нужно увеличить до 99,999999%

Ухожу посыпать голову пеплом.

ekzo 13 июл 2010 в 22:12

как то особо тупите. мы ищем вероятность маловероятной болезни при условии позитивного теста. последнее предложение из оригинального топика раскрывает суть.

Zebr 12 июл 2010 в 13:47

Из статьи следуют несколько выводов:

Вывод 1: Оборудование для диагностики васкулита не будет пользоваться спросом среди обычных потребителей.
Вывод 2: Заниматься поиском иголки в стогу сена — неблагодарное занятие. Лучше сидеть в больнице и дожидаться пока пациенты сами придут (или их привезут).

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Ошибки в интерпретации экспериментов

Комментарии 26

Публикации

Истории