Comments 76
100% людей, которые пробовали огурцы, не прожили более 150 лет.
Это называется систематической ошибкой отбора.
Я просто оставлю это здесь.
http://hpmor.com или http://hpmor.ru/
Начал читать… И сразу диссонанс словил.
ПРофессор, якобы приверженец научного подхода, которые отрицает существование чего-то, потому что оно противоречит его пониманию мира? ЛОЛ. Это не научный подход.
Сейчас появись магия — ученые не закроют глаза и не убегут в страхе, утверждая что такого быть не может.
А от ец Гарри из этой книге похоже именно так и поступит.
Кстати насколько я помню в hpmor папа Гарри вполне себе согласился отпустить сына несмотря на своё профзаболевание.
Во-первых, не все профессора действительно понимают что такое научный подход (я лично видел по меньшей мере троих непонимающих).
Во-вторых, пришедшее письмо — еще не доказательство существования магии. Как говорится, экстраординарные утверждения требуют экстраординарных доказательств. Вы хоть до встречи с МакГонагалл там дочитали?
В-третьих, самому профессору выбора убегать или исследовать никто и не давал. Исследованиями магии с позиций научного подхода может заняться только Гарри — и занимается.
PS вы правда думаете, что так легко написать комментарий за 4 минуты?
2. Речь не о том, что нет доказательств. Речь об отрабасывании возможных путей для выяснения. Да еще и пасынку: «Ты что проверять собрался? Ты что, допускаешь возможность?»
Меня вот это «допускаешь» смущает. Все нормальные ученые которых я видел — допускают возможность всего чего угодно. Просто не считают вероятность ряда событиями достаточной, чтобы на них внимание обращать. Но уверен, если появится повод — они обратят внимание. У семьи Гарри повод обратить внимание 100% есть.
3. А я не говорю о его выборе. Я говорю о его отношении к выбору пасынка. Отношение: Ты лузер, если начал проверять то, во что я не верю.
Своим образованием Гарри обязан книгам в отцовской библиотеке. Главное что сделал приемный отец — это научил их читать и любить.
Отношение к выбору Гарри вы тоже как-то не так уловили. Дело не в вере, ему просто в тот момент важнее переспорить жену чем принять правильное решение.
Мне пришлось пройти некоторые моменты по три раза, прежде чем я убедился, что все ключи к решениям были изложены, и изложены корректно.
важно то что вы претендуя на разумность сводите спектр допустимых суждений человека к стереотипу созданному в вашем разуме, но более всего досадно что вы этот стереотип пытаетесь навязать окружающим, а за такое не только минус получить можно…
Начало характеризует отца как не умного.
В книге последователем научного подхода является сам Гарри, но не его отец. Своего отца он характеризует так:
отец наверняка смог бы меня переспорить, если бы попытался, а не использовал свой опыт и интеллект главным образом на то, чтобы находить всё новые причины не менять свои убеждения.
Полагаю, это шпилька в сторону профессоров (да и не толко профессоров) утративших критичный взгляд на вещи, сделав выбор в пользу своего устоявшегося видения картины мира.
Заметим, что если P(B)=0, то вне зависимости от P(Е) P(B|E) останется нулем. Отсюда следует, что упертых нельзя переубедить, а также интересный ответ на ВСЕ диспуты между верующими и атеистами (равно как и всеми остальными, кто не рассматривает противоположную точку зрения) — они, к сожалению, бесполезны. Убедить можно только сомневающихся.
(PS: Если P(E)=1, а P(B)=0, возникает разрыв шаблона.)
Нет, не возникает. Более того, свидетельство с P(E)=1 не несет никакой информации, а потому не может вызвать разрыв шаблона.
Ситуацию "разрыв шаблона" я бы скорее описал как P(E | B) = 0.
А что здесь разрывошаблонного? Вероятность свидетельства при условии истинности теории равна 0, проще говоря, теория утверждает: "Такого не бывает". Если "такое" всё-таки случилось, то теория неверна, так и получается при P(E|B) = 0, P(B|E) тоже будет 0, по-моему, всё логично.
Хмм. Типичный диалог верующего с атеистом вертится вокруг фразы "Бог есть" (B). Для атеиста P(B)=0. Это его теория или убеждение. Далее, верующий приводит "свидетельство" Е, скажем, объект "Туринская плащаница". Вопрос, я правильно обозначил его как Е, или Е в данном конкретном случае будет утверждением вроде "Туринская плащаница содержит нерукотворное изображение, созданное божественным вмешательством, следовательно, Бог есть"? Если неправильно, то P(E)<1, строго говоря. Утверждение "Туринская плащаница есть", будет иметь P(E)=1, так как её существование можно проверить. Но такое утверждение не является прямым свидетельством теории (В).
Насчет разрыва шаблона — поправка правильная, в моем случае тогда правильно инвертировать B (иначе P(E|0) не имеет нормального смысла, нельзя определить условную вероятность при нулевой вероятности условия). Получаем P(notB)=1, P(E|notB)=0, т.е. то же, что у вас. (Хорошая штука бинарная логика, если двумя разными путями получен один результат, значит, он верен в рамках использованного мат.аппарата. Фуух)
Вообще-то условная вероятность при нулевой вероятности условия замечательно определяется. Например, когда оказываются взаимосвязаны дискретная случайная величина и непрерывная. Это во-первых.
А во-вторых, смысл условных вероятностей заключается как раз в том, что их зачастую можно вычислить не через определение, а альтернативными способами.
Ну и всё же:
Вроде это из психологии и вроде название состоит из двойной фамилии… Никак не могу вспомнить и нагуглить…
p.s. Точность теста же дана после одного раза его прохождения.
Грубо говоря, даже на 90% надежных системах нужна минимум 4х проверка для подтверждения Положительного результата.
Т.е. допустим, у вас есть некоторая теория А, при истинности которой со 100% вероятностью наступает некое следствие Б. Так вот теорема Байеса говорит вам, что если вы в процессе иследований встретили Б, то это еще не значит, что теория А верна, т.к. к Б могло привести нечто другое.
Пример:
Контекст — теорема Пифагора доказана и верна.
Теория А — все треугольники прямоугольные.
Следствие Б — если в треугольнике две меньшие стороны равны 3 и 4 метра, то третья сторона равна 5.
В процессе иследований вы берете произвольный треугольник с двумя меньшими сторонами 3 и 4 метра, измеряете большую сторону у треугольника, и её длина оказывается равна 5 метрам.
Теорема Байеса предостерегает вас от вывода, что наблюдение следствия Б (стороны 3, 4 и 5) доказывает вашу теорию (все треугольники прямоугольные). И говорит вам: «А ты уверен, что при ложности твоей теории А следствие Б не могло бы произойти?»
В первом случае за 100% берутся больные люди. То есть если тестировать только людей, которые точно больны, то тест ошибается только в 1% случаев. Во втором 100% вообще всех людей (и здоровых, и больных), тогда тест ошибается в 50% случаев.
То есть любой медицинский тест который обещает точность 99% (как правило меньше) бесполезен? Ведь каждый раз проверяя обычных людей тест будет давать 50% шанс. Раз проверился — болен, второй раз — не болен, третий раз снова болен, и так до бесконечности. :))
1)Каждый сотый болен раком
2)точность теста 99%.
Допустим раком болен каждый тысячный, а точность по прежнему 99%, тогда при положительном тесте вероятность что вы больны = 9%
0.001*0.99/(0.01*0.999+0.01*0.999) если я ничего не напутал, для меня это сюрприз конечно), повторный тест позволит либо апровегнуть результа предыдущего, либо увеличить вероятность что он все же верен.
Нет, не так, и я не совсем правильно написал. Тест ошибается в 50% не всех случаев, а только в 50% от случаев, когда результат теста положительный.
Грубо говоря, возьмём 100 человек (100%) и протестируем. 1 из них болен (1% больных), ему тест наверняка покажет, что он больной (вероятность ошибки всего 1%). Остается 99 здоровых. Одному из них тест тоже покажет, что он больной (1% от 99 — чуть меньше 1, но не принципиально), хотя он здоров. Таким образом, имеем 2 человека, которым тест показал, что они больные, но болен из них только 1. У каждого из них всего 50% шанс, что именно он больной.
Так что польза от теста вполне практическая. Если тест показал отрицательный результат, то человек 99% здоров. Если результат положительный, то паниковать рано (вероятность всего 50%), но перепровериться надо, второй тест даст однозначный ответ — так как человек уже не в 1%, а аж 50% группе риска, вторая ошибка очень маловероятна.
В ситуации, когда возможна систематическая ошибка, повторные проверки делаются по другой методике.
Естественно, это упрощённый пример для понимания сути теоремы, в нём много чего не учитывается.
p.s. Эргодичность, в принципе, неплохо проверяется: берем у 100 человек 100 анализов. Если распределение ошибки внутри выборки по каждому пациенту совпадает с распределением между пациентами, то все хорошо.
p.p.s. все еще остается шанс, что есть какие-то уникумы 1 на миллион, но шанс их наличия примерно известен, и можно внести в формулу рассчета по теореме нужную поправку.
p.p.p.s.
тогда тест останется ложноположительным, проведите вы его хоть 100 раз подрядРечь идет только о вероятности, а в указанном примере она никогда не будет строго равна единице.
Если взять случайного человека из группы риска в 1% проходить тест с ошибкой первого и второго рода 1%, положительный результат будет верен с вероятностью 50%.
Не стоит применять эти расчеты в жизни, в них не учитывается, что анализы сдают не случайные люди, а те, в отношении кого уже имеются подозрения, и там вероятность ложного срабатывания будет меньше, т.к. в выборке будет значительно больший процент больных.
Pположительногорезультата = 0.01(вероятность болезни)*0.99 (вероятность правильного определения) + 0.99 (вероятность здоровья)*(1-0.99)(вероятность ошибки)
Слагаемые равны, значит, если у кого-то положительный результат, с вероятностью 50% результат ложноположительный.
где первое вероятность истинно положительного результата теста, а второе — ложно положительного.
Тогда подсчет P(E) становится более очевидным. Это общий случай или только для данного примера подходит?
вопрос остается: Это общий случай или только для данного примера подходит?
Очень хорошо изложена суть теоремы. Добавить доказательство (тем боле что оно занимает 2 строчки) — и это была бы просто идеальная статья.
P.S. Не в порядке замечания переводчику.
Формула не дописана. Давайте проведем мысленный эксперимент. Возьмем 1000 человек и проведем им 99% тест на рак, у 10 человек тест даст положительный результат — может ли рак на самом деле быть у 5 человек (по статье 50%), а у 5 тест даст ложный результат? Для ответа на этот вопрос нужно знать — а сколько вообще человек из 1000 на самом деле болеют раком (это и есть ключевой параметр в теореме, о котором в статье ни слова)
Если раком болеет 1 человек из 10 000, то при проверке 10 000 человек тест даст 100 положительных результатов, хотя мы знаем что на самом деле болеет только 1 (т.е. вероятность что вы больны около 1%).
Если раком болеет 1 из 200, то при проверке 200 человек — тест даст 2 положительных результата и вероятность что у вас рак действительно будет около 50%.
В приведенном в тексте примере утверждается: «Да, ваш отличный тест с 99%-й точностью выдаёт столько же ложных срабатываний, сколько и истинных».
То есть, «столько же» — это в абсолютном выражении?
Ну, то есть: была группа из десяти тысяч испытуемых, из которых сто больны раком. Сделали десять тысяч тестов, выявили девяносто девять из ста больных людей. Среди оставшихся 9900 здоровых людей у девяноста девяти тест выдал ложно-положительный результат.
А затем делается мощный вывод: здесь 99, там 99, 99/198 = 0,5, значит, вероятность наличия болезни 0,5. Если приверженцы теоремы так оценивают вероятность события, то это — адовая казуистика.
Весь практический смысл — не исключать вариантов, для которых нет ни подтверждения, ни опровержения. О чем, в общем-то, и говорит автор.
P.S. Статья интересная, спасибо!
А затем делается мощный вывод: здесь 99, там 99, 99/198 = 0,5, значит, вероятность наличия болезни 0,5. Если приверженцы теоремы так оценивают вероятность события, то это — адовая казуистика.
Я не понял, что именно вам не нравится? Плюс, если теорема доказана, то нет смысла говорить о «приверженцах».
Согласен с комментарием xMushroom ниже, что иная формулировка фразы сделала бы ее понятнее.
Правильно это должно было звучать:
Да, ваш отличный тест с 99%-й точностью выдаёт столько же ложных положительных срабатываний, сколько и истинных положительных.
Знание = сумма последовательных уверенностей, (С) если не ошибаюсь Веды
Я вообще не понимаю, почему этот тест назван «на 99% надежным». Это в чистом виде маркетинговый ход. И цифры там подобраны так, что путаница в голове — где логическая зависимость, а где численное равенство.
Указал наличие болезни
Тест_№ Больные(Б%) Здоровые(Зд%)
1 99% 1.0% — здесь сумма больных со здоровыми равна 100%
2 99% 2.7% — здесь сумма Б%+Зд% не равна 100%
3 99% 3.3% — здесь сумма Б%+Зд% не равна 100%
Я не понимаю, по какому критерию тест №1 был назван «на 90% надежным». Его численные характеристики — Б% («указал наличие болезни у больного») и Зд%(«ложно указал наличие болезни у здорового»).
Сумма Б%+Зд% не должна быть равна 100%!!! Их нельзя складывать, это сложение сапогов с
пирогами! И находить какой-то общий "хэш" для срабатывания по больным и здоровым тоже нельзя, будет искажение информации. Только срабатывания по больным отдельно и по здоровым отдельно.
Складывать нельзя, потому что результат теста — косвенный признак, а не сама болезнь. Сложение же подразумевает идентичность единиц измерения (признаков), и для этого тест ВСЕГДА должен работать верно (типа тот 1% «здоровых» людей на самом деле больны, а 1% «больных» людей на самом деле здоровы). В нашем случае это априори не так…
Я вообще не понимаю, почему этот тест назван «на 99% надежным». Это в чистом виде маркетинговый ход.
Как по-вашему следует назвать тест, который из 100 проверок в среднем ошибается один раз?
И в чем заключается «маркетинговый ход», если этого теста не существует в природе и он вообще не продается, а был выдуман исключительно для примера?
Допустим, ваш тест надёжен на 99%. То есть, 99 из 100 человек, больных раком, получат положительный результат, и 99 здоровых людей из 100 получат отрицательный результат.
Вроде тут никто ничего не складывал. Просто для простоты примера в обоих направлениях взяты одинаковые цифры, что и позволило (опять же, для простоты) обозвать тест как в общем на 99% надежный. По-моему, вполне разумное упрощение, пример и так не слишком простой.
Там ещё и вероятность здоровья тоже взята 99%, но вы же понимаете, что это чисто совпадение (взяли красивые цифры для наглядности), и не говорит о взаимозависимости этих величин?
их действительно не стоит складывать, потому что у нас могут быть разные проценты надёжности для положительного и отрицательного результата (например бывают тесты которые вообще никогда не дают ложноотрицательных результатов) и нам правильнее указывать обе эти цифры отдельно(и когда это важно их так и указывают). тем не менее мы спокойно можем "сложить" результаты для получения некоторой общей надёжности всего теста если такой показатель нам удобнее.
Теорема Байеса – это лишь экспресс-метод подсчёта вероятностной обоснованности нового на основе статически имеющихся доказательств свидетельств:
«мнение о выборе нового с обоснованностью есть функция выбора вероятности доказательств суждения из N-матриц: [i-изначальное мнение / i-свидетельства]
По такому же сравнительному принципу работают сейчас многие нейронные сети, отсекая заранее ненужный перебор вероятностей, а также по похожему способу работают скалярные микросхемы.
В итоге результат получают более быстро, но не значит, что точнее. А последующий цикл подбора получается более эффективным.
Здравый смысл в этом методе есть, так как любые отдельные субъективные свидетельства могут быть изменчивы, то только их динамический массив в текущий момент времени дает объективную картину мира. Это и нужно принципу эволюции.
Но это всё усредняет мышление, так как по такому принципу люди, доказывающие теорему Байеса – ну просто «ботаны», не достойные внимания, так как они скрупулёзно доказывающие то, чего нет.
Так как:
«Достоверность вашего убеждения зависит от того, насколько сильно общие убеждения объясняет существующие факты, а чем больше вариантов такого объяснения фактов, тем менее достоверно ваше личное убеждение».
Закончим подсчёты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099, и получим 0,5.
Если вы поделите 0,0198 на 0,0099, то получится 2, а не 0,5. Здесь аргументы перепутаны местами.
в работах философа Кёртиса Брауна и специалистов по информатике Оскара Бонилла и Калида Азада
Что это за авторы, и какие работы имеются в виду?
Теорема Байеса: из-за чего весь сыр-бор?