Pull to refresh

Comments 76

Чем больше я знаю, тем больше неизвестного. 100% людей, которые пробовали огурцы, не прожили более 150 лет. И самое любимое: «Иногда кругозор человека сужается до одной точки, это и есть точка зрения» (Конфуций). Я к чему. Заметил следующее: чем больше человек знает, тем он менее категовичен и склонен спорить. Ну а теперь для меня данная статья — ещё одно доказательство этого утверждения. Спасибо, прочёл с удовольствием.
Полностью согласен! Тем более, что и про «точки» и «огурцы» тоже люблю приводить примеры. ))) А насчет "… менее категоричен...", так этому есть объяснение — Эффект Даннинга-Крюгера. У дурака на все есть 1-2 готовых рецепта, а умному надо на основе анализа конкретных исходных данных выбрать наиболее вероятный вариант… )))
100% людей, которые пробовали огурцы, не прожили более 150 лет.

Это называется систематической ошибкой отбора.

А что будет, когда журналисты доберутся до теоремы Ферма…
Скорее, до весёлой фермы они доберутся
Хм. Заинтересовался…
Начал читать… И сразу диссонанс словил.
ПРофессор, якобы приверженец научного подхода, которые отрицает существование чего-то, потому что оно противоречит его пониманию мира? ЛОЛ. Это не научный подход.
Сейчас появись магия — ученые не закроют глаза и не убегут в страхе, утверждая что такого быть не может.
А от ец Гарри из этой книге похоже именно так и поступит.
Добрый день. Я так понимаю, вы отец Гарри? А может обоснуете свой минус, ну так. ради интереса?
большинство людей, а особенно профессора категоричны и уверены в своём единственно правильном понимании мира. У профессоров твердолобость это вообще профзаболевание, не излучающий единственно-правильное мнения профессор, не есть авторитет для студента, не может эффективно передать знание. Он ведь не уверен что прав, кто его будет слушать.
Кстати насколько я помню в hpmor папа Гарри вполне себе согласился отпустить сына несмотря на своё профзаболевание.

Во-первых, не все профессора действительно понимают что такое научный подход (я лично видел по меньшей мере троих непонимающих).


Во-вторых, пришедшее письмо — еще не доказательство существования магии. Как говорится, экстраординарные утверждения требуют экстраординарных доказательств. Вы хоть до встречи с МакГонагалл там дочитали?


В-третьих, самому профессору выбора убегать или исследовать никто и не давал. Исследованиями магии с позиций научного подхода может заняться только Гарри — и занимается.


PS вы правда думаете, что так легко написать комментарий за 4 минуты?

1. Книга позиционируется как научная, а также отличающаяся образование Гарри за счет умного приемного отца. Начало характеризует отца как не умного.
2. Речь не о том, что нет доказательств. Речь об отрабасывании возможных путей для выяснения. Да еще и пасынку: «Ты что проверять собрался? Ты что, допускаешь возможность?»
Меня вот это «допускаешь» смущает. Все нормальные ученые которых я видел — допускают возможность всего чего угодно. Просто не считают вероятность ряда событиями достаточной, чтобы на них внимание обращать. Но уверен, если появится повод — они обратят внимание. У семьи Гарри повод обратить внимание 100% есть.
3. А я не говорю о его выборе. Я говорю о его отношении к выбору пасынка. Отношение: Ты лузер, если начал проверять то, во что я не верю.

Своим образованием Гарри обязан книгам в отцовской библиотеке. Главное что сделал приемный отец — это научил их читать и любить.


Отношение к выбору Гарри вы тоже как-то не так уловили. Дело не в вере, ему просто в тот момент важнее переспорить жену чем принять правильное решение.

Даже отбросив неидеальность отца Гарри фраза «Все нормальные ученые которых я видел — допускают возможность всего чего угодно.» звучит весьма абсурдно. Нельзя применить научный метод к ненаучным гипотезам, например.
Просто читайте дальше. Это же художественное произведение, и там среди прочего есть ряд загадок о том, почему некоторые люди ведут себя не идеально-логично. Чтение очень увлекательное.
Мне пришлось пройти некоторые моменты по три раза, прежде чем я убедился, что все ключи к решениям были изложены, и изложены корректно.
это цельноюмористический фанфик от человека в некоторой степени связанного с наукой… но это не важно…
важно то что вы претендуя на разумность сводите спектр допустимых суждений человека к стереотипу созданному в вашем разуме, но более всего досадно что вы этот стереотип пытаетесь навязать окружающим, а за такое не только минус получить можно…
Начало характеризует отца как не умного.

В книге последователем научного подхода является сам Гарри, но не его отец. Своего отца он характеризует так:
отец наверняка смог бы меня переспорить, если бы попытался, а не использовал свой опыт и интеллект главным образом на то, чтобы находить всё новые причины не менять свои убеждения.

Полагаю, это шпилька в сторону профессоров (да и не толко профессоров) утративших критичный взгляд на вещи, сделав выбор в пользу своего устоявшегося видения картины мира.
То есть если профессор посчитал присчитал приглашение в школу магии чушью — это не реалистично, профессор так себя бы не повёл, я правильно понял? =)

Заметим, что если P(B)=0, то вне зависимости от P(Е) P(B|E) останется нулем. Отсюда следует, что упертых нельзя переубедить, а также интересный ответ на ВСЕ диспуты между верующими и атеистами (равно как и всеми остальными, кто не рассматривает противоположную точку зрения) — они, к сожалению, бесполезны. Убедить можно только сомневающихся.


(PS: Если P(E)=1, а P(B)=0, возникает разрыв шаблона.)

Нет, не возникает. Более того, свидетельство с P(E)=1 не несет никакой информации, а потому не может вызвать разрыв шаблона.


Ситуацию "разрыв шаблона" я бы скорее описал как P(E | B) = 0.

А что здесь разрывошаблонного? Вероятность свидетельства при условии истинности теории равна 0, проще говоря, теория утверждает: "Такого не бывает". Если "такое" всё-таки случилось, то теория неверна, так и получается при P(E|B) = 0, P(B|E) тоже будет 0, по-моему, всё логично.

Хорошо, поправлюсь.


P(E | B) = 0 при P(B) = 1

Хмм. Типичный диалог верующего с атеистом вертится вокруг фразы "Бог есть" (B). Для атеиста P(B)=0. Это его теория или убеждение. Далее, верующий приводит "свидетельство" Е, скажем, объект "Туринская плащаница". Вопрос, я правильно обозначил его как Е, или Е в данном конкретном случае будет утверждением вроде "Туринская плащаница содержит нерукотворное изображение, созданное божественным вмешательством, следовательно, Бог есть"? Если неправильно, то P(E)<1, строго говоря. Утверждение "Туринская плащаница есть", будет иметь P(E)=1, так как её существование можно проверить. Но такое утверждение не является прямым свидетельством теории (В).


Насчет разрыва шаблона — поправка правильная, в моем случае тогда правильно инвертировать B (иначе P(E|0) не имеет нормального смысла, нельзя определить условную вероятность при нулевой вероятности условия). Получаем P(notB)=1, P(E|notB)=0, т.е. то же, что у вас. (Хорошая штука бинарная логика, если двумя разными путями получен один результат, значит, он верен в рамках использованного мат.аппарата. Фуух)

Вообще-то условная вероятность при нулевой вероятности условия замечательно определяется. Например, когда оказываются взаимосвязаны дискретная случайная величина и непрерывная. Это во-первых.


А во-вторых, смысл условных вероятностей заключается как раз в том, что их зачастую можно вычислить не через определение, а альтернативными способами.

«В этих случаях теорема не уничтожает предвзятость, а потакает ей.» — ни теорема, ни Томас Бейз не виноваты в том, что кто-то применяет доказанное утверждение, преследуя свои цели.

Ну и всё же:

image

Занятно теперь молодежь развлекается)
немного оффтопа
Напомните плиз, как называется синдром, когда человек, в силу недостаточности знаний делает неверное предположение, а потом проверяет его, но опять в силу недостаточности знаний подтверждает свое предположение, и далее считает что его предположение верно.
Вроде это из психологии и вроде название состоит из двойной фамилии… Никак не могу вспомнить и нагуглить…

На саммом деле, Эффект Даннинга — Крюгера лишь следствие. Само же явление в данной формулировке получается из сочетания систематической ошибки выбора (например из-за недостаточного кругозора) и предвзятости подтверждения (неправильная методика проверки гипотез).
Блин магия какая-то. Как так не могу понять. Если точность теста 50%. То что говорят тогда нам цифры 1% из 100%? Так 50% из 100% или 1% из 100%? Ничего не понял.

p.s. Точность теста же дана после одного раза его прохождения.
p.s.s. А или типа как: точность теста 1% из 100, но никто не знает кто этот 1% и вероятность попасть в этот 1% у каждого 50%, так как у всех равный шанс в него попасть. Правильно? ЛОЛ.
специально же расписано что точность теста 99% это 99 положительных срабатываний у ста больных и 99 отрицательных у ста здоровых, а 50% это вероятность того что у вас рак при положительном срабатывании такого теста и начальной вероятности того что вы больны раком в 1%.
После первого срабатывания у вас остается шанс 50% что тест ошибся именно в ПОЛОЖИТЕЛЬНОМ срабатывании. То есть если второй тест вышел негативным, то с Большей вероятностью вы здоровы, если второй тест тоже положителен то вы 99% больны раком.

Грубо говоря, даже на 90% надежных системах нужна минимум 4х проверка для подтверждения Положительного результата.
Єто ж очевидно как встретить на улице динозавра — 50%, или больньі или нет)
Теорема Байеса вам как раз говорит о том, что не нужно забывать про те случаи, когда тест положителен при ложности теории.
Т.е. допустим, у вас есть некоторая теория А, при истинности которой со 100% вероятностью наступает некое следствие Б. Так вот теорема Байеса говорит вам, что если вы в процессе иследований встретили Б, то это еще не значит, что теория А верна, т.к. к Б могло привести нечто другое.

Пример:
Контекст — теорема Пифагора доказана и верна.
Теория А — все треугольники прямоугольные.
Следствие Б — если в треугольнике две меньшие стороны равны 3 и 4 метра, то третья сторона равна 5.

В процессе иследований вы берете произвольный треугольник с двумя меньшими сторонами 3 и 4 метра, измеряете большую сторону у треугольника, и её длина оказывается равна 5 метрам.
Теорема Байеса предостерегает вас от вывода, что наблюдение следствия Б (стороны 3, 4 и 5) доказывает вашу теорию (все треугольники прямоугольные). И говорит вам: «А ты уверен, что при ложности твоей теории А следствие Б не могло бы произойти?»

В первом случае за 100% берутся больные люди. То есть если тестировать только людей, которые точно больны, то тест ошибается только в 1% случаев. Во втором 100% вообще всех людей (и здоровых, и больных), тогда тест ошибается в 50% случаев.

А, все, понял. Спасибо, здорово прояснили.

То есть любой медицинский тест который обещает точность 99% (как правило меньше) бесполезен? Ведь каждый раз проверяя обычных людей тест будет давать 50% шанс. Раз проверился — болен, второй раз — не болен, третий раз снова болен, и так до бесконечности. :))

Нет, только в случае
1)Каждый сотый болен раком
2)точность теста 99%.
Допустим раком болен каждый тысячный, а точность по прежнему 99%, тогда при положительном тесте вероятность что вы больны = 9%
0.001*0.99/(0.01*0.999+0.01*0.999) если я ничего не напутал, для меня это сюрприз конечно), повторный тест позволит либо апровегнуть результа предыдущего, либо увеличить вероятность что он все же верен.

3) тест является первичной диагностикой, иначе выборка не репрезентативная

Нет, не так, и я не совсем правильно написал. Тест ошибается в 50% не всех случаев, а только в 50% от случаев, когда результат теста положительный.


Грубо говоря, возьмём 100 человек (100%) и протестируем. 1 из них болен (1% больных), ему тест наверняка покажет, что он больной (вероятность ошибки всего 1%). Остается 99 здоровых. Одному из них тест тоже покажет, что он больной (1% от 99 — чуть меньше 1, но не принципиально), хотя он здоров. Таким образом, имеем 2 человека, которым тест показал, что они больные, но болен из них только 1. У каждого из них всего 50% шанс, что именно он больной.

Так что польза от теста вполне практическая. Если тест показал отрицательный результат, то человек 99% здоров. Если результат положительный, то паниковать рано (вероятность всего 50%), но перепровериться надо, второй тест даст однозначный ответ — так как человек уже не в 1%, а аж 50% группе риска, вторая ошибка очень маловероятна.

Это все отлично работает в мире, где ложноположительные и ложноотрицательные результаты теста истинно случайны. В нашем мире ложноположительный результат теста может быть спровоцирован, например, гормональным сбоем в организме, который не соответствует проверяемому диагнозу, тогда тест останется ложноположительным, проведите вы его хоть 100 раз подряд. Это, почему-то, не учитывается адептами данной теоремы. Или я что-то не так понимаю?

В ситуации, когда возможна систематическая ошибка, повторные проверки делаются по другой методике.

Естественно, это упрощённый пример для понимания сути теоремы, в нём много чего не учитывается.

В описанной модели теста ошибка теста является истинно случайной величиной, подчиняющейся эргодическому закону) Если в действительности она не обладает этими свойствами, то это проблема оценки точности теста, а не теоремы Байеса. То есть да, модель все еще упрощенная по отношению к реальности, но уже лучше, чем было бы, если бы мы руководствовались только данными теста без оглядки на Байеса.

p.s. Эргодичность, в принципе, неплохо проверяется: берем у 100 человек 100 анализов. Если распределение ошибки внутри выборки по каждому пациенту совпадает с распределением между пациентами, то все хорошо.
p.p.s. все еще остается шанс, что есть какие-то уникумы 1 на миллион, но шанс их наличия примерно известен, и можно внести в формулу рассчета по теореме нужную поправку.
p.p.p.s.
тогда тест останется ложноположительным, проведите вы его хоть 100 раз подряд
Речь идет только о вероятности, а в указанном примере она никогда не будет строго равна единице.
На картинке наверное нагляднее будет: нижняя строка — наличие рака, правая колонка — ошибки диагноза. Синий цвет — истинно положительные результаты, зелёный — ложноположительные. Число клеток с истинным и ложным положительным результатом равно, следовательно при точности теста 99% вероятность, что положительный результат — ложный, равна 50%

Если взять случайного человека из группы риска в 1% проходить тест с ошибкой первого и второго рода 1%, положительный результат будет верен с вероятностью 50%.


Не стоит применять эти расчеты в жизни, в них не учитывается, что анализы сдают не случайные люди, а те, в отношении кого уже имеются подозрения, и там вероятность ложного срабатывания будет меньше, т.к. в выборке будет значительно больший процент больных.

Можно разобраться и без всяких теорем. Рассмотрим только положительные результаты. Они складываются из правильно определенных больных и ложноположительных. И в данном случае их пополам: примерно 0.01 за счет правильно определенных больных и примерно 0.01 за счет ошибки диагностики. Итого получается, что 50%

Pположительногорезультата = 0.01(вероятность болезни)*0.99 (вероятность правильного определения) + 0.99 (вероятность здоровья)*(1-0.99)(вероятность ошибки)
Слагаемые равны, значит, если у кого-то положительный результат, с вероятностью 50% результат ложноположительный.
На основе примера с раком, получается, что P(E) = P(E I B) + P(E I notB),
где первое вероятность истинно положительного результата теста, а второе — ложно положительного.
Тогда подсчет P(E) становится более очевидным. Это общий случай или только для данного примера подходит?
точнее: P(E) = P(E I B) * P(B) + P(E I notB) * P( notB )
вопрос остается: Это общий случай или только для данного примера подходит?

Вы только что написали формулу полной вероятности для n=2.


Более общая формула:


P(E) = P(E | B1) P(B1) + P(E | B2) P(B2) +… + P(E | Bn) P(Bn) при условии что {B1, B2, ..., Bn} — полная группа событий.

А с чем связан такой возникший ажиотаж? Теоремма очень не новая, но что то я раньше не слышал о её «чудесных» свойствах.
Любая теорема подразумевает доказательство.
Очень хорошо изложена суть теоремы. Добавить доказательство (тем боле что оно занимает 2 строчки) — и это была бы просто идеальная статья.

P.S. Не в порядке замечания переводчику.
Из данной статьи можно понять, что статья, в которой журналист выдает себя за ученого — намного хуже, чем статья, в которой журналист насилует ученого.

Формула не дописана. Давайте проведем мысленный эксперимент. Возьмем 1000 человек и проведем им 99% тест на рак, у 10 человек тест даст положительный результат — может ли рак на самом деле быть у 5 человек (по статье 50%), а у 5 тест даст ложный результат? Для ответа на этот вопрос нужно знать — а сколько вообще человек из 1000 на самом деле болеют раком (это и есть ключевой параметр в теореме, о котором в статье ни слова)

Если раком болеет 1 человек из 10 000, то при проверке 10 000 человек тест даст 100 положительных результатов, хотя мы знаем что на самом деле болеет только 1 (т.е. вероятность что вы больны около 1%).

Если раком болеет 1 из 200, то при проверке 200 человек — тест даст 2 положительных результата и вероятность что у вас рак действительно будет около 50%.
По-моему, вы невнимательно прочитали статью. Всё там есть:
Допустим, вас проверяют на наличие рака, который появляется у 1% людей вашего возраста.
И в расчётах эта цифра фигурирует:
P(B), вероятность того, что у вас рак до тестирования, равна 1%, или 0,01.
Объясните, пожалуйста, гуманитарию.
В приведенном в тексте примере утверждается: «Да, ваш отличный тест с 99%-й точностью выдаёт столько же ложных срабатываний, сколько и истинных».
То есть, «столько же» — это в абсолютном выражении?
Ну, то есть: была группа из десяти тысяч испытуемых, из которых сто больны раком. Сделали десять тысяч тестов, выявили девяносто девять из ста больных людей. Среди оставшихся 9900 здоровых людей у девяноста девяти тест выдал ложно-положительный результат.
А затем делается мощный вывод: здесь 99, там 99, 99/198 = 0,5, значит, вероятность наличия болезни 0,5. Если приверженцы теоремы так оценивают вероятность события, то это — адовая казуистика.
Весь практический смысл — не исключать вариантов, для которых нет ни подтверждения, ни опровержения. О чем, в общем-то, и говорит автор.
P.S. Статья интересная, спасибо!
А затем делается мощный вывод: здесь 99, там 99, 99/198 = 0,5, значит, вероятность наличия болезни 0,5. Если приверженцы теоремы так оценивают вероятность события, то это — адовая казуистика.

Я не понял, что именно вам не нравится? Плюс, если теорема доказана, то нет смысла говорить о «приверженцах».
Пока комментарий был на модерации, уже разобрался в вопросе. Нравится всё. Сделал для себя полезные выводы, по новому теперь оцениваю вклад ложноположительных срабатываний систем мониторинга на работе в общую картину доступности ИТ-инфраструктуры. Будем с ними (срабатываниями) бороться посильно.

Согласен с комментарием xMushroom ниже, что иная формулировка фразы сделала бы ее понятнее.
Полагаю, автор просто пропустил слово «положительных», решив, что оно и так понятно из предыдущих рассуждений. С Байесом лучшего такого не делать, а то и самому запутаться недолго. :)
Правильно это должно было звучать:
Да, ваш отличный тест с 99%-й точностью выдаёт столько же ложных положительных срабатываний, сколько и истинных положительных.

Знание = сумма последовательных уверенностей, (С) если не ошибаюсь Веды

Я вообще не понимаю, почему этот тест назван «на 99% надежным». Это в чистом виде маркетинговый ход. И цифры там подобраны так, что путаница в голове — где логическая зависимость, а где численное равенство.


               Указал наличие болезни
Тест_№  Больные(Б%)  Здоровые(Зд%)
  1       99%           1.0%    — здесь сумма больных со здоровыми равна 100%
  2       99%           2.7%    — здесь сумма Б%+Зд% не равна 100%
  3       99%           3.3%    — здесь сумма Б%+Зд% не равна 100%

Я не понимаю, по какому критерию тест №1 был назван «на 90% надежным». Его численные характеристики — Б% («указал наличие болезни у больного») и Зд%(«ложно указал наличие болезни у здорового»).


Сумма Б%+Зд% не должна быть равна 100%!!! Их нельзя складывать, это сложение сапогов с
пирогами!
И находить какой-то общий "хэш" для срабатывания по больным и здоровым тоже нельзя, будет искажение информации. Только срабатывания по больным отдельно и по здоровым отдельно.


Складывать нельзя, потому что результат теста — косвенный признак, а не сама болезнь. Сложение же подразумевает идентичность единиц измерения (признаков), и для этого тест ВСЕГДА должен работать верно (типа тот 1% «здоровых» людей на самом деле больны, а 1% «больных» людей на самом деле здоровы). В нашем случае это априори не так…

Я вообще не понимаю, почему этот тест назван «на 99% надежным». Это в чистом виде маркетинговый ход.

Как по-вашему следует назвать тест, который из 100 проверок в среднем ошибается один раз?
И в чем заключается «маркетинговый ход», если этого теста не существует в природе и он вообще не продается, а был выдуман исключительно для примера?
А разве кто-то говорил, что должна?
Допустим, ваш тест надёжен на 99%. То есть, 99 из 100 человек, больных раком, получат положительный результат, и 99 здоровых людей из 100 получат отрицательный результат.

Вроде тут никто ничего не складывал. Просто для простоты примера в обоих направлениях взяты одинаковые цифры, что и позволило (опять же, для простоты) обозвать тест как в общем на 99% надежный. По-моему, вполне разумное упрощение, пример и так не слишком простой.
Там ещё и вероятность здоровья тоже взята 99%, но вы же понимаете, что это чисто совпадение (взяли красивые цифры для наглядности), и не говорит о взаимозависимости этих величин?

их действительно не стоит складывать, потому что у нас могут быть разные проценты надёжности для положительного и отрицательного результата (например бывают тесты которые вообще никогда не дают ложноотрицательных результатов) и нам правильнее указывать обе эти цифры отдельно(и когда это важно их так и указывают). тем не менее мы спокойно можем "сложить" результаты для получения некоторой общей надёжности всего теста если такой показатель нам удобнее.

Теорема Байеса – это лишь экспресс-метод подсчёта вероятностной обоснованности нового на основе статически имеющихся доказательств свидетельств:
«мнение о выборе нового с обоснованностью есть функция выбора вероятности доказательств суждения из N-матриц: [i-изначальное мнение / i-свидетельства]
По такому же сравнительному принципу работают сейчас многие нейронные сети, отсекая заранее ненужный перебор вероятностей, а также по похожему способу работают скалярные микросхемы.
В итоге результат получают более быстро, но не значит, что точнее. А последующий цикл подбора получается более эффективным.
Здравый смысл в этом методе есть, так как любые отдельные субъективные свидетельства могут быть изменчивы, то только их динамический массив в текущий момент времени дает объективную картину мира. Это и нужно принципу эволюции.
Но это всё усредняет мышление, так как по такому принципу люди, доказывающие теорему Байеса – ну просто «ботаны», не достойные внимания, так как они скрупулёзно доказывающие то, чего нет.
Так как:
«Достоверность вашего убеждения зависит от того, насколько сильно общие убеждения объясняет существующие факты, а чем больше вариантов такого объяснения фактов, тем менее достоверно ваше личное убеждение».

Закончим подсчёты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099, и получим 0,5.


Если вы поделите 0,0198 на 0,0099, то получится 2, а не 0,5. Здесь аргументы перепутаны местами.
Закончим подсчёты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099, и получим 0,5.

Все правильно написано.

Но написано так, что помогает перепутать. Предмет разбора и так на путаницу провоцировать горазд, а тут ещё и это…

в работах философа Кёртиса Брауна и специалистов по информатике Оскара Бонилла и Калида Азада

Что это за авторы, и какие работы имеются в виду?

Sign up to leave a comment.

Articles