Pull to refresh

Comments 76

Чем больше я знаю, тем больше неизвестного. 100% людей, которые пробовали огурцы, не прожили более 150 лет. И самое любимое: «Иногда кругозор человека сужается до одной точки, это и есть точка зрения» (Конфуций). Я к чему. Заметил следующее: чем больше человек знает, тем он менее категовичен и склонен спорить. Ну а теперь для меня данная статья — ещё одно доказательство этого утверждения. Спасибо, прочёл с удовольствием.
Полностью согласен! Тем более, что и про «точки» и «огурцы» тоже люблю приводить примеры. ))) А насчет "… менее категоричен...", так этому есть объяснение — Эффект Даннинга-Крюгера. У дурака на все есть 1-2 готовых рецепта, а умному надо на основе анализа конкретных исходных данных выбрать наиболее вероятный вариант… )))
100% людей, которые пробовали огурцы, не прожили более 150 лет.

Это называется систематической ошибкой отбора.

А что будет, когда журналисты доберутся до теоремы Ферма…
Скорее, до весёлой фермы они доберутся
Хм. Заинтересовался…
Начал читать… И сразу диссонанс словил.
ПРофессор, якобы приверженец научного подхода, которые отрицает существование чего-то, потому что оно противоречит его пониманию мира? ЛОЛ. Это не научный подход.
Сейчас появись магия — ученые не закроют глаза и не убегут в страхе, утверждая что такого быть не может.
А от ец Гарри из этой книге похоже именно так и поступит.
Добрый день. Я так понимаю, вы отец Гарри? А может обоснуете свой минус, ну так. ради интереса?
большинство людей, а особенно профессора категоричны и уверены в своём единственно правильном понимании мира. У профессоров твердолобость это вообще профзаболевание, не излучающий единственно-правильное мнения профессор, не есть авторитет для студента, не может эффективно передать знание. Он ведь не уверен что прав, кто его будет слушать.
Кстати насколько я помню в hpmor папа Гарри вполне себе согласился отпустить сына несмотря на своё профзаболевание.

Во-первых, не все профессора действительно понимают что такое научный подход (я лично видел по меньшей мере троих непонимающих).


Во-вторых, пришедшее письмо — еще не доказательство существования магии. Как говорится, экстраординарные утверждения требуют экстраординарных доказательств. Вы хоть до встречи с МакГонагалл там дочитали?


В-третьих, самому профессору выбора убегать или исследовать никто и не давал. Исследованиями магии с позиций научного подхода может заняться только Гарри — и занимается.


PS вы правда думаете, что так легко написать комментарий за 4 минуты?

1. Книга позиционируется как научная, а также отличающаяся образование Гарри за счет умного приемного отца. Начало характеризует отца как не умного.
2. Речь не о том, что нет доказательств. Речь об отрабасывании возможных путей для выяснения. Да еще и пасынку: «Ты что проверять собрался? Ты что, допускаешь возможность?»
Меня вот это «допускаешь» смущает. Все нормальные ученые которых я видел — допускают возможность всего чего угодно. Просто не считают вероятность ряда событиями достаточной, чтобы на них внимание обращать. Но уверен, если появится повод — они обратят внимание. У семьи Гарри повод обратить внимание 100% есть.
3. А я не говорю о его выборе. Я говорю о его отношении к выбору пасынка. Отношение: Ты лузер, если начал проверять то, во что я не верю.

Своим образованием Гарри обязан книгам в отцовской библиотеке. Главное что сделал приемный отец — это научил их читать и любить.


Отношение к выбору Гарри вы тоже как-то не так уловили. Дело не в вере, ему просто в тот момент важнее переспорить жену чем принять правильное решение.

Даже отбросив неидеальность отца Гарри фраза «Все нормальные ученые которых я видел — допускают возможность всего чего угодно.» звучит весьма абсурдно. Нельзя применить научный метод к ненаучным гипотезам, например.
Просто читайте дальше. Это же художественное произведение, и там среди прочего есть ряд загадок о том, почему некоторые люди ведут себя не идеально-логично. Чтение очень увлекательное.
Мне пришлось пройти некоторые моменты по три раза, прежде чем я убедился, что все ключи к решениям были изложены, и изложены корректно.
это цельноюмористический фанфик от человека в некоторой степени связанного с наукой… но это не важно…
важно то что вы претендуя на разумность сводите спектр допустимых суждений человека к стереотипу созданному в вашем разуме, но более всего досадно что вы этот стереотип пытаетесь навязать окружающим, а за такое не только минус получить можно…
Начало характеризует отца как не умного.

В книге последователем научного подхода является сам Гарри, но не его отец. Своего отца он характеризует так:
отец наверняка смог бы меня переспорить, если бы попытался, а не использовал свой опыт и интеллект главным образом на то, чтобы находить всё новые причины не менять свои убеждения.

Полагаю, это шпилька в сторону профессоров (да и не толко профессоров) утративших критичный взгляд на вещи, сделав выбор в пользу своего устоявшегося видения картины мира.
То есть если профессор посчитал присчитал приглашение в школу магии чушью — это не реалистично, профессор так себя бы не повёл, я правильно понял? =)

Заметим, что если P(B)=0, то вне зависимости от P(Е) P(B|E) останется нулем. Отсюда следует, что упертых нельзя переубедить, а также интересный ответ на ВСЕ диспуты между верующими и атеистами (равно как и всеми остальными, кто не рассматривает противоположную точку зрения) — они, к сожалению, бесполезны. Убедить можно только сомневающихся.


(PS: Если P(E)=1, а P(B)=0, возникает разрыв шаблона.)

Нет, не возникает. Более того, свидетельство с P(E)=1 не несет никакой информации, а потому не может вызвать разрыв шаблона.


Ситуацию "разрыв шаблона" я бы скорее описал как P(E | B) = 0.

А что здесь разрывошаблонного? Вероятность свидетельства при условии истинности теории равна 0, проще говоря, теория утверждает: "Такого не бывает". Если "такое" всё-таки случилось, то теория неверна, так и получается при P(E|B) = 0, P(B|E) тоже будет 0, по-моему, всё логично.

Хорошо, поправлюсь.


P(E | B) = 0 при P(B) = 1

Хмм. Типичный диалог верующего с атеистом вертится вокруг фразы "Бог есть" (B). Для атеиста P(B)=0. Это его теория или убеждение. Далее, верующий приводит "свидетельство" Е, скажем, объект "Туринская плащаница". Вопрос, я правильно обозначил его как Е, или Е в данном конкретном случае будет утверждением вроде "Туринская плащаница содержит нерукотворное изображение, созданное божественным вмешательством, следовательно, Бог есть"? Если неправильно, то P(E)<1, строго говоря. Утверждение "Туринская плащаница есть", будет иметь P(E)=1, так как её существование можно проверить. Но такое утверждение не является прямым свидетельством теории (В).


Насчет разрыва шаблона — поправка правильная, в моем случае тогда правильно инвертировать B (иначе P(E|0) не имеет нормального смысла, нельзя определить условную вероятность при нулевой вероятности условия). Получаем P(notB)=1, P(E|notB)=0, т.е. то же, что у вас. (Хорошая штука бинарная логика, если двумя разными путями получен один результат, значит, он верен в рамках использованного мат.аппарата. Фуух)

Вообще-то условная вероятность при нулевой вероятности условия замечательно определяется. Например, когда оказываются взаимосвязаны дискретная случайная величина и непрерывная. Это во-первых.


А во-вторых, смысл условных вероятностей заключается как раз в том, что их зачастую можно вычислить не через определение, а альтернативными способами.

«В этих случаях теорема не уничтожает предвзятость, а потакает ей.» — ни теорема, ни Томас Бейз не виноваты в том, что кто-то применяет доказанное утверждение, преследуя свои цели.

Ну и всё же:

image

Занятно теперь молодежь развлекается)
немного оффтопа
Напомните плиз, как называется синдром, когда человек, в силу недостаточности знаний делает неверное предположение, а потом проверяет его, но опять в силу недостаточности знаний подтверждает свое предположение, и далее считает что его предположение верно.
Вроде это из психологии и вроде название состоит из двойной фамилии… Никак не могу вспомнить и нагуглить…

На саммом деле, Эффект Даннинга — Крюгера лишь следствие. Само же явление в данной формулировке получается из сочетания систематической ошибки выбора (например из-за недостаточного кругозора) и предвзятости подтверждения (неправильная методика проверки гипотез).
Блин магия какая-то. Как так не могу понять. Если точность теста 50%. То что говорят тогда нам цифры 1% из 100%? Так 50% из 100% или 1% из 100%? Ничего не понял.

p.s. Точность теста же дана после одного раза его прохождения.
p.s.s. А или типа как: точность теста 1% из 100, но никто не знает кто этот 1% и вероятность попасть в этот 1% у каждого 50%, так как у всех равный шанс в него попасть. Правильно? ЛОЛ.
специально же расписано что точность теста 99% это 99 положительных срабатываний у ста больных и 99 отрицательных у ста здоровых, а 50% это вероятность того что у вас рак при положительном срабатывании такого теста и начальной вероятности того что вы больны раком в 1%.
После первого срабатывания у вас остается шанс 50% что тест ошибся именно в ПОЛОЖИТЕЛЬНОМ срабатывании. То есть если второй тест вышел негативным, то с Большей вероятностью вы здоровы, если второй тест тоже положителен то вы 99% больны раком.

Грубо говоря, даже на 90% надежных системах нужна минимум 4х проверка для подтверждения Положительного результата.
Єто ж очевидно как встретить на улице динозавра — 50%, или больньі или нет)
Теорема Байеса вам как раз говорит о том, что не нужно забывать про те случаи, когда тест положителен при ложности теории.
Т.е. допустим, у вас есть некоторая теория А, при истинности которой со 100% вероятностью наступает некое следствие Б. Так вот теорема Байеса говорит вам, что если вы в процессе иследований встретили Б, то это еще не значит, что теория А верна, т.к. к Б могло привести нечто другое.

Пример:
Контекст — теорема Пифагора доказана и верна.
Теория А — все треугольники прямоугольные.
Следствие Б — если в треугольнике две меньшие стороны равны 3 и 4 метра, то третья сторона равна 5.

В процессе иследований вы берете произвольный треугольник с двумя меньшими сторонами 3 и 4 метра, измеряете большую сторону у треугольника, и её длина оказывается равна 5 метрам.
Теорема Байеса предостерегает вас от вывода, что наблюдение следствия Б (стороны 3, 4 и 5) доказывает вашу теорию (все треугольники прямоугольные). И говорит вам: «А ты уверен, что при ложности твоей теории А следствие Б не могло бы произойти?»

В первом случае за 100% берутся больные люди. То есть если тестировать только людей, которые точно больны, то тест ошибается только в 1% случаев. Во втором 100% вообще всех людей (и здоровых, и больных), тогда тест ошибается в 50% случаев.

А, все, понял. Спасибо, здорово прояснили.

То есть любой медицинский тест который обещает точность 99% (как правило меньше) бесполезен? Ведь каждый раз проверяя обычных людей тест будет давать 50% шанс. Раз проверился — болен, второй раз — не болен, третий раз снова болен, и так до бесконечности. :))

UFO landed and left these words here

3) тест является первичной диагностикой, иначе выборка не репрезентативная

Нет, не так, и я не совсем правильно написал. Тест ошибается в 50% не всех случаев, а только в 50% от случаев, когда результат теста положительный.


Грубо говоря, возьмём 100 человек (100%) и протестируем. 1 из них болен (1% больных), ему тест наверняка покажет, что он больной (вероятность ошибки всего 1%). Остается 99 здоровых. Одному из них тест тоже покажет, что он больной (1% от 99 — чуть меньше 1, но не принципиально), хотя он здоров. Таким образом, имеем 2 человека, которым тест показал, что они больные, но болен из них только 1. У каждого из них всего 50% шанс, что именно он больной.

Так что польза от теста вполне практическая. Если тест показал отрицательный результат, то человек 99% здоров. Если результат положительный, то паниковать рано (вероятность всего 50%), но перепровериться надо, второй тест даст однозначный ответ — так как человек уже не в 1%, а аж 50% группе риска, вторая ошибка очень маловероятна.

Это все отлично работает в мире, где ложноположительные и ложноотрицательные результаты теста истинно случайны. В нашем мире ложноположительный результат теста может быть спровоцирован, например, гормональным сбоем в организме, который не соответствует проверяемому диагнозу, тогда тест останется ложноположительным, проведите вы его хоть 100 раз подряд. Это, почему-то, не учитывается адептами данной теоремы. Или я что-то не так понимаю?

В ситуации, когда возможна систематическая ошибка, повторные проверки делаются по другой методике.

Естественно, это упрощённый пример для понимания сути теоремы, в нём много чего не учитывается.

В описанной модели теста ошибка теста является истинно случайной величиной, подчиняющейся эргодическому закону) Если в действительности она не обладает этими свойствами, то это проблема оценки точности теста, а не теоремы Байеса. То есть да, модель все еще упрощенная по отношению к реальности, но уже лучше, чем было бы, если бы мы руководствовались только данными теста без оглядки на Байеса.

p.s. Эргодичность, в принципе, неплохо проверяется: берем у 100 человек 100 анализов. Если распределение ошибки внутри выборки по каждому пациенту совпадает с распределением между пациентами, то все хорошо.
p.p.s. все еще остается шанс, что есть какие-то уникумы 1 на миллион, но шанс их наличия примерно известен, и можно внести в формулу рассчета по теореме нужную поправку.
p.p.p.s.
тогда тест останется ложноположительным, проведите вы его хоть 100 раз подряд
Речь идет только о вероятности, а в указанном примере она никогда не будет строго равна единице.
На картинке наверное нагляднее будет: нижняя строка — наличие рака, правая колонка — ошибки диагноза. Синий цвет — истинно положительные результаты, зелёный — ложноположительные. Число клеток с истинным и ложным положительным результатом равно, следовательно при точности теста 99% вероятность, что положительный результат — ложный, равна 50%

Если взять случайного человека из группы риска в 1% проходить тест с ошибкой первого и второго рода 1%, положительный результат будет верен с вероятностью 50%.


Не стоит применять эти расчеты в жизни, в них не учитывается, что анализы сдают не случайные люди, а те, в отношении кого уже имеются подозрения, и там вероятность ложного срабатывания будет меньше, т.к. в выборке будет значительно больший процент больных.

Можно разобраться и без всяких теорем. Рассмотрим только положительные результаты. Они складываются из правильно определенных больных и ложноположительных. И в данном случае их пополам: примерно 0.01 за счет правильно определенных больных и примерно 0.01 за счет ошибки диагностики. Итого получается, что 50%

Pположительногорезультата = 0.01(вероятность болезни)*0.99 (вероятность правильного определения) + 0.99 (вероятность здоровья)*(1-0.99)(вероятность ошибки)
Слагаемые равны, значит, если у кого-то положительный результат, с вероятностью 50% результат ложноположительный.
На основе примера с раком, получается, что P(E) = P(E I B) + P(E I notB),
где первое вероятность истинно положительного результата теста, а второе — ложно положительного.
Тогда подсчет P(E) становится более очевидным. Это общий случай или только для данного примера подходит?
точнее: P(E) = P(E I B) * P(B) + P(E I notB) * P( notB )
вопрос остается: Это общий случай или только для данного примера подходит?

Вы только что написали формулу полной вероятности для n=2.


Более общая формула:


P(E) = P(E | B1) P(B1) + P(E | B2) P(B2) +… + P(E | Bn) P(Bn) при условии что {B1, B2, ..., Bn} — полная группа событий.

А с чем связан такой возникший ажиотаж? Теоремма очень не новая, но что то я раньше не слышал о её «чудесных» свойствах.
Любая теорема подразумевает доказательство.
Очень хорошо изложена суть теоремы. Добавить доказательство (тем боле что оно занимает 2 строчки) — и это была бы просто идеальная статья.

P.S. Не в порядке замечания переводчику.
Из данной статьи можно понять, что статья, в которой журналист выдает себя за ученого — намного хуже, чем статья, в которой журналист насилует ученого.

Формула не дописана. Давайте проведем мысленный эксперимент. Возьмем 1000 человек и проведем им 99% тест на рак, у 10 человек тест даст положительный результат — может ли рак на самом деле быть у 5 человек (по статье 50%), а у 5 тест даст ложный результат? Для ответа на этот вопрос нужно знать — а сколько вообще человек из 1000 на самом деле болеют раком (это и есть ключевой параметр в теореме, о котором в статье ни слова)

Если раком болеет 1 человек из 10 000, то при проверке 10 000 человек тест даст 100 положительных результатов, хотя мы знаем что на самом деле болеет только 1 (т.е. вероятность что вы больны около 1%).

Если раком болеет 1 из 200, то при проверке 200 человек — тест даст 2 положительных результата и вероятность что у вас рак действительно будет около 50%.
По-моему, вы невнимательно прочитали статью. Всё там есть:
Допустим, вас проверяют на наличие рака, который появляется у 1% людей вашего возраста.
И в расчётах эта цифра фигурирует:
P(B), вероятность того, что у вас рак до тестирования, равна 1%, или 0,01.
Объясните, пожалуйста, гуманитарию.
В приведенном в тексте примере утверждается: «Да, ваш отличный тест с 99%-й точностью выдаёт столько же ложных срабатываний, сколько и истинных».
То есть, «столько же» — это в абсолютном выражении?
Ну, то есть: была группа из десяти тысяч испытуемых, из которых сто больны раком. Сделали десять тысяч тестов, выявили девяносто девять из ста больных людей. Среди оставшихся 9900 здоровых людей у девяноста девяти тест выдал ложно-положительный результат.
А затем делается мощный вывод: здесь 99, там 99, 99/198 = 0,5, значит, вероятность наличия болезни 0,5. Если приверженцы теоремы так оценивают вероятность события, то это — адовая казуистика.
Весь практический смысл — не исключать вариантов, для которых нет ни подтверждения, ни опровержения. О чем, в общем-то, и говорит автор.
P.S. Статья интересная, спасибо!
А затем делается мощный вывод: здесь 99, там 99, 99/198 = 0,5, значит, вероятность наличия болезни 0,5. Если приверженцы теоремы так оценивают вероятность события, то это — адовая казуистика.

Я не понял, что именно вам не нравится? Плюс, если теорема доказана, то нет смысла говорить о «приверженцах».
Пока комментарий был на модерации, уже разобрался в вопросе. Нравится всё. Сделал для себя полезные выводы, по новому теперь оцениваю вклад ложноположительных срабатываний систем мониторинга на работе в общую картину доступности ИТ-инфраструктуры. Будем с ними (срабатываниями) бороться посильно.

Согласен с комментарием xMushroom ниже, что иная формулировка фразы сделала бы ее понятнее.
Полагаю, автор просто пропустил слово «положительных», решив, что оно и так понятно из предыдущих рассуждений. С Байесом лучшего такого не делать, а то и самому запутаться недолго. :)
Правильно это должно было звучать:
Да, ваш отличный тест с 99%-й точностью выдаёт столько же ложных положительных срабатываний, сколько и истинных положительных.

Знание = сумма последовательных уверенностей, (С) если не ошибаюсь Веды

Я вообще не понимаю, почему этот тест назван «на 99% надежным». Это в чистом виде маркетинговый ход. И цифры там подобраны так, что путаница в голове — где логическая зависимость, а где численное равенство.


               Указал наличие болезни
Тест_№  Больные(Б%)  Здоровые(Зд%)
  1       99%           1.0%    — здесь сумма больных со здоровыми равна 100%
  2       99%           2.7%    — здесь сумма Б%+Зд% не равна 100%
  3       99%           3.3%    — здесь сумма Б%+Зд% не равна 100%

Я не понимаю, по какому критерию тест №1 был назван «на 90% надежным». Его численные характеристики — Б% («указал наличие болезни у больного») и Зд%(«ложно указал наличие болезни у здорового»).


Сумма Б%+Зд% не должна быть равна 100%!!! Их нельзя складывать, это сложение сапогов с
пирогами!
И находить какой-то общий "хэш" для срабатывания по больным и здоровым тоже нельзя, будет искажение информации. Только срабатывания по больным отдельно и по здоровым отдельно.


Складывать нельзя, потому что результат теста — косвенный признак, а не сама болезнь. Сложение же подразумевает идентичность единиц измерения (признаков), и для этого тест ВСЕГДА должен работать верно (типа тот 1% «здоровых» людей на самом деле больны, а 1% «больных» людей на самом деле здоровы). В нашем случае это априори не так…

Я вообще не понимаю, почему этот тест назван «на 99% надежным». Это в чистом виде маркетинговый ход.

Как по-вашему следует назвать тест, который из 100 проверок в среднем ошибается один раз?
И в чем заключается «маркетинговый ход», если этого теста не существует в природе и он вообще не продается, а был выдуман исключительно для примера?
А разве кто-то говорил, что должна?
Допустим, ваш тест надёжен на 99%. То есть, 99 из 100 человек, больных раком, получат положительный результат, и 99 здоровых людей из 100 получат отрицательный результат.

Вроде тут никто ничего не складывал. Просто для простоты примера в обоих направлениях взяты одинаковые цифры, что и позволило (опять же, для простоты) обозвать тест как в общем на 99% надежный. По-моему, вполне разумное упрощение, пример и так не слишком простой.
Там ещё и вероятность здоровья тоже взята 99%, но вы же понимаете, что это чисто совпадение (взяли красивые цифры для наглядности), и не говорит о взаимозависимости этих величин?

их действительно не стоит складывать, потому что у нас могут быть разные проценты надёжности для положительного и отрицательного результата (например бывают тесты которые вообще никогда не дают ложноотрицательных результатов) и нам правильнее указывать обе эти цифры отдельно(и когда это важно их так и указывают). тем не менее мы спокойно можем "сложить" результаты для получения некоторой общей надёжности всего теста если такой показатель нам удобнее.

Теорема Байеса – это лишь экспресс-метод подсчёта вероятностной обоснованности нового на основе статически имеющихся доказательств свидетельств:
«мнение о выборе нового с обоснованностью есть функция выбора вероятности доказательств суждения из N-матриц: [i-изначальное мнение / i-свидетельства]
По такому же сравнительному принципу работают сейчас многие нейронные сети, отсекая заранее ненужный перебор вероятностей, а также по похожему способу работают скалярные микросхемы.
В итоге результат получают более быстро, но не значит, что точнее. А последующий цикл подбора получается более эффективным.
Здравый смысл в этом методе есть, так как любые отдельные субъективные свидетельства могут быть изменчивы, то только их динамический массив в текущий момент времени дает объективную картину мира. Это и нужно принципу эволюции.
Но это всё усредняет мышление, так как по такому принципу люди, доказывающие теорему Байеса – ну просто «ботаны», не достойные внимания, так как они скрупулёзно доказывающие то, чего нет.
Так как:
«Достоверность вашего убеждения зависит от того, насколько сильно общие убеждения объясняет существующие факты, а чем больше вариантов такого объяснения фактов, тем менее достоверно ваше личное убеждение».

Закончим подсчёты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099, и получим 0,5.


Если вы поделите 0,0198 на 0,0099, то получится 2, а не 0,5. Здесь аргументы перепутаны местами.
Закончим подсчёты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099, и получим 0,5.

Все правильно написано.

Но написано так, что помогает перепутать. Предмет разбора и так на путаницу провоцировать горазд, а тут ещё и это…

в работах философа Кёртиса Брауна и специалистов по информатике Оскара Бонилла и Калида Азада

Что это за авторы, и какие работы имеются в виду?

Sign up to leave a comment.

Articles