Теории вероятностей: готовимся к собеседованию и разрешаем «парадоксы» / Хабр

Каждый год я участвую примерно в сотне собеседований в образовательных проектах JetBrains: собеседую абитуриентов в Computer Science Center и корпоративную магистратуру ИТМО (кстати, набор на программу идёт прямо сейчас). Все собеседования устроены по одному шаблону: мы просим на месте порешать задачи и задаём базовые вопросы по дисциплинам, которые студенты изучали в университетах. Большинство вопросов, которые мы задаём, довольно простые — нужно дать определение некоторого понятия, сформулировать свойство или теорему. К сожалению, у значительной доли студентов все эти определения выветриваются сразу после экзаменов в университетах. Казалось бы, что тут удивительного? В современном мире любое определение можно за пару секунд нагуглить, если это нужно. Но невозможность восстановить базовое определение свидетельствует о непонимании сути предмета.

Если непонимание алгебры или математического анализа может мало влиять на вашу жизнь, то непонимание теории вероятностей делает из вас лёгкую мишень для обмана и манипулирования. Суждения о вероятностях различных событий настолько глубоко вошли в нашу повседневную жизнь, что умение правильно рассуждать и отличать правду от невежества или манипуляции является необходимым. В этом небольшом обзоре мы поговорим о базовых понятиях теории вероятностей, научимся правильно формулировать утверждения про простые случайные процессы и разберём несколько парадоксов. Часть материала позаимствована из брошюры А. Шеня «Вероятность: примеры и задачи», которую я очень рекомендую для самостоятельного изучения.

Перед тем, как говорить об определениях, нам нужно договориться о том, откуда же в нашем мире берётся случайность. Например, почему мы считаем, что подбрасывание монеты — это случайный процесс? С точки зрения классической физики, описывающей процессы в макромире, всё детерминировано, поэтому по параметрам подброса монеты можно однозначно определить, какой стороной она упадёт. Однако на практике оказывается, что измерить и учесть все силы, которые действуют на монетку фактически, невозможно, и поэтому результат этого эксперимента принято считать случайным. Важно понимать, что этот вопрос не является вопросом теории вероятностей. Теория вероятностей работает с моделями — для неё монетка, у которой орёл и решка выпадают одинаково часто, и монетка, у которой орлов в два раза больше, чем решек, — это просто две разные модели. Вопрос о том, какая из моделей больше соответствует наблюдаемой действительности — это вопрос нашего опыта (опыт показывает, что частота орла и решки примерно одинаковая). Таким образом, первым делом мы должны договориться о модели.

Определения

Для определения модели, которая позволит нам говорить о вероятностях, нужно описать вероятностное пространство.

Вероятностное пространство в самом простом конечном случае состоит из множества элементарных исходов $\Omega = \{a_1, a_2, \dotsc, a_n\}$ и набора неотрицательных чисел $\{p_1,p_2,\dotsc, p_n\}$ , таких что их сумма равна $inline$ . Довольно часто все исходы считаются равновероятными, т.е. $p_1=p_2=\dotsb=p_n$ . В более сложном бесконечном случае нужно отдельно выделять множество интересующих нас событий и задавать вероятности событий при помощи функции, называемой вероятностной мерой. Событием называется множество, состоящее из элементарных событий, т.е. любое подмножество $\Omega$ . Вероятность события $E\subseteq \Omega$ , обозначается $\Pr[E]$ , — это сумма всех таких $inline$ , что $a_i\in E$ . В частности, вероятность пустого события $E = \emptyset$ равна нулю, а события $E=\Omega$ равна 1. В случае, когда все исходы считаются равновероятными, вероятность события просто равна отношению количества исходов, содержащихся в событии, к общему количеству элементарных исходов, т.е. $\Pr[E] = |E| / |\Omega|$ .

Вероятность любого события заключена между 0 и 1. Если вероятность события нулевая, то такое событие называется невозможным, если же вероятность события равна единице, то такое событие называется достоверным.

Важно, что без определения вероятностного пространства нельзя (в математическом смысле) говорить о вероятности чего-либо.

Замечание

На основе определения вероятностного пространства легко провести разделение между теорией вероятностей и статистикой: теория вероятностей предсказывает частоты на основе знания вероятностного пространства, а статист��ка решает обратную задачу — на основе наблюдаемых частот определяет параметры неизвестного вероятностного пространства.

Пример: подбрасывание монетки

Будем считать, что монетка ~~чеканная~~ «правильная» или «симметричная», т.е. она одинаково часто выпадает орлом и решкой, а на ребро никогда не встаёт. Тогда множество элементарных исходов состоит из двух элементов, $\Omega = \{ \text{ОРЁЛ}, \text{РЕШКА}\}$ . Так как мы договорились, что монетка «правильная», то разумно считать, что $inline$ . Теперь давайте перечислим все возможные события и их вероятности.

Не выпадет ни орёл, ни решка. Это соответствует событию $E = \emptyset$ , $\Pr[E] = 0$ .
Выпадет орёл, $E = \{\text{ОРЁЛ}\}$ , $\Pr[E] = 1/2$ .
Выпадет решка, $E = \{\text{РЕШКА}\}$ , $\Pr[E] = 1/2$ .
Выпадет орёл или решка, $E = \{\text{ОРЁЛ}, \text{РЕШКА}\}$ , $\Pr[E] = 1/2 + 1/2 = 1$ .

Пример: подбрасывание игрального кубика

Как и в случае с монеткой мы будем предполагать, что игральный кубик выпадает всеми гранями одинаково часто. Тогда множество элементарных исходов состоит из шести элементов, $\Omega = \{ 1, 2, 3, 4, 5, 6\}$ , все их вероятности равны $p_1 = p_2 = \dotsb = p_6 = 1/6$ . Количество различных событий в этом эксперименте равно $inline$ (это количество всех подмножеств множества из 6 элементов). Удивительным образом вопрос «сколько существует различных событий в эксперименте с подбрасывание игрального кубика?», по моим наблюдения, ставит в тупик 9 из 10 абитуриентов.
Давайте рассмотрим некоторые примеры событий.

Выпадет 1, $E = \{1\}$ , $\Pr[E] = 1/6$ .
Выпадет число большее трёх, $E = \{4, 5, 6\}$ , $\Pr[E] = 1/6 + 1/6 + 1/6 = 1/2$ .
Выпадет число кратное трём, $E = \{3, 6\}$ , $\Pr[E] = 1/6 + 1/6 = 1/3$ .

Пример: два подбрасывания монетки

В тех же предположениях о «симметричености» монеты мы определим множество элементарных исходов как множество упорядоченных пар

$\Omega = \{ (\text{ОРЁЛ}, \text{ОРЁЛ}), (\text{ОРЁЛ}, \text{РЕШКА}), (\text{РЕШКА}, \text{ОРЁЛ}), (\text{РЕШКА}, \text{РЕШКА})\}.$

Симметриченость монетки позволяет нам заключить, что все элементарные исходы равновероятны, т.е. $inline$ .
Примеры событий.

В первом броске выпадет решка, $E = \{(\text{РЕШКА},\text{ОРЁЛ}), (\text{РЕШКА}, \text{РЕШКА})\}$ , $\Pr[E] = 1/4 + 1/4 = 1/2$ .
Выпадет хотя бы одна решка, $E = \{(\text{РЕШКА},\text{ОРЁЛ}), (\text{РЕШКА}, \text{РЕШКА}),(\text{ОРЁЛ}, \text{РЕШКА})\}$ , $\Pr[E] = 1/4+1/4+1/4 = 3/4$ .
Монетка дважды выпадет одной стороной, $E = \{(\text{ОРЁЛ}, \text{ОРЁЛ}), (\text{РЕШКА}, \text{РЕШКА})\}$ , $\Pr[E] = 1/4 + 1/4 = 1/2$ .

Пример: выбираем случайное число из календаря 2020 года

Множество элементарных исходов $\Omega = \{1, 2,\dotsc,31\}$ . Как выбрать вероятности? Это зависит от того, как устроен эксперимент. Например, мы можем вырвать случайный лист отрывного календаря и посмотреть число на нем. Наиболее точной моделью, описывающей этот эксперимент, было бы вероятностное пространство с $inline$ исходами, где одинаковые числа разных месяцев различаются. И тогда вероятность того, что выпадет число 1, была бы суммой вероятностей элементарных исходов, соответствующих первым числам разных месяцев, т.е. $12\cdot 1/366$ . Но мы можем для удобства рассмотреть более простое множество элементарных исходов $\Omega$ с 31 исходом, но с разными вероятностями: $p_1 = p_2 =\dotsb =p_{29} = 12/366$ , $p_{30} = 11/366$ , $p_{31} = 7/366$ .

Пример события: «выпавшее число месяца делится на 10». Это соответствует событию
$E = \{10,20,30\},\ \Pr[E] = p_{10} + p_{20} + p_{30} = (12+ 12+11)/366 = 35/366$ .

Замечание

Как только мы определили вероятностное пространство (т.е. определились с множеством $\Omega$ и вероятностями, которые мы приписываем элементарным исходам), то вопрос о вероятности некоторого события становится чисто арифметическим. Другими словами, как только мы выбрали некоторую математическую модель, которая с нашей точки зрения описывает физический процесс, то вероятности всех событий однозначно определены.

Задачи для самопроверки

В каждой задаче следует сначала описать вероятностное пространство, а уже только потом производить вычисления.

Бросаем два игральных кубика: красный и синий. Определите вероятность того, что цифры на красном и синем кубиках совпадут.
В этом же эксперименте с кубиками нужно найти наиболее вероятную сумму цифр на кубиках.
Наудачу выбирается одно число от 1 до 20. Считая все числа равновозможными, определите вероятность того, что выбранное число:
- чётно;
- делится на 3;
- делится и на 2, и на 3;
- не делится ни на 2, ни на 3;
- имеет сумму цифр 9;
- имеет сумму цифр, делящуюся на 3.

Пример вероятностного пространства, не соответствующего физическому миру

Рассмотрим следующий эксперимент: подбрасываем две монетки и смотрим на то, какими сторонами они выпали. Можно было бы сказать, что в данной задаче всего три исхода: две решки, два орла и орёл и решка. Если предполагать, что все исходы равновозможны, то получается, что вероятность выпадения двух орлов равна 1/3. Математика не запрещает нам рассматривать такое вероятностное пространство, но экспериментальная проверка подсказывает, что в физическом мире ответ скорее ближе к 1/4. Поэтому не стоит по умолчанию предполагать все исходы равновозможными, иначе мы получим 1/2 в ответ на вопрос о вероятности встречи динозавра.

Формула суммы вероятностей

Будем называть два события несовместными, если их пересечение равно пустому множеству. Т.е., нет исходов, которые соответствовали бы обоим событиям. Пример: события «на игральном кубике выпало чётное число» и «на игральном кубике выпала единица или тройка» несовместны.

Несовместные события обладают следующим свойством. Пусть $inline$ и $inline$ — два несовместных события. Вероятность того, что произойдёт хотя бы одно из них, равна сумме вероятностей $inline$ и $inline$ , другими словами $\Pr[A\cup B] = \Pr[A] + \Pr[B]$ , событие $A\cup B$ также называют суммой событий $inline$ и $inline$ и обозначают $inline$ . Это свойство не выпол��яется для произвольных событий. Например, события «на игральном кубике выпало чётное число» и «на игральном кубике выпало число больше четырёх» не несовместны и сумма их вероятностей (5/6) больше вероятности их суммы (4/6).

Рассмотрим следующую задачу. В мешке лежат шарики трёх цветов: белые, жёлтые и чёрные. Причём известно, что белых $10\%$ от общего числа, а жёлтых — $15\%$ . Какова вероятность того, что случайно вытащенный шар будет светлым? Аккуратный подсчёт показывает, что если в мешке $inline$ шаров, то рассматриваемому событию соответствует $inline$ шаров, т.е. $25\%$ от общего числа шаров. События «вытащен белый шар» и «вытащен жёлтый шар» несовместны, поэтому вероятность, что шар будет светлым равна сумме вероятностей этих событий.

События называются противоположными, если всегда происходит ровно одно из них. Из этого определения можно заключить, что во-первых, эти события несовместны, а во-вторых, их суммарная вероятность равна 1. Событие, противоположное событию $inline$ , выражается, как $\Omega\setminus E$ (если все элементарные исходы имеют положительную вероятность, то это единственное такое событие).

Задача для самопроверки

Наудачу выбирается число $inline$ от 1 до 100. Рассмотрим следующие события:

число $inline$ чётно;
число $inline$ нечётно;
число $inline$ делится на 4;
число $inline$ имеет остаток 2 при делении на 4;
число $inline$ имеет остаток 1 при делении на 4.

Какие из этих событий несовместны? (укажите все пары)

Формула включений и исключений

Как определить вероятность суммы двух событий, которые не являются несовместными? Рассмотрим следующий пример. Среди учеников школы $15\%$ процентов знают французский язык и $20\%$ знают немецкий. Доля тех, кто владеет обоими языками всего $5\%$ . Какова доля учеников, знающих хотя бы один из этих двух языков? Если нарисовать диаграмму, если мы сложим доли знающих французский и знающих немецкий, то мы дважды посчитаем тех, кто знает оба языка. Поэтому ответ: $15\% + 20\% - 5\%= 30\%$ .

Этот же вопрос можно сформулировать и на языке теории вероятностей: с какой вероятностью случайно выбранный школьник знает хотя бы один из двух языков? Аналогичное рассуждение приводит нас к следующей формуле:

$\Pr[A\cup B] = \Pr[A] + \Pr[B] - \Pr[A\cap B],$

где $A\cap B$ — это пересечение событий $inline$ и $inline$ , т.е. это событие состоящее из тех элементарных исходов, которые входят одновременно и в $inline$ , и в $inline$ (такое событие также называют произведением событий $inline$ и $inline$ и обозначают $\Pr[AB]$ ).

Задача для самопроверки

Известно, что ученики класса, имеющие двойки по алгебре, составляют 25%, а ученики, имеющие двойки по геометрии, составляют 15%. Сколько учеников имеют двойки и по алгебре, и по геометрии, если ученики, не имеющие двоек ни по одному из предметов, составляют 70%?

Условная вероятность

Снова рассмотрим задачу про учеников и иностранные языки. Какая доля среди школьников знающих немецкий знает и французский? Ответ легко вычислить, посмотрев на картинку. Нужно вычислить отношение количества школьников знающих оба языка к количеству школьников знающих немецкий, т.е. $\frac{0.05N}{0.2N} = 25\%$ . Переходя к языку теории вероятностей можно задаться следующим вопросом: какова вероятность, что случайно выбранный школьник знает французский при условии, что он знает немецкий? Пусть события $inline$ и $inline$ соответствуют тому, что случайно выбранный школьник знает французский и немецкий соответственно. Тогда искомая вероятность называется условной вероятностью наступления $inline$ при условии $inline$ и обозначается $\Pr[A\mid B]$ . По аналогии получаем следующую формулу для условной вероятности:

$\Pr[A\mid B] = \frac{\Pr[A\cap B]}{\Pr[B]}.$

Какова вероятность, что случайно выбранный школьник знает немецкий при условии, что он знает французский?

Из формулы условной вероятности можно получить формулу для вероятности произведения двух событий.

$\Pr[A\cap B] = \Pr[B] \cdot \Pr[A\mid B].$

Словами: чтобы найти вероятность того, что произойдут оба события $inline$ и $inline$ , надо умножить вероятность события $inline$ на условную вероятность события $inline$ при известном $inline$ .

Задача для самопроверки

В классе 50% мальчиков; среди мальчиков 60% любит мороженое. Какова доля мальчиков, любящих мороженое, среди учеников класса? Как это переформулировать на языке теории вероятностей?

Независимость

Рассмотрим эксперимент с бросанием двух игральных кубиков: красного и синего. В этом эксперименте имеются 36 исходов, которые мы считаем равновозможными. Вероятность того, что на красном кубике выпадет тройка, равна $inline$ (6 исходов из 36), вероятность того, что на синем кубике выпадет тройка, тоже равна $inline$ . Какова вероятность того, что на синем кубике выпадет тройка при условии, что на красном выпала тройка? По формуле условной вероятности нужно посчитать отношение вероятности выпадения тройки на обоих кубиках к вероятности выпадения тройки на красном. Получаем $\frac{1/36}{1/6} = 1/6$ . Заметим, что наличие информации о том, что на красном кубике выпала тройка, никак не влияет на вероятность выпадения тройки на синем. Такие события будем называть независимыми. Будем говорить, что события $inline$ и $inline$ независимы, если

$\Pr[A\mid B] = \Pr[A].$

(В этом определении предполагаются, что обе вероятности событий $inline$ и $inline$ строго больше нуля.)

Альтернативное определение можно получить, если воспользоваться определением условной вероятности: два события называются независимыми, если вероятность их произведения равна произведению их вероятностей.

$\Pr[AB] = \Pr[A]\cdot \Pr[B].$

Задачи для самопроверки

Являются ли события «знать немецкий» и «знать французский» независимыми?
Бросаем один игральный кубик. Являются ли независимыми события:
1. «выпало чётное» и «выпало нечётное»,
2. «выпало чётное» и «выпало 2»,
3. «выпало чётное» и «выпало кратное трём».

Следующий шаг — это разговор про формулу Байеса, которая выводится из определения условной вероятности. Перепишем определение:

$P[B\mid A] = \frac{P[A\cap B]}{P[A]}\quad \Rightarrow\quad P[A\cap B] = P[B\mid A]\cdot P[A].$

И подставив это в определение получаем формулу Байеса

$P[A\mid B] = \frac{P[A\cap B]}{P[B]} = \frac{P[B\mid A]\cdot P[A]}{P[B]},$

которая позволяет менять местами событие и условие под знаком вероятности. Думаю, что про применение формулы Баейса нужно писать отдельный пост, например, такой.

На этом мы закончим с определениями и перед тем, как перейти к парадоксам, давайте обсудим, а в каких случаях мы можем говорить о вероятности.

Когда мы можем говорить о вероятности?

Предлагаю рассмотреть несколько вопросов, которые проиллюстрируют важность формулировок.

Какова вероятность того, что гуляя по улице вы встретите динозавра?

Я думаю, что всем ясно, что это не 1/2. Но всё же, как правильно ответить на этот вопрос? Проблема этого вопроса в том, что он сформулирован некорректно — из него нельзя однозначным образом определить вероятностное пространство, а следовательно и о вероятности говорить нельзя. Можно предложить какую-нибудь другую формулировку вопроса, в которой это будет очевидно. Например, начиная с завтрашнего дня на каждой улице города каждую минуту с вероятностью 0.00001 материализуется динозавр и существует в течение часа, никуда не уходя. В данной формулировке понятен случайный процесс и можно оценить вероятность встречи, если определить, как устроена прогулка, сколько длится и сколько улиц она затрагивает.

Вы подбросили монетку и не подглядывая накрыли её рукой. Какова вероятность того, что монетка повёрнута орлом вверх?

Очень хочется сказать, что в данном случае уж точно вероятность — 1/2. Однако, строго говоря, никакого случайного процесса уже нет. Монетка уже упала какой-то стороной. От того, что вы чего-то не знаете, не значит, что это что-то случайное. Например, если вы не знаете решение уравнения — это не значит, что его решением с одинаковой вероятностью может быть любое число. Поэтому в данном случае описать вероятностное пространство не получится. Можно переформулировать вопрос, например, так: «Какова вероятность, что вы угадаете сторону монетки, если наугад равновероятно выберите орёл или решку?». В такой формулировке уже ясно, что является случайным процессом (выбор орла или решки), как определить вероятностное пространство и получить ответ 1/2. При этом, в такой формулировке уже совершенно неважно, была монетка «честной» или нет.

Замечание. Нашу ��веренность в чём-то тоже можно описывать в терминах теории вероятностей — это делается в рамках Байесовской интерпретации теории вероятностей. Эта интерпретации позволяет использовать аппарат теории вероятностей для оценки нашей уверенности в истинности каких-то утверждений (не обязательно случайных) основываясь на информации, которая нам известна. Однако стоит заметить, что в этом случае понятие вероятности становится субъективным — у одного и того же события с точки зрения разных наблюдателей может быть разная вероятность. Например, в покере вы можете считать вероятность выпадения пиковой дамы положительной (так как вы не видите её на столе и в своей руке), а ваш противник, у которого в руке уже есть пиковая дама, будет оценивать вероятность её выпадения как нулевую. При этом можно придумать и такой вариант, в котором обе оценки окажутся отличными от «реальной», объктивной, вероятности. В этом нет противоречия, т.к. в это три различные величины (игроки обладают разной информацией, а объективная вероятность в данном случае соответствует полной информации).

Вы проснулись утром. Какова вероятность того, что сегодня воскресенье?

Думаю, что вы уже поняли, что ответ 1/7 — неправильный, а точнее, вопрос некорректный. Не понятно, что является случайный процессом. Для того, чтобы получить 1/7 нужно уточнить вопрос, например, так: вы засыпаете в воскресенье вечером и случайным образом просыпаетесь в любое утро на следующей неделе, какова вероятность, что вы проснётесь в воскресенье? Но даже с этим уточнением, если спросить вас о дне недели уже после того, как вы проснулись (после того, как случайный выбор был сделан), то такой вопрос останется некорректным — иначе придётся предполагать, что вы находитесь в суперпозиции всех дней недели до тех пор, пока не посмотрите на календарь.

Я написал на доске некоторое (конкретное) число и утверждаю, что дважды успешно проверил его на простоту вероятностным алгоритмом, который ошибается с вероятность менее 1%. С какой вероятностью это число простое?

Хотелось бы сказать, что это число простое с вероятностью более 99.99%. Однако, с математической точки зрения число может быть либо простым, либо нет. Поэтому так говорить некорректно. После того, как алгоритм завершил работу, ничего случайного в этой постановке задачи уже нет, следовательно нет и вероятности. Правильно было бы сказать, что вы уверены на 99.99%, что это число простое, но и это вы можете заявить только в том случае, если доверяете мне на 100% :)

Парадоксы

В этом разделе мы попробуем разобрать несколько известных «парадоксов» теории вероятностей и понять, что в них либо нет противоречий, либо вопросы поставлены некорректно.

Парадокс Монти-Холла

Этот очень известный парадокс. Об него было сломано много копий, в том числе даже именитые математики давали неправильный ответ.

Представьте, что вы стали участником игры, в которой вам нужно выбрать одну из трёх дверей. За одной из дверей находится автомобиль, за двумя другими дверями — козы. Вы выбираете одну из дверей, например, номер 1, после этого ведущий, который знает, где находится автомобиль, а где — козы, открывает одну из оставшихся дверей, например, номер 3, за которой находится коза. После этого он спрашивает вас — не желаете ли вы изменить свой выбор и выбрать дверь номер 2? Увеличатся ли ваши шансы выиграть автомобиль, если вы примете предложение ведущего и измените свой выбор?

Как подсказывает Википедия, для того, чтобы задача была определена корректно, нам требуется уточнить, что участнику игры заранее известны следующие правила:

автомобиль равновероятно размещён за любой из трёх дверей;
ведущий знает, где находится автомобиль;
ведущий в любом случае обязан открыть дверь с козой (но не ту, которую выбрал игрок) и предложить игроку изменить выбор;
если у ведущего есть выбор, какую из двух дверей открыть, он выбирает любую из них с одинаковой вероятностью.

Если вы не знакомы с этим парадоксом, то я предлагаю вам несколько минут подумать о том, каким будет правильный ответ.

Для того, чтобы ответить на заданный вопрос, давайте разберёмся, что тут является случайным процессом. По уточнению видно, что случайный процесс упоминается только в пунктах 1 и 4: «автомобиль равновероятно размещён за любой из трёх дверей» и «если у ведущего есть выбор, какую из двух дверей открыть, он выбирает любую из них с одинаковой вероятностью». Вопрос, на который мы должны научиться отвечать, звучит так: «Увеличатся ли ваши шансы выиграть автомобиль, если вы примете предложение ведущего и измените свой выбор». Т.е. нас спрашивают о том, какая из двух стратегий даёт большую вероятность выигрыша. Замечу, что условие номер 4 никак не влияет на факт выигрыша игрока, поэтому нет смысла включать его в вероятностное пространство. Поэтому предлагается выбрать вероятностное пространство с множеством элементарных исходов $\Omega = \{1,2,3\}$ , соответствующим номеру двери, за которым находится автомобиль, и вероятностями $inline$ . Теперь рассмотрим две стратегии игрока: «оставить выбранную дверь», обозначим $inline$ , и «сменить дверь», обозначим $inline$ .

Мы не знаем, как игрок делает выбор первой двери, но нам и не нужно это знать. Достаточно проверить, как работает стратегия при всех выборах первой двери. Обозначим через $inline$ дверь, которую игрок выбрал изначально, а через $inline$ — дверь, за которой спрятан автомобиль. Тогда для любого $d \in \{1,2,3\}$ событие «игрок выиграл при использовании стратегии $inline$ » соответствует тому, что он угалад правильную дверь с первой попытки. Говоря формально, нас интересует событие $E_1 = \{d\}$ , т.е. $inline$ , и его вероятность $inline$ . Событие «игрок выиграл при использовании стратегии $inline$ » соответствует противоположному событию $E_2 = \Omega\setminus \{d\}$ , т.е. $x \neq d$ , и его вероятность $inline$ . Осталось ещё раз отметить, что, если этот анализ верен для любого выбора $inline$ , поэтому верен и при любой стратегии выбора первой двери. Кроме того, заметим, что мы никак не использовали условие 4.

Как видите, никаких неоднозначностей тут нет, парадоксом эта задача называется только потому, что ответ может не соответствовать интуиции. Но так в математике случает��я довольно часто.

Парадокс мальчика и девочки

Цитирую Википедию.

Впервые задача была сформулирована в 1959 году, когда Мартин Гарднер опубликовал один из самых ранних вариантов этого парадокса в журнале Scientific American под названием «The Two Children Problem», где привёл следующую формулировку:

У мистера Джонса двое детей. Старший ребёнок — девочка. Какова вероятность того, что оба ребёнка — девочки?

У мистера Смита двое детей. Хотя бы один ребёнок — мальчик. Какова вероятность того, что оба ребёнка — мальчики?

Сам Гарднер изначально давал ответ $inline$ и $inline$ соответственно, но впоследствии понял, что ситуация во втором случае неоднозначна. Ответом на второй вопрос может быть и $inline$ в зависимости от того, как было выяснено, что один из детей — мальчик.

Вероятностное пространоство задано $\Omega = \{\text{ММ},\text{МД},\text{ДМ},\text{ДД}\}$ и все вероятности равны $inline$ . В первом случае нам известно, что выполнено событие $E = \{\text{ДМ},\text{ДД}\}$ . Поэтому при условии $inline$ вероятность двух девочек равна 1/2.

Во втором случае всё сложнее, т.к. не понятно, как мы узнали, что у мистера Смита один из детей мальчик. Можно предположить два варианта:

Выбирается случайный человек с двумя детьми и его спрашивают, есть ли среди его детей мальчик. Тогда вероятность двух мальчиков получится 1/3, т.к. это соответствует вероятности ММ при условии события $E = \{\text{ММ},\text{МД},\text{ДМ}\}$ .
Выбирается случайный человек с двумя детьми, выбирается случайный его ребёнок (старший или младший) и спрашивается его пол. Этот эксперимент соответствует другому вероятностному пространству, в котором нужно ещё учесть выбор того ребёнка, про которого спрашивают. В нём будет 8 элементарных исходов, и нам подойдут четыре из них (ММ и спросили про старшего, ММ и спросили про младшего, МД и спросили про старшего, ДМ и спросили про младшего). Нам подходят два исхода, поэтому ответом будет 1/2.

Парадокс Спящей Красавицы

Обсуждение этого парадокса мотивировано вот этим постом на хабре, который вызвал широкое обсуждение, но описание этого парадокса есть и в википедии.

Испытуемой («Спящей Красавице») делается укол снотворного. Бросается симметричная монетка. В случае выпадения орла её будят, и эксперимент на этом заканчивается. В случае выпадения решки её будят, делают второй укол (после чего она забывает о побудке) и будят на следующий день, не бросая монеты (в таком случае эксперимент идёт два дня подряд). Вся эта процедура Красавице известна, однако у неё нет информации, в какой день её разбудили.

Представьте себя на месте Спящей Красавицы. Вас разбудили. Какова вероятность того, что монетка упала решкой?

Предлагается рассмотреть два альтернативных решения с разными результатами.

Решение 1

У вас нет никакой информации о результате выпадения монеты и предыдущих побудках. Поскольку известно, что монетка честная, можно предположить, что вероятность выпадения решки равна $inline$ .

Решение 2

Проведём эксперимент 1000 раз. Спящую Красавицу будят в среднем 500 раз с орлом и 1000 раз с решкой (т.к. при выпадении решки Спящую Красавицу спрашивают 2 раза). Поэтому вероятность выпадения решки равна $inline$ .

Кажется, что оба решения могут претендовать на звание правильного. Однако, при попытке определить вероятностное пространство нас ожидают серьёзные трудности. Что же является случайным процессом? Дело в том, что когда Спящая Красавица просыпается, никакого случайного процесса уже нет. Выбор уже сделан. Ей не известен результат этого выбора, но ничего случайного уже нет. Это возвращает нас к примеру с динозавром. Если вы не знаете, есть ли за углом динозавр, то это не значит, что он там есть с вероятностью 1/2. Поэтому «Решение 1» отвечает не на вопрос про вероятность, а на вопрос про степень уверенности Спящей Красавицы. А «Решение 2» предлагает рассмотреть совершенно другой эксперимент, в котором задаётся в общем-то совершенно другой вопрос, на который предлагается ответить внешнему наблюдателю до начала эксперимента.

Для того, чтобы придать этому вопросу математический смысл и получить желаемый ответ 2/3, придётся воспользоваться каким-нибудь философским приёмом, вроде «подселения душ». Например, так: вы заходите в аппарат переселения душ, после этого подбрасывается монетка для Спящей Красавицы, которая создаёт две параллельные вселенные: одну, где монетка выпала орлом, и другую, где выпала решкой. Суммарно в пространстве-времени этих двух альтернативных вселенных есть три различных пробуждения Спящей Красавицы. Аппарат по переселению душ с вероятностью 1/3 подселяет вашу душу в тело Спящей Красавицы незадолго до одного из этих пробуждений. Какова вероятность, что вы проснетесь в параллельной вселенной, где выпала решка?

Как видите, для придания математического смысла этому вопросу, придётся хорошенько пофантазировать, но этим занимаются не математики, а философы (подробнее в этом посте). Утверждать, что «оба решения правильные», некорректно с математической точки зрения.

Задача для самопроверки

Объясните, почему в задаче о детях моряка, с которой начинается этот пост, вопрос поставлен некорректно (т.е. ни 1/2, ни 1/3 не являются правильным ответом).

Бесконечный случай

Когда мы переходим к бесконечному случаю, т.е. рассматриваем эксперименты с бесконечным числом элементарных исходов, то всё становится значительно сложнее. Я не буду вдаваться в детали и даже не буду определять вероятностное пространство для бесконечного случая, т.к. это требует более сложной математики. Однако, для иллюстрации отмечу, что в бесконечном случае могут быть такие (плохие) множества элементарных исходов, которые не имеют вероятности (неизмеримые множества). При этом для всех хороших (измеримых) событий вероятность определена однозначно. Поэтому и те «парадоксы», которые возникают в бесконечном случае, тоже возникают из-за неоднозначности выбора вероятностного пространства. Хорошим наглядным примером служит парадокс Бертрана, показывающий, как казалось бы эквивалентные (на самом деле нет) вероятностные пространства приводят к разным результатам.

Вместо заключения

Даже если вы не собираетесь никуда поступать или проходить собеседования на технические позиции в IT-компании, то вы всё равно можете захотеть освежить знания по математике, которые могут пригодиться в программировании. Могу посоветовать онлайн-курс СS центра по теории вероятностей, который читает А.И. Храбров.

БОНУС

Приглашаю всех послушать лекция Александра Шеня «Генераторы «случайных чисел»: теория и практика» в это воскресенье 26 апреля в 14:00 в Computer Science клубе. Лекция будет читаться в zoom-е, для участия нужно записаться на курс или подписаться на рассылку.

Теории вероятностей: готовимся к собеседованию и разрешаем «парадоксы»

Определения

Замечание

Пример: подбрасывание монетки

Пример: подбрасывание игрального кубика

Пример: два подбрасывания монетки

Пример: выбираем случайное число из календаря 2020 года

Замечание

Задачи для самопроверки

Пример вероятностного пространства, не соответствующего физическому миру

Формула суммы вероятностей

Задача для самопроверки

Формула включений и исключений

Задача для самопроверки

Условная вероятность

Задача для самопроверки

Независимость

Задачи для самопроверки

Когда мы можем говорить о вероятности?

Парадоксы

Парадокс Монти-Холла

Парадокс мальчика и девочки

Парадокс Спящей Красавицы

Решение 1

Решение 2

Задача для самопроверки

Бесконечный случай

Вместо заключения

БОНУС

Публикации

Информация