Теория вероятностей. Формула Байеса
Пусть проводится некоторый эксперимент.
— элементарные события (элементарные исходы эксперимента).
— пространство элементарных событий (совокупность всевозможных элементарных исходов эксперимента).
Определение 1:
Система множеств называется сигма-алгеброй, если выполняются следующие свойства:
Из свойств 1 и 2 определения 1 следует, что . Из свойств 2 и 3 определения 1 следует, что т.к.
Определение 2:
- — событие
- — вероятностная мера (вероятность), если:
- при
Свойства вероятности:
Определение 3:
— вероятностное пространство.
Определение 4:
— условная вероятность события при условии события .
Определение 5:
Пусть для , где , выполняется и . Тогда называется разбиением пространства элементарных событий.
Теорема 1 (формула полной вероятности):
— разбиение пространства элементарных событий, .
Тогда .
Теорема 2 (формула Байеса):
— разбиение пространства элементарных событий, .
Тогда .
С помощью формулы Байеса можно переоценить априорные вероятности (), исходя из наблюдений (), и получить совершенно новое представление о реальности.
Пример:
Предположим, что имеется тест, который применяется к человеку индивидуально и определяет: заражён он вирусом «X» или нет? Будем считать, что тест завершился успехом, если он вынес правильный вердикт для конкретного человека. Известно, что этот тест имеет вероятность успеха 0.95, а 0.05 — это вероятность как ошибки первого рода (false positive, т.е. тест вынес положительный вердикт, а человек здоров), так и ошибки второго рода (false negative, т.е. тест вынес отрицательный вердикт, а человек болен). Для ясности, положительный вердикт = тест «сказал», что человек заражён вирусом. Также, известно, что данным вирусом заражён 1% населения. Пусть некоторый человек получил положительный вердикт теста. С какой вероятностью он действительно болен?
Обозначим: — результат теста, — наличие вируса. Тогда по формуле полной вероятности:По теореме Байеса:Получается, что вероятность оказаться заражённым вирусом «X» при условии положительного вердикта теста равна 0.16. Почему такой результат? Изначально, человек с вероятностью 0.01 заражён вирусом «X» и еще с вероятностью 0.05 тест ошибётся. То есть, в случае, когда всего 1% населения заражён данным вирусом, вероятность ошибки теста, равная 0.05, оказывает существенное влияние на вероятность того, что человек действительно болен при условии, что тест дал положительный результат.
Список используемой литературы:
- «Основы теории вероятностей. Учебное пособие», М.Е. Жуковский, И.В. Родионов, МФТИ, МОСКВА, 2015;
- «Глубокое обучение. Погружение в мир нейронных сетей», С. Никуленко, А. Кадурин, Е. Архангельская, ПИТЕР, 2018.