Спасибо огромное! После прочтения первой статья полез в вики и нашел Парадокс Двух Заключенных. Её продолжение — Повторяющийся ПДЗ — наталкивает на кучу интересных размышлений.
В принятии решений вроде бы существует такая парадоксальная стратегия.
Если приходится принимать несколько решений подряд (по той же матрице), то предлагается
выбирать каждую строчку-вариант случайным образом. Но не равномерно-случайно,
а с определёнными вероятностями (P1, P2, P3). Для большинства матриц существует оптимальное распределение
Pi, максимизирующее прибыль.
Спасибо. Вспомнился институтский курс по теории принятия решений. Очень нравилось решать подобные задачки.
Кстати у вас неточность в №3
«При А=0 данный критерий можно заменить критерием максимума, а при А=1 — критерием Вальда.» — исходя из формулы все в точности до наоборот.
Кажется, дело в том, что критерий Сэвиджа считается не для исходной матрицы платежей, а для матрицы рисков (сожалений). На Википедии написано подробнее.
Теория игр: Игры с природой