Недавно, при просмотре неофициального онлайн-турнира по одной соревновательной игре, я ознакомился со следующим утверждением: для двух команд, равных по силе, т.е. когда исход матча моделируется броском симметричной бернуллиевской монетки, при игре в формате "до двух побед" вероятность счёта "в одни ворота", т.е. 2-0/0-2, равна вероятности счёта не "в одни ворота", т.е. 2-1/1-2. Это утверждение заставило меня вытащить из глубин памяти знания школьной комбинаторики и теорвера. Приведу небольшие заметки по данному вопросу.
Сценарий
Две команды — команда 0 и команда 1 — играют серию матчей. Результаты разных матчей серии являются независимыми случайными величинами со следующим распределением. Вероятность победы команды 0 в матче есть , вероятность победы команды 1 есть
. Считаем что
, т.е. ничьей быть не может.
Серия матчей играется в формате "first to ", т.е. до тех пор, пока некая команда не одержит
побед в серии матчей. Формат "first to
" (FT
) эквивалентен формату "best of
" (BO
), где победитель определяется на основании серии матчей длины
— если некая команда уже одержала
побед, то её оппонент не может одержать более
победы, т.е. не может выиграть.
Завершившуюся серию матчей можно представить в виде последовательности нулей и единиц, где на позиции
означает, что матч под номером
выиграла команда 0, а
на позиции
означает, что матч выиграла команда 1. Пример такой последовательности:
В данном примере команда 0 выиграла со счётом 4-2 в FT4/BO7. В дальнейшем для обозначения счёта будем также использовать запись следующего вида: , где
есть число побед команды 0, а
есть число побед команды 1. Т.е. счёт выше можно записать в виде
. Любой счёт завершившейся серии матчей может быть представлен в виде
в случае победы команды 0, и
в случае победы команды 1, где
. Заметим также что команда, победившая в серии матчей, обязана победить в последней игре серии, т.е. в случае победы команды 0 последовательность должна заканчиваться на
, в случае победы команды 1 — на
. Число нулей в последовательности есть число побед команды 0, число единиц в последовательности есть число побед команды 1.
Вероятность определённого счёта в серии матчей
Серия матчей между двумя командами, где в каждом матче результат (победа команды 0 или команды 1) является случайной величиной с указанными выше вероятностями, может быть моделирована как последовательность случайных величин, подчиняющихся распределению Бернулли. Если результаты отдельных матчей независимы, то вероятность выпадения последовательности есть произведение вероятностей отдельных элементов. К примеру, для рассмотренной выше последовательности вероятность именно такой серии матчей есть
. Однако, одному и тому же счёту могут соответствовать разные серии матчей. К примеру, счёт
может получиться из следующих серий:
Необходимо подсчитать общее число возможных серий для произвольного счёта.
В серии матчей для счёта вида (т.е. с победой команды 0) будет содержаться ровно
нулей. Расставим
единиц в последовательность из
нулей. Для первой единицы есть ровно
мест, в которые единицу можно поставить (так как последовательность должна заканчиваться нулём, а серия матчей — победой команды 0). Следующую единицу вставляем в последовательность из
элементов, т.е. возможных мест для её постановки будет
. Считая, что все вставляемые единицы уникальны, получаем
вариантов для вставки единиц в оригинальную последовательность из
нулей. Вспомним теперь, что любая перестановка единиц не меняет получившуюся последовательность. Это значит, что результат необходимо поделить на число перестановок
единиц, равное
. Итого получаем:
Итоговая вероятность счёта есть
.
Для счёта , аналогичным образом, вероятность есть
.
Проверку условия нормировки
оставим читателю.
Результаты
Первым делом посмотрим просто на распределение с произвольно выбранными параметрами:
![](https://habrastorage.org/getpro/habr/upload_files/55c/849/9f0/55c8499f0d77720da992942c5c09e589.png)
График получился асимметричным в силу того, что , максимум вероятности достигается для счёта 3-10, что вполне соответствует заданным вероятностям. Как кривые меняются при изменении вероятностей победы в матче?
![](https://habrastorage.org/getpro/habr/upload_files/3a5/520/ffa/3a5520ffafa8c4bb4cc79ce29ee6361d.png)
Кажется, что вероятность некоторых счётов одинакова — к примеру, при вероятность для 0-10 и 1-10 не поменялась. Обратимся к выведенным ранее формулам. Вероятность счёта
есть
. Вероятность счёта
есть
. Т.е. вероятности оказываются одинаковыми при
. Несмотря на то, что вероятность более длинной серии матчей для счёта
меньше вероятности короткой серии матчей для счёта
, за счёт увеличения числа серий матчей, при которых достигается счёт
вероятность счёта
равна вероятности счёта
.
![](https://habrastorage.org/getpro/habr/upload_files/804/6dc/984/8046dc984186af059158f0b4ebd46efb.png)
Для подобный эффект наблюдается уже при
и
соответственно, тогда как для
и
вероятность есть монотонная функция от счёта. Рассмотрение утверждения о том, что вероятность является монотонной функцией от счёта для любых случаев, когда
либо
, оставим читателю.
Также, при наблюдается равенство вероятностей для счётов 10-8, 10-9, 9-10, 8-10, и для счётов 3-5, 4-5, 5-4, 5-3. Покажем, что для любого
при
вероятность счёта
равна вероятности счёта
.
Вероятность счёта в данном случае есть
, а вероятность счёта
есть
.
Заметим, что .
Получаем, что .
Полученный результат легко объясняется с точки зрения модели: и для счёта и для счёта
в серии матчей должен возникнуть счёт
после какого-то матча. Из этого счёта может с вероятностью
получиться счёт
, либо с вероятностью
может получиться счёт
. Из последнего счёта возможен только счёт
или
с равными вероятностями.
Так, для формата FT2/BO3 получаем что действительно, если команды равны и исход матча определяется симметричной бернуллиевской монеткой, то вероятности счётов 2-0/0-2 и счётов 2-1/1-2 одинаковы и составляют каждый. Означает ли это, однако, что итоговый счёт для формата FT2/BO3 не позволяет извлечь совершенно никакой информации о силе команд и вероятностях победы?
Заметим, что полученные нами ранее формулы для вероятностей счёта позволяют найти ML-оценки вероятностей победы и
. Вероятность счёта
пропорциональна произведению
. Логарифм правдоподобия, с точностью до постоянного слагаемого, есть
. Дифференцируя логарифм правдоподобия по
и приравнивая производную к нулю получаем условие экстремума:
.
Отсюда следуют оценки на вероятности: ,
. Доказательство того, что эти оценки максимизируют логарифм правдоподобия, оставим читателю.
Таким образом, хоть формата FT2/BO3 и недостаточно для точной оценки относительной силы команд, однако некоторую информацию ML-подход всё-таки позволяет извлечь. Рассмотрим, как меняется функция правдоподобия для фиксированного счёта:
![](https://habrastorage.org/getpro/habr/upload_files/541/578/27f/54157827f6f41caabfa090bd337f4230.png)
Вероятности для счётов 2-0 и 0-2 принимают максимум в точках, соответствующих однозначной победе соответствующей команды. Вероятности для счётов 2-1 и 1-2 принимают максимум в точках и
соответственно, т.е. счёт с одной победой в серии проигравшей команды является более сильным свидетельством в пользу равенства команд, нежели счёт "в одни ворота". Как от вероятности
зависит будет ли счёт "в одни ворота" или нет в формате FT2/BO3 ?
Вероятность счёта "в одни ворота" есть сумма вероятностей для счётов 2-0 и 0-2. Эта вероятность есть:
Вероятность счёта "не в одни ворота" есть сумма вероятностей для счётов 2-1 и 1-2. Эта вероятность есть:
![](https://habrastorage.org/getpro/habr/upload_files/3be/a36/b61/3bea36b61c23204f030bc9a794c2edf0.png)
Можно заметить, что счёты 2-1/1-2 могут выпадать при практически любом соотношении сил команд, кроме крайних случаев или
. При увеличении равенства сил команд, т.е. при
, вероятность счётов 2-1/1-2 увеличивается, но она всегда ниже вероятности счётов 2-0/0-2 и становится равной только в точке своего максимума (и минимума вероятности 2-0/0-2), при
. Т.е. проводя между фиксированными командами достаточно большое количество серий матчей в формате FT2/BO3, мы не увидим результатов 2-1/1-2 более чем в 50% серий матчей просто в силу того, что счёт "не в одни ворота" не выпадает чаще 50% независимо от силы команд. А в случае неравенства сил команд частоты счётов 2-1/1-2 будут даже меньше 50%. Факт выпадения счётов 2-1/1-2 свидетельствует в пользу равенства команд, тогда как факт выпадения счётов 2-0/0-2 говорят об обратном.
При проведении турнира у нас нет возможности посчитать частоты различных счётов, так как большинство серий матчей проводятся для каждой пары команд, т.е. для каждых вероятностей и
, лишь один раз. Тем не менее, даже единственный сампл счёта позволяет извлечь информацию об относительной силе команд. Несмотря на то, что при равной силе команд счёты 2-0/0-2 выпадают с такой же частотой, что и счёты 2-1/1-2, это не говорит о том, что мы можем просто не учитывать факт выпадения тех или иных счётов. Чем больше счётов 2-1/1-2 мы получаем в турнире — тем больше у нас оснований полагать, что в условиях описанный выше модели силы команд, участвующих в турнире, действительно примерно равны.