Здесь рассматривается статья M. J. MAHER'a «Modelling association football scores».

Данная статья имеет небольшое прикладное значение, но она является фундаментальной и на неё ссылаются многие современные авторы. Основной идеей является применение двумерной пуассоновской модели, которая учитывает корреляцию предикторов. Поскольку сами по себе коэффициенты ставок букмекеров, являются отражением вероятностей спортивных событий и соответственно хорошими фичами, важно уметь раскладывать их на составляющие статистики.
Абстракт
Некоторые публикации отвергают модель Пуассона для оценки результатов футбольных матчей в пользу отрицательного бинома.

Однако в данной статье модель Пуассона исследуется более подробно. Включены параметры, отражающие присущие командам сильные стороны в атаке и обороне, и из иерархии моделей выбрана наиболее подходящая модель. Сравниваются наблюдаемые и ожидаемые частоты забитых мячей, и тесты на соответствие показателям показывают, что, несмотря на небольшие систематические различия, независимая пуассоновская модель дает достаточно точное описание футбольных результатов. Улучшения могут быть достигнуты за счет использования двумерной пуассоновской модели с корреляцией между оценками, равной 0,2.
1. Введение
MORONEY, M. продемонстрировал, что количество голов, забитых командой в футбольном матче, не очень хорошо согласуется с распределением Пуассона, но если использовать «модифицированный Пуассон» (отрицательный биномиал), то соответствие будет намного лучше.
REEP, POLLARD и BENJAM подтвердили это, используя данные Первого дивизиона английской футбольной лиги за четыре сезона, а затем применили отрицательное биномиальное распределение к другим играм с мячом. Следствием этого результата является то, что одно и то же отрицательное биномиальное распределение применяется к количеству голов, забитых командой, независимо от силы этой команды или соперника. На самом деле в более ранней работе REEP и BENJAM отмечали, что «случайность действительно доминирует в игре». Но позже HILL в своей работе показал, что футбольные эксперты были способны еще до начала сезона с некоторым успехом предсказывать итоговые позиции в турнирной таблице. Таким образом, на протяжении всего сезона в игре доминирует мастерство, а не случайность. С этим, вероятно, согласилось бы большинство людей, которые смотрят футбольные матчи; в то время как в одном матче удача играет значительную роль (упущенные голевые моменты, сомнительные решения из‑за офсайда и удары в перекладину, очевидно, могут кардинально повлиять на результат), в других матчах удача играет гораздо меньшую роль. Команды не одинаковы; у каждой из них есть свои присущие ей качества, и, конечно же, мы должны ожидать, что когда хорошая команда играет со слабой командой, у хорошей команды будет высокая вероятность победы и высокая результативность. Используя данные за весь сезон или только за его часть, эти неотъемлемые качества команд лиги можно определить, например, с помощью оценки максимального правдоподобия или с помощью линейной модели.
2. Модель
Есть веские основания полагать, что количество голов, забитых командой в матче, скорее всего, является переменной Пуассона: владение мячом — важный аспект футбола, и каждый раз, когда команда завладевает мячом, у нее появляется возможность атаковать и забить. Вероятность того, что атака приведет к голу, конечно, невелика, но количество раз, когда команда владеет мячом во время матча, очень велико. Если p равно константе, а атаки независимы, количество голов будет биномиальным, и в этих обстоятельствах очень хорошо подойдет приближение Пуассона. Среднее значение этого Пуассона будет варьироваться в зависимости от качества команды, и поэтому, если рассмотреть распределение голов, набранных всеми командами, то получится распределение Пуассона с переменным средним значением и, следовательно, что‑то вроде отрицательного бинома. Поэтому в этой статье, по крайней мере на данный момент, будет принята независимая пуассоновская модель для оценки результатов. В частности, если команда играет дома против команды
и наблюдаемый результат равен
, мы будем предполагать, что
, является распределением Пуассона со средним значением
, что
, также является распределением Пуассона со средним значением
, и что
независимы. Тогда мы можем представить себе, что
отражает силу атаки команды
при игре дома, a
слабость защиты команды
при игре на выезде,
— слабость защиты команды i дома и
— силу атаки команды j на выезде. В лиге, состоящей из 22 команд, таких параметров 88 (и 924 наблюдения за результатами).; однако, если
умножить на коэффициент
, а все
разделить на
, все произведения
останутся неизменными, и, следовательно, для получения уникального набора параметров может быть наложено ограничение:
Таким же образом может быть наложено другое ограничение:
поэтому необходимо указать только 86 независимых параметров.
Поскольку предполагается, что независимы друг от друга (представляя разные «игры» в истории), оценка
значений будет производиться исключительно по x, а оценка
только по y. Таким образом, для результатов хозяев поля функция логарифмического правдоподобия равна:
Следовательно,
и таким образом, оценки максимального правдоподобия удовлетворяют:
Одна из более простых схем, которая хорошо работает, заключается в том, чтобы использовать для оценки
, а затем использовать
для оценки
и так далее поочередно. Хорошие первоначальные оценки можно получить, рассматривая знаменатели в приведенных выше выражениях как суммирование по всем командам, то есть,
Похожим образом находим .
3. Результаты
Данные были получены в удобной матричной форме из футбольного ежегодника Ротманса (1973, 1974, 1975) (the Rothmans Football Yearbook). Для анализа были выбр��ны 12 отдельных лиг (четыре дивизиона английской футбольной лиги для каждого из трех сезонов). Оценка максимального правдоподобия для четырех типов параметров только для одного набора данных: дивизион 1 в сезоне 1971–1972 годов.

Возникает вопрос о том, необходимы ли все эти параметры для адекватного описания результатов. Интуитивно кажется, что между командами должны быть реальные различия, но являются ли эти различия более очевидными в атаках или обороне, и действительно ли необходимо иметь отдельные параметры для качества атаки команды дома и на выезде? Рассмотрение таких вопросов приводит к возможной иерархии моделей, которые можно было бы протестировать. Внизу приведена модель 0, в которой ,
,
,
; то есть все команды идентичны во всех отношениях. В верхней части находится модель 4, описанная ранее, в которой всем четырем типам параметров разрешено принимать разные значения для разных команд. Иерархия показана в таблице 2. В данном случае обозначение предназначено для того, чтобы показать, может ли набор параметров (например,
) принимать разные значения для разных команд (
) или одно и то же значение применимо ко всем командам (
).

В модели 0 есть четыре параметра, но для того, чтобы получить уникальный набор оценок, накладываются ограничения (или, что эквивалентно,
), дающие только два независимых параметра. Ниже приведены подробные сведения об ограничениях, налагаемых в других моделях:
Model 1A: , Таким образом, существует n + 1 независимый параметр (где n — количество команд в лиге).
Model 1B: , Таким образом, существует n + 1 независимый параметр (где n — количество команд в лиге).
Model 2: , 2n независимых параметров (где n — количество команд в лиге).
Model 3С: 3n — 1 независимых параметров (где n — количество команд в лиге).
Model 3D: , 3n — 1 независимых параметров (где n — количество команд в лиге).
Model 4: , 4n — 2 независимых параметров (где n — количество команд в лиге).
Таким образом, можно видеть, что продвижение на один уровень вверх в иерархии моделей приводит к введению (n — 1) дополнительных параметров. При нулевой гипотезе о том, что эти дополнительные параметры не нужны, будет асимптотическим распределением
с оценкой с помощью обычного теста отношения правдоподобия, где
нф — это увеличение логарифмической вероятности при переходе от одной модели к другой.
Для Премьер лиги в сезоне 1971–1972 изменения значения максимального логарифмического правдоподобия при переходе от одной модели к другой показаны в таблице 2 ().
Эта таблица показывает, что когда вариативность допустима (при переходе от модели 0 к модели 1A или от модели 1B к модели 2) достигается весьма значительное увеличение логарифмической вероятности. Аналогично, когда допустима вариативность значений
(модель от 0 до 1B или от 1A до 2), логарифмическая вероятность снова очень значительно возрастает. Когда значения
перестают быть пропорциональными значению
(в моделях от 2 до 3D или от 3C до 4), получается незначительное увеличение логарифмической вероятности. Однако, когда значения
освобождаются от их привязки к
, никакого существенного увеличения не происходит. Следует отметить, что порядок, в котором происходило освобождение этих параметров, практически не влиял на увеличение логарифмической вероятности для каждого из них; это было верно для всех двенадцати наборов данных. Следовательно, можно связать увеличение логарифмической вероятности с каждым из четырех типов параметров, и, параллельно с идеями линейных моделей, в которых факторы вводятся в модель по одному за раз, «включение
», например, означает освобождение
от их связи с
. В таблице 3 показано увеличение логарифмической вероятности из-за включения каждого из четырех типов параметров для каждого из двенадцати наборов данных.

В (1971-1974гг) в дивизионах 1 и 2 участвуют 22 команды, а в дивизионах 3 и 4 — 24 команды. Таким образом, число степеней свободы в асимптотическом распределении для логарифма
составляет 21 (для 1 и 2 дивизиона) и 23 соответственно для 3 и 4.
В целом, можно видеть, что параметры , безусловно, должны быть включены в модель, но параметры
включать не обязательно. (В этих последних случаях нулевые гипотезы не только не могут быть отвергнуты, но и кажутся полностью согласующимися с данными.) Это означает, что один параметр
может использоваться для описания качества атаки команды i, а параметр
— для описания слабости защиты команды, независимо от того, играет ли команда дома или на выезде. Таким образом, хотя преимущество хозяев поля является очень важным фактором, оно в равной степени применимо ко всем командам, и присущая каждой команде способность забивать голы при игре на выезде постоянно снижается.
Таким образом, в свете приведенных выше результатов была принята модель 2 как наиболее подходящая, и был проведен дальнейший анализ ее адекватности в качестве описания механизма, лежащего в основе футбольных результатов.
4. Тесты
и средние значения
могут быть использованы для сопоставления команд
, используя оценки максимального правдоподобия. Поскольку
считаются пуассоновскими независимыми распределениями, можно легко рассчитать вероятности того, что
. Повторив это для всех пар
, можно найти ожидаемое распределение очков и сравнить его с наблюдаемым. Например, для дивизиона 1 в сезоне 1971–1972 гг. эти наблюдаемые и ожидаемые частоты приведены в таблице 4.

Для модели 2 значения параметров являются следующими:
и
Из этого следует, что
и
что означает, что сумма средних значений пуассоновских распределений равна наблюдаемому количеству забитых мячей. Таким образом, оценка параметров приводит к одному линейному ограничению на ожидаемые частоты в каждом из двух тестов на соответствие , приведенных в таблице 4. Итоговая статистика будет распределена приблизительно по
в соответствии с гипотезой о том, что результаты команд хозяев и гостей распределены по Пуассону. Это было повторено для каждого из остальных одиннадцати наборов данных, и итоговая статистика
приведена в таблице 5.

Случаи, когда модель была бы отклонена, отмечены звездочкой. Для результатов команд-хозяев поля таких случаев два, а для результатов команд-гостей — три. В целом, модель Пуассона можно считать приемлемой, хотя и с некоторыми небольшими сомнениями. Если сравнить наблюдаемые и ожидаемые частоты для каждого из двенадцати наборов данных, можно увидеть некоторые небольшие, но систематические различия. Общие наблюдаемые и ожидаемые пропорции составляют:
забито дома | |||||
0 | 1 | 2 | 3 |
| |
наблюдаемые | 0.217 | 0.321 | 0.254 | 0.130 | 0.078 |
ожидаемые | 0.230 | 0.318 | 0.238 | 0.128 | 0.086 |
забито гостями | |||||
0 | 1 | 2 | 3 |
| |
наблюдаемые | 0.388 | 0.371 | 0.177 | 0.051 | 0.014 |
ожидаемые | 0.406 | 0.352 | 0.166 | 0.056 | 0.020 |
Модель недооценивает количество случаев, когда был забит один или два гола, и переоценивает количество случаев, когда было забито 0 или голов. Этот эффект можно увидеть в каждом из двенадцати наборов данных. Различия невелики и всего за один сезон не приводят к серьезному завышению значения
, но если сложить наблюдаемые и ожидаемые частоты для всех двенадцати сезонов, то значения статистики
(16,2 и 28,8 голов дома и на выезде соответственно) приведут к явному отказу от модели. Таким образом, распределение количества голов, забитых командой в матче, очень близко к распределению Пуассона, но немного «уже». Может показаться, что это противоречит выводам МОРОНИ (1951) и РИПА и БЕНДЖАМИНА (1968), которые заключались в том, что распределение, которое было шире (с точки зрения отношения дисперсии к среднему значению), чем требовалось для Пуассона; отрицательный биномиал был их подходящим распределением. Однако в обеих этих работах для результатов всех матчей было установлено единое распределение, в то время как здесь каждый матч имеет разное распределение Пуассона.
5. Модель двумерной пуассоновской регрессии
Модель двумерной пуассоновской регрессии - это статистический подход, используемый для анализа данных подсчета, который включает в себя два взаимосвязанных результата. Эта модель особенно полезна, когда результаты подсчета могут происходить одновременно и на них влияет один и тот же набор предикторов.
Конечно, нет недостатка в возможных объяснениях небольшого расхождения между независимой пуассоновской моделью и данными в предыдущем разделе; на самом деле, возможно, справедливее будет сказать, что удивительно, что такая простая модель так близко подходит к полному объяснению данных! Матч не состоит из двух независимых игр на противоположных концах поля; для заинтересованных команд важен результат, и поэтому, например, если команда проигрывает за десять минут до конца игры, она должна больше рисковать в обороне, чтобы попытаться забить. Таким образом, анализ распределения разницы в показателях команд,, может оказаться показательным. В таблице 6 показаны наблюдаемые и оценочные частоты для Z в соответствии с моделью 2 для дивизиона 1 в 1971-1972 годах.

Видно, что количество ничейных матчей (Z = 0) немного занижено. Это систематическая особенность, отмеченная во всех двенадцати наборах данных. Статистические данные о степени соответствия приведены в таблице 7;

Для независимой модели, только у одного из двенадцати статистический показатель меньше ожидаемого значения 7. (Число степеней свободы уменьшено до 7 из-за линейного ограничения на ожидаемые частоты, полученные в результате оценки значений
) Это позволяет предположить, что может существовать некоторая корреляция между значениями
.
Теперь возьмём модель двумерной пуассоновской регрессии; в ней предельные распределения по-прежнему являются пуассоновскими со средними значениями , но между оценками существует корреляция
. Один из способов представления такого двумерного распределения Пуассона состоит в том, что
являются независимыми пуассоновскими значениями со средним равным
соответственно, с
— ковариацией между
. Был опробован диапазон значений для
, и наиболее подходящим, по-видимому, оказалось значение около 0,2. При вычислении ожидаемых частот для Z использовались значения
, полученные в результате подгонки независимой модели Пуассона. Члены двумерной функции вероятности Пуассона могут быть вычислены с помощью следующего рекурсивного соотношения:
Результаты подгонки этой двумерной пуассоновской модели приведены в таблицах 6 и 7, где видно, что введение дополнительного параметра привело к значительному улучшению результата. Статистики
в таблице 7 не только незначительны, но и являются достаточно репрезентативными значениями, полученными из распределения
. (Предполагалось, что установка дополнительного параметра
будет примерно эквивалентна наложению другого линейного ограничения на ожидаемые частоты, хотя на самом деле одно и то же значение
было применено ко всем двенадцати наборам данных). Таким образом, двумерная пуассоновская модель с корреляцией около 0,2, по-видимому, вполне адекватно отражает различия в оценках.
6. Итог
Некоторые работы по распределению очков в футбольных матчах отвергали модель Пуассона в пользу отрицательного бинома. Однако в этих работах не были учтены различия в качествах команд в лиге. Первая рассмотренная здесь модель предполагает, что результаты команд хозяев и гостей в любом матче являются независимыми пуассоновскими переменными со средними значениями представляют качество атак и защиты команд в домашних и выездных матчах. Оценка максимального правдоподобия этих параметров показывает, что необходимы только
, что показывает, что относительная сила атак команд одинакова независимо от того, играют ли они дома или на выезде; то же самое относится и к обороне. Когда эта модель применяется к каждому из двенадцати наборов данных и наблюдаемое и ожидаемое распределение баллов сравнивается с помощью теста
, девятнадцать из двадцати четырех случаев дают незначимый результат на уровне 5%. Таким образом, в целом независимая пуассоновская модель достаточно хорошо согласуется с данными. Отклонения от этой модели невелики, но постоянны в каждом из наборов данных, при этом наблюдается несколько меньше случаев, чем ожидалось, когда не забивалось ни одного гола или забивалось большое количество голов. Однако, когда исследуются различия в оценках, несоответствие модели оказывается более серьезным и предполагает, что предположение о независимости не является полностью обоснованным. Затем для моделирования зависимости между оценками была использована двумерная пуассоновская модель, которая значительно улучшила прогнозы. Коэффициент корреляции между результатами команд хозяев поля и команд гостей оценивается примерно в 0.2 .

Референсы
MORONEY, M. (1951), Factsfrom figures, London, Pelican.
REEP, C. and B. BENJAMIN (1968), Skill and chance in association football, J. R. Statist. SOC. A, 131, pp. 581-585.
HARVILLE, D. (1977), The use of linear-model methodology to rate high school or college football teams, J. Amer. Statist. Ass. 72, No. 3S8, pp. 278-289
HILL, I.D. (1974), Association football and statistical inference, Appl. Statist. 23, No. 2, pp. 203-208
REEP, C., R. POLLARD and B. BENJAMIN (1971), Skill and chance in ball games, J. R. Statist. SOC. A,134, pp. 623-629.
THOMPSON, M. (1975), On any given Sunday: fair competitor orderings with maximum likelihood methods, J. Amer. Statist. Ass. 70, No. 351, pp. 536-541.