Здесь рассматривается статья M. J. MAHER'a «Modelling association football scores».
Данная статья имеет небольшое прикладное значение, но она является фундаментальной и на неё ссылаются многие современные авторы. Основной идеей является применение двумерной пуассоновской модели, которая учитывает корреляцию предикторов. Поскольку сами по себе коэффициенты ставок букмекеров, являются отражением вероятностей спортивных событий и соответственно хорошими фичами, важно уметь раскладывать их на составляющие статистики.
Абстракт
Некоторые публикации отвергают модель Пуассона для оценки результатов футбольных матчей в пользу отрицательного бинома.
Однако в данной статье модель Пуассона исследуется более подробно. Включены параметры, отражающие присущие командам сильные стороны в атаке и обороне, и из иерархии моделей выбрана наиболее подходящая модель. Сравниваются наблюдаемые и ожидаемые частоты забитых мячей, и тесты на соответствие показателям показывают, что, несмотря на небольшие систематические различия, независимая пуассоновская модель дает достаточно точное описание футбольных результатов. Улучшения могут быть достигнуты за счет использования двумерной пуассоновской модели с корреляцией между оценками, равной 0,2.
1. Введение
MORONEY, M. продемонстрировал, что количество голов, забитых командой в футбольном матче, не очень хорошо согласуется с распределением Пуассона, но если использовать «модифицированный Пуассон» (отрицательный биномиал), то соответствие будет намного лучше.
REEP, POLLARD и BENJAM подтвердили это, используя данные Первого дивизиона английской футбольной лиги за четыре сезона, а затем применили отрицательное биномиальное распределение к другим играм с мячом. Следствием этого результата является то, что одно и то же отрицательное биномиальное распределение применяется к количеству голов, забитых командой, независимо от силы этой команды или соперника. На самом деле в более ранней работе REEP и BENJAM отмечали, что «случайность действительно доминирует в игре». Но позже HILL в своей работе показал, что футбольные эксперты были способны еще до начала сезона с некоторым успехом предсказывать итоговые позиции в турнирной таблице. Таким образом, на протяжении всего сезона в игре доминирует мастерство, а не случайность. С этим, вероятно, согласилось бы большинство людей, которые смотрят футбольные матчи; в то время как в одном матче удача играет значительную роль (упущенные голевые моменты, сомнительные решения из‑за офсайда и удары в перекладину, очевидно, могут кардинально повлиять на результат), в других матчах удача играет гораздо меньшую роль. Команды не одинаковы; у каждой из них есть свои присущие ей качества, и, конечно же, мы должны ожидать, что когда хорошая команда играет со слабой командой, у хорошей команды будет высокая вероятность победы и высокая результативность. Используя данные за весь сезон или только за его часть, эти неотъемлемые качества команд лиги можно определить, например, с помощью оценки максимального правдоподобия или с помощью линейной модели.
2. Модель
Есть веские основания полагать, что количество голов, забитых командой в матче, скорее всего, является переменной Пуассона: владение мячом — важный аспект футбола, и каждый раз, когда команда завладевает мячом, у нее появляется возможность атаковать и забить. Вероятность того, что атака приведет к голу, конечно, невелика, но количество раз, когда команда владеет мячом во время матча, очень велико. Если p равно константе, а атаки независимы, количество голов будет биномиальным, и в этих обстоятельствах очень хорошо подойдет приближение Пуассона. Среднее значение этого Пуассона будет варьироваться в зависимости от качества команды, и поэтому, если рассмотреть распределение голов, набранных всеми командами, то получится распределение Пуассона с переменным средним значением и, следовательно, что‑то вроде отрицательного бинома. Поэтому в этой статье, по крайней мере на данный момент, будет принята независимая пуассоновская модель для оценки результатов. В частности, если команда играет дома против команды и наблюдаемый результат равен, мы будем предполагать, что , является распределением Пуассона со средним значением , что , также является распределением Пуассона со средним значением , и что независимы. Тогда мы можем представить себе, что отражает силу атаки команды при игре дома, a слабость защиты команды при игре на выезде, — слабость защиты команды i дома и — силу атаки команды j на выезде. В лиге, состоящей из 22 команд, таких параметров 88 (и 924 наблюдения за результатами).; однако, если умножить на коэффициент , а все разделить на , все произведения останутся неизменными, и, следовательно, для получения уникального набора параметров может быть наложено ограничение:
Таким же образом может быть наложено другое ограничение:
поэтому необходимо указать только 86 независимых параметров.
Поскольку предполагается, что независимы друг от друга (представляя разные «игры» в истории), оценка значений будет производиться исключительно по x, а оценка только по y. Таким образом, для результатов хозяев поля функция логарифмического правдоподобия равна:
Следовательно,
и таким образом, оценки максимального правдоподобия удовлетворяют:
Одна из более простых схем, которая хорошо работает, заключается в том, чтобы использовать для оценки , а затем использовать для оценки и так далее поочередно. Хорошие первоначальные оценки можно получить, рассматривая знаменатели в приведенных выше выражениях как суммирование по всем командам, то есть,
Похожим образом находим .
3. Результаты
Данные были получены в удобной матричной форме из футбольного ежегодника Ротманса (1973, 1974, 1975) (the Rothmans Football Yearbook). Для анализа были выбраны 12 отдельных лиг (четыре дивизиона английской футбольной лиги для каждого из трех сезонов). Оценка максимального правдоподобия для четырех типов параметров только для одного набора данных: дивизион 1 в сезоне 1971–1972 годов.
Возникает вопрос о том, необходимы ли все эти параметры для адекватного описания результатов. Интуитивно кажется, что между командами должны быть реальные различия, но являются ли эти различия более очевидными в атаках или обороне, и действительно ли необходимо иметь отдельные параметры для качества атаки команды дома и на выезде? Рассмотрение таких вопросов приводит к возможной иерархии моделей, которые можно было бы протестировать. Внизу приведена модель 0, в которой , , ,
; то есть все команды идентичны во всех отношениях. В верхней части находится модель 4, описанная ранее, в которой всем четырем типам параметров разрешено принимать разные значения для разных команд. Иерархия показана в таблице 2. В данном случае обозначение предназначено для того, чтобы показать, может ли набор параметров (например, ) принимать разные значения для разных команд () или одно и то же значение применимо ко всем командам ().
В модели 0 есть четыре параметра, но для того, чтобы получить уникальный набор оценок, накладываются ограничения (или, что эквивалентно, ), дающие только два независимых параметра. Ниже приведены подробные сведения об ограничениях, налагаемых в других моделях:
Model 1A: , Таким образом, существует n + 1 независимый параметр (где n — количество команд в лиге).
Model 1B: , Таким образом, существует n + 1 независимый параметр (где n — количество команд в лиге).
Model 2: , 2n независимых параметров (где n — количество команд в лиге).
Model 3С: 3n — 1 независимых параметров (где n — количество команд в лиге).
Model 3D: , 3n — 1 независимых параметров (где n — количество команд в лиге).
Model 4: , 4n — 2 независимых параметров (где n — количество команд в лиге).
Таким образом, можно видеть, что продвижение на один уровень вверх в иерархии моделей приводит к введению (n — 1) дополнительных параметров. При нулевой гипотезе о том, что эти дополнительные параметры не нужны, будет асимптотическим распределением с оценкой с помощью обычного теста отношения правдоподобия, где нф — это увеличение логарифмической вероятности при переходе от одной модели к другой.
Для Премьер лиги в сезоне 1971–1972 изменения значения максимального логарифмического правдоподобия при переходе от одной модели к другой показаны в таблице 2 ().
Эта таблица показывает, что когда вариативность допустима (при переходе от модели 0 к модели 1A или от модели 1B к модели 2) достигается весьма значительное увеличение логарифмической вероятности. Аналогично, когда допустима вариативность значений (модель от 0 до 1B или от 1A до 2), логарифмическая вероятность снова очень значительно возрастает. Когда значения перестают быть пропорциональными значению (в моделях от 2 до 3D или от 3C до 4), получается незначительное увеличение логарифмической вероятности. Однако, когда значения освобождаются от их привязки к , никакого существенного увеличения не происходит. Следует отметить, что порядок, в котором происходило освобождение этих параметров, практически не влиял на увеличение логарифмической вероятности для каждого из них; это было верно для всех двенадцати наборов данных. Следовательно, можно связать увеличение логарифмической вероятности с каждым из четырех типов параметров, и, параллельно с идеями линейных моделей, в которых факторы вводятся в модель по одному за раз, «включение», например, означает освобождение от их связи с . В таблице 3 показано увеличение логарифмической вероятности из-за включения каждого из четырех типов параметров для каждого из двенадцати наборов данных.
В (1971-1974гг) в дивизионах 1 и 2 участвуют 22 команды, а в дивизионах 3 и 4 — 24 команды. Таким образом, число степеней свободы в асимптотическом распределении для логарифма составляет 21 (для 1 и 2 дивизиона) и 23 соответственно для 3 и 4.
В целом, можно видеть, что параметры , безусловно, должны быть включены в модель, но параметры включать не обязательно. (В этих последних случаях нулевые гипотезы не только не могут быть отвергнуты, но и кажутся полностью согласующимися с данными.) Это означает, что один параметр может использоваться для описания качества атаки команды i, а параметр — для описания слабости защиты команды, независимо от того, играет ли команда дома или на выезде. Таким образом, хотя преимущество хозяев поля является очень важным фактором, оно в равной степени применимо ко всем командам, и присущая каждой команде способность забивать голы при игре на выезде постоянно снижается.
Таким образом, в свете приведенных выше результатов была принята модель 2 как наиболее подходящая, и был проведен дальнейший анализ ее адекватности в качестве описания механизма, лежащего в основе футбольных результатов.
4. Тесты
и средние значения могут быть использованы для сопоставления команд , используя оценки максимального правдоподобия. Поскольку считаются пуассоновскими независимыми распределениями, можно легко рассчитать вероятности того, что . Повторив это для всех пар , можно найти ожидаемое распределение очков и сравнить его с наблюдаемым. Например, для дивизиона 1 в сезоне 1971–1972 гг. эти наблюдаемые и ожидаемые частоты приведены в таблице 4.
Для модели 2 значения параметров являются следующими:
и
Из этого следует, что
и
что означает, что сумма средних значений пуассоновских распределений равна наблюдаемому количеству забитых мячей. Таким образом, оценка параметров приводит к одному линейному ограничению на ожидаемые частоты в каждом из двух тестов на соответствие , приведенных в таблице 4. Итоговая статистика будет распределена приблизительно по в соответствии с гипотезой о том, что результаты команд хозяев и гостей распределены по Пуассону. Это было повторено для каждого из остальных одиннадцати наборов данных, и итоговая статистика приведена в таблице 5.
Случаи, когда модель была бы отклонена, отмечены звездочкой. Для результатов команд-хозяев поля таких случаев два, а для результатов команд-гостей — три. В целом, модель Пуассона можно считать приемлемой, хотя и с некоторыми небольшими сомнениями. Если сравнить наблюдаемые и ожидаемые частоты для каждого из двенадцати наборов данных, можно увидеть некоторые небольшие, но систематические различия. Общие наблюдаемые и ожидаемые пропорции составляют:
забито дома | |||||
0 | 1 | 2 | 3 | 4 | |
наблюдаемые | 0.217 | 0.321 | 0.254 | 0.130 | 0.078 |
ожидаемые | 0.230 | 0.318 | 0.238 | 0.128 | 0.086 |
забито гостями | |||||
0 | 1 | 2 | 3 | 4 | |
наблюдаемые | 0.388 | 0.371 | 0.177 | 0.051 | 0.014 |
ожидаемые | 0.406 | 0.352 | 0.166 | 0.056 | 0.020 |
Модель недооценивает количество случаев, когда был забит один или два гола, и переоценивает количество случаев, когда было забито 0 или голов. Этот эффект можно увидеть в каждом из двенадцати наборов данных. Различия невелики и всего за один сезон не приводят к серьезному завышению значения , но если сложить наблюдаемые и ожидаемые частоты для всех двенадцати сезонов, то значения статистики (16,2 и 28,8 голов дома и на выезде соответственно) приведут к явному отказу от модели. Таким образом, распределение количества голов, забитых командой в матче, очень близко к распределению Пуассона, но немного «уже». Может показаться, что это противоречит выводам МОРОНИ (1951) и РИПА и БЕНДЖАМИНА (1968), которые заключались в том, что распределение, которое было шире (с точки зрения отношения дисперсии к среднему значению), чем требовалось для Пуассона; отрицательный биномиал был их подходящим распределением. Однако в обеих этих работах для результатов всех матчей было установлено единое распределение, в то время как здесь каждый матч имеет разное распределение Пуассона.
5. Модель двумерной пуассоновской регрессии
Модель двумерной пуассоновской регрессии - это статистический подход, используемый для анализа данных подсчета, который включает в себя два взаимосвязанных результата. Эта модель особенно полезна, когда результаты подсчета могут происходить одновременно и на них влияет один и тот же набор предикторов.
Конечно, нет недостатка в возможных объяснениях небольшого расхождения между независимой пуассоновской моделью и данными в предыдущем разделе; на самом деле, возможно, справедливее будет сказать, что удивительно, что такая простая модель так близко подходит к полному объяснению данных! Матч не состоит из двух независимых игр на противоположных концах поля; для заинтересованных команд важен результат, и поэтому, например, если команда проигрывает за десять минут до конца игры, она должна больше рисковать в обороне, чтобы попытаться забить. Таким образом, анализ распределения разницы в показателях команд,, может оказаться показательным. В таблице 6 показаны наблюдаемые и оценочные частоты для Z в соответствии с моделью 2 для дивизиона 1 в 1971-1972 годах.
Видно, что количество ничейных матчей (Z = 0) немного занижено. Это систематическая особенность, отмеченная во всех двенадцати наборах данных. Статистические данные о степени соответствия приведены в таблице 7;
Для независимой модели, только у одного из двенадцати статистический показатель меньше ожидаемого значения 7. (Число степеней свободы уменьшено до 7 из-за линейного ограничения на ожидаемые частоты, полученные в результате оценки значений ) Это позволяет предположить, что может существовать некоторая корреляция между значениями .
Теперь возьмём модель двумерной пуассоновской регрессии; в ней предельные распределения по-прежнему являются пуассоновскими со средними значениями , но между оценками существует корреляция . Один из способов представления такого двумерного распределения Пуассона состоит в том, что являются независимыми пуассоновскими значениями со средним равным соответственно, с — ковариацией между . Был опробован диапазон значений для , и наиболее подходящим, по-видимому, оказалось значение около 0,2. При вычислении ожидаемых частот для Z использовались значения , полученные в результате подгонки независимой модели Пуассона. Члены двумерной функции вероятности Пуассона могут быть вычислены с помощью следующего рекурсивного соотношения:
Результаты подгонки этой двумерной пуассоновской модели приведены в таблицах 6 и 7, где видно, что введение дополнительного параметра привело к значительному улучшению результата. Статистики в таблице 7 не только незначительны, но и являются достаточно репрезентативными значениями, полученными из распределения . (Предполагалось, что установка дополнительного параметра будет примерно эквивалентна наложению другого линейного ограничения на ожидаемые частоты, хотя на самом деле одно и то же значение было применено ко всем двенадцати наборам данных). Таким образом, двумерная пуассоновская модель с корреляцией около 0,2, по-видимому, вполне адекватно отражает различия в оценках.
6. Итог
Некоторые работы по распределению очков в футбольных матчах отвергали модель Пуассона в пользу отрицательного бинома. Однако в этих работах не были учтены различия в качествах команд в лиге. Первая рассмотренная здесь модель предполагает, что результаты команд хозяев и гостей в любом матче являются независимыми пуассоновскими переменными со средними значениями представляют качество атак и защиты команд в домашних и выездных матчах. Оценка максимального правдоподобия этих параметров показывает, что необходимы только , что показывает, что относительная сила атак команд одинакова независимо от того, играют ли они дома или на выезде; то же самое относится и к обороне. Когда эта модель применяется к каждому из двенадцати наборов данных и наблюдаемое и ожидаемое распределение баллов сравнивается с помощью теста , девятнадцать из двадцати четырех случаев дают незначимый результат на уровне 5%. Таким образом, в целом независимая пуассоновская модель достаточно хорошо согласуется с данными. Отклонения от этой модели невелики, но постоянны в каждом из наборов данных, при этом наблюдается несколько меньше случаев, чем ожидалось, когда не забивалось ни одного гола или забивалось большое количество голов. Однако, когда исследуются различия в оценках, несоответствие модели оказывается более серьезным и предполагает, что предположение о независимости не является полностью обоснованным. Затем для моделирования зависимости между оценками была использована двумерная пуассоновская модель, которая значительно улучшила прогнозы. Коэффициент корреляции между результатами команд хозяев поля и команд гостей оценивается примерно в 0.2 .
Референсы
MORONEY, M. (1951), Factsfrom figures, London, Pelican.
REEP, C. and B. BENJAMIN (1968), Skill and chance in association football, J. R. Statist. SOC. A, 131, pp. 581-585.
HARVILLE, D. (1977), The use of linear-model methodology to rate high school or college football teams, J. Amer. Statist. Ass. 72, No. 3S8, pp. 278-289
HILL, I.D. (1974), Association football and statistical inference, Appl. Statist. 23, No. 2, pp. 203-208
REEP, C., R. POLLARD and B. BENJAMIN (1971), Skill and chance in ball games, J. R. Statist. SOC. A,134, pp. 623-629.
THOMPSON, M. (1975), On any given Sunday: fair competitor orderings with maximum likelihood methods, J. Amer. Statist. Ass. 70, No. 351, pp. 536-541.