На ЧМ по футболу закончилась групповая стадия, количество команд-участниц сократилось вдвое, стали известны пары участников плей-офф. В связи с этим, разработчики из компании Wolfram Research обновили расчёт статистической вероятности для оставшихся матчей.
Предварительно в Wolfram|Alpha загрузили около 200 МБ данных, извлечённых со специализированных сайтов. Это, прежде всего, исторические данные о 30 000 международных матчах с 1950 по 2014 годы, в том числе составы команд и характеристики игроков. Это не только для прогноза исхода матчей, а чтобы система Wolfram|Alpha могла обрабатывать поисковые запросы, связанные с футболом.
Например, вот статистика по изменению роста и индекса массы тела футболистов за последние 50 лет.
Возвращаясь к анализу ЧМ 2014, модель рассчитывает вероятность исхода каждого матча, основываясь на статистике прошлых игр, в том числе с учётом преимущества домашнего поля, преимущества своего континента и других факторов, которые выявились после анализа исторической базы. Модель затем прошла тренировку на 2000 последних матчах и показала точность прогноза 48%.
После добавления в модель Elo-рейтингов команд точность увеличилась 58,3%, а для матчей на выбывание — 75,7%. Это вполне достаточно, чтобы рассчитать вероятность исхода ЧМ 2014.
Итак, после групповой стадии вероятность победы в турнире распределяется следующим образом.
По сравнению с предыдущим прогнозом, резко выросли шансы Нидерландов (благодаря крупной победе над фаворитом).
Наиболее вероятная пара финалистов — Бразилия и Нидерланды.
Вся сетка предполагаемых исходов игр плей-офф показана на схеме.
Ещё один набор диаграмм показывает вероятность выигрыша (синим) или проигрыша (оранжевым) для 9 наиболее рейтинговых команд на каждой стадии плей-офф.
На групповой стадии ЧМ 2014 точность прогноза Wolfram|Alpha составила 62,5% (движок правильно рассчитал победу Коста-Рики над Италией, ничью в матче Германии и Ганы, ничью Бразилии и Мексики, а также несколько других неочевидных исходов). Посмотрим, как модель покажет себя в матчах плей-офф.