Прогноз ЧМ 2014 на языке Вольфрама



    На ЧМ по футболу закончилась групповая стадия, количество команд-участниц сократилось вдвое, стали известны пары участников плей-офф. В связи с этим, разработчики из компании Wolfram Research обновили расчёт статистической вероятности для оставшихся матчей.

    Предварительно в Wolfram|Alpha загрузили около 200 МБ данных, извлечённых со специализированных сайтов. Это, прежде всего, исторические данные о 30 000 международных матчах с 1950 по 2014 годы, в том числе составы команд и характеристики игроков. Это не только для прогноза исхода матчей, а чтобы система Wolfram|Alpha могла обрабатывать поисковые запросы, связанные с футболом.

    Например, вот статистика по изменению роста и индекса массы тела футболистов за последние 50 лет.





    Возвращаясь к анализу ЧМ 2014, модель рассчитывает вероятность исхода каждого матча, основываясь на статистике прошлых игр, в том числе с учётом преимущества домашнего поля, преимущества своего континента и других факторов, которые выявились после анализа исторической базы. Модель затем прошла тренировку на 2000 последних матчах и показала точность прогноза 48%.



    После добавления в модель Elo-рейтингов команд точность увеличилась 58,3%, а для матчей на выбывание — 75,7%. Это вполне достаточно, чтобы рассчитать вероятность исхода ЧМ 2014.

    Итак, после групповой стадии вероятность победы в турнире распределяется следующим образом.



    По сравнению с предыдущим прогнозом, резко выросли шансы Нидерландов (благодаря крупной победе над фаворитом).

    Наиболее вероятная пара финалистов — Бразилия и Нидерланды.



    Вся сетка предполагаемых исходов игр плей-офф показана на схеме.



    Ещё один набор диаграмм показывает вероятность выигрыша (синим) или проигрыша (оранжевым) для 9 наиболее рейтинговых команд на каждой стадии плей-офф.



    На групповой стадии ЧМ 2014 точность прогноза Wolfram|Alpha составила 62,5% (движок правильно рассчитал победу Коста-Рики над Италией, ничью в матче Германии и Ганы, ничью Бразилии и Мексики, а также несколько других неочевидных исходов). Посмотрим, как модель покажет себя в матчах плей-офф.
    Реклама
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее

    Комментарии 49

      +7
      Подкуп не учтён :)
        +4
        Хех, прямо как в моих хотелках, хотя считаю, что Нидерланды победят, всё-таки.
          0
          Любопытно, что по информации Lenta.Ru ставки на Нидерланды 7.5:1, у Вольфрама существенно выше. Кто желает сказочно обогатиться? :-)
          +6
          Модель затем прошла тренировку на 2000 последних матчах и показала точность прогноза 48%.

          это 50 на 50 получается?
            +27
            Как шанс встретить динозавра на улице, примерно.
              +1
              как в том анекдоте: «предсказывали бы наоборот — было бы 52%» :)
              +3
              Судя по всему, есть три возможных исхода матча – победа одной из команд и ничья, так что не совсем 50 на 50.
                +2
                В контексте плей-офф ЧМ — ничьи быть не может, поэтому таки 50 на 50
                  0
                  Можете посмотреть ставки в букмекерских конторах на матчи плей-офф, там вполне себе есть ничья. Исход матча – это все таки тот исход, который был зафиксирован на момент окончания основного времени.
                    +2
                    Ставки — пожалуйста, но в таком случае я не вижу смысла в таком прогнозе финальной части от вольфрама, который учитывает ничью там, где ее быть не может. Можно конечно откинуть ничейные результаты и не принимать их во внимание при выборе победителя, но, как мне кажется, это будет иметь существенное влияние в каких-нибудь случаях.
                    Впрочем, как и учет истории матчей. Не могу понять каким образом матч 50-летней давности может сказаться на матче в этом году. Эмоциональный эффект от серии побед предыдущих поколений имеет место быть, но как быть, если условный Лихтенштейн играет против третьего состава Бразильцев? Такая модель (если брать только этот параметр) однозначно скажет, что победа Бразилии здесь будет однозначной, так как она всегда выигрывала у них. Хотя вот там вроде есть какие-то параметры типа age и selections… Возможно, они именно состав учитывают.
                    У меня была идея сделать нечто подобное (прогноз) ради интереса, но я бы опирался больше на реальные данные, которые выдает команда сейчас (скажем, на протяжении последних 10 матчей), а не вчера (год-два назад). Скажем, если речь идет о чемпионате страны, то можно было бы нарыть кучу косвенной статистики (включая наличие травмированных в команде и их влияние на результат), которая имела бы куда больший вес, чем рассуждения «вчера мы обыграли Барселону, которая позавчера выиграла ЛЧ — значит мы сильнее их и победим этот %football_club_name% сегодня».
                    Хотя все равно это будет одна сплошная ложь :)
                      0
                      там вполне себе есть ставки на проход в следующий раунд, т.ч. все таки 50х50 )
                        0
                        Есть ставки и на укусы — 1 к 150)
                  +2
                  Если я правильно помню, точность предсказания начинается от 50% и означает отсутствие корреляции как таковой? Если так, то 48% — это отрицательная корреляция.
                    0
                    Нет. Нельзя утверждать, что корреляции нет, если пространство элементарных исходов случайного процесса неизвестно. Пусть имеется процесс с дискретным равномерным распределением вероятностей и n=100 исходов. Тогда вероятность для каждого из исходов будет 1/n, и, если мы можем предсказать один из исходов с вероятностью 50%, то, очевидно, множество прогнозов и множество полученных в результате случайного процесса исходов будут коррелированы.

                    Но, если у Вас, как у той блондинки, всегда два исхода, то да, смысла в таком прогнозе мало :)
                  +4
                  Вольфрамавцам надо вкладываться в букмекерство, Forbes будет их имена постоянно печатать.
                    0
                    На групповой стадии ЧМ 2014 точность прогноза Wolfram|Alpha составила 62,5% (движок правильно рассчитал победу Коста-Рики над Италией, ничью в матче Германии и Ганы, ничью Бразилии и Мексики, а также несколько других неочевидных исходов). Посмотрим, как модель покажет себя в матчах плей-офф.

                    Прогноз рассчитывался после каждого сыгранного тура или сразу на все три тура перед началом турнира? Просто думаю, он предугадал победу Коста-Рики над Италией после матча с Уругваем или просто каким-то другим загадочным способом.
                      –9
                      Было бы интересно посмотреть прогноз, если бы была сборная России.
                        +19
                        «Прогноз» тупо соотвествует ELO рейтенгу сборных с википедии :)

                        image
                          0
                          Для желающих сделать ставки наличие просчитанной вероятности играет большую роль — дает возможность найти игры, где коэффициент букмекеров выше вероятности проигрыша Вольфрама.

                          Если, конечно, вы доверяете Вольфраму. И если, конечно, другие участники не будут ставить точно так же по нему :)
                            0
                            Может быть, это не прогноз плохой, просто рейтинг хорошо отражает возможности команд?
                              0
                              Посмотрите на картинку из поста, либо это и есть визуализация ELO (см. колонку Points) и косяк alizar'а, либо Vanger13 прав и ELO-рейтинг внезапно стал больше, чем основа для расчетов.
                                0
                                Поясню: если рейтинг участвовал как один из параметров, то система могла дать ему большой вес, и это вполне логично, т.к. рейтинг создан, чтобы оценивать возможности команд. Если не участвовал, то это тоже очень интересный результат. Конечно, это может быть и ошибкой, но я надеюсь на лучшее.
                            +8
                            Поставил себе в календарь напоминание к концу ЧМ2014 сравнить результаты с этим прогнозом.
                              +2
                              Итак ЧМ закончился.

                              По прогнозу
                              1. Бразилия
                              2. Голландия
                              3. Германия

                              По факту:
                              1. Германия
                              2. Аргентина
                              3. Голландия

                              Прогноз с треском провалился.
                            +2
                            Первые два матча сошлись. Бразилия и Колумбия идут дальше.
                              +2
                              Еще 2. Голландия и Коста Рика. Хотел же поставить)
                                0
                                Франция — Нигерия так же прошёл.
                                  0
                                  И Германия. Хотел же поставить как статью увидел на все матчи( Прямо как с bitcoin, когда цена расти начала только.
                                    0
                                    6 из 6 угадали, осталось еще 9, не считая матча за 3 место.
                                    Скажем еще 5 игр сыграют как на схеме, а последние 4 ровно наоборот )
                                      0
                                      Можно же просто ставить одну сумму на каждый матч по отдельности. Тогда в плюсе будешь думаю. Хотя бы только на первые 8. А там видно будет уже. Но сейчас то поздно. 6 матчей уже упущено(
                            +1
                            Было бы интересно посмотреть точность прогноза не просто в процентах, а с учетом сложности «угадываения».
                            Например, в матче Франция — Гондурас достаточно просто взглянуть на название сборных даже не зная о них абсолютно ничего, что бы предсказать исход. А вот победа Коста-Рики над Италией — тут уже надо быть провидцем!
                            То есть в эти Х% «угадывания» результатов, входят как вполне очевидные матчи, так и те, которые предугадать очень сложно
                              0
                              Пока точность поражает. Хотя травма Неймара и де Йонга внесут свои коррективы в игру бразильцев и голландцев соответственно. Так что в финале можем увидеть Германию и Аргентину. Хочется верить, что футбол не настолько предсказуем.
                                +3
                                Ну ничегож себе осечка…
                                  0
                                  Малюсенькая причем)
                                  +2
                                  Бразилия — Германия. Мимо.
                                  Интересно, если бы пересчитывали с учетом травм бразильцев и коэффициентов которые, вроде как тоже учитывались, изменилось бы что-то или нет
                                    0
                                    Есть мнение, что всё, что было до полуфинала — достаточно предугадываемые матчи сами по себе, в отличие от игр, начинающихся с полуфинала.
                                    К тому же, не смотря на заслуги Wolfram|Alpha, даже те матчи, до полуфинала, некоторые команды еле вытягивали, по пенальти с разницей в один гол.
                                      0
                                      Тут думаю надо было после каждого матча прогноз переделывать. Вот у Microsoft Cortana отгадала пока все матчи, включая победу Германии.
                                      P.S.: Сейчас она говорит, что победит Аргентина. Посмотрим)
                                        0
                                        С таким счетом?
                                          0
                                          Там просто кто пройдет дальше. Счет не говорится.
                                            +1
                                            Ну вот. 14-0 в пользу Cortana от МС.
                                              0
                                              В финале Cortana за сборную Германии. А за 3 место за бразильцев
                                                0
                                                Неудивительно, что за немцев — с таким счётом выиграть :)
                                          0
                                          финалы 4-х играются на пределе сил, так что просто нужно больше данных, как мне кажется.
                                          0
                                          Судя по всему, после матча Бразили — Германия 7:1 компьютер не может предсказать все
                                            0
                                            Предсказать — значит выбрать из нескольких событий одно. Если бы компьютер всегда выбирал настолько невероятное, вряд ли бы он добился такой точности в прогнозах.
                                            Посмотрите на другие матчи игр на вылет — всё верно, даже бразильцы сыграют с голландцами. Только не в финале :)
                                            0
                                            В принципе, ну а кто знал, что так всё сложится?
                                            Где компьютеры и где футбол!

                                            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                            Самое читаемое