Комментарии 37
Кто через два месяца вспомнит о том, какие ставки предлагались?
https://en.wikipedia.org/wiki/2002%E2%80%9303_UEFA_Champions_League#Semi-finals
Хозяин-гость более чем уместны, ибо в Англии большое количество мест на стадионе занимают владельцы сезонных абонементов домашней команды. А насчет двух месяцев вы правы, ставки букмекеров могут достаточно сильно измениться в зависимости от формы команд на момент матча, наличия травмированных и тому подобного.
Строго говоря, букмекерские коэффициенты не обязаны отражать реальную вероятность выигрыша той или иной команды. Задача букмекера получить профит при любом исходе матча. Поэтому коэффициенты отражают не силу команд, а ожидания тех, кто делает ставки.
Если выигрыш команды А в три раза вероятнее выигрыша команды Б, но люди склонны ставить на А и на Б примерно одинаковое количество денег, то букмекер поставит на матч равные коэффициенты 0.95/0.95. И получит свои 5 процентов при любом исходе. Конечно, такие большие перекосы бывают редко.
За весь сезон 2015/2016 было 380 футбольных игр, в которых команды у себя дома забили 567 мяча (1.49 за игру), а в гостях — 459 (1.20 за игру).
Делим голы забитые дома 567 на количество встреч 380. Аналогично — голы в гостях 459 на 380. Расчет
(5:563)$ echo 'scale=5;567/380;459/380' | bc -q
Как мне кажется разумнее накапливать статистику первую половину сезона и, если у команды сохранился тренер, остались те же игроки и рисунок игры, то можно попробовать прогнозировать вторую половину.
Есть несколько вопросов:
1. Есть ли статистика показывающая как вероятность прогнозируемых исходов коррелирует с реальными результатами матчей, на протяжении продолжительного периода времени (например одного чемпионата)?
2. Удалось ли по данному методу получить перевес над букмекером, например мы получили коэффициент 1.6 на победу MC, а букмекер нам дает к примеру 1.4, что на продолжительном временном участке приведет к потере поставленных денег. Есть ли статистика по матчам где букмекер дал более высокий коэффициент и корреляция этих данных с реальным исходом?
Собрать и находить статистику оказалось гораздо сложнее чем я думал. Множество сайтов блокируются Роскомнадзором, другие прячут весь контент только для платных пользователей. Даже такую простую вещь как статистика забитых за весь сезон мячей и разбивку дома / в гостях, надо было искать и искать. Так что скорее всего то, что Вы спрашиваете — это платный контент для тех, кто делает ставки онлайн.
Пару лет назад я написал программу, которая рассчитывает рейтинг ЭЛО для каждой команды после игр друг с другом, по рейтингу рассчитывается вероятность каждого исхода для встречи двух команд, в последствии при прошествии нескольких туров вероятности уточнялись по формуле Байеса. Такой подход в среднем дал 44% угаданных результатов для Английской Премьер Лиги, но когда я стал сравнивать полученные вероятности с коэффициентами букмекера, выяснилось, что букмекер практически всегда дает коэффициент ниже минимально необходимого, как итог вероятность заработка на ставках стремится к 0.
Вы упускаете из виду маржу букмекера, поэтому коэффициент всегда ниже реального.
Самым простым примером для иллюстрации понятия маржи будет встреча равных по силе соперников. Вероятность победы первой и второй команды разделится поровну, т.е. 50% на 50%. Для удобства в расчётах переведём её в безразмерную величину (обозначим вероятность буквой Р):
Вероятность победы и первой и второй команды будет равна 0.5. Считаем коэффициент. Математически он равен:
По логике вещей, БК на данное событие должна была выставить коэффициент 2. Что же делает букмекерская контора? Она вводит так называемую маржу, допустим, 10 %. Это довольно высокая маржа, но она наглядно покажет нам, насколько понизится коэффициент с учётом такой высокой маржи.
Маржа распределится на два плеча по 5 %, и вероятность исходов уже будет составлять в процентах не 50%, а 55% или, соответственно, не 0.5, а 0.55 в безразмерных единицах. Коэффициент с учётом маржи будет составлять:
По расчётам получается так:
- ставку с вероятностью исхода 50%, Вы должны покупать с коэффициентом 2;
- ставку с вероятностью исхода 55%, Вы должны покупать с коэффициентом 1.82.
Но в реальности Вы делаете ставку, вероятность исхода которой составляет 50%, на пониженный коэффициент 1.82, в котором букмекерская контора уже учла маржу, в нашем случае 10%.
Величина маржи в разных букмекерских конторах лежит в пределах от 2% до 20%. Чем выше маржа, тем ниже коэффициенты – это закономерность.
2. Можно ли как-то просчитать вероятности, если одна из команд только вышла в этот дивизион, например. Т.е. данных по прошлому году по ней просто нет.
По первому пункту, ничто нам не мешает добавить данные текущего чемпионата к статистике прошлого, тем самым гипотетически прогноз должен стать точнее.
По второму пункту, если играют команды из разных чемпионатов, или команда перешла в следующий дивизион из предыдущего, мы можем взять ее статистику прошлых матчей поскольку выборки по каждой команде в явном виде не связаны.
Если неправ, поправьте.
Небольшой пример:
«Бернли» по итогам Чемпионшипа 15/16 занял первое место и попал в Премьер-лигу на следующий сезон.
Чемпионшип (в среднем за 46 игр)
голы дома 1.65 пропущенные дома 0.61
голы на выезде 1.48 пропущенные на выезде 0.91
Премьер-лига (в среднем за 17 игр, турнир продолжается)
голы дома 1.56 пропущенные дома 1.11
голы на выезде 0.25 пропущенные на выезде 2.25
Все показатели ухудшились. Одно дело играть с Редингом и Брентфордом, совсем другое с Челси и Ливерпулем.
Та же история с международными матчами, если ПСЖ за прошлый сезон в Лиге 1 забил 102 гола (в среднем 2.68 за игру), это не говорит о том, что можно рассчитывать на подобную результативность во встрече с условным Манчестер Сити, который в среднем пропускал больше одного гола за матч. По причине того, что чемпионат Англии по классу превосходит уровень чемпионата Франции. Соответственно голы будут иметь разную ценность.
Хотелось бы вам предложить заглянуть на страничку датасета футбольной статистики на kaggle: https://www.kaggle.com/prajitdatta/ultimate-25k-matches-football-database-european
Мне кажется вы найдёте там много интересного для подобных исследований :)
Диаграммы очень похожи, следовательно модель Пуассона хорошо объясняет соотношение мячей, забитых командой в течение матча.Очень сильное утверждение.
А откуда брали статистику по матчам?
По крупицам, тут есть, но навигация и UI адовое просто — http://www.soccerstats.com/.
Как в действительности букмейкерские конторы ставки рассчитывают по миллионам событий?
Я делал статистику по >300000 событий еще лет 6 назад и проставлялся, все гораздо хуже, чем в рекламе.
Наиболее перспективен лайв футбола, но прокрутить банк неимоверно сложно.
Однако, коэффициенты, которые предлагают букмекерские конторы, не проходят проверку на критерий Келли. Из-за этого «вдолгую» стратегия ставок, даже в случае если мы имеем идеальную модель, убыточна. Критерий Келли нарушается из-за того, что букмекер берет себе процент с каждой ставки.
Например, если вероятность события 0.7, коэффициент, который предложит идеальный букмекер, должен быть равен 1.428… (1/0.7), однако на практике он будет к примеру 1.35 (если маржа букмекера 5%).
У буков задача делить поток ставок, а не точные кефы. И почти всегда можно найти выгодный кеф у одного из конкурентов. Есть даже специальные сервисы.
Я так понимаю, эта книга только в бумажном виде существует?
1/(1 — (sum(A[1,2:6])+sum(A[2,3:6])+sum(A[3,4:6])+sum(A[4,5:6])+A[5,6] + sum(diag(A))))
Распределение Пуассона и футбольные ставки