Pull to refresh
0
3
Send message

Как при помощи машинного обучения и чата GPT 4.0 удалось предсказать чемпиона Евро 2024 и обыграть букмекера

Level of difficultyEasy
Reading time6 min
Views2.7K

Прошло 2 месяца с окончания чемпионата Европы по футболу, а значит самое время подвести итоги.

Краткий дискурс в начало.
Перед стартом ЧЕ, мне стало интересно проверить точность машинного обучения при прогнозе на столь непрогнозируемую сферу как футбол, а заодно узнать можно ли обыграть букмекера, написав пару строчек кода.

Был проанализирован датасет из 3000 релевантных матчей, не проанализировано все остальное (рейтинг, форма и т. п.).

Условия с "букмекером": 51 матч сыгран турнире, на каждый совершена условная ставка в размере 100 долларов на основании прогноза машины + 2 раза по 100 долларов мы поставили на чемпиона - до начала турнира и после окончания групповой стадии. Оба раза триумфатором была выбрана Испания.

Виртуальный банк составил 5 300 долларов, в конце посмотрим как он изменился

Итак, с помощью чата GPT 4.0 я перебрал несколько вариантов базового алгоритма Random forest на питоне и на R. Результаты оказались выше на R, поэтому его и принял за основу. Код с прогнозом описан в прошлых статьях, здесь я подвожу итоги.

Читать далее
Total votes 5: ↑3 and ↓2+3
Comments5

Предсказываем результаты плей-офф и победителя Евро 2024 при помощи машинного обучения и чата GPT 4.0 (часть 2)

Level of difficultyEasy
Reading time5 min
Views1.4K

Дисклеймер

По приведенным ниже прогнозам не стоит делать ставки, т.к. они не учитывают букмекерскую маржу, форму команд, а также много других факторов. В целом ставки на спорт весьма специфичное занятие, рассчитанное во многом на психологию человека, скрытые слабости и т. д., поэтому в целом не стоит ставить на основании любых прогнозов в интернете.

Результаты предсказаний группового этапа:

Читать далее
Total votes 3: ↑1 and ↓2+1
Comments3

Предсказываем результаты группового этапа и победителя Евро 2024 при помощи машинного обучения и чата GPT 4.0

Level of difficultyEasy
Reading time11 min
Views3.3K

Дисклеймер

По приведенным ниже прогнозам не стоит делать ставки, т.к. они не учитывают букмекерскую маржу, форму команд, а также много других факторов. В целом ставки на спорт весьма специфичное занятие, рассчитанное во многом на психологию человека, скрытые слабости и т. д., поэтому в целом не стоит ставить на основании любых прогнозов в интернете.

Для проведения исследования использовались: датасет: https://www.kaggle.com/datasets/martj42/international-football-results-from-1872-to-2017?resource=download , язык программирования R, чат GPT 4.0. 

Цели исследования: 1) проверить точность прогноза в результате машинного обучения на основании базы данных за 20 лет 2) узнать размер выигрыша/проигрыша в букмекерской конторе при использовании приведенного подхода.

Проблематика исследования: здесь не учтены важные факторы такие как уровень и стоимость игроков, текущая форма команд, фактор домашнего турнира для сборной Германии и многое другое.

Это все учтено самими букмекерами при выставлении коэффициентов на матчи, минус 10-15 процентов их маржи, поэтому просто выбирая фаворитов выиграть невозможно.

Лично для меня больший интерес представляет ответ на вопрос - удастся ли машине обнаружить неочевидные закономерности и обыграть букмекера, а не определение фаворита.

 

Методология

В первую очередь был обработан датасет, так как он включает результаты более 47 000 матчей за 152 года, в том числе - различных африканских квалификаций, которые нам не интересны и замедлили бы обработку данных, датасет был сокращен до результатов евро, квалификации к нему и лиге наций.

Читать далее
Total votes 4: ↑2 and ↓2+2
Comments5

Описательный анализ или как выбрать страну для релокации (пошаговый ключ к посту топ 20 стран)

Reading time4 min
Views13K

Описательный анализ (далее - ОА) это самый простой вид анализа, который используется на начальном этапе анализа данных. Задачи ОА могут быть разными, но чаще всего целью ОА является облегчить принятие решений для бизнеса через выявление закономерностей и тенденций.

К примеру, производитель хочет выйти на новые рынки в соседние страны, чтобы не изучать каждую страну в отдельности, что будет дорого и долго, проводится предварительный анализ или ОА, по результатам которого мы получаем 3 страны максимально подходящие критериям бизнеса. После заказываем дополнительные исследования и уже проводим диагностический, прогностический и иные виды анализа согласно бизнес-требованиям.

В данном случае нет смысла применять другие виды анализа, так как объективных данных в любом случае будет недостаточно, но и ОА с большой долей вероятности поможет вам определиться с выбором.

Целью анализа является определить для себя группу стран, которые в дальнейшем вы будете изучать более подробно. В конце приведу пример, как это работает.

Данные с сайта https://www.numbeo.com/, анализ проведен в BigQuery.

Критерии

Добавить свои критерии поможет базовая функция электронных таблиц =VLOOKUP.

Например, мы решаем добавить в нашу таблицу столбец с показателями валового дохода от аренды квартиры в центре города (полезно учитывать, если планируете купить квартиру и сдавать её или оплачивать в ипотеку).

Для этого используется функция =VLOOKUP, которая подбирает совпадающие значения.

=VLOOKUP(A2:A96, $I$2:$J$112, 2, FALSE)

Читать далее
Total votes 27: ↑9 and ↓18-6
Comments36

Топ 20 стран для комфортной жизни с зарплатой 500/1000/1500 долларов

Level of difficultyEasy
Reading time3 min
Views17K

Я релоцировался из России пару лет назад, как полагаю и многие читатели Хабра. В последнее время решил поменять страну проживания и обнаружил, что сложно найти систематизированную информацию по странам, чтобы принять решение куда лучше направиться.

В связи с чем я провел анализ стран по наиболее существенным на мой взгляд критериям. Данные предоставлены за 1-й квартал 2024 года из открытого источника https://www.numbeo.com/, проанализированы 92 страны.

Читать далее
Total votes 50: ↑30 and ↓20+20
Comments164

Information

Rating
1,052-nd
Registered
Activity

Specialization

Data Analyst
Python
SQL