Комментарии / Профиль Mreeew / Хабр

Пользователь

Машинное обучение для прогнозирования тенниса: часть 1

Mreeew 3 авг 2016 в 06:22

коммент ниже по идее отвечает на этот вопрос)
чтобы было более понятно
Предположим мы ставим по 2% денег на каждый матч

budget < — 1000
ROI < — 0.038

for ( i in 1:2173){
bet_amount < — budget*0.02 ##взяли 2% денюжек из конверта
budget < — budget — bet_amount ## в конверте осталось на 2% меньше
bet_amount < — bet_amount*(1+ROI) ##это мы поставили денюжки на матч и победили
budget < — budget + bet_amount ##столько денюжек стало в конверте)
}

print (budget)
>>5211.422

То есть мы получили в пять раз больше.
Единственное что тут не учитывается, а это важно — поражения. Цифра 3.8 процента — средняя по больнице, если бы мы постоянно выигрывали с таким ROI, тогда получили бы в 5+ раз больше денег, так как 2% от капитала постоянно растут. Но мы будем иногда проигрывать, тем самым периодически теряя 2% капитала, поэтому итоговая сумма всё таки ниже чем 5211. В любом случае 1038 USD тут не пахнет=)
У Автора статьи данных побольше, он может сказать реальную цифру в год для конкретной модели.
Надеюсь помог в осознании)

Деревья, у которых нет листьев

Mreeew 23 мая 2016 в 14:53

Крутая статья!
Но возникло несколько вопросов:
1) Почему использовали randomForest, а не обычный bagging(rf со всеми переменными). Ведь случайный лес нужен, чтобы понизить эффект «близорукости» алгоритма, но в нашем случае, когда мы строим дерево глубиной 1, на «близорукость» алгоритма пофиг
2) Я понимаю, что в результате получился бешеный underfittting, но не озвучите ли хоть какие-то метрики точности? Банально, чтобы было с чем сравнить=)