Мои выводы об использовании машинного обучения для ставок на спорт: всегда ли выигрывают букмекеры?
Наивная идея, ориентированная на деньги?
Однажды днем, посреди отпуска, мне пришла в голову мысль использовать машинное обучение для предсказания футбольных результатов в премьер-лигах. Сам я никогда не делал ставок на спорт, потому что не люблю распоряжаться деньгами, я так зарабатываю. Тем не менее, я поддержал эту идею. Я подумал, что если я смогу разработать алгоритм, обеспечивающий точность более 60%, я смогу распределить риск и делать ставки на несколько матчей, получая таким образом постоянный доход.
Я подумал следующее: если я начну со 100 долларов и поставлю по 10 долларов в 10 разных матчах, есть вероятность, что я смогу выиграть около 5 из 10 матчей. Я думал, что если у меня будет надежный алгоритм, я смогу разбогатеть. Вот важная часть, я никогда в жизни не делал ставки, и я не знаю тонкостей и тонкостей индустрии ставок. Я знал, что должен провести исследование, чтобы лучше понять, чего мне не хватает.
Я знал, что что-то упускаю; Я не мог быть первым, кто подумал об этом, это никогда не бывает так просто. Я провел небольшое исследование, чтобы лучше понять, что я мог найти по этой теме. Результаты были очень интересными, поскольку я обнаружил, как все работает на самом деле.
Во-первых, я нашел пару журнальных статей, которые позволили мне составить небольшой обзор литературы в этой области. И да, судя по всему, это целая область исследований, в которой профессионалы в области искусственного интеллекта посвящают свое время и силы совершенствованию своих моделей машинного обучения (ML). Согласно Банкеру и др. (2019) Хотя в нескольких исследованиях рассматривалось статистическое спортивное прогнозирование, использование парадигмы нейронных сетей является более поздним подходом.
В своем исследовании я нашел процент точности различных алгоритмов для разных видов спорта
Пурукер (1996) достиг 61% точности прогнозирования результатов в Национальной футбольной лиге (НФЛ) с использованием модели нейронной сети.
Кан (2003) расширил работу Пурукера (1996), добившись 75% точности в матчах 14-й и 15-й недель НФЛ. Для этого были собраны данные о 208 матчах сезона 2003 года.
Маккейб и Треватан (2008) изучали спортивные прогнозы в четырех различных видах спорта, а именно: НФЛ (лига регби), АФЛ (футбол по австралийским правилам), суперрегби (союз регби) и футбол английской премьер-лиги (АПЛ), используя данные за прошлый год. 2002. Средняя производительность алгоритма NN составила 67,5%.
Davoodi and Khanteymoori (2010) попытались предсказать результаты скачек, используя данные 100 гонок на ипподроме Aqueduct Race Track, проходившем в Нью-Йорке в январе 2010 года. он достиг точности 77%.
Tax and Joustra (2015) использовали данные голландских футбольных соревнований для прогнозирования результатов будущих матчей. В этом случае авторы также рассматривали коэффициенты ставок как переменные для своих моделей машинного обучения. В то время как их модели достигли точности 54,7%, модель, которая использовала только коэффициенты ставок, достигла точности 55,3%. Этот факт заставил меня кое-что осознать. Букмекерские конторы имеют собственную команду по анализу данных. Если шансы на победу команды равны 10/1, то, вероятно, эта команда проиграет.
Узнав, что точность алгоритмов в предыдущих исследованиях составляет от 50 до 70% (в зависимости от вида спорта), я все еще думал, что это было бы осуществимо, если бы шансы на матчи были бы как минимум 2/1.
Выясняем, почему с этим еще никто не стал миллионером
Прежде чем я напишу первую строку кода, я решил выяснить, действительно ли это возможно. В какой-то момент я подумал, что, может быть, использование собственных алгоритмов не законно, на что простой поиск в Google ответил, что это разрешено. Затем я подумал о букмекерских конторах и о том, как они регулируют или ограничивают сумму, которую вы можете поставить. Я нашел диссертацию под названием
«Обыграть букмекеров с их же номерами — и как фальсифицируется рынок онлайн-ставок на спорт в 2017 году».
На этой диссертации мои исследования остановились. В этой статье объясняется, как авторы пытались использовать свой алгоритм для монетизации, и обнаружили два основных препятствия. Первый:
Букмекеры используют собственные алгоритмы машинного обучения для расчета коэффициентов на матч.
Поэтому, поскольку ваша модель машинного обучения указывает вам на более определенные результаты, вы всегда можете получить небольшую выгоду. Второе, и даже более важное:
Букмекеры дискриминируют успешных клиентов
Следовательно, когда вы начнете часто выигрывать, букмекеры начнут вас дискриминировать и ограничивать сумму денег, которую вы можете поставить.
Помимо этих двух барьеров, в газете, которую я нашел, объяснялось, что за 5 месяцев они заработали 2086 долларов на 672 ставках с доходностью 6,2%. Это хорошо (это не так уж хорошо для тех усилий, которые вы должны приложить), но это тяжелая работа. Вы должны посвятить много времени и усилий, чтобы сделать много ставок и выдержать отметку букмекеров.
Я пришел к выводу, что разработка моделей машинного обучения для ставок на спорт хороша только для практики и улучшения ваших навыков работы с данными. Вы можете загрузить созданный вами код на GitHub и улучшить свое портфолио. Тем не менее, я не думаю, что это то, чем вы могли бы заниматься в рамках своего образа жизни в долгосрочной перспективе. Потому что в итоге букмекеры никогда не проигрывают. В конечном итоге я не написал ни строчки кода в этом проекте. Я надеюсь, что мой литературный обзор поможет проиллюстрировать другие.
No Comment