足球比赛如何预测比分?
给大家上干货。
预测足球比赛的比分,最常用的就是泊松模型,泊松模型也是专门处理比分数据的。
考虑到很多玩家此前可能从未接触过数据统计模型,完全没有任何基础,这都没有关系,这篇回答依然可以让你学会如何通过简单的泊松分布计算足球比赛中各个比分发生的概率,进而计算得到比赛胜平负的概率。
我们以明天凌晨德甲,沃尔夫斯堡vs拜仁慕尼黑这场比赛来说。
一、模型的意义
首先,我们需要大概了解一下泊松分布,这里只做个简单的解释。
泊松分布是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德尼·泊松在1838年发表。泊松分布适合于描述单位时间内随机事件发生次数的概率分布。比如公交站台的候车人数、服务器在一定时间内接受服务请求的次数、电话交换机接到呼叫的次数、机器出现故障的次数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等等。
泊松分布的概率质量函数为:
对于足球比赛来说,比赛的进球数也服从泊松分布。泊松分布的参数λ就是单位时间(即一场比赛)内随机事件(进球)的平均发生次数。所以,通过结合历史数据,我们可以使用泊松分布计算足球比赛中可能的进球数。 然后使用简单的泊松分布公式计算足球比赛所有比分发生的概率。
二、参数计算
在使用泊松分布预测足球比分之前,我们需要先评估球队的进球能力和失球能力。评估球队进球和失球能力最好的数据就是xG(预期进球)和xGA(预期失球)。但是考虑到大部分玩家可能不会计算xG和xGA,我们也可以使用平均进球数来代替。
在之前的一篇回答中我给大家讲过“预期进球比进球数更可靠”,但是如果是超过15场或大半个赛季的比赛样本,那么进球数据也是很可靠的。所以这里使用平均进球数也是可以的。
怎么分析足球比赛?所以第一步,我们需要先计算比赛中各支球队的平均进球数,得到的平均值用于判断各支球队的“进攻实力”和“防守实力”,然后两相比较。
需要注意的是,在计算进攻和防守实力时,选择的数据范围非常重要。如果范围太大,数据将会偏离球队目前的真实实力。如果范围太小,异常值会影响数据的准确性。本赛季的德甲联赛已经进行了一半,各支球队差不多都踢了15场联赛,这为应用泊松分布提供了足够的样本量。
接下来我们来看如何计算一支球队的进攻实力和防守实力。
根据本赛季德甲截止目前的比赛赛果计算各支球队的进攻实力时,我们首先要确定每支球队在主场和在客场的平均进球数。
- 主场平均进球数=主场进球数/比赛场数=269/137=1.964
- 客场平均进球数=客场进球数/比赛场数=191/137=1.394
球队平均进球数与联赛平均进球数的比值就是一支球队的进攻实力。
同理,我们也可以计算各支球队的防守实力,只需将上述计算互换位置就可以(因为主队进球数就等于客队失球数)。
- 主场平均失球数=主场失球数/比赛场数=191/137=1.394
- 客场平均失球数=客场失球数/比赛场数=269/137=1.964
球队平均失球数与联赛平均失球数的比值就是一支球队的防守实力。
现在,我们就可以计算沃尔夫斯堡和拜仁慕尼黑的进攻实力和防守实力。
沃尔夫斯堡的主场平均进球数=11/7=1.571
沃尔夫斯堡的主场平均失球数=7/7=1.000
拜仁慕尼黑的客场平均进球数=17/7=2.429
拜仁慕尼黑的客场平均失球数=6/7=0.857
这个时候我们就可以计算出:
沃尔夫斯堡的主场进攻实力=1.571/1.964=0.800 (越高越好)
沃尔夫斯堡的主场防守实力=1/1.394=0.717 (越低越好)
拜仁的客场进攻实力=2.429/1.394=1.742 (越高越好)
拜仁的客场防守实力=0.857/1.964=0.436 (越低越好)
接下来我们就可以计算出两支球队本场比赛的预期进球数:
沃尔夫斯堡这场比赛的预期进球数=沃尔夫斯堡的主场进攻实力×拜仁慕尼黑的客场防守实力×联赛主场平均进球数=0.800×0.436×1.964=0.685
拜仁慕尼黑的预期进球数=拜仁慕尼黑的客场进攻实力×沃尔夫斯堡的主场防守实力×联赛客场平均进球数=1.742×0.717×1.394=1.741
三、泊松概率计算
以上计算得到的数据表示,明天凌晨的这场比赛,沃尔夫斯堡预期会进0.685球,拜仁预期会进1.741球。但是对于足球比赛来说,实际比分不可能是0.685比1.741,所以我们需要在一系列结果中找到概率分布。换而言之就是,我们在整个分布中将上述计算得出的预期进球数每一种结果发生的概率。
换算过程我们可以在EXCEL中使用泊松函数,计算出两支球队在这场比赛中不同进球数的概率分布(这里我们使用的数据范围为0至5)。计算出的概率分布如下:
计算结果显示,沃尔夫斯堡进0球的概率为50.41%,进1球的概率为34.53%,进2球的概率为11.83%,以此类推。
拜仁进0球的概率为17.53%,进1球的概率为30.53%,进2球的概率为26.57%,以此类推。
然后我们再将他们的概率相乘就可以进一步得到不同比分的概率,比如0:2的概率就是50.41%×26.57%=13.39%。计算出的概率分布如下:
需要注意的是,这里所有的概率相加<100%,是因为还有进球数超过5的比分,并没有计算在内。
这个时候,从以上概率分布中我们就已经得到了本场比赛各种比分发生的概率。
比如0:0的概率是8.84%,1:3的概率是5.32%,2:2的概率是3.14%等等。
其中概率最高的是0:1,也就是说本场比赛最有可能出现的比分是0:1,其次是0:2、1:1和1:2。
以上就是我们使用泊松分布预测足球比分的整个过程。
当然,基于此,我们也可以把其中沃尔夫斯堡赢球的所有比分概率相加,得到沃尔夫斯堡本场比赛赢球的概率,同理也可以计算得到本场比赛平局的概率以及拜仁赢球的概率。
沃尔夫斯堡赢球的概率为14.2%
双方打平的概率为22.95%
拜仁赢球的概率为61.87%
(注意:三项概率相加<100%,也是因为没有计算进球数超过5的比分)
然后我们将得到的概率转换为赔率:7.04 4.36 1.62
同样也可以计算得到各种进球数的概率。然后我们可以将计算得到的赔率和市场上的赔率进行对比,比如我们可以找到竞彩给本场比赛开出的赔率为7.50 5.60 1.21.
通过对比我们就可以发现,沃尔夫斯堡赢球和打平的赔率具有正期望价值。
以上就是通过数据分析对足球比赛进行预测,然后进行投注的整个过程。
但是这里需要强调的是,我们并没有计算进球数超过5的比分发生的概率,所以最终的计算结果肯定会存在一定的误差,其次泊松分布是比较简单的预测模型,并没有考虑大量因素,包括球队的状态,伤病和停赛的情况。
此外,由于足球比赛中存在大量的某一方0进球的比赛,而传统的泊松模型会低估“0进球”的概率,所以相对来说误差也会比较大,这个时候就需要使用零膨胀泊松模型。而且足球比赛中主队进球和客队进球往往并不是相互独立的,这时还需要联立泊松模型。
所以总的来说,因为上述原因,以上的计算结果相对而言会存在一些比较明显的误差,并不能作为投注决策的依据。但是我希望可以通过这个分析的过程帮助大家更好的理解足彩,理解足彩的赔率是如何开出的,以及玩家应该如何投注才能获利。