数据回顾球员:触底反弹的万乐

时间:2020-07-02 21:48       来源: 西甲直播

勒万多夫斯基的最高中锋身份从未被质疑过。事实上,从传统数据来看,凭借稳定的目标数量,黎凡在江湖中的地位永远不会受到太多质疑。问题是,如果它比黎凡特好,它将不可避免地经历高潮和低潮。上个赛季应该是莱文最糟糕的赛季;这一季,黎凡可被视为触底反弹,迎来了过去五年来的最高表现。

前言:一个简单的玩家数据评分模型

在这里,我们介绍了数据图的一个新情况,并以高层次的数据来看待黎凡近年来的情况。这也是一种在流行期间变得无聊的尝试。

我试着用8个数据来衡量一个球员的进攻表现,包括持球的5个数据:运球频率、运球成功率、持球频率、持球成功率、渐进跑(即达到一定的持球向前距离,每个区域有不同的标准,并且离前场越近,所需的距离越短);2项无球和射门选择数据:禁区内的触球次数和每次射门的预期进球数;还有我自己的量化的投篮水平——真正的投篮命中率。

需要特别说明的是,真正的投篮命中率是我自己的算法,它的目标是量化一个球员“纠正投篮难度”的能力。公式为“(实际进球数——预期进球数)/射门次数”,可简单理解为“每个球员在射门时面临一定困难时,进球概率与平均水平之间的差异”。在这种算法下,真实的投篮命中率很容易为负。坦率地说,你的射击水平低于平均水平。注意:在大样本中,这个数据不受拍摄环境的影响,因为拍摄环境越差,拍摄越难。虽然得分的概率较低,但一旦你得分,奖金会更大。

(关于真实的投篮得分率,请参考三个高水平的数据图表来告诉你:本赛季三大联赛中谁有质量和数量)

鉴于这八个数据,我们将选定的玩家与相同位置的玩家进行比较,计算每个环节中有多少玩家超过相同位置,并给出分数。

例如,如果一名球员每90分钟运球5次,并且在同一位置的球员中排名第8,并且在同一位置有20名球员,则该球员的运球频率得分为(1-8/20)*100%=60%。

张贴本赛季在英超表现出色的球员的得分表——格雷利。我通常给这个位置的球员添加传球数据,所以是两张照片:

图中的“频率”项每90分钟使用一次数据。入选的对象是本赛季在英超联赛中出场超过800分钟的左翼和左翼球员(根据wyscout的统计,这两个位置在格拉利的出场时间最多)。区域的大小表明有多少玩家超过了同一个位置。面积越大,分数越高。

传递数据与像莱文这样的球员没什么关系,所以我不会在这里解释,但我以后会有机会详细解释。

当然,这个建模本身的改进是非常大的。首先,这些“频率”项没有与球队的控球率结合起来进行二次计算。然而,当在控球率较高的球队比赛时,显然更容易积累数据,如持球频率。像威士考特一样,齐达内使用的是没有这种数据的数据库。老实说,对我来说这似乎是不可原谅的...其次,这里筛选的位置是“或”而不是“和”,只要格拉利在,因为他已经在中锋位置踢了一段时间,传球成功率和其他数据绝对会高于纯粹的边锋。"你在某个位置输入数据了吗?"这个问题也是我们在进行位置区分时面临的最终问题。