[论文解读] Actions Speak Louder Than Goals: Valuing Player Actions in Soccer
本文提出了SPADL,一种用于表示足球球员动作的标准化语言,以及VAEP,一种基于其对进球预期影响的上下文感知数据驱动框架,用于为所有在球动作(如传球、射门和带球)分配价值。通过使用概率分类建模比赛状态和长期影响,VAEP比传统指标更准确地量化进攻和防守贡献,结果显示预测性能显著提升(AUC: 0.7556),并为欧洲顶级联赛中的球探和球员评估提供了可操作的见解。
Assessing the impact of the individual actions performed by soccer players during games is a crucial aspect of the player recruitment process. Unfortunately, most traditional metrics fall short in addressing this task as they either focus on rare actions like shots and goals alone or fail to account for the context in which the actions occurred. This paper introduces (1) a new language for describing individual player actions on the pitch and (2) a framework for valuing any type of player action based on its impact on the game outcome while accounting for the context in which the action happened. By aggregating soccer players' action values, their total offensive and defensive contributions to their team can be quantified. We show how our approach considers relevant contextual information that traditional player evaluation metrics ignore and present a number of use cases related to scouting and playing style characterization in the 2016/2017 and 2017/2018 seasons in Europe's top competitions.
研究动机与目标
- 解决足球比赛中除进球和射门外,缺乏全面且上下文感知的个体球员动作评估指标的问题。
- 开发一种统一语言(SPADL),用于标准化事件流数据,以实现在不同数据源间的一致性分析。
- 构建一个框架(VAEP),根据动作对未来进球概率的影响,为所有在球动作动态赋值。
- 通过考虑位置、压力和球队状态等比赛情境,实现更准确的球员评估。
- 利用来自欧洲顶级联赛的真实世界数据,支持球员球探、球队策略和表现分析的实际应用。
提出的方法
- 提出SPADL(足球球员动作描述语言),一种使用动作类型、队伍、起始和结束坐标以及比赛状态等结构化格式表示球员动作的标准化表示方法。
- 开发VAEP(基于预期表现的价值动作),一种基于游戏状态特征估计每个动作预期进球影响的概率分类框架。
- 使用逻辑回归、随机森林和XGBoost模型,基于包括球员位置、球位置和压力水平在内的游戏状态特征,建模短期进球和失球概率。
- 采用类似马尔可夫决策过程的方法,通过分析游戏状态之间的转换,建模动作的长期影响。
- 采用特征工程流程,对空间、时间和上下文相关的游戏状态信息进行编码,以训练预测模型。
- 发布一个Python包(socceraction),可将原始事件数据转换为SPADL格式,实现VAEP,并估计进球概率。
实验结果
研究问题
- RQ1如何设计一种标准化语言,以一致地表示足球事件数据中多样的在球动作?
- RQ2数据驱动框架在多大程度上能为所有类型的球员动作(而不仅仅是射门和进球)分配上下文准确的价值?
- RQ3建模动作的长期影响是否能相比传统指标,提升球员表现评估的准确性?
- RQ4基于VAEP推导出的动作价值与现有指标相比,在预测球队结果和球员贡献方面表现如何?
- RQ5通过上下文感知的动作价值评估,可以对球员角色、踢球风格和球探价值获得哪些新见解?
主要发现
- VAEP框架在使用XGBoost时达到AUC 0.7556,显著优于逻辑回归(AUC: 0.7231)和随机森林(AUC: 0.7050),证明了其在预测动作影响方面的强大能力。
- 该模型成功捕捉了动作的长期影响,例如一次精准传球在数个动作后促成进球,而传统指标往往忽略此类影响。
- 基于聚合动作价值的球员评分显示,来自低级别联赛(如比利时、荷兰)的年轻新星获得的评分高于同水平在顶级联赛(如英格兰、西班牙)的球员,凸显了情境依赖的评估重要性。
- 该框架为增加对手进球概率的动作(如危险区域内的低质量传球)赋予负值,从而实现对防守贡献的平衡评估。
- VAEP模型表明,靠近对方球门的高压区域内的动作价值更高,且传球的价值在很大程度上取决于执行时的位置和防守压力。
- 开源的socceraction包实现了从SPADL转换到动作价值评估的端到端处理,支持可复现性与实际部署。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。