[논문 리뷰] Actions Speak Louder Than Goals: Valuing Player Actions in Soccer
이 논문은 축구 선수 행동을 표준화된 언어로 표현하는 SPADL과, 골 확률에 미치는 영향을 고려해 골, 슛, 드리블과 같은 공을 다루는 모든 행동에 대해 맥락 인식형 가치를 부여하는 데이터 기반 프레임워크인 VAEP을 소개한다. 게임 상태와 장기적 영향을 확률적 분류 기반으로 모델링함으로써 VAEP은 전통적인 지표보다 공격 및 수비 기여도를 더 정확하게 측정한다. 결과적으로 예측 성능 향상(AUC: 0.7556)과 유럽 주요 리그에서 스카우팅 및 선수 평가에 실질적인 통찰을 제공한다.
Assessing the impact of the individual actions performed by soccer players during games is a crucial aspect of the player recruitment process. Unfortunately, most traditional metrics fall short in addressing this task as they either focus on rare actions like shots and goals alone or fail to account for the context in which the actions occurred. This paper introduces (1) a new language for describing individual player actions on the pitch and (2) a framework for valuing any type of player action based on its impact on the game outcome while accounting for the context in which the action happened. By aggregating soccer players' action values, their total offensive and defensive contributions to their team can be quantified. We show how our approach considers relevant contextual information that traditional player evaluation metrics ignore and present a number of use cases related to scouting and playing style characterization in the 2016/2017 and 2017/2018 seasons in Europe's top competitions.
연구 동기 및 목표
- 골과 슛 외의 개별 선수 행동을 평가하기 위한 종합적이고 맥락 인식형 지표의 부족을 해결하기 위해.
- 다양한 데이터 소스 간 일관된 분석을 가능하게 하기 위해 이벤트 스트림 데이터를 표준화하는 데 사용할 수 있는 통합된 언어(SPADL)를 개발하기 위해.
- 미래 골 확률에 대한 영향을 기반으로 모든 공을 다루는 행동에 대해 동적 가치를 할당하는 프레임워크(VAEP)를 구축하기 위해.
- 위치, 압박 수준, 팀 상태와 같은 게임 맥락을 고려해 선수 평가의 정확도를 높이기 위해.
- 유럽 주요 리그의 실제 데이터를 활용해 스카우팅, 팀 전략 수립, 성과 분석에 실질적인 응용을 지원하기 위해.
제안 방법
- 행동 유형, 팀, 시작 및 종료 좌표, 게임 상태를 포함한 구조화된 형식을 사용하는 표준화된 선수 행동 표현 방식인 SPADL(Soccer Player Action Description Language)을 제안한다.
- 게임 상태 특징 기반으로 각 행동의 예상 골 영향을 추정하는 확률적 분류 프레임워크인 VAEP(Value Actions by Expected Performance)를 개발한다.
- 로지스틱 회귀, 랜덤 포레스트, XGBoost를 사용하여 선수 위치, 볼 위치, 압박 수준 등의 게임 상태 특징에서부터 단기 골 확률과 실점 확률을 모델링한다.
- 게임 상태 간 전이를 분석함으로써 행동의 장기적 영향을 모델링하기 위해 마르코프 결정 과정 유사 접근법을 적용한다.
- 공간적, 시간적, 맥락적 게임 상태 정보를 인코딩하는 기능 공학 파이프라인을 활용해 예측 모델을 훈련한다.
- 원시 이벤트 데이터를 SPADL 형식으로 변환하고 VAEP를 구현하며 골 확률을 추정하는 Python 패키지(socceraction)를 공개한다.
실험 결과
연구 질문
- RQ1다양한 공을 다루는 행동을 일관된 분석이 가능하도록 축구 이벤트 데이터 내에서 표현할 수 있는 표준화된 언어를 설계하는 데에는 어떤 방법이 필요한가?
- RQ2데이터 기반 프레임워크가 슛과 골 외의 모든 유형의 선수 행동에 대해 맥락에 맞는 정확한 가치를 할당할 수 있는 정도는 어느 정도인가?
- RQ3행동의 장기적 영향을 모델링함으로써 기존 지표에 비해 선수 성과 평가의 정확도를 향상시킬 수 있는가?
- RQ4VAEP에서 유도된 행동 가치가 팀 결과 예측 및 선수 기여도 평가에서 기존 지표와 비교해 어떻게 다를 수 있는가?
- RQ5맥락 인식 행동 평가를 통해 선수 역할, 플스타일, 스카우팅 가치에 대해 어떤 통찰을 얻을 수 있는가?
주요 결과
- VAEP 프레임워크는 XGBoost를 사용할 경우 AUC 0.7556을 기록하여 로지스틱 회귀(AUC: 0.7231)와 랜덤 포레스트(AUC: 0.7050)를 크게 앞서며 행동 영향에 대한 강력한 예측 능력을 입증했다.
- 모델은 몇 번의 행동 후에 골로 이어지는 정확한 패assing과 같은 행동의 장기적 영향을 성공적으로 포착했으며, 기존 지표가 간과하는 바를 반영한다.
- 집계된 행동 가치 기반 선수 평가에서, 벨기에, 네덜란드 등 소규모 리그의 젊은 유망주들이 잉글랜드, 스페인 등 최고 리그의 유사한 선수들보다 더 높은 평가를 받았으며, 이는 맥락 기반 성과 평가의 중요성을 드러낸다.
- 상대 팀의 골 확률을 증가시키는 행동(예: 위험 지역에서의 실수 패assing)에 대해 음수 가치를 할당함으로써 수비 기여도를 균형 잡힌 방식으로 평가할 수 있다.
- VAEP 모델은 골대 근처의 고압력 존에서의 행동이 더 높은 가치를 지닌다는 점을 보여주며, 패assing의 가치가 실행 당시의 위치와 수비적 압박 수준에 크게 의존한다는 점을 입증했다.
- 오픈소스 socceraction 패키지는 SPADL 변환부터 행동 평가까지 이벤트 데이터의 엔드 투 엔드 처리를 가능하게 하여 재현 가능성과 실세계 적용을 지원한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.