[論文レビュー] Actions Speak Louder Than Goals: Valuing Player Actions in Soccer
本稿では、サッカー選手の行動を標準化された言語で表現するSPADLと、スコアリングへの期待影響に基づき、パスやシュート、ドリブルなどのボールオンアクションに文脈に配慮した価値を割り当てるデータドリブンなフレームワークVAEPを紹介する。確率的分類を用いてゲーム状態と長期的影響をモデル化することで、VAEPは従来の指標よりも攻撃的・守備的貢献をより正確に定量化する。結果として、予測性能が向上(AUC: 0.7556)し、ヨーロッパ主要リーグにおけるスカウティングと選手評価に実用的で有用なインサイトを提供する。
Assessing the impact of the individual actions performed by soccer players during games is a crucial aspect of the player recruitment process. Unfortunately, most traditional metrics fall short in addressing this task as they either focus on rare actions like shots and goals alone or fail to account for the context in which the actions occurred. This paper introduces (1) a new language for describing individual player actions on the pitch and (2) a framework for valuing any type of player action based on its impact on the game outcome while accounting for the context in which the action happened. By aggregating soccer players' action values, their total offensive and defensive contributions to their team can be quantified. We show how our approach considers relevant contextual information that traditional player evaluation metrics ignore and present a number of use cases related to scouting and playing style characterization in the 2016/2017 and 2017/2018 seasons in Europe's top competitions.
研究の動機と目的
- ゴールやシュート以外の選手行動を評価するための包括的で文脈に配慮した指標の不足に対処すること。
- 異なるデータソース間で一貫した分析を可能にするために、イベントストリームデータを標準化するための統一言語(SPADL)を構築すること。
- 将来的なスコア確率への影響に基づき、ボールオンアクションすべてに動的価値を割り当てるフレームワーク(VAEP)を構築すること。
- 場所、プレッシャー、チーム状態などのゲームの文脈を考慮することで、より正確な選手評価を可能にすること。
- ヨーロッパ主要リーグの実データを用いて、選手スカウティング、戦術戦略、パフォーマンス分析への実用的応用を支援すること。
提案手法
- 選手行動の種別、チーム、開始・終了座標、ゲーム状態を含む構造化されたフォーマットを用いた、行動の標準化表現(SPADL: Soccer Player Action Description Language)を提案する。
- ゲーム状態特徴に基づき、各行動の期待ゴール影響を推定する確率的分類フレームワーク(VAEP: Value Actions by Expected Performance)を開発する。
- ロジスティック回帰、ランダムフォレスト、XGBoostを用い、選手の位置、ボールの位置、プレッシャーレベルを含むゲーム状態特徴から、短期的なスコア確率と失点確率をモデル化する。
- ゲーム状態間の遷移を分析することで、行動の長期的影響をモデル化する、マルコフ意思決定過程に類似したアプローチを採用する。
- 空間的・時間的・文脈的ゲーム状態情報をエンコードする特徴工学パイプラインを活用し、予測モデルの学習を実施する。
- 生イベントデータをSPADL形式に変換し、VAEPを実装し、スコア確率を推定するPythonパッケージ(socceraction)をリリースする。
実験結果
リサーチクエスチョン
- RQ1多様なボールオンアクションを一貫した分析が可能なように、サッカーイベントデータにおける行動を表現する標準化された言語をどのように設計できるか?
- RQ2データドリブンなフレームワークは、シュートやゴール以外のすべてのタイプの選手行動に対し、文脈的に正確な価値を割り当てられるか、その程度はいかほどか?
- RQ3行動の長期的影響をモデル化することで、従来の指標と比較して、選手パフォーマンス評価の正確性が向上するか?
- RQ4VAEPから導出された行動価値は、チームの結果予測や選手貢献の評価において、既存の指標と比較してどのように異なるか?
- RQ5文脈に配慮した行動価値化を用いることで、選手の役割、プレー様式、スカウティング価値に関するどのようなインサイトが得られるか?
主な発見
- VAEPフレームワークはXGBoostを用いてAUC 0.7556を達成し、ロジスティック回帰(AUC: 0.7231)やランダムフォレスト(AUC: 0.7050)を大きく上回り、行動影響の予測力が非常に高いことが示された。
- モデルは、数アクション後にゴールをもたらすような的確なパスの長期的影響を効果的に捉えており、従来の指標が見逃す事象を包括的に評価できる。
- 行動価値の集計に基づく選手レーティングでは、ベルギー・オランダの下位リーグに所属する若手の才能が、イングランド・スペインのトップリーグに所属する同レベルの選手よりも高いレーティングを獲得しており、評価の文脈依存性が顕著に現れた。
- 相手チームのスコア確率を高める行動(危険ゾーンでの不適切なパスなど)に対して負の価値を割り当てることで、守備的貢献のバランスの取れた評価が可能になった。
- VAEPモデルは、相手ゴール付近の高プレッシャーゾーンでの行動がより高い価値を持つこと、およびパスの価値が実行時の位置と守備的プレッシャーに強く依存することを示した。
- オープンソースのsocceractionパッケージにより、SPADLへの変換から行動価値評価までエンドツーエンドの処理が可能となり、再現性と実世界への展開を支援する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。