Skip to main content
QUICK REVIEW

[論文レビュー] Applying Deep Learning to Basketball Trajectories

Rajiv Ratn Shah, Rob Romijnders|arXiv (Cornell University)|Aug 12, 2016
Sports Analytics and Performance参考文献 5被引用数 29
ひとこと要約

この論文では、NBA SportVuの生の3次元ボール軌道データに再帰的ニューラルネットワーク(RNN)を適用し、3ポイントシュートの成否を予測している。物理的特徴を含まないモデルよりも優れた性能を示しており、位置情報のみを用いてAUC 0.843を達成した。これは、深層学習が物理的特徤を必要とせず、複雑で非線形なボールの運動を学習できることを示している。

ABSTRACT

One of the emerging trends for sports analytics is the growing use of player and ball tracking data. A parallel development is deep learning predictive approaches that use vast quantities of data with less reliance on feature engineering. This paper applies recurrent neural networks in the form of sequence modeling to predict whether a three-point shot is successful. The models are capable of learning the trajectory of a basketball without any knowledge of physics. For comparison, a baseline static machine learning model with a full set of features, such as angle and velocity, in addition to the positional data is also tested. Using a dataset of over 20,000 three pointers from NBA SportVu data, the models based simply on sequential positional data outperform a static feature rich machine learning model in predicting whether a three-point shot is successful. This suggests deep learning models may offer an improvement to traditional feature based machine learning methods for tracking data.

研究の動機と目的

  • 深層学習モデルが、物理的特徴を含まない生の位置追跡データのみを用いて、3ポイントシュートの成否を予測できるかどうかを調査すること。
  • 速度や角度などのエンジニアリング特徴に依存する従来の機械学習モデル(例:勾配ブースティング、線形モデル)と比較して、RNNの性能を評価すること。
  • 順序付きモデリングを用いてバスケットボールの非線形なボール軌道を捉える可能性を評価すること。
  • データ品質およびモデルのハイパーパrameterが、運動追跡タスクにおける予測性能に与える影響を評価すること。

提案手法

  • 本研究では、SportVuが25 Hzで記録したボール位置(X, Y, Z)の時系列をモデル化する目的で、再帰的ニューラルネットワーク(RNN)、具体的にはLSTMアーキテクチャを用いている。
  • ベースラインモデルとして、速度、加速度、位置データから導出された幾何的変数を含む包括的な手作業特徴を用いた勾配ブースティングマシン(GBM)を採用している。
  • RNNは、ボールがバスケットから8フィート離れた瞬間を起点として、0.5秒間のボール位置の時系列を入力とし、シュートの成否(成功/失敗)を予測するように学習している。
  • データセットは、631試合の20,156本の3ポイントシュート試みから構成されており、プレイ・バイ・プレイデータを介して成否が紐付けられている。
  • 性能評価には受信者操作特性曲線下の面積(AUC)を用い、生の位置データと特徴エンジニアリング済み入力の両方でモデル間の比較がなされている。
  • データ量が限られていること(約40 MB)を考慮し、一般化性能の向上を図るためのデータオーグメンテーション手法の検討も行われた。

実験結果

リサーチクエスチョン

  • RQ1生の3次元ボール軌道データのみを用いて学習したRNNは、速度や角度といった多数の特徴をエンジニアリングした従来の機械学習モデルを上回って、シュート成否を予測できるか?
  • RQ2物理法則の明示的知識なしに、RNNはバスケットボールの軌道の非線形的ダイナミクスをどの程度学習できるか?
  • RQ3学習データ量の変化に伴いモデル性能はどのように変化するか? また、限られたデータセットの状況下で、データオーグメンテーションは結果の向上に寄与するか?
  • RQ4現在のトラッキングデータ(例:SportVuのノイズ)の限界は、深層学習モデルの予測精度をどの程度制限しているか?

主な発見

  • RNNモデルは、3ポイントシュートの最後の0.5秒間の生の位置情報(X, Y, Z)のみを用いて、シュート成否を予測する際、AUC 0.843を達成した。
  • これは、エンジニアリング特徴を用いた勾配ブースティングマシン(GBM)モデル(AUC 0.719)を著しく上回る性能であった。
  • 単純な一般線形モデルですらAUC 0.558にとどまり、RNNが非線形ダイナミクスを捉える優位性を示している。
  • 訓練データを半分にした場合でもRNNの性能は安定しており(AUC 0.870)、モデルの頑健性を示唆しているが、全データを用いた場合(AUC 0.906)にさらに高い性能が得られた。
  • 本研究では、RNNが物理的特徴を明示的に含まないまま、複雑で非線形なボール運動のパターンを学習できることを明らかにした。これは、順序付き運動をモデリングする分野におけるRNNの潜在的応用を示している。
  • SportVuトラッキングデータのノイズや不正確さが、強力な結果にもかかわらずモデル性能の制限要因であると特定された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。