[논문 리뷰] Predicting Tennis Serve directions with Machine Learning
저자들은 Match Charting Project 데이터를 사용하여 프로 선수들의 첫 서브 방향(측면당 세 방향)을 예측하는 ML 모델을 구축했고 남자 선수의 정확도는 약 49%, 여자 선수의 정확도는 약 44%에 도달했다. 이는 맥락적 특징을 바탕으로 한다.
Serves, especially first serves, are very important in professional tennis. Servers choose their serve directions strategically to maximize their winning chances while trying to be unpredictable. On the other hand, returners try to predict serve directions to make good returns. The mind game between servers and returners is an important part of decision-making in professional tennis matches. To help understand the players' serve decisions, we have developed a machine learning method for predicting professional tennis players' first serve directions. Through feature engineering, our method achieves an average prediction accuracy of around 49\% for male players and 44\% for female players. Our analysis provides some evidence that top professional players use a mixed-strategy model in serving decisions and that fatigue might be a factor in choosing serve directions. Our analysis also suggests that contextual information is perhaps more important for returners' anticipatory reactions than previously thought.
연구 동기 및 목표
- 프로 선수들의 첫 서브 방향 선택에 영향을 주는 요인을 이해한다.
- 서브 방향 결과에 대한 머신러닝 모델의 예측 정확도를 평가한다.
- 맥락 정보, 피로, 불안이 서브 방향 결정에 설명력을 갖는지 조사한다.
- 서브 방향 의사결정에 빛을 비추는 특징 중요도를 탐구한다.
제안 방법
- 레이블로 Match Charting Project의 실제 서브 방향 데이터를 사용한다.
- 포인트 단위 데이터에서 이전 서브 카운트, 서브 비율, 피로도 측정치, 수행 불안 지표 등을 포함한 특징들을 엔지니어링한다.
- 각 선수별로 70/30 학습-테스트 분할로 다중 모델(Multinomial Logistic Regression, Decision Tree, Random Forest, SVM, Neural Network)을 학습시킨다.
- 듀스와 애드 사이드, 남녀 선수별로 성능을 각각 평가한다.
- 의사 결정 트리 분석을 통해 특징 중요도를 식별하여 서브 방향 의사결정을 해석한다.
실험 결과
연구 질문
- RQ1맥락적 특징만으로도 개별 선수의 첫 서브 방향을 예측할 수 있는가?
- RQ2세 방향의 서브를 각 측면에서 사용할 때 선수 및 성별에 따른 예측 정확도는 어느 정도인가?
- RQ3어떤 특징이 서브 방향 선택에 가장 큰 영향을 미치는가(예: 이전 카운트, 피로, 불안 등)?
- RQ4결과가 혼합 전략적 행동과 피로가 서브 결정에 미치는 역할을 뒷받침하는가?
주요 결과
| 모델 | 듀스(남자) LR | 듀스(남자) RF | 듀스(남자) DT | 듀스(남자) SVM | 듀스(남자) NN | 평균(남자) | |
|---|---|---|---|---|---|---|---|
| Table 1 | 0.47 | 0.50 | 0.46 | 0.49 | 0.50 | 0.49 | |
| Novak Djokovic | 0.47 | 0.50 | 0.45 | 0.46 | 0.47 | 0.47 | |
| Roger Federer | 0.46 | 0.49 | 0.44 | 0.47 | 0.47 | 0.47 | |
| Nick Kyrgios | 0.55 | 0.52 | 0.50 | 0.55 | 0.54 | 0.53 | |
| Daniil Medvedev | 0.45 | 0.49 | 0.48 | 0.47 | 0.46 | 0.47 | |
| Andy Murray | 0.56 | 0.53 | 0.58 | 0.52 | 0.54 | 0.55 | |
| Rafael Nadal | 0.52 | 0.50 | 0.43 | 0.52 | 0.52 | 0.50 | |
| Dominic Thiem | 0.55 | 0.47 | 0.43 | 0.55 | 0.55 | 0.51 | |
| Stefanos Tsitsipas | 0.49 | 0.48 | 0.46 | 0.47 | 0.47 | 0.47 | |
| Stan Wawrinka | 0.46 | 0.49 | 0.45 | 0.45 | 0.48 | 0.46 | |
| Alexander Zverev | 0.46 | 0.42 | 0.42 | 0.47 | 0.46 | 0.44 | |
| Mean | 0.50 | 0.49 | 0.46 | 0.49 | 0.50 | 0.49 |
- 남자 선수의 듀스 사이드에서 평균 예측 정확도는 약 49%, 애드 사이드에서 약 50%이다.
- 여자 선수의 듀스 사이드에서 평균 예측 정확도는 약 44%, 애드 사이드에서 약 45%이다.
- 특정 선수에 대해 여러 ML 방법에서 예측 정확도가 일관되어 결과의 강건성을 시사한다.
- 특징 중요도 분석은 각 방향으로의 첫 서브 누적 카운트, 현재 포인트 이전의 런 인덱스, 및 첫 서브 비율을 영향을 주는 요인으로 강조한다.
- 상위 선수들이 혼합 전략을 사용할 수 있으며 피로가 서브 방향 선택에 영향을 줄 수 있다는 증거를 제공한다.
- 맥락 정보만으로도 리턴 선수의 예측 반응에 합리적인 예측을 얻을 수 있다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.