Skip to main content
QUICK REVIEW

[論文レビュー] Simultaneous Estimation of Ballpark Effects and Team Defense Using Total Bases Residuals

Jhe-Jia Wu, Tian-li YAN|arXiv (Cornell University)|Mar 22, 2026
Sports Dynamics and Biomechanics被引用数 0
ひとこと要約

この論文は、Total Bases Residuals (TBR) を用いた回帰フレームワークを紹介し、Exit Velocity(EV)とLaunch Angle(LA)を条件付けすることにより、球場効果とチーム守備を同時に推定する。Statcast データ(2015–2024)を使用。

ABSTRACT

Estimating ballpark effects and team defense in baseball is challenging because batted-ball outcomes are influenced by multiple factors, including contact quality, ballpark environment, defensive performance, and random variation. In this study, we propose a simple and interpretable framework based on Total Bases Residuals (TBR). Using Statcast data from 2015 to 2024, we construct expected total bases conditional on exit velocity and launch angle, and define residuals relative to this baseline. These residuals allow us to separate the effects of ballpark environment and team defense and to estimate them simultaneously within a unified regression framework. Our results show that, when our estimates differ from official MLB metrics, the differences can be explained by consistent patterns in home and away performance for both teams and their opponents, providing empirical support for our approach. Similar patterns are also observed in comparisons with existing defensive metrics. The results also suggest changes in league-wide outcomes and are broadly consistent with developments in the game, including the increased use of data-driven positioning, the restriction on defensive shifts, and possible changes in the physical properties of the baseball. We further introduce a standardized index that facilitates comparison across teams, ballparks, and seasons by expressing effects in units of standard deviation.

研究の動機と目的

  • 打球結果における球場効果と守備の分離の必要性を動機づける。
  • 環境要因と守備要因を isolating する簡潔で解釈可能な TBR ベースのフレームワークを提案する。
  • 大規模で統合された回帰アプローチを用いて、球場と守備の効果を共同推定する。
  • 球場効果の時間的安定性を評価し、既存指標と守備推定を比較する。
  • 球団・球場・シーズンを横断して効果を比較する標準化指標を提供する。

提案手法

  • EV と LA を条件付けてアウトカム残差 R_i = TB_i - μ_g(i) を構築する。ここで μ_g は EV–LA グリッドセル内の経験的平均 TB。
  • EV(3 mph刻み、0–120 mph)と LA(3度刻み、-90 to 90)のグリッドを定義する。
  • セル平均 μ_g を、シーズンを跨ぐ全打球の平均として計算する。
  • R_i を加法的回帰としてモデル化する: R_i = β^{park}_{p(i)} - β^{def}_{d(i)} + β_0 + ε_i、識別可能性制約を課す。
  • セル平均 y_{pd} を、セル内の観測を球場–守備セル(p,d)ごとに集計して推定し、重み付き最小二乗回帰 y_{pd} = β_0 + β^{park}_p - β^{def}_d + ε_{pd}(重み w_{pd}= n_{pd})を実行する。
  • 球場効果と守備効果をリーグ平均で中心化して、中心化された球場・守備効果と新しい切片を得る。効果の大きさを標準化した z スコアベースの指標を提示する。
Figure 1: Yearly Comparison of League-Wide Intercept Over Time (2015–2024).
Figure 1: Yearly Comparison of League-Wide Intercept Over Time (2015–2024).

実験結果

リサーチクエスチョン

  • RQ1接触品質を制御した後、打球残差から球場効果とチーム守備を同時推定できるか。
  • RQ2推定された球場効果は打者寄り/投手寄りの環境と整合し、時間的安定性を示すか。
  • RQ3提案された球場・守備推定は公式 MLB の球場要因や既存の守備指標(Def、OAA、OEE)と比較してどうか。
  • RQ4標準化指標はシーズン横断・球団横断・球場横断の効果の大きさ比較を容易にするか。

主な発見

  • 推定された球場効果は COL/CIN のような打者寄りの球場や SFG/SEA のような投手寄りの球場など、期待されるパターンを示し、リーグ全体の傾向と概ね一致する。
  • 球場要因は時間とともに比較的安定しており、平均的には MLB の公式球場要因よりも季を跨ぐばらつきが小さい。
  • Total Bases Residual フレームワークは Def、OAA などの既存指標と概ね整合する守備推定を生み出し、観測された打球結果のホーム/アウェイパターンを反映する。
  • ケーススタディ(例: Comerica Park、Minute Maid Park、Tropicana Field、Target Field)では MLB の球場要因と TBR ベースの球場効果の間に体系的な差異が見られ、ホーム/アウェイパターンが提案手法を裏付ける。
  • 効果の大きさを横断的に比較するための標準化指標(100基準)を提案する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。