ぼーの の日記

セイバーメトリクスとか

Expected Pitch Value(xPV) の信頼性評価

Expected Pitch Value(xPV)の信頼性*1について、折半法により評価を行った。

評価方法

19-21年の投手について、奇数番目の投球と偶数番目の投球におけるxPVをそれぞれ算出し、その相関を確認した。例として、ストレートの集計結果をFig.1に示す。投球数が多い投手ほど相関が高くなっていることがわかる。これは投球数の増加に伴って運による誤差が取り除かれ、観測値が安定化していることを示唆している。

得られた相関係数より、スピアマン・ブラウンの公式*2を用いて信頼性係数を算出した。

Fig.1 ストレート 集計結果

 

結果

Table.1にストレートの評価結果を示す。信頼性係数は0.7を超えると、安定した信頼できる数値としてみなすことができるといわれている。xPVは投球数800球以上で0.7に到達しており、投球イニングに換算するとおよそ100イニングに相当する。*3

投球数が小さくなるにつれ、信頼性係数は減少していくが、xPVとPV*4では減少速度が大きく異なることがわかる。xPVの減少は非常に緩やかであり、ランダムノイズの影響を受けにくいことがうかがえる。サンプルサイズの確保が難しい変化球にとって、この傾向は大きな意味を持つ。Table.2に投球数200~500における各球種の信頼性係数を示す。スライダーのxPVの信頼係数はストレートと近い値を示した。一方、フォークはやや低めに出る結果となった。CSW%でみると*5フォークが最も優れた安定性を示しており、フォークを評価する際はCSW%が有効かもしれない。

フォークのxPV値が安定しにくい要因として、投じられる投球カウントの違いが挙げられる。フォークボールは他の球種と異なり、決め球として用いられることがほとんどで、深い投球カウントで投じられることが多い。深い投球カウントはストライクとボールの得点価値の格差が大きいので*6、数値が振れやすい要因になっていると思われる。

Table.1 ストレートの信頼係数

 

Table.2 投球数200~500 球種別信頼係数

*2023年04月追記 Table.2のフォークのサンプルサイズを92→137に拡大。
xPV 0.22→0.41、PV 0.15→0.10、GB% 0.42→0.63、CSW% 0.82→0.82にアップデート。

 

*1:参考:指標の信頼性とは

*2:スピアマン―ブラウンの公式 | 統計用は集 | 統計WEB

*3:ストレート投球割合45%、17球/イニングと仮定したとき

*4:~xPVとPVの違い~

xPV:非インプレー打席は実際の打席結果を使用し、インプレー打席は打球性質のみを計算に使用。 
PV:非インプレー打席、インプレー打席ともに実際の打席結果を計算に使用。

*5:総投球に占める空振り・見逃しストライクの割合。CSW Rate: An Intro to an Important New Metric - Pitcher List

*6:こちらのカウント別wOBAより