ぼーの の日記

セイバーメトリクスとか

差分分析のすすめ

今回は分析手法のひとつである「差分分析」について実例を交えながら紹介する。

Fig.1はNPBにおけるストレートの球速とPitch Value(失点抑止量、以降PVと省略)の関係を示したグラフである。

Fig.1 FFの球速 vs PV

球速とPVは正の相関が見られ、球速が遅くなるほど失点抑止量が小さくことを示唆している。これは直感的にも納得がいく結果であり、とくに珍しいものではない。むしろ着目すべきは平均球速を下回る領域においてPVの減少が非常に緩やかになっている点である。このような傾向を見ると、「平均球速よりも遅すぎるストレートは打者が見慣れておらず、打ち損じやすくなるのでPVが減少しにくくなっているのではないか」といった解釈をしたくなるが、ここには注意が必要である。

150km/h付近と140km/h付近の球速帯では当然ながら構成する投手群が異なる。すなわち、それぞれの群は球速以外の特徴(変化量やリリース特性など)にも違いを持っている可能性がある。このような球速以外の要因がPVに影響している可能性があるため、「遅いストレートは打ちにくい」といった解釈を安易に行うのはやや危険である。

球速以外の特徴の影響を排除する方法として、個体内差分を観察する手法がある。具体的には、同一投手において球速が1km/h変化した際のPVの変化を見ることで、球速以外の特徴を一定としたうえで、球速がPVに与える純粋な影響を分析することができる。このような分析手法をここでは「差分分析」と呼ぶ。(差分分析の詳しい手順は後述の「差分分析の手順」を参照いただきたい。)

差分分析より得られた球速 vs PVのプロットをFig.2に示す。Fig.1とは異なり、PVは球速に対して直線的に比例している。このような結果からFig.1のプロットは球速以外の要因も強く影響していると推察できる。

Fig.2 差分分析の結果

 

差分分析の手順

分析手順の一例を紹介する。

149km/h→150km/hのときのPitch Value変化を考える。Fig.3のように各投手のPV/100の差分値を計算し、投球数に応じて加重平均をとってNPB平均値を算出する。このときノイズ低減のため、投球数は少ない方の値を用いる。

Fig.3 各投手の差分値計算

Fig.4に計算式も添えたイメージを示しておく。

Fig.4 各投手の差分値計算

おわりに

今回のケースのように、分析手法によって得られる結果が大きく変わる場合がある。複数の手法を組み合わせ、様々な視点からデータを観察することで、より深い考察が可能となる。今回紹介した分析テクニックも引き出しの一つとして頭にとどめていただけると幸いである。