ぼーの の日記

セイバーメトリクスとか

得点構造とDIPS

得点構造式から守備の影響を取り除くことで、投手のDIPS(守備独立型投手指標)っぽい式が導けるという話。

まず、得点構造式について考えよう。
1試合当たりの得点 R/G は以下のように分解できる。

R/G = R/PA × PA/G  R:得点、PA:打席数、G:試合数 

ここで R/PAは以下のようにさらに分解できる。

R/PA = R/OB × OB/PA  OB:出塁数

OB/PA出塁率(OBP)である。
R/OBは出塁に対する得点の割合を表しており、生還率とも呼ばれる。
トム・タンゴ氏の分析よれば、この生還率は出塁率で大雑把に近似することができる。
よって、R/PAは以下のように書き直すことができる。

R/PA = OBP^2 ・・・①

続いて、PA/G を分解してみよう。
1試合のアウト数は 27 なので、

PA/G = PA / ( OUT/27 )  OUT:アウト数

    = 27 × 1 / ( OUT/PA )

ここでアウト率 OUT/PA = 1 - OBP なので、

PA/G = 27 × 1 / ( 1 - OBP ) ・・・②

①、②式を冒頭の式に代入すると、最終的に

R/G = 27 × OBP^2 / ( 1 - OBP )

このように、少しの近似と簡単な四則演算を行うことで R/G を出塁率の式に変換することができる。

 

ところで出塁率は以下の式で算出される。

OBP = (  BB+HBP+H ) / ( BB+HBP+SO+BIP+HR )

BB:四球、HBP:死球、H:安打、SO:三振、BIP:インプレー打球、HR:本塁打

DIPS理論より、インプレー打球の安打率は投手の能力によらず3割に収束することから期待出塁率xOBPは

xOBP = ( BB+HBP+0.3BIP+HR ) / ( BB+HBP+SO+BIP+HR )

このxOBPを先ほどの得点構造式に適用すれば、DIPS理論を盛り込んだ式が得られる。とりあえずここではこれを xRA と呼ぼう。

xRA = 27 × xOBP^2 / ( 1 - xOBP )

 

代表的なDIPSとして FIP や tRA が有名だが、これらは各イベントの得点価値を解析して得られる式であり、その導出過程は非常に複雑である。しかも、イベント解析は平均的な得点環境を前提としているため、得点環境が大きく変わると計算が破綻してしまうという欠点がある。佐々木朗希のFIPがマイナスになったという話は有名だろう。

一方、xRA はFIPのようなイベント解析過程を踏まないため、上記のような計算破綻の問題が起こらない。xRAはFIPよりも数値的安定性に優れた指標である。

しかし、xRAは被本塁打を過小評価、四死球・三振を過大評価する傾向があり(詳しくは [ おまけ ] 参照)、精度にやや難があるため、xRAの有用性がFIPを超えることはないだろう。それでも、xRAが持つ計算ロジックの明快さや数値的安定性には目を見張るものがあり、非常に魅力的であると感じている。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

[ おまけ ] プラスワンメソッドで各イベントの得点価値を試算してみよう。

プラスワンメソッドという手法を用いてxRA式から各イベントの得点増加量を試算してみる。
2022年田中将大を例に計算してみよう。成績は以下の通り。

四死球(敬遠除く):33
奪三振(投手打席除く):126
BIP:495
HR:16

これらをxRA式にあてはめると、xRA=3.32 となる。
ここで四死球を1つ増やした時のxRAを計算し、その増加量を測ってみると、3.35 - 3.32 = 0.03 となる。
投球回は163より、試合数に換算すると 163/9 = 18.1。
よって失点の増加量は 0.03 × 18.1 = 0.54 。
同様の計算をすべての投球イベントについて行うと、

四死球:0.54
三振:-0.22
HR:0.54
BIP:0.00

四死球、HR、三振の得点増減量はtRA式の各係数と概ね一致すべきだが、乖離がみられる。
これは生還率を出塁率で近似した弊害が表れた結果だと思われる。
xRAの計算を行う際は、このような誤差を含んでいることを頭に入れておきたい。

最後に、2022年佐々木朗希について同様の計算を行った結果を以下に示す。

四死球:0.45
三振:-0.14
HR:0.45
BIP:0.03
RA:2.16
xRA:2.13

四死球、HRの得点価値が減少していることが分かる。出塁が少ない環境では、四死球本塁打が得点創出に与えるインパクトは小さくなるはずであり、xRAにはこの効果が反映されている。

一方で、BIPの得点価値はやや増加している。BIPは出塁とアウトが混在したイベントであり、ある一定のバランスをもってる。BIPの得点価値が増えたということは、出塁が枯渇している環境では、7割のアウトよりも3割の出塁の方が得点へのインパクトが大きいことを示唆している。

三振については四死球本塁打と同様の考えで、出塁が少ない環境では奪三振の失点抑止力は小さくなるべきである。