ぼーの の日記

セイバーメトリクスとか

NPB版kwERA、GBkwERA式の導出

NPBのデータを使って、kwERAおよびGBkwERA式を導出してみた。

kwERA式の導出

平均的な投手に比べて失った自責点 ERAA(Earned Runs Above Average) は、LWSTより、以下のように表せる。各イベントの得点価値はこちらを参照した。

ERAA = 0.437*単打+0.786*二塁打+1.117*三塁打+1.408*HR+0.292*四球-0.257*アウト

インプレ―打球(BIP)と本塁打による得点増減は投手がコントロールしにくい項目なので、リーグ平均値*1で固定値化すると、

ERAA = 0.292*四球-0.257*三振+0.022*(BIP+HR)  ・・・①

ここで、(BIP+HR)の得点価値を基準として各イベントの得点価値を書き直すと、

ERAA = (0.292-0.022)*四球-(0.257+0.022)*三振+(0.022-0.022)*(BIP+HR)

       = 0.276*四球-0.279*三振

9イニングあたりERAAに換算すると、

ERAA/9 =(0.276*四球-0.279*三振)/打席数*打席数/投球回*9

     =(0.276*四球-0.279*三振)/打席数*4.25*9

     = 10.6*(四球-三振) / 打席数

防御率(ERA)の形に書き直すと、

ERA=lgERA+ERAA/9+調整定数

19-21年のNPBのリーグ平均防御率は3.75、リーグERAA/9はおよそ-1.1なので、

3.75 = 3.75-1.1+調整定数

調整定数=1.1

したがって、kwERA式は

kwERA=4.8-10*(三振-四球) / 打席数
※計算簡略化のため、端数切り落とし

 

GBkwERA式の導出

ところで、(BIP+HR)の得点価値はゴロ打球の割合(GB%)によって大きく変動する。

19-21年のNPBデータより、ゴロ打球の得点価値は-0.087、ゴロ以外の打球の得点価値は0.121であることがわかっている。よって、これらの値をGB%で加重平均することで、(BIP+HR)の得点価値を推定することができる。*2計算結果をFig.1に示す。

f:id:bo-no05:20220205225123p:plain

Fig.1 GB%と打球得点価値

この結果はあくまで推定値に過ぎない。そこで実際の投手のGB%と打球得点価値を集計し、その関係性を確認した。Fig.2に19-21年の期間で900以上の打球を打たれた投手24名のGB%と打球得点価値についてプロットした図を示す。先ほどの推定値と比較すると、一定の相関が確認でき、相関係数は0.40と中程度の相関を示した。

f:id:bo-no05:20220205225013p:plain

Fig.2 実測値のプロット

以上の結果より、GB%と(BIP+HR)の得点価値の関係式は下式のように表すことができる。

(BIP+HR)の得点価値 = 0.121-0.0021*GB%

この式を①式の0.022の項に代入し、整理するとGBkwERA式が得られる。

GBkwERA=4.1-10*(三振-四球) / 打席数+(4.6-0.08*GB%)*(1-(三振+四球) / 打席数)

 

2022年 要注目・要注意選手

最後に防御率とGBkwERAの乖離が大きかった選手をピックアップする。

TOP3のうち、2名がDeNAの投手となっており、バックの守備が大きく影響していたと思われる。FAで移籍した又吉と、人的保障の岩崎は大きく明暗が分かれる形となった。

f:id:bo-no05:20220206011330p:plain

 

[参考]

1.http://baseballconcrete.web.fc2.com/alacarte/examining_dips.html
2.https://1point02.jp/op/gnav/glossary/gls_explanation.aspx?eid=20013

*1:平均BABIPと各安打の割合から算出。19-21年データを使用

*2:細かい話をすると、ゴロ以外の打球を占める内野フライの割合はGB%に依存することがわかっている。下図に示すようにゴロが少なくなるとゴロ以外の打球を占める内野フライの割合が増加していることがわかる。

Fig.1の計算ではこの効果を考慮していないため直線的な関数となっているが、これを考慮すると少ししなったようなカーブが得られる。(下図参照)
両者を比較すると、得点価値としてはっきり差が表れるのはGB%が35%以下の領域のみで、それ以外はほとんど差がない。GB%が35%を下回る投手は希少(100人に1、2人程度)であり、計算の煩雑さを考えると、線形式を採用するのがベターだと思われる。

f:id:bo-no05:20220206105024p:plain
内野フライとGB%
f:id:bo-no05:20220206110603p:plain
内野フライ効果と打球得点価値