ぼーの の日記

セイバーメトリクスとか

一球速報から測る守備評価

近年、観測技術の発達により映像解析を駆使したゾーン系守備指標(UZRやDRSなど)が広く使われるようになってきている。
ゾーン系指標の算出は技術的に高度であるため、個人での算出はほぼ不可能であり、数値に潜むバイアスやノイズは解析者さえも把握しきれないブラックボックス状態となっている。

一方で、個人で計算可能な守備指標としてレンジ系指標が存在するが、測定ノイズの大きさから年々使われなくなっている。しかしながら、レンジ系指標の計算に用いられる"補殺"や"安打"などの素データは、映像データを素データとするゾーン系指標と比べると、実に客観的かつ明快で主観の介入がほとんどないという良さがある。

本記事では、一球速報から得られるデータに着目し、測定ノイズを最大限に抑えたレンジ指標的守備評価を行い、その測定精度と有用性についてゾーン系指標と比較ながら検討を行なったので紹介する。

 

【概要】
今回は、一球速報で記録される"セカンドゴロ"や"左前ヒットゴロ"など、打球性質と打球方向を含んだデータを用いて守備評価を行った。

計算方法は、責任範囲に飛んできた打球のアウト獲得率を集計し、平均的な野手よりも獲得できたアウト数を計算する。内野手はゴロ処理、外野手はフライ処理に焦点を当て、評価する。

本記事で使用するデータは独自に集計したものであり、公式記録とズレがあることをご承知いただきたい。

【Step.1 守備責任打球の定義】
まず、各守備位置に対して "守備責任打球" (Resposible Batted Balls, RBB)を定義する。
守備責任打球とは、当該ポジションにおいて守備責任があると思われる打球の総数のことである。例えば遊撃手の場合、遊ゴロ、遊内野安打、左前ヒットゴロ、中前ヒットゴロが守備責任として想定される。各守備位置について設定したRBBをTable.1に示す。

守備責任範囲を設定することで、それ以外の打球を守備評価と関係ないものとして計算から除外でき、ノイズを低減できる。

 Table.1 各ポジションの守備責任打球(RBB)

f:id:bo-no05:20210731123237j:plain

 

【Step.2 安打責任率の定義】
ゴロアウトや内野安打は100%一野手の責任となるが、野手の間を抜く左前ヒットゴロや右中間ヒットフライは一定の責任分配が発生する。この責任分配の比率を安打責任率(Hit Responsibility Ratio, HRR%)として定義する。

例えば、一二塁間を抜く右前ヒットゴロの場合、二塁手一塁手の両者に責任が生じることとなるが、その責任割合は必ずしも1:1ではない。

2019年NPBの一二塁間方向の総ゴロアウト数は6594で、このうち一塁手が処理したゴロアウトは2187、二塁手が4407であった。二塁手のゴロアウトはさらに中堅方向と右翼方向に分類され、このうち中堅方向は一二塁間の打球と関係ないものとして除外する。今回、中堅方向のゴロアウトは全ゴロアウトの50%と仮定して計算を進める。

よって、一塁手のアウト奪取率は2187/(2187+4407*0.5)≒45%、二塁手が4407*0.5/(2187+4407*0.5)≒55%と求められ、二塁手一塁手よりも約1.2倍多くアウトを獲得している計算となる。今回、アウトを多く獲得しているということはそれだけ安打を許した時の責任も大きいと仮定し、アウト奪取率をそのまま安打責任率として使用する。Table.2に各打球方向の安打責任率HRR%を示す。

 Table.2 安打の打球方向と安打責任率HRR%

f:id:bo-no05:20210731121403j:plain
※2021/04/04 追記:ゴロ打球をレフト方向、センター方向、ライト方向に分割し、HRR%を見直した。

 

 【Step.3 RBBの算出】
 Step.1、2の定義をもとにRBBを算出する。
遊撃手の場合の算出式は以下の通り。
遊撃RBB = 遊ゴロアウト(エラー含む)+遊内野安打+ HRR% × 左前ヒットゴロ + HRR% × 中前ヒットゴロ
 
2020年京田陽太を例にとると、
遊撃RBB = 332 + 25 + 0.45 × 88 + 0.50 × 84 = 438.6
 
上記の計算により京田の遊撃RBBは438.6と求まる。このうちゴロアウト数は332なので、アウト奪取率は75.7%が得られる。2020年遊撃手のリーグ平均は73.5%なので、京田は平均を上回るパフォーマンスであったことを示唆している。
 
 【Step.4 守備得点の算出】
 Step.3で得られたデータをもとに余剰獲得アウト数を求め、得点換算を行う。
2020年京田陽太の場合、
余剰獲得アウト数=遊ゴロアウト - 遊撃RBB × (リーグ総遊ゴロアウト/リーグ総遊撃RBB)
        =332 - 438.6 × 0.735
        =9.6 アウト
 
京田陽太は平均的な遊撃手よりも 獲得アウトが 9.6個 多かった計算となる。
アウトをヒットにしたときの得点価値は0.72点なので、
得点換算すると 9.6 × 0.72 = 6.9 点の守備範囲得点(RngR)が求まる。
 
【本指標の測定精度について】
DELTA社がUZRシステムにより算出したRngRと本手法により得られたRngRを比較し、測定精度について検証した。
Fig.1は2019年、2020年の規定守備イニング以上の遊撃手(20選手)のRngRについて比較したグラフである。多少のバラツキはみられるものの、決定係数は0.72と比較的高い相関を示した。同じレンジ系指標であるRRFFSで同様の分析を行ったところ、決定係数はそれぞれ0.36と0.16であり、本手法により精度が大幅に改善されていることがわかった。

f:id:bo-no05:20210801185840j:plain

Fig.1 RngRの比較 @2019-2020年遊撃手
 Fig.2に遊撃手以外の守備位置のプロット図を示す。決定係数は二塁手を除き、遊撃手を下回っており、精度の低下を示唆している。考えられる原因としては、打球処理数の違いやライン際打球の存在などが影響していると思われるが、はっきりしたところはわかっていない。今後もデータを蓄積し、動向を確認していきたい。

f:id:bo-no05:20210801185818j:plain

f:id:bo-no05:20210912172941p:plain

Fig.2 各内野守備の RngR比較@2019-2020年野手

 最後にそのほかの守備指標の決定係数をTable3にまとめる。最終的にUZRの決定係数は0.4~0.8を示した。

Table.3 各種守備指標の決定係数(DELTA vs 本指標)
f:id:bo-no05:20210912173207p:plain

※DPRの算出方法は「デルタ・ベースボール・リポート4,テーブルスコアを活用した疑似UZRの遊撃手評価」を参照しています。
※ARMの算出方法は下記リンクを参照しています。
 http://archive.baseball-lab.jp/column_detail/&blog_id=7&id=19
 http://archive.baseball-lab.jp/column_detail/&blog_id=7&id=20

【本指標の有用性について】

今回の検証により1年分の一球速報データから算出した個人RngRは、従来のレンジ指標と比べて精度が大幅に向上していることがわかった。

本手法により得られるRngRは、レンジ系指標の長所である"客観性の高さ"を可能な限り維持しつつ、短所である"大きなランダムノイズ"を低減しており、UZRシステムにはない特性をもった指標として十分有用ではないかと考える。