セイバー指標を鵜呑みにするな:FangraphsとBaseball Referenceの違い

お知らせ:長い記事を書くと誰も読まないので、5分ぐらいで読める記事をこれから書いていきます。

注意:セイバーメトリクスに関する単語をあまり説明せずに使っています。殆ど自分用のメモです。

1.日米野球2018

遂に日米野球が始まりました。今年のMLBのメンバーは2014年に比べスター選手こそ少ないですが、一線級の選手が沢山揃っています。その来日メンバーのベストメンバー(野手)が以下になります:

JapanLineup

Source: How good would the Japan All-Star Series team be as an actual MLB team?

ちなみに僕の推しはソトです。

話はさておき、よーく見てみるとフィリーズのホスキンスのWAR (Wins Above Replacement - 選手の戦力としての価値を総合的に測る指標だと分かって頂ければ十分です) がめちゃくちゃ低いじゃないですか!WARが0.0だと代替可能選手(2軍・AAA並みの実力)と同じ貢献度になるので、かろうじてその選手よりホスキンスの方がチームに貢献している事になります。WARがマイナスの選手は沢山いるので、プラスである限りはそれなりの価値があります。ただ0.5となると「そこらへんにいる選手」ぐらいの評価になります。

この表はおそらくBaseball Referenceが算出したWARを基に作成されていますが、奇妙なのが0.5という数値がFangraphsが算出している2.9と大きく異なる事です。守備指標の算出方法の違いが原因かと思われますが、どうなのでしょうか。今回は調べませんが、何が言いたいかと言うと「数字の裏にある理論・モデルを把握しておこう」です。某ドラマが長打率を「二塁打以上のヒットを打つ確率」と解釈したり、たまにトンデモ指標があるので。

 

2.サイヤング争いでも

上記と似たような指標の違いは投手でも見られます。ナ・リーグのサイヤング賞候補であるメッツのデグロムはFangraphs上だとWARが8.8もあり、2位のシャーザー (7.2) に割と差をつけています。しかしBaseball Referenceを見てみるとデグロムはフィリーズのノラと同率1位 (WAR 10.0)であって、シャーザー (9.5)は3位 です。 

この違いは単純にWARの算出方法の違いにあり、Fangraphsはこのように説明しています:

FanGraphs’ WAR for pitchers is based on FIP (plus infield fly balls). We also have a version called RA9-WAR which is based on runs allowed. Baseball-Reference uses runs allowed and attempts to correct for the team defense.

(Source: What is WAR?)

極論Fangraphsの考えとしては「被本塁打四死球奪三振である程度投手の実力は把握でき(FIPと言う指標)、あとは運と球場補正次第」であります。しかしBaseball Referenceは:

The assumption is that once the ball is put into play (other than a home run) the entire outcome is determined by random chance and team defensive quality. This is definitely true to a greater degree than fans likely believe, but we disagree as to whether this is the best measure of the value of a pitcher's historical performance.

(Source: Pitching WAR Calculations and Details)

と言う風に「いや、投手はある程度打たれる打球の質(方向・角度・速度)をコントロールできるから」と考えています。かつこのモデルの方が「〇年間の活躍」など過去の実績・活躍をより正確に測れると論じています。 

どっちが正解なんでしょうかね。どこで読んだか忘れてしまいましたが(多分Redditのスレ):

  • 投手の一年間の活躍を見るならrWAR (Baseball Reference)
  • 投手の将来の予測したいならfWAR (Fangraphs)

みたいな事を書いている人がいて、僕は割とそれで納得しています。

 

3.結論

指標を鵜呑みにしないで、一体どのような意図が計算式にあるのかをある程度知っておいた方がセイバーメトリクスを楽しめるかと思います(例:田中将大FIPとxFIPの比較)。僕はバリバリ文系ですが、統計の裏にある理論・モデルを勉強するの中々楽しいですよ。まだまだ理解しきれていませんが。

ビシエドはなぜ首位打者になれそうなのか?

1.首位打者争い

NPBも今季残り僅かとなりました。セ・リーグのCS争いが白熱としている中、タイトル争いもそろそろ大詰めです。そのタイトル争いの中でセ・リーグの暫定首位打者に君臨している中日のビシエドに今回は注目したいと思います。9月22日時点(多分)でのビシエドの打率は0.351であり、2位の坂本(.334)に大きな差をつけています。誰が首位打者になろうと個人的にはあまり興味がないのですが、ビシエドがなぜここまで打率を伸ばせられたのかは気になる所です。

 

2.ビシエドの打率とBABIP

ビシエドの年度別の成績は以下になります:

f:id:chofu24:20180922223829p:plain

(データはNPBデルタより)

打率に注目すると、ビシエドの今季の打率は2016年と2017年に比べ劇的に上昇しています。そして共に上昇しているのがBABIPです。このBABIPと言うのはインプレーの打球の打率を表す指標です。言い方を変えるとフェアグランドに飛んだ打球(本塁打は計算式から除外されます)がどのぐらいの割合で安打になったのかを示してます。普段は0.300辺りを推移しますので、ビシエドの0.358が特異な数字である事は明白です。物凄く噛み砕きますと0.300を大きく超えている打者は運が良い、逆に下回っている場合は運が悪いと考える事が出来ます(実際はもっと複雑ですが、今はとりあえずこれぐらいの認識で大丈夫です)。

計算式は以下になります:

(安打ー本塁打)/(打数ー三振ー本塁打犠飛

以前別の記事でも軽く触れましたが、打率と言う指標は(a)相手の守備(b)運(c)実力の3要素によってある程度説明がつきます。そしてこの3要素によって0.300に収束するはずのBABIPが大きく変動する可能性があるのです。BABIPについてもっと詳しく読みたい方は英文記事ですが、Fangraphsの説明を読む事をお勧めします。一応軽く説明しますと:

(a)守備

(捕)原口(一)阿部(二)マギー(三)小谷野(遊)鳥谷(左)バレンティン(中)平沢(右)ペゲーロ

もし相手がこのような守備陣だと、平均的な守備に比べ安打が増える可能性が高いです。

(b)運

どんなに優れている打者でも野手の正面に打ち続けたら打率は0.000です。逆にショボいゴロを打っても、野手の間を抜ければ打率は1.000です。運が良いか悪いかで打率が左右される可能性があると言う事です(打者はある程度打球をコントロール出来ても、それには限界がある事を前提にしています)。記憶は少々曖昧なのですが、柳田は2016年シーズンの序盤は相当数字が悪かった記憶があります。その原因は不運にあると、このグラフを作ったFull-Countの記事は書いています。

(c)実力

好打者は球を芯で捉え、より速い打球を打つ技術を持っています。なのでその技術が打率とBABIPに反映されている可能性があります。その他にもイチローのように詰まりながらもレフトに安打を打つ技術などもありますので、各選手の技術を深く理解する必要が出てきます。数字だけで野球を語れたら苦労しません。

あと足が速い選手も必然的にBABIPが高くなります(内野安打が増えるため)。もし1年間だけ内野安打を多く打ったらそれは多分運ですが、継続的に例えば10年間内野安打を沢山打っている選手の打率は運だけでは説明出来ないかと思われます。

  

3.ビシエドはどうなんだよ!

正直に言うと現時点では何も分かりません。ただビシエドは2016年と2017年に比べ、強い打球を打つ割合が高くなっているのは分かっています(5%ぐらい増えています)。なのでもしこのデータが正確であれば、ビシエドは運だけでなく実力によって打率を上げた仮説を立てる事が出来ます(ちなみにBB/Kの指標も改善しています)。ただ打球の強さに関するデータは不確定要素が多く、測定誤差が起きやすいため定かではないのも事実です(プロ野球MLBのようにStatcastの設備が整っている訳ではありませんので)。

かつ、BABIPは長い目で見る必要があります。BABIPが安定するには820の打球サンプルが必要だと言われており、分析単位も基本的にシーズンです。なのでシーズン別のBABIPを比べる必要が出てきます。なぜなら全ての選手のBABIPは0.300に収束する訳ではなく、プレイスタイル(例:足が速い)によってBABIPの真値が0.330辺りの選手もいます。その選手がもし突然0.400の数字を叩き出したら、何かが起きていると考えて問題ないでしょう。なのでもしかしたらビシエドのBABIPの真値が0.340辺りの数値である可能性があるのです。

とりあえず現時点では何も分かりませんので、来季の成績を待つしかありません。個人的にはビシエドの打率が例年通り0.260辺りに回帰すると予想しています。

「先発投手」を再考する

1.常識に囚われないTBレイズ

僕は最近MLBのTBレイズに注目しています。岩村や松井が所属していたチームなのですが、TBレイズは今季どうあがいてもプレーオフに出れません。だけどそのレイズがいま行っている画期的な投手リレーが面白いのです。

普通なら投手リレーは以下のような流れになるかと思います:

先発投手(5~6回)→ 中継ぎ(1~2回)→ 抑え(1回) 

だけどレイズがいま行っているのが:

オープナー(1~2回) → 先発投手(5~6回) → 中継ぎ(1~2回) → 抑え(1回)

レイズはこれを中継ぎ・抑え投手として有名なセルジオ・ロモを使って今季初めてやりました。ちなみにですがロモはプロ生活において一度も先発を経験していません。

知らない人のために書いておきますが、ロモは数年前の日本対メキシコの親善試合のメキシコの選手として来日しています。ちなみに中村晃にホームランを打たれています。

 

2.なぜ先発投手を使わない?

ロモをオープナーとして使った理由はいたってシンプルです。

  • 対戦相手のエンゼルスは上位打線(当時は1番キンズラー/コザート・2番トラウト・3番アップトン)を右打者で固める傾向があるのですが、ロモは滅法右打者に対して強いのです。
  • 上位の右打者は1試合において4回か5回は打順がまわってきます。その内の1回を確実に仕留めるためにロモを使ったわけです。

一見物凄く破天荒な戦法ですが、一部界隈では前々から提唱されてきた戦法です。例えば僕は2016年にアリゾナで開かれたセイバーメトリクスの学会に参加したのですが、その時にMLBネットワークのブライアン・ケニーは「次に起こりえる野球界の革命とは?」の問いに対してこのような事を言っています:

The full bullpen attack. Why have a starting pitcher? Well, because we used to have one. He was the starter, and the closer, and the finisher, and everything in between. Why do you start with a guy? Why in the National League do you let a guy pitch the first two innings and have him bat? Why not have an opener, have a guy pitch two innings, pinch-hit for him, then bring in your Adam Wainwright type and let him go from the third to the eighth? It’s just tradition, really.

 要約すると「先発投手が長いイニング投げると言うのはただの伝統だよね」みたいな事を言っています。ちなみにドジャースも最近これをやっています(ちょっとチーム事情が違いますが)。

 

3.反対意見

勿論このような投手リレー・投手ローテに反対している人は多数います。「伝統に反する!」みたいな意見は正直個人的にどうでも良いのですが、「球団が金を節約するためにやっている」と言う意見も出ています。確かにMLBの契約の中には「〇〇イニング投げたらプラス〇億ドル」というのがちらほらあります(例:前田健太)。なのでもしこの投手ローテの組み方が主流になった場合は選手の年俸についても考え直さないといけません(その前に先発とリリーフの年俸の格差を是正して欲しい所ですが)。MLB選手会は歴史的に見て色々発言してきているので、選手会が何とかしてくれる事を信じます。

 

4.おまけ

TBレイズはちなみにこんな事もやっています。ロモは8回に登板をし、対戦相手のヤンキース打線を無失点に抑えています。そのまま試合は1点リードの中9回に突入したのですが、先頭打者のバード(左)の所でロモはサードにまわりました。そして次の打者のアンドゥーハー(右)になると、ロモはマウンドに戻りました。「ロモを試合に残したいけど、左打者との対戦成績は良くないからとりあえずサードに置くわ」って考えです。ちなみにバードは超絶プルヒッターなので「サードのロモに打つ可能性は低いだろう」と言う考えも兼ねています。面白い発想ですね。