セイバー指標を鵜呑みにするな:FangraphsとBaseball Referenceの違い

お知らせ:長い記事を書くと誰も読まないので、5分ぐらいで読める記事をこれから書いていきます。

注意:セイバーメトリクスに関する単語をあまり説明せずに使っています。殆ど自分用のメモです。

1.日米野球2018

遂に日米野球が始まりました。今年のMLBのメンバーは2014年に比べスター選手こそ少ないですが、一線級の選手が沢山揃っています。その来日メンバーのベストメンバー(野手)が以下になります:

JapanLineup

Source: How good would the Japan All-Star Series team be as an actual MLB team?

ちなみに僕の推しはソトです。

話はさておき、よーく見てみるとフィリーズのホスキンスのWAR (Wins Above Replacement - 選手の戦力としての価値を総合的に測る指標だと分かって頂ければ十分です) がめちゃくちゃ低いじゃないですか!WARが0.0だと代替可能選手(2軍・AAA並みの実力)と同じ貢献度になるので、かろうじてその選手よりホスキンスの方がチームに貢献している事になります。WARがマイナスの選手は沢山いるので、プラスである限りはそれなりの価値があります。ただ0.5となると「そこらへんにいる選手」ぐらいの評価になります。

この表はおそらくBaseball Referenceが算出したWARを基に作成されていますが、奇妙なのが0.5という数値がFangraphsが算出している2.9と大きく異なる事です。守備指標の算出方法の違いが原因かと思われますが、どうなのでしょうか。今回は調べませんが、何が言いたいかと言うと「数字の裏にある理論・モデルを把握しておこう」です。某ドラマが長打率を「二塁打以上のヒットを打つ確率」と解釈したり、たまにトンデモ指標があるので。

 

2.サイヤング争いでも

上記と似たような指標の違いは投手でも見られます。ナ・リーグのサイヤング賞候補であるメッツのデグロムはFangraphs上だとWARが8.8もあり、2位のシャーザー (7.2) に割と差をつけています。しかしBaseball Referenceを見てみるとデグロムはフィリーズのノラと同率1位 (WAR 10.0)であって、シャーザー (9.5)は3位 です。 

この違いは単純にWARの算出方法の違いにあり、Fangraphsはこのように説明しています:

FanGraphs’ WAR for pitchers is based on FIP (plus infield fly balls). We also have a version called RA9-WAR which is based on runs allowed. Baseball-Reference uses runs allowed and attempts to correct for the team defense.

(Source: What is WAR?)

極論Fangraphsの考えとしては「被本塁打四死球奪三振である程度投手の実力は把握でき(FIPと言う指標)、あとは運と球場補正次第」であります。しかしBaseball Referenceは:

The assumption is that once the ball is put into play (other than a home run) the entire outcome is determined by random chance and team defensive quality. This is definitely true to a greater degree than fans likely believe, but we disagree as to whether this is the best measure of the value of a pitcher's historical performance.

(Source: Pitching WAR Calculations and Details)

と言う風に「いや、投手はある程度打たれる打球の質(方向・角度・速度)をコントロールできるから」と考えています。かつこのモデルの方が「〇年間の活躍」など過去の実績・活躍をより正確に測れると論じています。 

どっちが正解なんでしょうかね。どこで読んだか忘れてしまいましたが(多分Redditのスレ):

  • 投手の一年間の活躍を見るならrWAR (Baseball Reference)
  • 投手の将来の予測したいならfWAR (Fangraphs)

みたいな事を書いている人がいて、僕は割とそれで納得しています。

 

3.結論

指標を鵜呑みにしないで、一体どのような意図が計算式にあるのかをある程度知っておいた方がセイバーメトリクスを楽しめるかと思います(例:田中将大FIPとxFIPの比較)。僕はバリバリ文系ですが、統計の裏にある理論・モデルを勉強するの中々楽しいですよ。まだまだ理解しきれていませんが。