本塁打を増やせば優勝間違いなし?

久しぶりの投稿になります。

結論:違う

 

時間があったのでMLBのデータを使って、ちょっと遊んでいました。

f:id:chofu24:20190814201818p:plain

図1

本来は「1試合あたりの本塁打数」x「勝率」を使いたかったのですが、IDで合わせるのがめんどくさかったのでやめました。かつ1871から2018までのチームデータを全て引っ張っているので、結構な荒業になってしまいますが、まあ本塁打を打てば良いって事じゃないですよね。ちなみに最高記録は去年のヤンキースです。

完全目視ですが、40勝を超えたあたりからほぼ無相関ですね。

f:id:chofu24:20190814202030p:plain

図2

 ピタゴラス勝率は「y = 得点^n / (得点^2 + 失点^2)で求められますが、要するに得点を奪いつつ、失点を抑えれば勝てるって事です。なのでいくらホームランが打てても、守備がいまいちなチームは大抵の場合勝てません。

終わり

追記:エクセルで作業したのですが、苦痛だったのではやくRの使い方を覚えたいです(もしくは諦めて、Stataに金を貢ぐか)

セイバーメトリクス!?統計学勉強しないと!

結論から言うと「セイバーメトリクス統計学100%」ではないです。

 

飲みの席とかで「セイバーメトリクスに興味があります」と言うと「野球を統計学的に見るやつ?」みたいな返事が大抵の場合帰ってきます。間違ってはいませんが、そもそも打率や本塁打など従来の指標を使っている時点で統計学です。なので打率、本塁打、打点だけを見ていても、一応統計学的な見地から野球を見ている事になります。

 

ウィキペディアには

セイバーメトリクス (SABRmetricsSabermetrics) とは、野球においてデータを統計学的見地から客観的に分析し、選手の評価や戦略を考える分析手法である。

と書いてあります。間違っては無いけど「統計学」という文字がどうも必要以上に小難しくしている気がします。別に統計学について詳しくなくても、野球について詳しければ全然理解できる内容です。セイバー関連の研究をしている人は新しい指標を色々作っていますが、それはより選手の能力を正確に測るためです。

 

極端な例をあげると「選手Aの守備能力」を測りたいときに「グローブの種類」に関するデータを与えられてもおそらくは何も分かりません。「選手Aは玉澤使っています」と言われても「だからなんやねん!」となるでしょう。そうじゃくて、普通なら「グローブの種類」ではなくて「捕殺」や「エラー」などもっと能力を正確に測れる指標に頼りますよね。しかしこの時に「けど打球がそもそも来なかったら捕殺とか少なくなるよね?」みたいな話になります。全ての指標が優れているわけではないので、指標の欠点に関する事は野球の知識がないと思いつきません。セイバーはざっくりこんな感じで、これぐらい知っていればFangraphsあたりの記事の内容は理解できるかと思います。

 

ただ「分析」となると、統計学の知識は必須です。例えば僕の交換留学先の知り合いはベイズ推定を使い、スカウト評価に関する分析を行っています。「は?」と感じですが、MLBのフロントはこのような分析が主流です(たぶん)。

 

言いたい事:セイバーメトリクスプロ野球でも少しずつ浸透しているっぽいですが、あまり中身は知られていないような印象があります。その時に「統計学」のイメージが先行してしまうと、よからぬ方向に理解が進みそうで心配です。逆に指標も内容を知らずに信仰してしまうと「トラウトのBABIP高いやん!雑魚じゃん!」みたいな事を言う人が出てくるかもしれません。トラウトのBABIPが高いのには理由があり、野球を知っていればすぐに分かるはずです。

巨人の補強:炭谷編

1.巨人、炭谷を獲得

いま体調を崩していて、勉強に集中できないのでブログを更新します。今回は巨人が炭谷を獲得した事について書きます。もっと細かく言うと「現在の巨人の捕手事情に炭谷は必要なのか?」みたいな感じです。なお、炭谷の人的補償として西武に移籍した内海には今回あまり触れません(大事な論点ですが、長くなってしまうので)。かつ、最近報道に出ている阿部の捕手復帰の噂もスルーです(実際に捕手が出来るのか、かなり不透明なので)。

結論を先に言っておくと:小林と大城の併用で良くない?

図1は現在の巨人の戦力事情を視覚的に表しています。ぶっちゃけ今回の記事には全く必要ない図ですが、せっかく作ったので載せます(退団が決まっている中井、ほぼ確実に引退するマギーも含んでいます)。そして見にくくてすいません。ちなみに炭谷(30歳)のWARは0.4です。

結構やっつけ仕事なので、データに間違いがあったらすいません。ちなみにこのブログ記事に載っている全ての図のデータ元はデルタです。

f:id:chofu24:20190107101801p:plain

図1

図1を作って思った事:(1)必然的に若手の方が総WARは高くなります。と言うのも、年を重ねれば重ねるほどプロ野球界で生き残っている確率が低いため(2)吉川尚はいい仕事をしているから、浅村を獲得しなかったのは正解(3)坂本はすごい(4)田中俊が思ったより数字が良かった。

 

2.打撃

今回はwRC+のみに着目します。簡単に説明すると、wRC+は得点貢献に球場補正をかけた指標です(100が平均的な選手)。ちなみに宇佐見は打席数(サンプル数)が足りないので省きます(故に数字が極端)。wRC+はサンプル数が少ないと、大きく変動するので。よって炭谷の打席数が比較的安定する2011年以降の数字だけを見ます(唯一wRC+が100に達している年は1打席しか立っていません)。

思った事:小林の1年目のwRC+(88)は高いけど、おそらく2017年や2018年の成績の方が小林の「真」の実力に近い。検定や分析を一切やらずに、完全に視覚だけを頼りにした感じで言うと「小林と炭谷の打撃はそんなに変わらない」って感じですかね。(個人的にはパ・リーグセ・リーグでどのぐらい炭谷の数字が変わりえるのか気になる所です)

ちなみに大城のwRC+は85です(202打席)。ただ1年目の数字って当てにならないので、ちょっと何とも言えないです。ただ主観的に言わせてもらうと、可能性を感じさせてくれるバッティングをしていると思います。

f:id:chofu24:20190107101719p:plain

図2

f:id:chofu24:20190107101742p:plain

図3

 

3.守備

守備はUZRを用いります。捕手同士を比べているので、ポジション補正をかける必要はありません。ちなみに計算式は何だか分かりません。とりあえずデルタはこんな事を言っています:

ただし打球の処理が主な役割ではない捕手についてはUZRによって有効な評価を行うことができないため、盗塁阻止・捕逸・暴投・失策の多さに得点価値を乗じて得点化した他の野手とは異なる評価を行っている。

なぜか大城を図に入れてしまいましたが、今更エクセルで変更するのもめんどくさいのでそのままにします。ちなみにデータは2014年以降のしかありませんでした。

思った事:炭谷のUZRは年々下がっている。守備がダメだから、イニング数が減っているのか。もしくはイニング数が減っているから、守備がダメになっているのか。それとも森友哉のせいなのか。因果関係は謎ですが、とりあえず記述統計上のUZRは下がっています。それに比べ小林は安定しています。そして大城のUZRはマイナス。

f:id:chofu24:20190107102631p:plain

図4

f:id:chofu24:20190107102646p:plain

図5

 

4.結論

炭谷と小林の打撃はそう変わらない。守備はいまいちだけど、将来的に成長する可能性がある大城(打撃は既に炭谷より上だと考えてます)。そう考えると小林と大城の併用で良い気がします。

戦力層を厚くするために炭谷を獲得する、って考えもあるかとおもいます。しかし炭谷は3年契約らしいです。しかも年俸は1億5千万。 即戦力としてあまり期待できない(少なくともアップグレードにはならない)選手にここまでの好待遇。それに加えて選手枠を使い、内海が移籍する。割に合わないと思います。