因果推論について:刑務所に入ると収入は減るのか?

社会学に関する投稿は短めになります。殆どメモです。だけどその代わりに5分ぐらいで読める内容なので、通学中・通勤中にでも読んでみてください。

今回は刑務所と因果推論についてです。アメリカの社会情勢を追っているとよくMass Incarcerationって言う単語を聞くと思いますが、それに関連する内容です。正直Incarcerationをどう訳せばいいのか分からないので、おおまかに「刑務所」と訳しました。

それで刑務所に関してですが、アメリカの研究で「刑務所に入る事によって、出所後の収入は減るのか?」みたいな議論があります。だけどこの研究をするなら、大きな壁を二つ乗り越えなければなりません(他にもありますが、この二つがメインだと思います)。それを図表化しているのが下の図1になります。超素人作りですが、これ僕の修士論文で使いました。てへぺろ。引用無しに使ったら、地の果てまで追いかけます。なお、今回の記事では「なぜ刑務所に入ると収入が減るのか」に関する議論には触れません。

一つ目は選択バイアス。例えば低学歴である事が「入所」と「低収入」両方に繋がるのであれば、「入所」と「低収入」は疑似相関ってなります。言い方を変えると「入所しようがしなかろうが、低学歴の人の収入が低い」って事です。もしそうであれば、貧困問題を解決する際は刑務所に目を向けるのではなく、教育格差に手を付けなければなりません。ただこれは「収入」だけに着目しているので、決して刑務所が無害であるとは言っていません(例:刑務所が家族関係や健康状態に与える悪影響)。

二つ目は。。。どう訳せば良いのだろうか。とりあえず入所をする場合、大抵の場合その前段階で「逮捕」や「有罪判決」のプロセスがあります(勿論色んなバリエーションはあります)。日本の事は正直良く分からない(逮捕されてからの拘留期間長すぎじゃね?)けど、とりあえずアメリカだとこうなります。そうなると出所後に見られる低収入は「刑務所」の影響ではなく「前科」によるものであるという可能性が出てきます。もし「前科」が「低収入」に繋がるのであれば、刑務所に入らなくても低収入になってしまうって事です。

あと今回は詳しく触れませんが、アメリカの刑務所は基本的に(1)地方が管理しているJail(2)州が管理しているPrison(3)政府が管理しているPrison、の3つに分けられます。その違いも考慮していく必要があります。これについて興味がある方はこのレポートの4ページ目を読んでください。

f:id:chofu24:20181206004529p:plain

図1(chofu24 2018)

とりあえず難しいって事です。興味がある方以下の論文を読んでみてください。

Apel, Robert, and Gary Sweeten. 2010. "The Impact of Incarceration on Employment during the Transition to Adulthood." Social Problems 57(3):448-479.

Freeman, Richard B. 1992. “Crime and the Employment of Disadvantaged Youths.” Pp. 201-237 in Urban Labor Markets and Job Opportunity., edited by G.E. Peterson and W. Vroman. Washington, DC: Urban Institute.

Grogger, Jeffrey. 1995. “The Effect of Arrests on the Employment and Earnings of Young Men.” The Quarterly Journal of Economics 110(1):51-71.

Harding, David J., Shawn D. Bushway, Jeffrey D. Morenoff and Anh P. Nguyen. 2018. “Imprisonment and Labor Market Outcomes: Evidence from a Natural Experiment.” American Journal of Sociology 124(1):49-110.

Kirk, David S., and Sara Wakefield. 2018. “Collateral Consequences of Punishment: A Critical Review and Path Forward.” Annual Review of Criminology 1:171-194.

Kling, Jeffrey R. 2006. “Incarceration Length, Employment, and Earnings.” American Economic Review 96(3):863-876.

Loeffler, Charles E. 2013. “Does Imprisonment Alter the Life Course? Evidence on Crime and Employment from a Natural Experiment.” Criminology 51(1):137-166.

National Research Council (NRC). 2014. The Growth of Incarceration in the United States: Exploring Causes and Consequences. Washington, DC: National Academies Press.

Needels, Karen E. 1996. “Go Directly to Jail and Do Not Collect? A Long-Term Study of Recidivism, Employment, and Earnings Patterns among Prison Releasees.” Journal of Research in Crime and Delinquency 33(4):471-496.

Pager, Devah. 2007. Marked: Race, Crime, and Finding Work in an Era of Mass Incarceration. Chicago, IL: University of Chicago Press.

Pettit, Becky, and Bruce Western. 2004. “Mass Imprisonment and the Life Course: Race and Class Inequality in U.S. Incarceration.” American Sociological Review 69(2):151-169.

Western, Bruce. 2002. "The Impact of Incarceration on Wage Mobility and Inequality." American Sociological Review 67(4):526-546.

Western, Bruce. 2006. Punishment and Inequality in America. New York, NY: Russell Sage.

Western, Bruce, and Becky Pettit. 2010. Collateral Costs: Incarceration’s Effect on Economic Mobility. Washington, DC: Pew Charity Trusts.

セイバー指標を鵜呑みにするな:FangraphsとBaseball Referenceの違い

お知らせ:長い記事を書くと誰も読まないので、5分ぐらいで読める記事をこれから書いていきます。

注意:セイバーメトリクスに関する単語をあまり説明せずに使っています。殆ど自分用のメモです。

1.日米野球2018

遂に日米野球が始まりました。今年のMLBのメンバーは2014年に比べスター選手こそ少ないですが、一線級の選手が沢山揃っています。その来日メンバーのベストメンバー(野手)が以下になります:

JapanLineup

Source: How good would the Japan All-Star Series team be as an actual MLB team?

ちなみに僕の推しはソトです。

話はさておき、よーく見てみるとフィリーズのホスキンスのWAR (Wins Above Replacement - 選手の戦力としての価値を総合的に測る指標だと分かって頂ければ十分です) がめちゃくちゃ低いじゃないですか!WARが0.0だと代替可能選手(2軍・AAA並みの実力)と同じ貢献度になるので、かろうじてその選手よりホスキンスの方がチームに貢献している事になります。WARがマイナスの選手は沢山いるので、プラスである限りはそれなりの価値があります。ただ0.5となると「そこらへんにいる選手」ぐらいの評価になります。

この表はおそらくBaseball Referenceが算出したWARを基に作成されていますが、奇妙なのが0.5という数値がFangraphsが算出している2.9と大きく異なる事です。守備指標の算出方法の違いが原因かと思われますが、どうなのでしょうか。今回は調べませんが、何が言いたいかと言うと「数字の裏にある理論・モデルを把握しておこう」です。某ドラマが長打率を「二塁打以上のヒットを打つ確率」と解釈したり、たまにトンデモ指標があるので。

 

2.サイヤング争いでも

上記と似たような指標の違いは投手でも見られます。ナ・リーグのサイヤング賞候補であるメッツのデグロムはFangraphs上だとWARが8.8もあり、2位のシャーザー (7.2) に割と差をつけています。しかしBaseball Referenceを見てみるとデグロムはフィリーズのノラと同率1位 (WAR 10.0)であって、シャーザー (9.5)は3位 です。 

この違いは単純にWARの算出方法の違いにあり、Fangraphsはこのように説明しています:

FanGraphs’ WAR for pitchers is based on FIP (plus infield fly balls). We also have a version called RA9-WAR which is based on runs allowed. Baseball-Reference uses runs allowed and attempts to correct for the team defense.

(Source: What is WAR?)

極論Fangraphsの考えとしては「被本塁打四死球奪三振である程度投手の実力は把握でき(FIPと言う指標)、あとは運と球場補正次第」であります。しかしBaseball Referenceは:

The assumption is that once the ball is put into play (other than a home run) the entire outcome is determined by random chance and team defensive quality. This is definitely true to a greater degree than fans likely believe, but we disagree as to whether this is the best measure of the value of a pitcher's historical performance.

(Source: Pitching WAR Calculations and Details)

と言う風に「いや、投手はある程度打たれる打球の質(方向・角度・速度)をコントロールできるから」と考えています。かつこのモデルの方が「〇年間の活躍」など過去の実績・活躍をより正確に測れると論じています。 

どっちが正解なんでしょうかね。どこで読んだか忘れてしまいましたが(多分Redditのスレ):

  • 投手の一年間の活躍を見るならrWAR (Baseball Reference)
  • 投手の将来の予測したいならfWAR (Fangraphs)

みたいな事を書いている人がいて、僕は割とそれで納得しています。

 

3.結論

指標を鵜呑みにしないで、一体どのような意図が計算式にあるのかをある程度知っておいた方がセイバーメトリクスを楽しめるかと思います(例:田中将大FIPとxFIPの比較)。僕はバリバリ文系ですが、統計の裏にある理論・モデルを勉強するの中々楽しいですよ。まだまだ理解しきれていませんが。

ビシエドはなぜ首位打者になれそうなのか?

1.首位打者争い

NPBも今季残り僅かとなりました。セ・リーグのCS争いが白熱としている中、タイトル争いもそろそろ大詰めです。そのタイトル争いの中でセ・リーグの暫定首位打者に君臨している中日のビシエドに今回は注目したいと思います。9月22日時点(多分)でのビシエドの打率は0.351であり、2位の坂本(.334)に大きな差をつけています。誰が首位打者になろうと個人的にはあまり興味がないのですが、ビシエドがなぜここまで打率を伸ばせられたのかは気になる所です。

 

2.ビシエドの打率とBABIP

ビシエドの年度別の成績は以下になります:

f:id:chofu24:20180922223829p:plain

(データはNPBデルタより)

打率に注目すると、ビシエドの今季の打率は2016年と2017年に比べ劇的に上昇しています。そして共に上昇しているのがBABIPです。このBABIPと言うのはインプレーの打球の打率を表す指標です。言い方を変えるとフェアグランドに飛んだ打球(本塁打は計算式から除外されます)がどのぐらいの割合で安打になったのかを示してます。普段は0.300辺りを推移しますので、ビシエドの0.358が特異な数字である事は明白です。物凄く噛み砕きますと0.300を大きく超えている打者は運が良い、逆に下回っている場合は運が悪いと考える事が出来ます(実際はもっと複雑ですが、今はとりあえずこれぐらいの認識で大丈夫です)。

計算式は以下になります:

(安打ー本塁打)/(打数ー三振ー本塁打犠飛

以前別の記事でも軽く触れましたが、打率と言う指標は(a)相手の守備(b)運(c)実力の3要素によってある程度説明がつきます。そしてこの3要素によって0.300に収束するはずのBABIPが大きく変動する可能性があるのです。BABIPについてもっと詳しく読みたい方は英文記事ですが、Fangraphsの説明を読む事をお勧めします。一応軽く説明しますと:

(a)守備

(捕)原口(一)阿部(二)マギー(三)小谷野(遊)鳥谷(左)バレンティン(中)平沢(右)ペゲーロ

もし相手がこのような守備陣だと、平均的な守備に比べ安打が増える可能性が高いです。

(b)運

どんなに優れている打者でも野手の正面に打ち続けたら打率は0.000です。逆にショボいゴロを打っても、野手の間を抜ければ打率は1.000です。運が良いか悪いかで打率が左右される可能性があると言う事です(打者はある程度打球をコントロール出来ても、それには限界がある事を前提にしています)。記憶は少々曖昧なのですが、柳田は2016年シーズンの序盤は相当数字が悪かった記憶があります。その原因は不運にあると、このグラフを作ったFull-Countの記事は書いています。

(c)実力

好打者は球を芯で捉え、より速い打球を打つ技術を持っています。なのでその技術が打率とBABIPに反映されている可能性があります。その他にもイチローのように詰まりながらもレフトに安打を打つ技術などもありますので、各選手の技術を深く理解する必要が出てきます。数字だけで野球を語れたら苦労しません。

あと足が速い選手も必然的にBABIPが高くなります(内野安打が増えるため)。もし1年間だけ内野安打を多く打ったらそれは多分運ですが、継続的に例えば10年間内野安打を沢山打っている選手の打率は運だけでは説明出来ないかと思われます。

  

3.ビシエドはどうなんだよ!

正直に言うと現時点では何も分かりません。ただビシエドは2016年と2017年に比べ、強い打球を打つ割合が高くなっているのは分かっています(5%ぐらい増えています)。なのでもしこのデータが正確であれば、ビシエドは運だけでなく実力によって打率を上げた仮説を立てる事が出来ます(ちなみにBB/Kの指標も改善しています)。ただ打球の強さに関するデータは不確定要素が多く、測定誤差が起きやすいため定かではないのも事実です(プロ野球MLBのようにStatcastの設備が整っている訳ではありませんので)。

かつ、BABIPは長い目で見る必要があります。BABIPが安定するには820の打球サンプルが必要だと言われており、分析単位も基本的にシーズンです。なのでシーズン別のBABIPを比べる必要が出てきます。なぜなら全ての選手のBABIPは0.300に収束する訳ではなく、プレイスタイル(例:足が速い)によってBABIPの真値が0.330辺りの選手もいます。その選手がもし突然0.400の数字を叩き出したら、何かが起きていると考えて問題ないでしょう。なのでもしかしたらビシエドのBABIPの真値が0.340辺りの数値である可能性があるのです。

とりあえず現時点では何も分かりませんので、来季の成績を待つしかありません。個人的にはビシエドの打率が例年通り0.260辺りに回帰すると予想しています。