球春到来!プロ野球がもうすぐ開幕しますね。
去年は37年ぶりに2年連続同じ順位で終わったセリーグですが、今年は我らが阪神タイガースは優勝することができるのか、今からソワソワしています。
悩む前に動く、ということでセイバーメトリクスを用いて我らが阪神タイガースが優勝する可能性を調べてみました。
統計学的見地から客観的に分析して選手の評価やゲームの戦略を考える分析手法。映画「マネー・ボール」以降、市民権を獲得しました。MLBの公式記録項目の幾つかはセイバーメトリクスに基づく指標が用いられています。
何勝すれば優勝するのか?(箱ひげ図編)
阪神タイガースが今年優勝するのかを考える前に、そもそも優勝とは何かを定義しましょう。というのも、単純に勝利数だけで見てはいけないからです。
プロ野球とは、決められた試合数を闘い、その年で一番高い勝率を得たチームが優勝フラッグを手にできるゲームです(2001年は例外的に勝ち星の多い順になりました)。
例えば2010年。読売ジャイアンツと同じ勝利数79でありながら勝率で上回る中日ドラゴンズが優勝し、勝利数は1つ少ない78でありながら勝率で上回る阪神タイガースが2位という結果に終わりました。
つまり、重要なことは「負けないこと」なのです。負ければ勝率が下がりますが、引き分ければ関係なくなります。プロ野球とは、勝たなければならないのではなく、負けてはならないゲームなのです。
さらに複雑(ゲーム性を高める点)なのが、勝率は絶対基準ではなく相対基準ということです。その年で一番高い勝率を得たチームが優勝だと言いましたが、言い換えると翌年に同じ勝率だったとしても2位で終わることがあるのです。
例えば2014年。読売ジャイアンツは82勝61敗1分、勝率0.573で優勝しました。
しかし、過去10年で言えば2012年の中日ドラゴンズ(75勝53敗16分、勝率0.586)、2008年の阪神タイガース(82勝59敗3分、勝率0.582)、2006年の阪神タイガース(84勝58敗4分、勝率0.592)は、勝率0.573を上回っているのに2位で終えています。
過去10年分の順位毎の勝率を箱ひげ図で表現すると、よく解ります。
プロ野球選手の平均選手寿命が約9年なので、それにプラス1年を足して過去10年分としました。プロ野球創設期からのデータ等を含めると平均化され過ぎて、現在の傾向が現れません。
1位と2位の差は、驚くほど少ないことが解ります。
過去10年、最も低い勝率で優勝したのは2007年の読売ジャイアンツ(80勝63敗1分、勝率0.559)でした。この勝率を上回って2位で終わったチームは、過去10年間で4回もあります。
つまり、その年のチーム構成が凄く良く、ホームラン王や最優秀勝利投手といった賞を獲得した選手がいたとしても、相対的に見て2位に終わることはあるということです。
結局、何勝すればいいかですが、勝率箱ひげ図を見るとある特徴が解ります。それは、各順位の最小値と最大値は、それぞれ前後の順位の中央値前後に位置していることです。
言い換えると、2位の最大級の頑張りは、1位にとっては当たり前だということです。そこで、2位の最高勝率に+0.01すれば、優勝すると考えてもいいのではないでしょうか。
その「数字」は勝率0.593、85勝。名将・落合博満も自著で「85勝基準」と言っていたので、結構ベタな数字が出てきましたね。
では、優勝するために、言い換えると85試合勝つために何が必要なのかを次に考えます。
勝利数に関係がありそうなメトリックスは何か?(相関係数編)
勝つために必要なことは、相手以上に得点を叩き出すことです。
ただし相手を0点に抑えていれば1点だろうが10点だろうが勝ちは勝ち、です。つまり得失点差と勝ち星が必ずしも紐付くとは限らないのです。
実際、2011年の東京ヤクルトスワローズは得点484、失点504、得失点差-20ながら2位でシーズンを終了しました。3位に終わった読売ジャイアンツは得点471、失点417、得失点差+54もあるにもかかわらず、です。
つまり、得失点を見るのではなく、勝利数自体に関係するメトリクスを探す必要があります。
過去10年間分の各球団の1年を通した実績を参考にして、相関(相関係数)を見てみましょう。相関係数は少しでもあれば何か関係があると見做して、「±0.2以上」を叩き出したメトリクスを探しました。
このメトリクスをもって次の分析に進みたいところですが、ふと思い出したのが「飛ばないボール問題」です。
2011年から試合ボールを統一球に変更して以降、圧倒的な投高打低が続き、2012年には開幕から4月25日までの123試合中38試合が完封試合という異常事態が起きていました。後に統一球問題とまで言われるようになり、2013年からはボールをもう一度変えて元の状態に戻っています。
この2年間が含まれることで、勝利数と各メトリクスの相関が崩れている可能性があります。そこで2年間分をデータから抜いて、もう1度だけ相関係数を算出してみました。その結果が次の通りです。
相関があらわれたメトリクス自体に変わりはありませんが、相関係数の強さがかなり変わりました。打者系メトリクスの相関は弱まり、投手系メトリクスの相関はかなり強まりました。
特徴的なのは、得点よりも失点のほうが強い相関が出たことです。失点が少ないほど勝利数が多い、ただし得点が多くても勝利数が多いとは限らないということでしょう。1点取ろうが10点取ろうが、相手を0点に抑えれば負けることは無いからです。
得点を多く弾き出すよりも、失点をいかに少なくするかが勝利への近道だと改めて考えます。
ちなみに、OPS(長打率+出塁率)と勝利数の相関が中ぐらいしか現れませんでしたが、そもそもOPSは打率と得点の相関が言うほど高いないため算出されたメトリクスでしかありません。
ちなみに得点、失点とそれぞれのメトリクスとの相関を見てみると、かなり強い相関が現れました。
相関係数は±0.7以上が「非常に強い相関」と一般的に言われていますから、あえて色を変えてみました。こうして見ると、OPSというメトリクスの優秀さが解りますね。
さらに、もう1つ気付いたことがあります。
それは打者系メトリックスの得点との相関係数の幾つかが勝利数との相関係数と比べて2倍強になっているのに比べて、投手系メトリクスの失点との相関係数の殆どは1.2倍程度にしか強まっていない、ということです。
このことから、得点を増やすことと失点を減らすことでは、後者が勝利数を増やすことへの近道であると言えるのではないでしょうか。
優勝するチームの特徴は何か?(主成分分析編)
最後に、上記のメトリクスを用いて主成分分析を行い、各チームの投打のバランスを把握したいと思います。
投高打低型、バランス型、打高投低型など様々な形があると思いますが、優勝するチームはどの年度も○○型だということが解れば、それに合わせたチーム構成をすればいいと思うのです。
その結果が次の通りです。
横軸の第1主成分、縦軸の第2主成分をそれぞれ見ていると、横ベクトルに打者系メトリクス、縦ベクトルに投手系メトリクスが多いことが解ります。
横軸は左に向かうほどOPSや長打率、打率などのメトリクスがありますから、打線の破壊力が高いことを表していると考えます。盗塁や四球が言うほど左に向いていませんが、こうしたメトリクスは破壊力とは異なるため、違うベクトルを向いてしまったようです。
縦軸は上に向かうほど被本塁打や被安打、下に向かうほど完封数や奪三振などのメトリックスがありますから、整備された投手力であると考えます。
つまり、真ん中を中心にバランスチーム型、左下が投高打高の強力チーム型、右下が投高打低の投手陣中心チーム型、左上が打高投低の打線中心チーム型になります。
さて、この図では各チーム名を含めていないので、最後にそれをマッピングしましょう。
強力チーム型は殆どが巨人、中日、阪神の3チームで占められています。メイクミルミルの2010年ヤクルト、2014年広島が入ってきていることが泣けます。
また、長らく暗黒時代が続いていた横浜改めDeNAですが、投手陣が整備され少しずつ投手陣中心チーム型になってきているようで、こちらも喜ばしい限りです。
投手陣中心チーム型、打線中心チーム型を比べると、2010年阪神を除いて圧倒的に投手陣中心チーム型は勝利数が多いことが解ります。さらに言うと、投手陣が強力であるほど打線が多少弱くてもカバーできることが伺えます。
以上のことから、投手陣の整備こそ優勝への最短距離である、と断言してもいいのではないでしょうか。
で、我らが阪神タイガースは優勝できるのか?
長らくお待たせしました。優勝に欠かせない秘訣が「投手力」だと解ったところで、我らが阪神タイガースの優勝の可能性を検討します。先ほどの図について、阪神タイガースだけを表してみます。
チーム構成の推移を赤矢印で表しています。11年、12年は欠落しています。
2010年を除いてチーム構成は投手陣中心チーム型であることが解ります。2010年は城島が加入し、マートン、鳥谷、新井、ブラゼル、平野が規定打席に到達、超強力打線だった一方、投手陣で規程投球回数に達したのは久保一人というアンバランスさでした。
和田監督になってからは再び投手力重視に戻っています。代わりに強力打線を失っていますが、なぜこれが等価交換になっているかは非常に謎なところです。
13年から14年にかけて投手力、打力ともに改善されています。一方で、強力チーム型になりきれていないのは打力がまだまだ弱いからです。今年は派手な補強を控えていますが補強に失敗していますが、裏目に出ないか心配です。
脅威なのが、整備された投手陣・強力な打線を兼ね備える広島カープです。13年から14年にかけて投手力を維持したまま打力強化に成功しています。
監督が緒方氏に変わりましたが、チーム構成を大きく変えること無く底上げにさらに成功した場合、1991年以来25年ぶりの広島カープの優勝は我らが阪神タイガースよりも十分に可能性はあると考えます。…と思っていたら、ホームラン王・エルドレッドの怪我が発表されました(2015年3月7日現在)。
いかがだったでしょうか。もし好評であれば、では打力向上のために何が必要なのか、について分析してみたいと思います。他にも、このチーム分析してくれ!というお声があれば挑戦します。一番うれしいのは、DeNAあたりから直接お声掛け頂くことです(目指せ戦略コーチ)。
メトリックスが非常に少ないので多少偏った結果になっていたり(本家のセイバーメトリクス関連指標をもっと用いたかったのです)、主成分分析だと第2主成分までなら寄与率が60%も無かったり、色々と穴がありますが、その辺はご容赦ください。
本当なら、今回分析した要素には運や監督の指揮力を含めるべきなのですが、そこまで考慮できていません(例えば06年阪神と14年阪神を比較して、チーム力は14年阪神が上なのに何故勝利数が少ないのか、とか)。
こんな感じで統計学を使って、分析するのは楽しいですよね。
セイバーメトリクスのようにどんどん新しい指標を設けて、既存のフレームに囚われずに勝利を掴むように、デジタルマーケティングも新しい指標を設けて物事を多角的に考えていくべきなのだと思います。
ご興味のある方は、是非、お問い合わせください。