WARの解説③ -基礎知識-
【これはnoteに投稿されたnana_metricsさんによる記事です。】
※リンク先は外部サイトの場合があります
前回の続きです。個人的に「WARの魅力」はここからだと思います。
「WARの辞書」というには大袈裟で稚拙なものだとは思いますが、辞書を「あ」から「ん」まで順番に読んで覚えていこうという方はいないと思います。つまりその程度のノリで、自分の中で曖昧になっている項目をぼんやりと眺められるくらいの記事にするつもりです。
極力順序に配慮し分かりやすく説明するつもりですが、よほどセンスが良い人でないと初見で全ての要素を理解するのは難しいと感じました(自分の数学的センス・理解力が無いだけ)。今回は「枠組み」みたいな基本的な話から。
「WARの辞書」というには大袈裟で稚拙なものだとは思いますが、辞書を「あ」から「ん」まで順番に読んで覚えていこうという方はいないと思います。つまりその程度のノリで、自分の中で曖昧になっている項目をぼんやりと眺められるくらいの記事にするつもりです。
極力順序に配慮し分かりやすく説明するつもりですが、よほどセンスが良い人でないと初見で全ての要素を理解するのは難しいと感じました(自分の数学的センス・理解力が無いだけ)。今回は「枠組み」みたいな基本的な話から。
■前置き
▼「fWAR」と「rWAR」
前提として、ここからはFanGraphs社(https://library.fangraphs.com/misc/war/)算出の「fWAR」、Baseball Reference社(https://www.baseball-reference.com/about/war_explained.shtml)算出の「rWAR(bWAR)」のふたつをメインに解説していきます。日本のデータサイトも含め他にもいくつか開発されていますが「どの要素をどれだけ重視しているか」の違いであり、「創出得失点を勝利数に換算する」という基本的な考えは全て同じです。fWARもrWARも比較的認知度の高い指標だと思いますが、双方の違いを細部まで解説していた日本語の記事が見当たらなかった為、当noteではそこについても言及します。
「計算方法が確立されていない・各社で異なるなら参考にしようがない」といった指摘も見受けられますが「質を重視するか、結果を重視するか」みたいな話であり、WARという名称が同じであるというだけでそれらの意図するものは各社によって異なる、ということは念頭に置いて頂きたいです。常に私が意識していることですが「欠陥のある指標などは存在せず、指標の扱い方が不適切であることがほとんど」という認識は広まってほしいという想いがあります。
▼指標への向き合い方
導入として少しだけ「指標への向き合い方」に触れます。例えば、打者のタイトル・指標として「首位打者=打率」「打点王=打点」といったものがありますが、ネット上では「セイバーメトリクスは打率や打点といった、今までに重要視されていた指標を否定している」といった意見が散見されます。少しだけセイバーメトリクスを齧った者として言えるのは「打率や打点を否定している訳ではなく、打者を評価する為により最適な指標を使っているに過ぎない」ということです。
主に打者評価に使われる指標として、前回の記事の「WARと敬遠」で少し触れた「wOBA」が挙げられますが、これは打者の総合的な評価として打率よりwOBAの方が「創出得点への相関=勝利への貢献度」を適切に表しているからそちらを扱っているに過ぎず、「フィールド内に飛んだ打球の内、よりヒットの確率が高い選手を表す指標」が必要になった場合、打率より適した指標は存在しません。「数字は嘘をつかない」とはよく言ったもので、要は指標を適切なタイミングで扱う事が重要であり、最初の記事(https://note.com/nana_metrics/n/n27b2fd8d0851)で触れた「WARは選手の価値を測る為の完全な指標ではない」という話にも繋がります。
▼なぜ指標を扱うのか
また「なぜそこまで指標に拘るのか?」という点も少しだけ。なぜならプレイヤーの数字というのは常に相対評価であるからです。
仮に「Two Way Player」として、各チームに1人や2人「15勝&40本塁打(便箋上馴染みのある指標を使いました)」を達成する選手がいた場合の大谷翔平の評価は?毎年のように60~70本塁打を記録する選手が出てくる環境で、Aaron Judgeが記録した62本塁打の価値は?全て「他の選手と比較し、優れているから」こそ数字としての価値があります。「打率3割を記録する打者は優れた打者だ」という古くからの風潮も、全体の平均打率が3割を大きく上回る環境では話が変わってきます。
相対評価を行う為に...少し視点を変えると「自分の観ていない試合も含め、全体を把握する為」に、指標というものは存在します(勿論他にも沢山の意図はありますが)。MLBが1日に15試合行われる中で、全てを漏れなくチェックしている人はほとんど存在しないと思います。全体のうちの限定的な局面だけを切り取って評価するのではなく、数字で全体を見て、その中で相対評価を行うことが、より中立的で正しい評価に繋がります。
勿論楽しみ方は人それぞれで、私自身贔屓の球団や選手のプレーを観てあーだこーだ言う時もあります。あくまで評価方法の話。野球は本当に面白い、最高のスポーツです。
■WARの基本的な構造
以下、聞き馴染みのない単語や指標が頻出します。私が出来る範囲で説明はするつもりですが、私自身が知識を付ける上で参考にしたサイトを載せる方が認識のズレも起こりにくいと思うので適度にリンクを貼ります。
▼「ピタゴラス勝率」の発見
過去の記事で何度かWARを「創出得失点を勝利数に換算した指標」と説明しました。セイバーメトリクスという概念を一躍有名なものにしたBill James考案の「ピタゴラス勝率(https://1point02.jp/op/gnav/glossary/gls_explanation.aspx?eid=20012)」という式により「チームの勝率は得点数と失点数によって予測出来る」という考えです。これにより、1試合における勝利数を「0」か「1」かで考えるだけでなく、各プレーを細分化し「○得点分=○勝分」に置き換える事が可能になります。得点も「0」や「1」だけではなく「ヒット1本で○点分、アウトひとつで−○点分」と評価し、積算していく事で創出得点をはじき出します。
また「得失点で勝率を求める」という考えを「目標の勝利数に必要な得点を求める」と置き換えることにより「1勝を上げるのに必要な得点数」が求められます。そして「1勝」は「1WAR」に値します。
考え方だけ理解していれば良い程度の認識ですが、理屈で理解したい方の為に「ピタゴラス勝率の根拠をロジスティック回帰で求める (https://1point02.jp/op/gnav/column/bs/column.aspx?cid=53730)」という記事のリンクを貼っておきます。正直私自身統計学は詳しくないですが「多少の変動はあれど、ピタゴラス勝率と実際の勝率は強い相関関係にある」とだけ覚えていればOKです。例を出すと2023年8月段階のSan Diego Padresはピタゴラス勝率と実際の勝率に乖離がある(https://blogs.fangraphs.com/the-padres-have-a-complicated-future/)=不運である、とも考えられています。
また「得失点で勝率を求める」という考えを「目標の勝利数に必要な得点を求める」と置き換えることにより「1勝を上げるのに必要な得点数」が求められます。そして「1勝」は「1WAR」に値します。
考え方だけ理解していれば良い程度の認識ですが、理屈で理解したい方の為に「ピタゴラス勝率の根拠をロジスティック回帰で求める (https://1point02.jp/op/gnav/column/bs/column.aspx?cid=53730)」という記事のリンクを貼っておきます。正直私自身統計学は詳しくないですが「多少の変動はあれど、ピタゴラス勝率と実際の勝率は強い相関関係にある」とだけ覚えていればOKです。例を出すと2023年8月段階のSan Diego Padresはピタゴラス勝率と実際の勝率に乖離がある(https://blogs.fangraphs.com/the-padres-have-a-complicated-future/)=不運である、とも考えられています。
※リンク先は外部サイトの場合があります
▼「1勝分=1WAR」に必要な得失点を求める
上で解説した「ピタゴラス勝率」により「勝利数をひとつ増やす為に必要な得点」を求めることが可能になりました。ただ、この式はリーグ環境を無視しています。「各チーム平均で2得点」の環境と「各チーム平均で5得点」の環境では、1得点が勝敗に影響する価値が大きく異なります。その為、リーグの総得失点を考慮した「Runs Per Win (https://library.fangraphs.com/misc/war/converting-runs-to-wins/)」という指標を利用し、1勝分に必要な創出得失点を算出します。これにより、各選手のプレーを得点換算すればそのまま勝利数に当て嵌める事が可能になります。
▼各プレーを得点換算する
得点というものは、例えばソロHRの「1」であったり、満塁の場面で走者一掃のタイムリーを放った「3」だったり、状況によってひとつのプレーにつき最大「4」まで発生します。しかし、HRは分かりやすく1点、塁上のランナーによっては4点まで創出するプレーですが「単打」や「二塁打2本」がどれだけの価値を生んでいるか、なかなか感覚では分かりません。
そこで「無死走者なし」や「二死満塁」といった「アウトカウント×3パターン」と「塁上の走者×8パターン」=24のパターンを状況ごとに分け、各パターンからどれだけ得点が発生したかの統計を取ることで「その状況の期待値=得点期待値」を算出します。この得点期待値に各プレーを当て嵌める事で…例を出すと「無死1塁から単打で無死1、2塁」になった場合、それぞれの状況の得点期待値の差がそのまま単打一本の得点価値となります。
そこで「無死走者なし」や「二死満塁」といった「アウトカウント×3パターン」と「塁上の走者×8パターン」=24のパターンを状況ごとに分け、各パターンからどれだけ得点が発生したかの統計を取ることで「その状況の期待値=得点期待値」を算出します。この得点期待値に各プレーを当て嵌める事で…例を出すと「無死1塁から単打で無死1、2塁」になった場合、それぞれの状況の得点期待値の差がそのまま単打一本の得点価値となります。
※リンク先は外部サイトの場合があります
ここで以前述べた「WARは状況を無視し、中立的に評価する」という話に戻ります。例に挙げた「無死1塁」といった状況は、その時点で打席にいる打者の能力で左右することは出来ません。そこで上に挙げた24パターンの中から「単打でどれくらいの得点期待値の変化が生まれたか」を集計する事で「単打一本の平均の得点価値」が算出されます。得点環境によって都度変化する数値ではありますが、例を出すと2023年8月現在、FanGraphs社算出の各イベントの得点価値は以下のようになります。
同じ考えで「盗塁(SB)」の得点価値も算出可能。 【nana_metrics】
しつこいようですが「状況に左右される要素を極力排除し、中立的に評価する」という考え方はセイバーメトリクスの基本となりますので覚えていただけると嬉しいです。WARでは打者の貢献を測る為、上の得点価値を元にした「wOBA」という指標が扱われています。今では一般的に認知されてきた「OPS」をアップデートしたような指標で、今後日本にも浸透していくと思われます。「野手WARの解説」でまた触れるつもりですが、私が理解を深める上で参考にした記事を貼りますのでそちらに目を通して頂けると幸いです。
※リンク先は外部サイトの場合があります
▼余談:なぜ「バントは不利」とされているのか
「得点期待値」について触れたので少しだけ余談です。セイバーメトリクスに馴染みのない方でも耳にした事のある話題だと思います。「バントは不利な戦術だ」という意見は今でこそ多く見かけるようになった指摘ですが「失敗が目立つからそれなら打たせた方がマシ」といった印象論の話ではなく、上の得点期待値に当て嵌める事で理論的に説明が可能です。
例えば、バントが成功した事で「無死1塁」から「一死2塁」に変化した場合の得点期待値の変化を求めればバントそのものの価値が算出でき、上のリンク先にある「2013~2015年のNPBの得点期待値表」を見ると、無死1塁の得点期待値=0.807点、一死2塁の得点価値=0.682点となり、結果的に得点期待値が下がっている事が分かります。また、別の走者状況でも同様です。
「打席に入ったのが投手、もしくは打撃の期待出来ない選手だった場合」や「得点期待値でなく、1点で良いから欲しい場合」等、様々な状況を加味して指摘したくなるとは思いますが「WARの解説」という趣旨から外れてしまうのでここでの解説は控えます。代わりにと言ってはなんですが「1.02」に全4章で寄稿された市川様の記事で多角的に検証されているのでそちらをご参照ください。
例えば、バントが成功した事で「無死1塁」から「一死2塁」に変化した場合の得点期待値の変化を求めればバントそのものの価値が算出でき、上のリンク先にある「2013~2015年のNPBの得点期待値表」を見ると、無死1塁の得点期待値=0.807点、一死2塁の得点価値=0.682点となり、結果的に得点期待値が下がっている事が分かります。また、別の走者状況でも同様です。
「打席に入ったのが投手、もしくは打撃の期待出来ない選手だった場合」や「得点期待値でなく、1点で良いから欲しい場合」等、様々な状況を加味して指摘したくなるとは思いますが「WARの解説」という趣旨から外れてしまうのでここでの解説は控えます。代わりにと言ってはなんですが「1.02」に全4章で寄稿された市川様の記事で多角的に検証されているのでそちらをご参照ください。
※リンク先は外部サイトの場合があります
▼基準を設ける
上の「なぜ指標を扱うのか」の項で述べたように、野球は相対評価のスポーツです。細かい計算は「野手WAR」「投手WAR」として別の記事で解説する予定ですが、打撃なら「wOBA」を元に、投手なら「FIP(fWAR)」や「xRA(rWAR)」といった指標から創出得失点を算出し、それらを相対的に評価しWARに反映させています。
少し複雑な話になりますが、ここでの比較対象は「全選手の平均」ではありません。MLBにしてもNPBにしても「全体の平均の成績」を残しているのは「全選手」ではない為です。野手だったら普段からスタメンに並ぶような「レギュラー格」と言える選手が、投手なら先発ローテーションに入ったり、一年通してチームの終盤を支えるようなリリーフ投手などが「全体の平均の成績」の多くを構成しています。全選手に平等に出場機会があるわけではありません。プロのレベルで「平均的」であることには一定の価値があります。
そこで「Replacement Level(https://library.fangraphs.com/misc/war/replacement-level/)(代替水準)」を基準に設定します。
少し複雑な話になりますが、ここでの比較対象は「全選手の平均」ではありません。MLBにしてもNPBにしても「全体の平均の成績」を残しているのは「全選手」ではない為です。野手だったら普段からスタメンに並ぶような「レギュラー格」と言える選手が、投手なら先発ローテーションに入ったり、一年通してチームの終盤を支えるようなリリーフ投手などが「全体の平均の成績」の多くを構成しています。全選手に平等に出場機会があるわけではありません。プロのレベルで「平均的」であることには一定の価値があります。
そこで「Replacement Level(https://library.fangraphs.com/misc/war/replacement-level/)(代替水準)」を基準に設定します。
※リンク先は外部サイトの場合があります
▼「Replacement Level」の考え方
ここが「WAR - Wins Above Replacement」において重要な部分です。リプレイスメント・レベルとは「最小限のコストで用意出来る選手」の水準を指し、MLBだとマイナーレベルのフリーエージェント選手であったり、簡単に言うと「すぐにでも用意出来るレベルの選手」が残すであろう水準のことを指します。
こちらは「Baseball Concrete」様のブログを参考にさせて頂きました。理解力に乏しい私は感覚で理解するまでに時間のかかる項目でしたが、理屈の通った考え方で「WARの魅力のひとつ」とも言えます。
こちらは「Baseball Concrete」様のブログを参考にさせて頂きました。理解力に乏しい私は感覚で理解するまでに時間のかかる項目でしたが、理屈の通った考え方で「WARの魅力のひとつ」とも言えます。
※リンク先は外部サイトの場合があります
リプレイスメント・レベルに関するブログを漁る過程で「代替可能選手を試合に出さないことによる貢献」という表現を多く見かけましたが、自分の言葉で説明すると「試合に出場し続けることによる貢献」と言う表現の方がしっくり来ます。
仮にひとつのチームの投手:野手が全て平均の成績を残したと仮定すると、前述したピタゴラス勝率の計算では「勝率5割=平均レベル」のチームになります。また、全選手がリプレイスメント・レベルの選手で構成されたチームは「最低水準の勝率」になることも予測されます。「平均レベルのチーム」から「最低水準のチーム」の勝利数を引いた差が、そのまま「平均的」であることの価値になります。
少し難しい概念かもしれませんが、なるべく自分が理解出来た過程をそのままに説明しました。それでも理解しづらいと言う方は図などで分かりやすく説明されている下の記事も参考になると思います。
仮にひとつのチームの投手:野手が全て平均の成績を残したと仮定すると、前述したピタゴラス勝率の計算では「勝率5割=平均レベル」のチームになります。また、全選手がリプレイスメント・レベルの選手で構成されたチームは「最低水準の勝率」になることも予測されます。「平均レベルのチーム」から「最低水準のチーム」の勝利数を引いた差が、そのまま「平均的」であることの価値になります。
少し難しい概念かもしれませんが、なるべく自分が理解出来た過程をそのままに説明しました。それでも理解しづらいと言う方は図などで分かりやすく説明されている下の記事も参考になると思います。
※リンク先は外部サイトの場合があります
ごちゃごちゃして来た感が否めませんが、要はWARという指標は「代替水準と比較し、何勝分の貢献が出来たか」というものになります。
■次回
ここまででWARの「大枠」となる部分や考えは説明出来たと思います。基本的な考えに加えて細かい理屈まで説明するつもりでしたが、やっぱり長くなってしまうので次に分けます。特に上の「リプレイスメント・レベル」は実際どの程度の勝率が予測されるのか、投手と野手それぞれどういった基準が設けられているのか、fWARとrWARで違いがあるのかなどの説明をする予定です。そこまで細かい部分を気にする人は少ないと思いますが私個人はこういう数字遊びはとても面白くて好きです。すっかり抜けていましたが「守備位置補正」とその考え方にも触れたいと思います。
抜けてる箇所や勘違いしてる箇所、他の適切な表現等あれば都度修正するのでリプライなどくれたら嬉しいです。
抜けてる箇所や勘違いしてる箇所、他の適切な表現等あれば都度修正するのでリプライなどくれたら嬉しいです。
※リンク先は外部サイトの場合があります
- 前へ
- 1
- 次へ
1/1ページ