データ解析の競争イベント「ベースボール×データハッカソン ~ビッグデータから解き明かすベースボールビジネス~」のプレイベントが15日、東京・渋谷で開催された。

元楽天川井貴志氏(42)らが10月6、7日の大会に向け、セイバーメトリクスの用語解説などを行った。

パ・リーグTVで西武-ソフトバンク戦(メットライフドーム)を観戦しながら、チャット機能を使って参加者と主催側が質問と回答を同時並行で行うなど、最先端のイベントらしい趣向にあふれた。

プロ野球のデータを独自に収集し、数球団に提供している株式会社「DELTA」が、セイバーメトリクスのデータを紹介した。打者の能力を示す指標では、OPS(出塁率+長打率)に加え、wOBA(weighted On Base Average)の日本プロ野球版(NPB版)が解説された。

これは{0.692×(四球-故意四球)+0.730×死球+0.966×失策出塁数+0.865×単打+1.334×二塁打+1.725×三塁打+2.065×本塁打}÷(四球-故意四球+死球+打数+犠飛)で計算し、1打席あたりの得点増への貢献度を示す指標だ。過去2、3年分のNPBデータから、平均値を割り出している。

参加者から、チャットで質問が出た。「なぜ失策出塁の方が、単打より(価値が)高いのか」。前の式を見ると、失策出塁には1本あたり0.966点が加わるが、単打は1本あたり0.865点にしかならない。

DELTAからの回答は「単打は進塁が1つだけだが、失策出塁は進塁が2つ以上発生するケースがあるため」だった。また「係数は各イベント(単打、本塁打など)が発生する前後の得点期待値から算出されています」との解説も加わった。

今度は「得点期待値」が気になる。これは「各状況からイニング終了までに入った得点の平均」だ。無死走者なしでは0.440だが、無死満塁では2.092になる。アウトが増えるごとに少なくなり、走者状況では、基本的に「なし」→「一塁」→「二塁」→「三塁」→「一、二塁」→「一、三塁」→「二、三塁」→「満塁」の順に大きくなる。だが、「1死三塁」と「1死一、二塁」の場合だけは、この大きさが逆になる。「1死三塁」が0.906だが、「1死一、二塁」は0.878なのだ。

この現象には「1死三塁は1点が入るケースが多く、1死一、二塁は2、3点が入ることが多い。だが1死一、二塁は併殺があるからではないか」という考察が加えられた。

さらに、「プレーの種類により得点価値」も紹介された。単打は0.437、二塁打は0.786、三塁打は1.117、本塁打1.408、凡打は-0.235、併殺打は-0.746、空振り三振は-0.255、見逃し三振は-0.238となる。

面白いのは、三塁打は1点以上の価値があるということだ。三塁に走者が残ると、そのまま送球間の失策などで一気に生還するよりも、次打者以降に好影響を与えるため、1点以上の価値を生むと推察される。

また、空振り三振の方が、見逃し三振よりもマイナス面が大きい。野球界では従来「見逃し三振するぐらいなら空振り三振してこい」という指導が行われて来たケースが多い。ところが、統計を取ると「球界の常識」とは逆であることが証明された。

川井氏は元プロ投手として「恐怖心を与えるのは空振り三振。投手としては嫌だった」と話した。統計データと実際の選手の感じ方には、差異がある点は興味深い。「人間が必ずしも合理的な行動を取らない」ことを証明した行動経済学の要素を含んでいる。

この他に「環境中立的な評価」と「環境依存的な評価」が紹介された。環境中立的とは「単打はどの場面で出ても単打」として扱う評価だ。環境依存的とは「3回に生まれた単打1本よりも、9回にサヨナラ打となった単打の方が価値を持つ」というもの。得点圏打率の高さを評価するのは、環境依存的である。セイバーメトリクスでは「勝負強さに再現性は認められない」「偶然によるところが多い」とみなされ、環境中立的な評価が一般的だ。だが、スポーツ報道や契約更改などでは、環境依存的な評価を重んじる傾向にある。

ハッカソンの本大会では、選手のパフォーマンスやファンクラブ会員のマーケティングデータから、将来の観客数やEC(電子商取引)購入金額の予測精度を競う。また、データから新たなアイデアで新しいビジネス価値を創造する競争も行われる。川井氏は「いろんな方が来られて、野球界に入られると、野球界は発展すると思う」と話した。

米国球界では既に、野球経験のない、金融界やデータ分析のプロがフロントの要職に就いている。日本でも、このイベントから新たな人材発掘につながるか注目したい。【斎藤直樹】