セイバーメトリクスと成果主義

野球と統計の相性の良さ

 野球では、統計による戦力評価は実用の段階に達しており、「セイバーメトリクス」という名称で定着し、球団経営にも生かされている。まず、野球でどのように統計が生かされるかについて簡単に見ていく。

 野球はより多く得点したチームが勝つ競技であるが、セイバーメトリクスが定着する以前から取られていた統計の中では、出塁率という数字が得点と高い相関を示した。野球のルールでは1人の打者(走者)が4回進塁すると1得点となる。走者が塁にいる状態で次の打者が出塁すると、玉突きで進塁が発生し、実際には3回ほど連続して打者が出塁すれば1点入る。つまり出塁の期待値を高めればそのまま得点の増加につながることになる。

 初期にはこの出塁率が重視されたが、得点の本質はあくまで「4回進塁すること」である。従って、最も重視されるべき指標は「進塁の期待値」である。セイバーメトリクスでは、出塁率に長打率(単打は1、二塁打は2と進塁数が加味される数字)を加算したOPSという指標を用い、より進塁数に近い計量を行うようになった。OPSは実用性も高く、その合計値から高い信頼度で得点数の期待値を計算することができる。現在ではより発展し、27アウトでの得点の期待値を計算するモデル(XR27)といったものも作られている。。

 得点との相関が高い指標があれば得点は予測しやすくなる。ここまではまあ「当たり前」の話である。ここから、もう少しメタな話――なぜ相関の高い指標が簡単に見つかるか、という話をしてみよう。

 野球の攻撃は、一つ一つの打席の独立性が高いという特徴がある。攻撃と守備、打席の交換といった細かい単位でプレーが切れるというルールがあり、そのために一つの打席における打撃結果が前後のプレーから独立する。また打撃に関しては、選手間のプレーの相性といったものもあまりない。たとえば、ある特定の二人の平凡な選手の打順を並べると相乗効果で得点率が向上する、といったようなことはほとんど起きない。野球はチーム競技ということになっているが、こと攻撃に関しては個人プレーを順繰り行っているだけ、というほうが適切である。犠打やヒットエンドランといった戦術もあるという反論もあるかもしれないが、そういった戦術は得点との相関が特にないか、あっても低いことが明らかとなっている。このため、かつてはバントを選ぶような場面でも、最近は単に強打を選ぶ方が多くなっている。

 統計学をかじったことがある方はお察しがついているかと思うが、試行に独立性があると、期待値の計算は足し算と掛け算の組み合わせに帰着させることができるようになる。足し算と掛け算の組み合わせなら、小学生レベルの算数で解くことができるので、誰でも容易に統計の有用性が分かるし、チーム運営に生かすこともできるようになる。

 もちろん、野球は確率がすべてというわけではない。OPSという指標はあくまで結果であり、確率ではなく割合である。打者や投手の力や技術、相性や駆け引き、その時のコンディションに左右されつつ、一つ一つの打席を積み重ねた通算の数字である。選手や監督は、体を鍛え、球に目を慣らし、進塁の確率を上げるために練習する。それがうまく行けば、OPSも上がる。このような練習の部分では、まだ数字が支配するような解明され尽くした方法論があるわけではなく、選手や監督それぞれの努力に拠っている。

 陸上競技のリレーは持ちタイムの合計で簡単に予測できるし、メンバーを入れ替えた場合のタイムも簡単に予測できるが、ただそれは選手や監督が何もしなくてもいいということを意味するわけではない。才能と努力と研鑽の結果としてメンバー各々の持ちタイムが存在するのであり、トレーニングや指導によって持ちタイムは少なからず変動する。予測しやすいが、決してそれがすべてではない。

 あくまで、長期のリーグ戦を行う環境であれば、様々な統計手法を用いて個人成績を集計し、シーズン通算成績の結果予測は陸上のリレーの結果予測に近い精度で可能になり、強いチームを作りたければとりあえずOPSの高い選手を集めてくればよいとなりがちである、ということである。

サッカーには適用できるか?

 野球でセイバーメトリクスが使えるならば、サッカーでも同じようなことが可能ではないか。このような考えは誰でもするところである。前述の通り、野球の場合には進塁と得点の関係がルール上明白であり、かつ進塁の数値化が容易であるため、手軽に正確なモデルを立てて予測することができる。つまり、ルールが統計向きである。一方でサッカーでは、プレーの独立性が野球に比べて低い点が多々ある。

 まず第一点に、原則としてプレーに切れ目がない。このため、攻めに人数をかけ過ぎるとカウンターで失点する確率が上がるといったことが起きるため、少なくともベイズ統計などを用いなければ解析を受け付けない。野球では「打席」の存在によってプレーに切れ目があり、マルコフ過程に近似したモデリングを行うことができるのとは対照的である。

 二点目に、攻撃や守備、つなぎ役にストライカーと言った役割分担が生じているため、数値の単純な足し算掛け算で結果を予測することができないことも指摘できる。数字上点を取っているフォワードを二人前に並べても得点力が倍増するとは限らず、狙い通りに行かないことも多い。たとえば、得点力の高いフォワード二人がともにワンタッチゴーラー型であり、得点力のボトルネックがシュート精度でなくラストパスの本数であるのならば、二人で限られたラストパスを食い合うだけで得点数は増えない。

 また、サッカーでは得点に結びつくプレーに複数の経路がある。ドリブル突破でもよいし、裏抜けのパスでもよく、ミドルシュートやセットプレーでもよい。現在のところ、これらさまざまな種類のプレーを「得点への貢献」という唯一のパラメタとしてまとめることはできていない。野球でも四球に単打、本塁打と性質の異なるものがあるが、そちらは「進塁数」という一つの指標に集約することができ、得点力との比較が可能である。

 以上の事情により、昨季ゴール数や走行距離といった選手個々人の個別の指標を単純に足し算・掛け算するだけでは今期ゴール数や勝利数といった結果を予測することは難しい。計量を使うにしても、何も考えずに数字を使うことはできず、システム分析のようなことが必要になってくる。たとえば、やりたい戦術がありそのために強化するとして、今のチームでどこがボトルネックになっているか解析し、そのボトルネックを十分補える選手を調べて引き抜いてくる、といったような個別の作業が必要である。長期的には個別の作業が体系化され、統計から計算できるようになるのかもしれないが、少なくとも現在のところそういった技術はない。

 さて、ここまで行っても、まだ勝敗に結びつくところまでは行かない。一つのシステムを組みたてたところで、システムとシステムの性能比較、相性問題のチェックを行わなければならないからである。野球でも打者と投手の相性といったものはあるが、サッカーの戦術面での相性はそれよりもずっと大きい。

 サッカーでも野球のようなメトリクスは可能ではないか。これは誰でも考えるところだろうが、原始的な二変数の相関関係程度では実用的なメトリクスを確立することは難しいだろう。少なくともベイズ推定、多次元プロットに各種の多変量解析、機械学習を利用したパターン解析等の近代的な統計を用いて各プレーの「ゴールまでの到達度」を評価する必要があるだろう。

その仕事は独立試行か

 さて、ここから少し発展して、人事評価一般について考える。1990年代からいわゆる「成果主義」という言葉が良く使われるようになったが、成果主義では「何を成果として評価するか」が適切でなければ失敗するということが経験的に語られるようになった。この「適切な評価が可能かどうか」という点に、作業の独立性は大きくかかわる。

 稼ぎの発生が独立試行であり、多人数で働いていても並列的に処理しているのに過ぎないのであれば、成果主義に基づく給与の設定は簡単である。例えば飛び込み営業の実績のようなものであれば、顧客層の競合を除けばかなり独立試行に近く、歩合制としてもあまり問題がない。ライン生産工でも、同じ工程を行う人を比較する場合、時間当たり処理数を不良率やライン停止率で補正した歩合制の賃金を設定することも可能であろう。ただしそれでも、インセンティブの対象を絞りすぎると、他者への迷惑を顧みずインセンティブを達成しようとする人も現れるので、その点で注意が必要である。

 成果主義が導入しやすい職場もあるが、得てしてほとんどの職場では分業が成り立っており、一人だけの力で仕事が完成するわけではない。分業が成立している場合には足し算よりは掛け算に近くなるため、貢献度の単純な計量は難しくなる。直列的に業務が受け渡される仕組みでは、異なる業務の成果を一つの賃金という指標に還元することは容易ではない。やっていることが違うので、本来一つの指標に還元しようがないのである。異なる業務を一つの指標に還元する論理的な解は、ある労働者を「一般的個人」に置き換えた場合に全体のパフォーマンスに与える影響で計る、というものであろう。しかしそれは論理上の理想値な方法であって、実現は困難である。

 成果主義の導入が妥当かどうかは、稼ぎの発生が独立試行であるとき、または職務担当者の入れ替えが容易で「平均的労働者」とのパフォーマンス比較ができるかどうかにかかっている。また、成果主義計量単位は「人」におく必要性は必ずしもなく、チームや部署単位であっても、その単位において稼ぎの発生が独立試行的であるのなら導入可能である。そうでないのであれば、成果主義を一律に導入することが妥当かどうか、よく検討する必要があるだろう。

スポーツ選手と社長の報酬

 現代のトップスポーツ選手は、巨大企業のCEO並みの巨額の報酬を得ている。これらの人々が巨額な報酬を得るのには、ある共通性がある。それは、ポストの数が限られているにもかかわらず影響を与える対象が多い、という点である。たとえば有名プロスポーツクラブともなれば数百万人のファンを抱えているが、実際に試合に出場できるのは指折り数えられる程度の人数である。数百万人が少しずつ払った金を少人数に集めれば一人当たりでは大金になる。「優勝のためにあと1000円は払える」という人が百万人いれば、十億円かけて選手を雇えるのである。大企業のトップも同様である。従業員10万人の企業で、従業員一人当たり一万円を多く稼がせる手腕の社長であれば、増えた分を労働者9000円、社長1000円で山分けしたとしても、社長の報酬は一億円に達する。

 テレビ放送で一つのチームが世界中にファンを持ち、一つの企業が世界的展開をする現代においては、一握りの人間が数百万人に影響を与えることも珍しくなくなった。一握りの大金持ちが現れやすくなった背景には、そのような側面もある。

(おまけ)サッカーで計量を勝利につなげるには?

 サッカーでは得点につながる経路が複数あり、単純な指標に分解できないことはすでに述べた。現状、こういった複雑なものは、既知の単純な指標に縮約するのではなく、その複雑な構造に適した縮約を行うことが一般的に行われている。コンピュータの発達により計算が容易になり、同時にネット通信でたくさんのデータをやり取りできるようになってから、データからその背後にある構造を探りだすデータマイニング(データ発掘)の手法が急速に進歩している。ここでは、その代表的な手法について、サッカーでの応用を考えてみよう。

 データマイニングの古典的な手法として「バスケット解析」「共起分析」というものがある。ありていに言えば「この商品を買った人はほかにこんな商品も買っています」という分析のことである。これをサッカーに応用すれば、「得点を入れたこの選手は、他にこういうタイプの選手と同時に起用されているときに得点を入れています」といった分析を行うことが考えられる。これは相性問題を分析する一つの方法として誰かが挑戦していることだろう。

 守備に関しても、位置取りがある程度良く、対人も弱くなく……と複数次元の指標が非線形に組みあわされた指標であると考えられる(比して野球の進塁と得点の相関は一次元の線形な関係である)。こういった対象については、条件付き確率を用いた計算や、データクラスタリングの手法が役に立つことだろう。

 古典的な統計学はモデルが分かっている場合に有効な手法を数多く発達させてきたが、現代の統計学はそれに加えてモデルが分からない場合にどのようなモデルかを探る分野が急速に発達している。 現在サッカーで確実に勝利を予測するモデルはないし、将来的にも簡単に予測できるようにはならないだろうが、少しでも予測可能になる道具は出そろいつつあるので、少しずつ適用されていくというのが筆者の予想である。

(2012/05/02)