【バスケットボール】+/-, APM, RAPMについて

こんにちは、らんそうるいです。最近、Bリーグ版のPIPMが公開されて(https://b-impactmetrics.amebaownd.com/)、ボックススコアに残らない貢献を数値化できる指標に関心があります。それらの指標をここではプラスマイナス系の指標と呼ぶことにし、プラスマイナス系の指標でよく見かける +/- (Plus-Minus)、APM (Adjusted Plus-Minus)、RAPM (Regularized Adjusted Plus-Minus)の3指標について、私自身が知っていることをまとめたいと思います。NBAで発展してきたプラスマイナス系の指標は英語で解説記事が書かれているケースが多く、私が英語が苦手なこともあって、不正確な内容を含むかもしれません。不備などがございましたら、指摘していただけると幸いです。

+/- (Plus-Minus)

+/-は、あるプレイヤーが試合に出ている時の得失点差を表したスタッツです。たとえば、プレイヤー1が試合に出場している時に、チームが30点を取り、相手に20点を許したとすると、プレイヤー1の+/-は「+10」になります。(参考:https://clutchtime.jp/archives/3807#i-2

 +/-の長所は、なんと言ってもボックススコアに残らない貢献を数値化できる点です。たとえば、優れた3Pシューターはそのシュート力でディフェンスを引きつけ、フロアにスペースを作ることができます。あるいは、屈強なビッグマンはスクリーンによってエースのプレーをお膳立てしているかもしれません。これらは確かにオフェンスへの貢献なのですが、ボックススコアには(普通は)記錄されません。+/-はこのような貢献の仕方も捉える指標だと言われています。

 一方で+/-には短所もあります。+/-はどのようなラインナップで味方とプレーしたか、あるいはどのようなラインナップを相手にしたかで、選手間の比較が難しいケースがあります。たとえば、NBAでは、3kings時代のマイアミ・ヒートで、ジェームズ・ウェイド・ボッシュという、スーパースターと一緒にプレーする時間の長かったマリオ・チャルマースという選手の+/-が非常に高い値になっていたという事例があります。このように優れたチームメイトの存在によって、そうでもない選手(チャルマース選手ごめん)の+/-が引き上げられてしまうことがあります。

 このラインナップの問題を克服したのが、次に紹介するAPMです。

Adjusted Plus-Minus (APM)と重回帰分析

APMはコートに立っている10人を一つのデータ(stintと呼ばれます)として得失点差を計算します。もし、一人でも選手交代があった場合は新たに得失点差を計算します。つまり、その試合(/シーズン)に出現したすべてのラインナップの得失点差を計算します。

 さらに選手全員に1, 2, …. , nと番号を振り、新たな列とします。そしてこれらの列に、ホームチームでオンコートの選手には1、アウェーチームでオンコートの選手には-1、オフコートの選手には0の変数を割り当てます。つまり、選手の人数分だけ列が増えて、それらの列には1,-1,0のいずれかが入っています。また一つの行で1が振られている選手は5人、-1も5人となります。こうして得られた変数をPlayer_1, Player_2, … , Player_nと呼ぶことにします。

 こうして得られたデータセットに対して、次のような重回帰分析を実行します。

  • あるラインナップの得失点差 = b_1 * player_1 + b_2 * player_2 + … + b_n * player_n

 この重回帰分析の結果得られた偏回帰係数(b)がAPMです。重回帰分析では、偏回帰係数は他の変数を一定にした時の従属変数への影響を測定することができるので、バスケの文脈で言うと優れたチームメイトと一緒にプレーする時間が長いためにAPMの値が大きくなる、といったことは起こりません。このようにAPMはその名の通りラインナップの影響をアジャストしています。

 APMにも欠点があります。こちら(https://www.nbastuffer.com/analytics101/adjusted-plus-minus/)でAPMの欠点が4つ挙げられています。その中でもRAPMに関連する欠点を説明します。APMは重回帰分析なのですが、重回帰モデルが過学習になるという欠点があります。つまり、今年のデータには最も当てはまりの良いAPMが計算されますが、来年のデータにはあまり当てはまらないAPMが計算されます。いま手元にあるデータはうまく説明できるけれど、手元にない未知のデータを上手く予測できないということです。機械学習の分野では、このような過学習の問題を緩和するために、「正則化」という手法を使います。正則化された回帰分析――リッジ回帰を用いて、APMの過学習の問題を緩和したのが、RAPMです。

Regularized Adjusted Plus-Minus (RAPM)とリッジ回帰

RAPMがリッジ回帰だと既に書いてしまったので、この節で書くことはほとんどありません。

 リッジ回帰については、Hastie et al. (2017) The Elements of Statistical Learningという教科書が参考になると思います。英語版のPDFを無料で入手することができます。

 RAPM、特に数シーズン分のデータを用いたRAPMは、上述したような調整が入るものの、基本的にはプラスマイナスなので解釈が容易です。そのため、インパクトメトリックやアドバンスドスタッツが新しく開発された時に、それらの性能を調べるためのベンチマークとして使われることがあるようです。

まとめ

  • +/- はあるプレイヤーが試合に出ている時の得失点差を表したスタッツ。
  • APMはラインナップの影響を調整した +/-。計算には重回帰分析を使う。
  • RAPMはラインナップの影響を調整しつつ、未来のデータへのフィットも考えた +/-。計算にはリッジ回帰を使う。

間違いのご指摘がございましたら著者のTwitter (https://twitter.com/rnsr0371)にご連絡お願いします。

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA