BリーグとNBAでは得点・アシスト・リバウンドの相関は異なるか?

こんにちは、らんそうるいです。またまたまたまた偏相関係数を使ってみるシリーズです。偏相関係数を使って出場時間の影響を取り除いたスタッツ同士の関係を調べるという記事で、Bリーグで一部のスタッツの偏相関係数を算出してみました。この記事に寄せられた反応の中で、とても興味深いものがあったので、それを検討してみるというのが今回の記事の目標です。 興味深い反応というのは、しんたろう様からいただいた次のような内容です。すなわち「(Bリーグでは)外国籍選手の得点が多いので(得点と)アシストの相関が弱」い「NBAだと全然違うんだろうなー」というものです。 確かにBリーグはNBAと比べて得点源の選手が外国籍選手でかつインサイドの選手に集中しているという特徴があると思います。すると、仮説として次のようなものが浮かびました。
  • 仮説1:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とリバウンドの相関は弱いだろう。
  • 仮説2:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とアシストの相関は正の方向に強いだろう。
これらの仮説を調べるために、出場時間の影響を取り除いた偏相関係数と、時間あたりのスタッツの単純相関係数を算出し、BリーグとNBAで比較を行います。ただ、技術力不足で「得点源の選手のポジションがバラけているので」というプロセスに関する部分は検討できませんでした。それでは行ってみましょう。

データの準備

Bリーグ

生データとしてrintaromasuda様のgithubから、teams.csvとgames_boxscore_202021.csvを使用させていただきました。これらのデータを加工して、B1 2020-21シーズンの各選手の平均スタッツを作成しました。

NBA

生データとしてNBAsufferから、2020-21レギュラーシーズンのデータを使用しました。今回の分析で必要な 選手名・出場時間・得点・リバウンド・アシスト・ターンオーバーを抽出し、データセットとしました。

分析

単純相関係数の確認

まず、Bリーグから。
続いてNBAです。
2つの相関行列を比較すると、すでに仮説1,2に沿ったパターンが得られています。すなわち、単純相関係数をBリーグとNBAで比較すると、得点とリバウンドの相関係数はBリーグの方が高く、得点とアシストの相関係数はNBAの方が高い、というものです。そして、やはり、出場時間が全てのスタッツを正の相関関係を持つことが分かりました。次節では、この出場時間の影響を取り除いた分析として、出場時間をパーシャルアウトした偏相関係数を使った分析と、出場時間あたりの単純相関係数を使った分析をご報告します。

出場時間をパーシャルアウトした偏相関係数

以下のコードを実行して、Bリーグでの偏相関係数を求めました。
#出場時間をパーシャルアウトした偏相関係数の算出
#Bリーグから
#得点とリバウンド
bleague %>% dplyr::select(MIN,PTS,TR) %>% pcor(.) %>% .$estimate#0.554
##            MIN       PTS         TR
## MIN 1.00000000 0.7084206 0.05160796
## PTS 0.70842055 1.0000000 0.55354800
## TR  0.05160796 0.5535480 1.00000000
#得点とアシスト
bleague %>% dplyr::select(MIN,PTS,AS) %>% pcor(.) %>% .$estimate#-0.247
##           MIN         PTS          AS
## MIN 1.0000000  0.80786519  0.43628975
## PTS 0.8078652  1.00000000 -0.02470183
## AS  0.4362898 -0.02470183  1.00000000
#得点とターンオーバー
bleague %>% dplyr::select(MIN,PTS,TO) %>% pcor(.) %>% .$estimate#0.339
##           MIN       PTS        TO
## MIN 1.0000000 0.6432244 0.3784983
## PTS 0.6432244 1.0000000 0.3391300
## TO  0.3784983 0.3391300 1.0000000
#リバウンドとアシスト
bleague %>% dplyr::select(MIN,TR,AS) %>% pcor(.) %>% .$estimate#-0.283
##           MIN         TR         AS
## MIN 1.0000000  0.7265273  0.6710463
## TR  0.7265273  1.0000000 -0.2825550
## AS  0.6710463 -0.2825550  1.0000000
#リバウンドとターンオーバー
bleague %>% dplyr::select(MIN,TR,TO) %>% pcor(.) %>% .$estimate#0.184
##           MIN        TR        TO
## MIN 1.0000000 0.4480473 0.6454615
## TR  0.4480473 1.0000000 0.1839529
## TO  0.6454615 0.1839529 1.0000000
#アシストとターンオーバー
bleague %>% dplyr::select(MIN,AS,TO) %>% pcor(.) %>% .$estimate#0.554
##           MIN        AS        TO
## MIN 1.0000000 0.1198998 0.6181150
## AS  0.1198998 1.0000000 0.5541025
## TO  0.6181150 0.5541025 1.0000000
続いてNBAです。
#続いてNBA
#得点とリバウンド
nba %>% dplyr::select(MIN,PTS,TR) %>% pcor(.) %>% .$estimate#0.092
##           MIN        PTS         TR
## MIN 1.0000000 0.79207079 0.34065724
## PTS 0.7920708 1.00000000 0.09157992
## TR  0.3406572 0.09157992 1.00000000
#得点とアシスト
nba %>% dplyr::select(MIN,PTS,AS) %>% pcor(.) %>% .$estimate#0.338
##           MIN       PTS        AS
## MIN 1.0000000 0.7447512 0.1968958
## PTS 0.7447512 1.0000000 0.3381634
## AS  0.1968958 0.3381634 1.0000000
#得点とターンオーバー
nba %>% dplyr::select(MIN,PTS,TO) %>% pcor(.) %>% .$estimate#0.487
##           MIN       PTS        TO
## MIN 1.0000000 0.7140271 0.1021819
## PTS 0.7140271 1.0000000 0.4873483
## TO  0.1021819 0.4873483 1.0000000
#リバウンドとアシスト
nba %>% dplyr::select(MIN,TR,AS) %>% pcor(.) %>% .$estimate#-0.159
##           MIN         TR         AS
## MIN 1.0000000  0.6109680  0.6555736
## TR  0.6109680  1.0000000 -0.1589336
## AS  0.6555736 -0.1589336  1.0000000
#リバウンドとターンオーバー
nba %>% dplyr::select(MIN,TR,TO) %>% pcor(.) %>% .$estimate#0.114
##           MIN        TR        TO
## MIN 1.0000000 0.4793980 0.5869941
## TR  0.4793980 1.0000000 0.1146396
## TO  0.5869941 0.1146396 1.0000000
#アシストとターンオーバー
nba %>% dplyr::select(MIN,AS,TO) %>% pcor(.) %>% .$estimate#0.626
##           MIN        AS        TO
## MIN 1.0000000 0.2831282 0.3736861
## AS  0.2831282 1.0000000 0.6257609
## TO  0.3736861 0.6257609 1.0000000
結果をまとめます。
  • Bリーグでは得点とリバウンドの偏相関係数が0.554あるのに対し、NBAでは0.092しかない。
    • 「仮説1:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とリバウンドの相関は弱いだろう」を支持する結果です。
  • Bリーグでは得点とアシストの偏相関係数が-0.247であるのに対し、NBAでは0.338である。つまり、相関関係が逆転している。
    • 「仮説2:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とアシストの相関は正の方向に強いだろう」を支持する結果です。
ただし、注意点があります。それは「得点源の選手のポジションがバラけているので」という結果に対する説明の部分です。今回は偏相関係数の値を比べているだけなので、この部分については検討できていません。この説明を検討するアイディアが浮かばなかったので、今後の課題と言えます。

時間あたりのスタッツを使った単純相関係数

この分析は補足的な分析です。この分析方法と偏相関係数を使った分析の違いや使うべき状況の違いが、私には分からないので、掲載しました。結果としては前節とパラレルなものです。 Bリーグでのデータを示します。
続いてNBAです。
結果をまとめます。
  • Bリーグでは時間あたりの得点とリバウンドの相関係数が0.482あるのに対し、NBAでは0.107しかない。
    • 「仮説1:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とリバウンドの相関は弱いだろう」を支持する結果です。
  • Bリーグでは時間あたりの得点とアシストの相関係数が0.103であるのに対し、NBAでは0.312ある。
    • 「仮説2:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とアシストの相関は正の方向に強いだろう」を支持する結果です。
結果の解釈の注意点は偏相関係数を使った分析と同じなので省略します。

終わりに

この記事では、Twitterでいただいた興味深い反応――BリーグとNBAでは傾向が異なるのではないか、を検討してみました。その結果、BリーグとNBAを比較すると、得点とリバウンドの相関関係はBリーグの方が強く、得点とアシストの相関関係は逆転していてBリーグではほとんど関係がないか負の相関、NBAでは正の相関が見られるということが分かりました。この結果は、おそらくBリーグでは得点源の選手がインサイドの外国籍選手に集中しているということに起因するのだと考えられます。 最後に興味深い反応と仮説をくださったしんたろう様に感謝してこの記事を終わりたいと思います。ありがとうございました。

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA