BリーグとNBAでは得点・アシスト・リバウンドの相関は異なるか?
こんにちは、らんそうるいです。またまたまたまた偏相関係数を使ってみるシリーズです。偏相関係数を使って出場時間の影響を取り除いたスタッツ同士の関係を調べるという記事で、Bリーグで一部のスタッツの偏相関係数を算出してみました。この記事に寄せられた反応の中で、とても興味深いものがあったので、それを検討してみるというのが今回の記事の目標です。
興味深い反応というのは、しんたろう様からいただいた次のような内容です。すなわち「(Bリーグでは)外国籍選手の得点が多いので(得点と)アシストの相関が弱」い「NBAだと全然違うんだろうなー」というものです。
確かにBリーグはNBAと比べて得点源の選手が外国籍選手でかつインサイドの選手に集中しているという特徴があると思います。すると、仮説として次のようなものが浮かびました。
- 仮説1:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とリバウンドの相関は弱いだろう。
- 仮説2:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とアシストの相関は正の方向に強いだろう。
- 分析に使ったコード(R)などはこちらです。→https://github.com/rnsr0371/partial_correlation_nba_bleague.git
データの準備
Bリーグ
生データとしてrintaromasuda様のgithubから、teams.csvとgames_boxscore_202021.csvを使用させていただきました。これらのデータを加工して、B1 2020-21シーズンの各選手の平均スタッツを作成しました。NBA
生データとしてNBAsufferから、2020-21レギュラーシーズンのデータを使用しました。今回の分析で必要な 選手名・出場時間・得点・リバウンド・アシスト・ターンオーバーを抽出し、データセットとしました。分析
単純相関係数の確認
まず、Bリーグから。 続いてNBAです。 2つの相関行列を比較すると、すでに仮説1,2に沿ったパターンが得られています。すなわち、単純相関係数をBリーグとNBAで比較すると、得点とリバウンドの相関係数はBリーグの方が高く、得点とアシストの相関係数はNBAの方が高い、というものです。そして、やはり、出場時間が全てのスタッツを正の相関関係を持つことが分かりました。次節では、この出場時間の影響を取り除いた分析として、出場時間をパーシャルアウトした偏相関係数を使った分析と、出場時間あたりの単純相関係数を使った分析をご報告します。出場時間をパーシャルアウトした偏相関係数
以下のコードを実行して、Bリーグでの偏相関係数を求めました。#出場時間をパーシャルアウトした偏相関係数の算出
#Bリーグから
#得点とリバウンド
bleague %>% dplyr::select(MIN,PTS,TR) %>% pcor(.) %>% .$estimate#0.554
## MIN PTS TR
## MIN 1.00000000 0.7084206 0.05160796
## PTS 0.70842055 1.0000000 0.55354800
## TR 0.05160796 0.5535480 1.00000000
#得点とアシスト
bleague %>% dplyr::select(MIN,PTS,AS) %>% pcor(.) %>% .$estimate#-0.247
## MIN PTS AS
## MIN 1.0000000 0.80786519 0.43628975
## PTS 0.8078652 1.00000000 -0.02470183
## AS 0.4362898 -0.02470183 1.00000000
#得点とターンオーバー
bleague %>% dplyr::select(MIN,PTS,TO) %>% pcor(.) %>% .$estimate#0.339
## MIN PTS TO
## MIN 1.0000000 0.6432244 0.3784983
## PTS 0.6432244 1.0000000 0.3391300
## TO 0.3784983 0.3391300 1.0000000
#リバウンドとアシスト
bleague %>% dplyr::select(MIN,TR,AS) %>% pcor(.) %>% .$estimate#-0.283
## MIN TR AS
## MIN 1.0000000 0.7265273 0.6710463
## TR 0.7265273 1.0000000 -0.2825550
## AS 0.6710463 -0.2825550 1.0000000
#リバウンドとターンオーバー
bleague %>% dplyr::select(MIN,TR,TO) %>% pcor(.) %>% .$estimate#0.184
## MIN TR TO
## MIN 1.0000000 0.4480473 0.6454615
## TR 0.4480473 1.0000000 0.1839529
## TO 0.6454615 0.1839529 1.0000000
#アシストとターンオーバー
bleague %>% dplyr::select(MIN,AS,TO) %>% pcor(.) %>% .$estimate#0.554
## MIN AS TO
## MIN 1.0000000 0.1198998 0.6181150
## AS 0.1198998 1.0000000 0.5541025
## TO 0.6181150 0.5541025 1.0000000
続いてNBAです。
#続いてNBA
#得点とリバウンド
nba %>% dplyr::select(MIN,PTS,TR) %>% pcor(.) %>% .$estimate#0.092
## MIN PTS TR
## MIN 1.0000000 0.79207079 0.34065724
## PTS 0.7920708 1.00000000 0.09157992
## TR 0.3406572 0.09157992 1.00000000
#得点とアシスト
nba %>% dplyr::select(MIN,PTS,AS) %>% pcor(.) %>% .$estimate#0.338
## MIN PTS AS
## MIN 1.0000000 0.7447512 0.1968958
## PTS 0.7447512 1.0000000 0.3381634
## AS 0.1968958 0.3381634 1.0000000
#得点とターンオーバー
nba %>% dplyr::select(MIN,PTS,TO) %>% pcor(.) %>% .$estimate#0.487
## MIN PTS TO
## MIN 1.0000000 0.7140271 0.1021819
## PTS 0.7140271 1.0000000 0.4873483
## TO 0.1021819 0.4873483 1.0000000
#リバウンドとアシスト
nba %>% dplyr::select(MIN,TR,AS) %>% pcor(.) %>% .$estimate#-0.159
## MIN TR AS
## MIN 1.0000000 0.6109680 0.6555736
## TR 0.6109680 1.0000000 -0.1589336
## AS 0.6555736 -0.1589336 1.0000000
#リバウンドとターンオーバー
nba %>% dplyr::select(MIN,TR,TO) %>% pcor(.) %>% .$estimate#0.114
## MIN TR TO
## MIN 1.0000000 0.4793980 0.5869941
## TR 0.4793980 1.0000000 0.1146396
## TO 0.5869941 0.1146396 1.0000000
#アシストとターンオーバー
nba %>% dplyr::select(MIN,AS,TO) %>% pcor(.) %>% .$estimate#0.626
## MIN AS TO
## MIN 1.0000000 0.2831282 0.3736861
## AS 0.2831282 1.0000000 0.6257609
## TO 0.3736861 0.6257609 1.0000000
結果をまとめます。
- Bリーグでは得点とリバウンドの偏相関係数が0.554あるのに対し、NBAでは0.092しかない。
- 「仮説1:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とリバウンドの相関は弱いだろう」を支持する結果です。
- Bリーグでは得点とアシストの偏相関係数が-0.247であるのに対し、NBAでは0.338である。つまり、相関関係が逆転している。
- 「仮説2:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とアシストの相関は正の方向に強いだろう」を支持する結果です。
時間あたりのスタッツを使った単純相関係数
この分析は補足的な分析です。この分析方法と偏相関係数を使った分析の違いや使うべき状況の違いが、私には分からないので、掲載しました。結果としては前節とパラレルなものです。 Bリーグでのデータを示します。 続いてNBAです。 結果をまとめます。- Bリーグでは時間あたりの得点とリバウンドの相関係数が0.482あるのに対し、NBAでは0.107しかない。
- 「仮説1:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とリバウンドの相関は弱いだろう」を支持する結果です。
- Bリーグでは時間あたりの得点とアシストの相関係数が0.103であるのに対し、NBAでは0.312ある。
- 「仮説2:Bリーグと比べてNBAでは、得点源の選手のポジションがバラけているので、得点とアシストの相関は正の方向に強いだろう」を支持する結果です。