Bリーグにおいてホームコートアドバンテージは存在するか?──B1 2020-21シーズンのデータを用いた検討

2021/09/17追記:独立な2群のt検定でホーム/アウェイの勝率の差を検討していましたが、おそらく対応ある2群のt検定が正しいので、訂正しました。
こんにちは、らんそうるい(@rnsr0371)です。先日、Twitterで神戸の高校生(当時中学生)たちが国際統計ポスターコンクールの中学生以下の部門で優勝したことがバスケクラスタの中で話題になりました(『プロバスケ勝率と観客数の関係は? 統計ポスターで高1生が世界一』)。そのポスターは『国際統計ポスターコンクールでFirst Prizeを受賞した神戸大学付属中等教育学校の生徒3名が久元市長を表敬訪問します』の下部のリンクから見ることができます。
このポスターがバスケクラスタ内で話題になったのは、Bリーグのデータを用いて、①ホームコートアドバテージの存在を確認したこと、②ホームコートアドバンテージの背景として気温・湿度・観客数を検討したものの、ホームコートアドバンテージとは相関がなかったこと、を示したためです。ホームコートアドバンテージとは、ホームチームの方がアウェイチームよりも勝ちやすいという現象で、バスケ以外のスポーツでも存在が囁かれています。
この記事の目的は、このポスターに感銘を受けたらんそうるいが、B1 2020-21シーズンのデータを用いて、ホームコートアドバンテージが存在するかを追試することです。ポスターで使われているデータはB1 2018-19シーズン(と書かれてはいるものの、B1以外のチームのデータも含まれていると思います)のものです。B1 2020-21シーズンのデータを用いてもホームコートアドバンテージの存在が確認できれば、神戸の高校生たちが示した結果の一般性を高めることができます。逆に、存在が確認できなければ、B1 2018-19シーズンと2020-21シーズンの違いを考察することで、ホームコートアドバンテージの生起メカニズムに迫れるかもしれません。
先に分析結果を報告すると、B1 2020-21シーズンのデータを用いた場合、ホームコートアドバンテージの存在は確認できませんでした。神戸の高校生たちの分析と比較して、今回の分析が異なる点は、コロナウイルス感染症対策のためにB1 2020-21シーズンでは観客の上限が5000人に限定されていたことです(参考:2020-21シーズン開幕にあたっての試合開催方式について)。もしかしたら観客数の多さがホームコートアドバンテージの生起に関係しているのかもしれないと思いました。
分析に使ったコードはGitHubにアップされています。記事で用いた分析はPythonを用いましたが、マルチレベルモデルによる分析のためのRのコードもアップされています。

分析

使用したデータ

rintaromasuda様のGitHubから、games_202021.csv、games_summary_202021.csv、teams.csvをお借りしました。これらのデータを加工して、まずは神戸の高校生たちと同じ分析を行います。続いて、おそらくサンプルサイズの関係からホームコートアドバンテージの存在を検出しやすい、ロジスティック回帰分析と回帰分析の結果を報告します。

神戸の高校生たちと同じ分析(ホーム勝率とアウェイ勝率の平均値の差の検定)

B1 2020-21シーズンに所属していた20チームのホームでの勝数(home_win)アウェイでの勝数(away_win)、ホームゲーム数(home_games)、試合数(games)、アウェイゲーム数(away_games)、ホームでの勝率(win%_home)、アウェイでの勝率(win%_away)をまとめたのが次の表です。ホームでの勝率の平均値は0.503、アウェイでの勝率の平均値は0.496でした。
これらの差が偶然によるものとは言い難いかを調べるために、独立な2群の平均値の差の検定(t検定)を行いました。その結果、t(18)=0.097, p=0.923という結果が得られました。対応ある2群のt検定を行いました。その結果、t(19)=0.227, p=0.823という結果が得られました。つまり、確かにホームでの勝率の方が高いが、それは偶然得られた可能性を否定できない結果が得られました。この分析に使ったデータは、神戸の高校生たちのデータと比べて、サンプルサイズが小さいため、この検定の検出力は高くありません。しかし、神戸の高校生たちの得た結果と比べて明らかに効果量が小さいので、この分析ではホームコートアドバンテージが確認できなかったと結論づけたいと思います。

勝敗を従属変数としたロジスティック回帰分析

次に、勝敗(勝ち=1, 負け=0)を従属変数・ホーム/アウェイのダミー変数(ホーム=1, アウェイ=0)を独立変数に、ロジスティック回帰分析を行いました。その結果が次の表です。
注目していただきたいのは、表の一番下にあるhomeという行です。分析の結果、p=0.906となり、ホーム/アウェイと勝ち負けの間に関係を見出すことはできませんでした。

得点を従属変数とした回帰分析

最後に、得点を従属変数・ホーム/アウェイのダミー変数(ホーム=1, アウェイ=0)を独立変数に回帰分析を行いました。ホームの方が得点が高い(ダミー変数の回帰係数が0より大きい)という結果が得られれば、平均的にはホームチームの方が勝っている、すなわちホームコートアドバンテージが存在すると言えます。回帰分析の結果を次の表に示します。
注目していただきたいのは、表の中ほどにあるhomeという行です。分析の結果、p=0.791となり、ホーム/アウェイで平均得点に差があるとは言いにくいことが分かりました。

まとめ

この記事では、プロバスケリーグでホームコートアドバンテージが確認できるか? というテーマで、神戸の高校生たちの分析の追試を行いました。分析としては、高校生たちと同じ分析、勝敗を従属変数としたロジスティック回帰分析、得点を従属変数とした回帰分析を行いました。その結果、B1 2020-21シーズンのデータではホームコートアドバンテージがいずれの分析でも確認できませんでした。
高校生たちが用いたデータ(B1 2018-19シーズン)と今回のデータ(B1 2020-21シーズン)の違いの一つとして、観客数の多さがあります。2020-21シーズンでは、コロナウイルス感染症対策のために観客の入場制限が行われており、観客数の上限は5000人でした。もしかすると、この観客数の多さがホームコートアドバンテージが起きるか起きないかを分ける鍵なのかもしれないと分析をしていて思いました。
感想や分析の不備のご指摘がございましたら、お気軽に著者のTwitter(らんそうるい)までお寄せください。

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA