データ分析関連のテキストを紹介します!

こんにちは、らんそうるい(@rnsr0371)です。この記事では、私が統計学やデータ分析を学ぶ上で参考になったオススメのテキストを紹介します。

テキストの紹介の前に私のバックグラウンドやスキル感について説明します。私は大学で実験心理学を専攻していて、実験データを分析するために統計学の勉強を始めました。数理的にバリバリ統計学を理解する・新しい手法を開発するというよりは、統計学を誤りなく使う「良いユーザー」になれるように教育を受けてきました。また、私の現在のスキル感は「統計検定2級当落線上(落ちる寄り)」だと思っています。

この記事では統計学の理論的な事柄に関するテキスト・プログラミングに関するテキスト・データの可視化(グラフを描くこと)に関するテキスト・数学に関するテキストの4つをご紹介します。バスケ独特のデータ分析には触れません。また、英語のテキストも扱いません。では行ってみましょう!

統計学の理論的な事柄に関するテキスト

南風原『心理統計学の基礎』

私が学生時代に統計学に入門する時に読んだテキストです。色んなサイトで名著として紹介されています。次に紹介する『基本統計学』とは扱っている内容・レベルが似ているのですが、『心理統計学の基礎』では仮説検定の導入として相関係数の検定が使われているのが特徴的なところだと思います。また、『心理統計学ワークブック』という、『心理統計学の基礎』に準拠した問題集も公刊されており、独学に向いているテキストだと思います。

宮川『基本統計学[第4版]』

これも名著と名高い本です。数式の展開が分かりやすく、文系出身の方でも読みやすいテキストです。極めてオーソドックスな順番で各章が構成されていて、王道を征くテキストだと思います。個人的には『心理統計学の基礎』よりも『基本統計学』の方が好みです。『心理統計学の基礎』と『基本統計学』はどちらか片方だけ読んでもいいし、どちらも読んでみてもいいと思います。

日本統計学会『統計学基礎』

統計検定2級の公式テキストです。このテキスト、評判が悪い気がするのですが、私は結構好きです。上で紹介した『心理統計学の基礎』か『基本統計学』を読んだあとに『統計学基礎』を読むと、手短にまとまっていて良いテキストだと思います。逆に『統計学基礎』を初めにチョイスするのはオススメしません。

プログラミングに関するテキスト

RとPythonのどちらでデータ分析をやるのかは難しい問題です。両方紹介します。どちらも統計学の基礎を固めてから読み進めるのがいいと思います。あるいは、データがあるなら『心理統計学の基礎』や『基本統計学』で学んだことをRやPythonで実装しながら勉強を進めるのもアリだと思います。

山田・杉澤・村井『Rによるやさしい統計学』

Rの初歩の初歩から教えてくれるテキストです。統計学に関する説明はかなり軽めだったと思います。ちょっと古い本なので、R StudioやtidyverseといったRを使いやすくするツールたちについての説明はないはずです。R Studioやtidyverseについては『RユーザのためのRStudio[実践]入門』というテキストがあるので、それで補充するといいかもしれません。

寺田・辻・鈴木・福島『Pythonによるあたらしいデータ分析の教科書』

「Python3 エンジニア認定データ分析試験」という資格でテキストとされている本です。Jupyter Notebookや各種モジュール(pandasやsklearn, matplotlib etc.)の使い方が説明されています。時々、キャンペーンで無料でこのテキストが配布されることがあります。要チェックや!

データの可視化に関するテキスト

Rを使うにせよ、Pythonを使うにせよ、グラフの名前を知っておかないと、実装方法が分からず詰みます。そのため、データの視覚化に関するテキストは一冊は読んでおいたほうが良いと思います。

ナフリック『Google流資料作成術』

3D円グラフ絶対許さないパーソンが執筆した可視化に関するテキストです。データを使ってストーリーを語るという点に重点を置いているのが、次に紹介する『データ視覚化のデザイン』との違いかなと思います。

永田『データ視覚化のデザイン』

様々なグラフが名前とともに示されていて、読んでて楽しい上に「あのグラフなんて名前だっけ??」となった時に辞書的に使うことができるテキストです。

数学に関するテキスト

この分野は苦手です……

永野・岡田『統計学のための数学教室』

統計検定2級くらいのレベルの統計学なら、この本で十分だと信じたいです。相関係数が-1~1の間に収まることについて、トリッキーな証明をしていて面白かったです。

まだ理解できていないのですが、もう一段上のレベルの本として、永田『統計学のための数学入門30講』という本があり、線形代数・微分積分をスピーディーに学べるという噂です。これが理解できるレベルまで行きたいなぁ……

終わりに

ユーザーとして統計学を使ってきたので、数学の壁にぶち当たって伸び悩んでいる私ですが、オススメな本は以上です。つよつよなデータサイエンティストの皆様には、現状からひとつ上のレベルに上がるための、良いテキストがございましたら、ぜひ教えていただきたいです。よろしくお願いいたします。

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA