鶏のあばら骨

sed scientia est potentia

統計分析初学者のための文献リスト

昨今ビッグデータへの注目によっていわゆる教養としての統計学に関心を寄せる方が増えたと聞く。また、現状としてデータ・サイエンティストと呼ばれる人の多くは情報学系のバックボーンを持ち、分析に際しては記述統計を主に扱って事象の予測を行うようだ。

しかし、ビッグデータが手に入る立場にいる人はそう多くはない。また、因果関係が見えない予測に納得できる人も多くはないだろう。そのため、手元にある「スモール」なデータから、目に見えない因果関係を把握しようとする伝統的な推測統計を学ぶことは決して無駄ではないと考えられる。

そこで本記事では統計分析の初学者向けの文献をリストアップする。実はここ数年文系の大学生を対象に統計分析の講義と実習を行う機会を頂いていたので、個人的な備忘録も兼ねている。ただし、以下にあげる文献の多くは社会心理学社会学を背景としたミクロデータの分析を想定したものが多いことには注意されたい。

入門書:まずはここから

統計学がわかる (ファーストブック)

統計学がわかる (ファーストブック)

「ハンバーガーショップ」という副題のせいでイロモノみたいな印象を受けるが間違いなく良書である。類書の中でも抜群にわかりやすい。著者のHPでもほぼ同じ内容を扱っているので、まずはそちらから入門してみると良い。

マンガでわかる統計学

マンガでわかる統計学

マンガでわかる統計学 回帰分析編

マンガでわかる統計学 回帰分析編

通称「萌え萌え統計」(といっても10年前の「萌え」だが)。「そこを初学者に数式で説明するか?」という箇所がなくはないのだが、全体として興味を持つとっかかりとしては悪くない。本書のシリーズでは他に因子分析編もあるがそちらは未読。

よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)

よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)

前掲書2冊よりもややアカデミックだが、統計を教養として学ぶにとどめるなら本書で十分だろう。難しい数式をほとんど用いていないのだが、随所に著者らの工夫が垣間見え、非常に丁寧に解説が行われている。特に初学者にとって最初の躓きになりやすい統計的検定の考え方を、「囲碁部に所属するしんすけ君とけんたろう君の実力差を推し量る」ケースを用いて説明したセクション(pp.108-109)は秀逸である。ちなみに本書と同じ「やわらかアカデミズム・〈わかる〉シリーズ」には良書が多い。

基本書:確かな理解のために

心理統計学の基礎―統合的理解のために (有斐閣アルマ)

心理統計学の基礎―統合的理解のために (有斐閣アルマ)

本格的すぎていったいこれのどこが「基礎」なんだと文句のひとつも言いたくなるが、本書の解説に間違いはないので安心できる。どうやら「入門書」と「基本書」は必ずしも一致しないようだ。回帰分析のベクトル表現(pp.198-199)と重回帰分析のベクトル表現(pp.241-243)の説明は、当該分析の理解を深めるのにうってつけである。

読む統計学 使う統計学[第2版]

読む統計学 使う統計学[第2版]

各種分析の事例が身近なものなので助かる。

調査データ分析の基礎―JGSSデータとオンライン集計の活用

調査データ分析の基礎―JGSSデータとオンライン集計の活用

網羅的な一冊。初学者は本書に収録されている各種分析を押さえておけば問題ないだろう。本書では統計ソフトのSPSSを用いて説明を行っているが、概念的な説明がしっかりしているので他の統計ソフトのユーザーでも参考になる。

統計学入門 (基礎統計学)

統計学入門 (基礎統計学)

入門書にしてはやや格調高い感じがする。しかし本書と共に実際に手を動かして数式を解いてみるとスイスイ理解できる。独学者の友。

特定の分析に特化したもの

誰も教えてくれなかった因子分析―数式が絶対に出てこない因子分析入門

誰も教えてくれなかった因子分析―数式が絶対に出てこない因子分析入門

因子分析といったらこの1冊だろう。「俺の説明が理解できなかったなら、とりあえずこれ読んどけ」で済む。

原因をさぐる統計学―共分散構造分析入門 (ブルーバックス)

原因をさぐる統計学―共分散構造分析入門 (ブルーバックス)

共分散構造分析とは、ざっくり言うと、因子分析と回帰分析を組み合わせることで複数の概念間の因果を推定する方法である。説明はいかにも「統計本」っぽいのでまったくの初学者向きというわけではないが、数式が最小限に抑えられている一方で図表が豊富に掲載されているので理解しやすい。

応用書:Stataの解説書

統計分析を身に付けるには統計ソフトを用いて実際に分析してみるのが一番である。概念をいくら説明されても自らの手をガチャガチャ動かして分析する実感を得なければ定着しない。自動車の運転と同じように、多くのユーザーにとって統計分析なんてのはしょせん「習うより慣れろ」である。

以下では私がよく使うStataという統計ソフトを使用した解説書を紹介する。ちなみに統計ソフトとしてはSASSPSS、Rが有名である。最近ではExcelで動くHADが業界内が注目されていたりする。このうち2015年1月現在、無料で利用できるのはSAS(University Edition)、R、HADであるが、これらの解説書の紹介はまた別の機会としたい。

A Gentle Introduction to Stata, Fourth Edition

A Gentle Introduction to Stata, Fourth Edition

良い本だとつくづく思う。簡にして要を得た解説は、統計分析を学び始めたばかりの者をしてひるませることがない。これから新しい入門用の本が出版されるよりも、本書の和訳本が出るだけで多くのStataユーザーが救われるのではないか。

Stataによる計量政治学

Stataによる計量政治学

本格的な解説書といえる。各種分析の概念的な説明にも余念がない。また、第2章「研究テーマの選び方」および第3章「理論と仮説」は実証研究を行う人間なら必読である。

Stataによる社会調査データの分析―入門から応用まで

Stataによる社会調査データの分析―入門から応用まで

改訂 Stataによる社会調査データの分析: 入門から応用まで

改訂 Stataによる社会調査データの分析: 入門から応用まで

本書は大変お世話になった(し、今でもお世話になっている)。Stataでコマンドを組むのに最も参考になった。概念的な説明はやや物足りない感が否めないが、それは本書の想定読者の水準ではないので仕方がないだろう。新版になってマルチレベル分析や分位点回帰分析の解説が追加された。Stataユーザーなら常に手元に置いておきたい。

もし誰かに統計分析を教えることになったら

Q&Aで知る統計データ解析―DOs and DON’Ts (心理学セミナーテキストライブラリ)

Q&Aで知る統計データ解析―DOs and DON’Ts (心理学セミナーテキストライブラリ)

「因子分析に必要な標本数は?」といった種々の実践的な疑問に、Q&A方式で回答している。特に統計分析を誰かに教えることになった人におすすめしたい。生徒からの質問にその場で回答できず困ったら、まずはこれを参照すると良い。