岡本安晴(著)
データ分析のための統計学入門
――統計学の考え方――
おうふう、2009
ISBN 9784273035303
「はじめに」から(抜粋)
各章の内容は以下の通りである。
第1章「グラフ」では、データ分析の基本であるデータの分布状態を図示する方法を扱った。1変量の場合としてヒストグラムと棒グラフ、2変量の場合として散布図を説明した。
第2章「統計量」では、まず1変量の場合をとりあげ、平均値、分散、歪度、尖度およびデータの標準化について説明した。順序統計量とヒンジの解説も行った。2変量の場合については、共分散、相関係数、回帰分析、擬似相関、順位相関などについて説明した。
第3章「検定」では、2項検定を例として検定の考え方について説明し、それに基づいて差の検定、等分散の検定、相関係数の検定について解説した。ノンパラメトリック検定ではカイ2乗検定を取り上げた。また、補足においてメタ分析の考え方に触れた。
第4章「分散分析」では、多重比較にふれながら分散分析がなぜ必要なのか説明した後、被験者間要因、被験者内要因および交互作用の解説を行った。また、重回帰分析と分散分析の関係についても説明した。
第5章「効果量と検定力」では、効果量の説明を行った後、平均値の差の検定および分散分析の場合を取り上げて、効果量と検定力の関係についてシミュレーション例を紹介しながら解説した。
第6章「推定」では、まず点推定としてモーメント法を取り上げるとともに不偏推定量と一致推定量について触れた。点推定に対して区間推定の考え方についても説明した。最尤法、ベイズ的方法、ブートストラップについても本章において取り上げた。
第7章「母集団を想定しない分析」では、ランダマイゼーション検定とサブサンプルによる分析を紹介した。
付録「確率」に、確率の基本的事項の説明を用意した。
なお、統計学の本書レベルの学習に必要な数学的知識については拙著
を用意している。
目次
第1章 グラフ: データの図示
1.1 1変量の場合
ヒストグラム、棒グラフ(柱状グラフ、柱状図)と折れ線グラフ
1.2 2変量の場合
散布図
第2章 統計量
2.1 1変量の場合
位置と散らばりの指標(平均、分散など)、データの標準化、分布の形状の指標(歪度と尖度)、順序統計量(中央値など)、ヒンジと箱ひげ図
2.2 2変量の場合
共分散、相関係数、回帰分析と相関係数、回帰(regression)、擬似相関と変量間の関係、順位相関係数
補足2.A 計算の有効桁 補足2.B 和と積の記号:狽ニΠ 補足2.C データに定数を足した場合、掛けた場合の平均と分散 補足2.D 標準得点の平均値と分散・不偏分散 補足2.E 順序統計量をp:1−pに内分する値 補足2.F 相関係数と内積
第3章 検定
3.1 検定の考え方
2項検定(帰無仮説と対立仮説)、2項検定の例
3.2 正規分布を仮定する検定
平均値の差のt検定(条件間で独立なデータの場合)、等分散の仮定を置かない場合、平均値の差のt検定(条件間で対応のあるデータの場合)、等分散の検定、相関係数の検定
3.3 ノンパラメトリック検定
カイ2乗検定:適合度の検定、分割表の分析:分布の違いの検定、分割表の分析:カテゴリの独立の検定
補足3.A メタ分析
第4 分散分析
4.1 多重比較
4.2 分散分析の考え方と方法
被験者間1要因の場合、被験者内1要因の場合、被験者間2要因の場合、その他の分散分析
4.3 重回帰分析と分散分析
補足4.A 球形仮定(the assumption of sphericity)
第5章 効果量と検定力
5.1 平均値の差の効果量(独立なデータの場合)
5.2 分散分析の場合の効果量(被験者間1要因)
第6章 推定
6.1 点推定(モーメント法)
不偏推定量と一致推定量
6.2 区間推定
6.3 最尤法
尤度関数、尤度比検定、情報量基準AIC、信頼区間とフィッシャー情報量
6.4 ベイズ的方法
6.5 ブートストラップ
ノンパラメトリック・ブートストラップ、パラメトリック・ブートストラップ
7 母集団を想定しない分析
7.1 ランダマイゼーション検定
7.2 サブサンプルによる分析
データの収集方法に構造がある場合、データの収集方法に構造化がない場合
付録 確率
A 集合
A.1 定義 A.2 集合の演算
B 数え上げることのできる事象の確率
B.1 基礎的性質 B.2 条件付確率と独立 B.3 期待値 B.4 ベイズの定理 B.5 補足
C 積分
C.1 1変数関数の積分 C.2 多重積分
D 連続量の確率
D.1 分布関数 D.2 条件付確率密度関数 D.3 期待値・平均・分散
E 確率の例
E.1 ベルヌーイ分布 E.2 2項分布 E.3 正規分布 E.4 カイ2乗分布 E.5 ティ分布 E.6 エフ分布 E.7 非心カイ2乗分布 E.8 非心ティ分布 E.9 非心エフ分布 E.10 2変量正規分布
付表1〜付表5
ソースコードファイルの他に、実行形式のファイル(*.exe)も用意した。
実行形式のファイルはネイティブなので、ダウンロードした*.exeファイルをダブルクリックすれば実行できる。
この実行形式のファイルは、Delphi版をコンパイルしたものである。
また、Visual C++版が用意されている場合は、その実行形式のファイル(*.exe)もRelease版として用意した。
このRelease版は、.NET Frameworkがインストールされておれば、ダウンロードしたファイルのダブルクリックで実行できる。
ソース・コードはZIP形式の圧縮ファイルなので、ダウンロード後解凍する必要がある。
解凍は、ダウンロードしたファイルの名前をマウスの右ボタンでクリックすると表示されるメニュリストから
「解凍」あるいは「展開」などの項目を選ぶと解凍できる。
解凍したファイルはフォルダ(解凍時に作成される)に格納されるが、
Delphiの場合は、プロジェクトファイル(*.dprあるいは*.dproj)
Visual C++あるいはVisual Studioの場合は、ソリューションファイル(*.sln)
を開くと、エディタに表示、あるいは実行できる。
なお、ウェブサイト<Visual C++/CLRプログラミング入門>にも本書関連のサンプルプログラムを用意しました。
Visual C++プログラミングの解説は
岡本安晴「大学生のための心理学VC++プログラミング入門」勁草書房
に用意している。
1変量記述統計量(Visual C++版:ニフティLaCooncanのウェブサイト)
2変量記述統計量(Visual C++版:ニフティLaCoocanのウェブサイト)
偏相関係数(Visual C++版:ニフティLaCoocanのウェブサイト)
2項分布のグラフと確率(Delphi版、Visual C++版)
平均値の差の検定:独立な場合(Delphi版、Visual C++版)
平均値の差の検定:対応のある場合(Delphi版、Visual C++版)
カイ2乗検定:度数分布の検定(Delphi版)<Visual C++版はこちら>
カイ2乗検定:分割表の分析(Delphi版)<Visual C++版はこちら>
被験者間1要因分散分析(Delphi版、Visual C++版)
被験者内1要因分散分析(Delphi版、Visual C++版)
被験者間2要因分散分析(Delphi版、Visual C++版)
被験者間1要因・被験者内1要因分散分析(Visual C++版)
被験者内(繰り返し、反復)2要因分散分析(Visual C++版)
3要因以上の分散分析では、分散分析当たりの第1種の過誤の確率が大きくなります。
効果量と検定力<平均値の差:独立な場合>(Delphi版、Visual C++版)
効果量と検定力<被験者間1要因分散分析>(Delphi版、Visual C++版)