平均の差の検定:条件間で対応のあるデータの場合
論理的推論能力の訓練プログラムの効果を調べるために、2つの等価な論理的推論能力測定用テストAとBを用意し、5訓練前にテスト1を、訓練後にテスト2を実施したとする。訓練プログラムが、A,B,C,D,E、の5人に実施されたものとする。このとき、各人の訓練前後のテストの成績が表1のようであったとする。
|
表1 |
|
被験者 テスト1(訓練前) テスト2(訓練後) |
|
A 80 85 B 90 88 C 40 60 D 55 70 E 30 40 |
各被験者の訓練前の成績(テスト1)と訓練後の成績(テスト2)は図1のように図示できる。

図1
テスト1の成績の分布およびテスト2の成績の分布は緑の縦方向の矢印で示されているようにお互いに重なっている。しかし、個人ごとの変化は赤の矢印で示されているように1人を除いてすべてテスト2の成績の方がよい。2つの条件間でデータに対応があるときは(上の例の場合は、同じ被験者のテスト1とテスト2の成績)、対応を無視して条件全体での分布を比較した場合はそれらの分布の重なりが大きく、分布間に差があるかどうか明らかでない場合でも、対応のあるデータごと(上の例の場合は、各被験者ごと)の変化には明瞭な傾向が認められることがある。条件間で対応のあるデータの場合は、個人間の差を除いて個人内での条件間の変化に着目して以下のように検定を行う。
被験者
に対して、2つの条件AおよびBからのデータ
および
が得られたとする。ここで、被験者は
人とする。すなわち、
である。
および
が、それぞれ平均
および
、分散
および
の正規分布に従うデータであるとする。このとき、平均の差
が0であるかどうかの検定を対応のあるデータの差
によって行う。
帰無仮説「
」のもとでは、
(1) 
は、自由度
のt分布に従う。ここで、


である。
式(1)の
値は、対立仮説「
」の方が正しいときは、図1に示される棄却域に入る確率が高くなる。

図1
対立仮説を「
」と設定する両側検定では、
値が図1に示される棄却域に入るとき帰無仮説「
」は棄却され、対立仮説「
」が採用される。
対立仮説が「
」のときは、対立仮説が正しいときは(1)式から算出される
値は図2に示される棄却域に入る確率が高くなる。

図2
対立仮説を「
」と設定する片側検定では、
値が図2に示される棄却域に入るとき帰無仮説「
」は棄却され、対立仮説「
」が採用される。
逆に、対立仮説を上とは逆の方向に「
」と設定する片側検定では、
値が図3に示される棄却域に入るとき帰無仮説「
」を棄却して、対立仮説「
」を採用する。

図3
上のt検定を行うためのプログラムは、ここをクリックして表示されるページに用意した。
統計学の入門書として<岡本安晴「データ分析のための統計学入門――統計学の考え方――」おうふう、2009>を用意している。