日本女子大学心理学科

岡本安晴

Up

第2部 統計的検定

 

データは、研究対象についての情報を得るために集められる。このとき、情報とは、研究対象についての何らかの理論・モデル・仮説に関するものである。何らの理論ないしはそれに準ずるものとは無関係にデータが存在するとは考えにくい。データを集めるということは、データとしてはとりあげない、当該のデータからは捨てられる事実があるということであり、このデータの取捨選択には何らかの価値判断が前提となる。この価値判断の拠りどころとなるものは、何らかの理論ないしはそれに準ずるものと考えるのが自然である。もちろん、研究上明確に設定された理論・モデル・仮説の検証ためにも、データの収集が計画されることはいうまでもない。

 

 

現象には不確定の変動が含まれるのが普通である。このため、理論・モデル・仮説とデータの関係は、揺らぎを伴うことがある。例えば、AさんとBさんとでは、どちらが走るのが速いかを問題にする場合について考えてみる。この場合、100mを走る時間は測定の度に変動する。このランダムに変動する性質のため、速さの比較は例えば平均値で行うことが考えられる。しかし、ランダムに変動するデータの平均値は、もちろんデータの変動を反映してこれもまたランダムに変動する。Aさん、Bさん、それぞれの10日間にわたる10回の測定値のうち、前半の5回の平均値ではAさんの方が速いが、後半の5回の平均値ではBさん方が速いということもあり得る(もちろん、原因はいろいろ考えられるが、ここでは10日間において両者に練習効果などの変化がないとして考えている)。ランダムな変動を含むデータに基づいて判断するためには、このランダム性を踏まえた分析が必要である。ランダム性を数学的に扱うものが確率論であり、確率論に基づいてデータのランダム性の評価を踏まえながら得られたデータと理論・モデル・仮説との関係を考察するのが統計学であるといえる。この場合の統計学的方法はmodel-based inferenceと呼ばれている(Snijders et al., 1999)。これに対して、全数調査など、母集団が有限個の要素から構成されるときのサンプリングに基づいて当該の母集団の分布について考察するものはdesign-based inferenceと呼ばれている。このdesign-based inferenceは、ここでは一応除いて考える。心理学研究でのデータ分析など、科学的研究におけるデータ分析の場合は、model-based inferenceの考え方が現在では一般的である(Salsburg, 2001)。

統計学で扱われているデータ分析法には、モデルの比較や適合度の検討を行う検定、モデルのパラメタの推定、不確実性の伴うデータに基づく決定がある。

統計学では、なるべく特定の研究対象に依存しない分析法が取り上げられる。このため、注意しておいた方がよいと思われることがある。つまり、統計学では、開発された分析法の適用可能な範囲がどれだけであるかがその分析法の評価基準の1つとなることがある。しかし、データを集めて分析を行うということを繰り返していって研究が進むと、当該の研究の理論あるいはモデルが、既存の統計学的モデルでは十分に表現できないようになる。つまり、その精密化された理論を適切に反映するモデルを設定した分析が必要になる。このとき、そのモデルは、当該の理論に適した特殊なものとなり、広くいろいろなデータの分析に用いることができるという意味での一般性は失われていく。このことは、研究を進めていく上で重要なことである。この区別を忘れると、判断を誤ることがある。

豊田ら(心理学研究、2004、33−40)は、「Okamoto(1990)の方法は、拡張を行うことが難しいという欠点があった(p.34)」としているが、これは上の区別を忘れた誤った判断である。豊田らの関心は、一般性のある分析法の開発であると思われるが、このことは当該の実質科学的理論になるべく依存しない分析法を目指すことを意味する。しかし、Okamoto(1990)の関心は、一般性のある分析法ではなく、実質科学的問題であるので、分析法が一般性を求めないのは当然であり、むしろ実質科学的理論の研究が進むにつれて、それに適合した特殊化したモデルが設定されていくことになる。もっとも、Okamoto(1990)のモデルは、そこまで特殊化はしていないが、これはその研究がまだ始まったばかりの段階だからである。

上の誤った評価の例は、分散分析など一般性のある分析法にとどまることの危険への注意を促すものである。

 

 

参考書

村上陽一郎「新しい科学論」講談社、1979

野家啓一「クーン」東京印書館、1998

Salsburg, D.  The Lady Tasting Tea: How statistics revolutionized science in the twentieth century. 2001.

Snijders, T. A. B. and Bosker, R. J.  Multilevel Analysis: An introduction to basic and advanced multilevel modeling. 1999.

富田恭彦「科学哲学者柏木達彦の多忙な夏」ナカニシヤ出版、1997

 

---

 

 統計的検定、推定では、確率、積分などの数学が用いられる。

これらについての基礎的な解説を、ここをクリックして表示されるページに用意した。

 

 

Up