Up

連続な確率分布

 

このページの改訂版を

岡本安晴「統計学数学入門[上]培風館

に含めました。

 

1.分布関数

 

生起する可能性のある標本点をすべて数え上げることができる場合は、1つ1つの標本点に確率を割り当てることによって確率モデル(確率空間)を構成できる。しかし、事象が実数上の任意の値である場合は数え上げることができない。この場合は密度関数を用いて確率を与えることができる。

例として、0以上1以下の値をランダムにとる変数Xを考える。この変数Xが

 

; 但し、

 

の範囲の値をとる確率は図1.1の青色の面積の大きさに対応すると考えられる。

 

1.1 一様分布

 

の範囲の値はXのとりうるすべての値を含むので、赤枠で囲まれた面積に対する青色の矩形の面積の比率が、この変数Xがの範囲の値をとる確率を表すと考えられる。赤枠の面積は1なので、青色の矩形の面積が確率となる。この面積は積分

 

 

で求められる。ここで、は常に値が1である関数

 

 

を表している。

一般に、上の確率変数Xに対して、次式

 

 

が任意のに対して成り立つように関数をとることができるとき、をXの密度関数(density)、分布密度、あるいは確率密度(probability density)などと呼ぶ。

 

1.2 密度関数

 

 

このとき、

 

 

が成り立っている。

逆に、関数が次の条件

 

 

を満たすとき、を実数の集合とし、の部分集合からなる集合が実数の任意の区間を要素とし、次の条件

 

(1.1) 

(1.2) ならば

(1.3) ;有限個:または、;無限個)ならば

      

 

を満たすならば、

 

 

により確率を与えることができる。このとき、

 

、 

 

で与えられる確率変数Xに対して、

 

           

 

となり、は確率変数Xの確率密度になっている。

次式で与えられる関数

 

 

は、分布関数(distribution function)と呼ばれている。

次式

 

 

から、

 

 

の成り立つことがわかる。

 

 

 

2.条件付確率密度関数・Bayesrule・独立

 

まず、から2次元空間への関数

 

、 

 

を考える。

からへの関数が次式

 

(2.1)               

 

を満たすとき、を同時分布(simultaneous distribution)あるいは結合分布(joint distribution)と呼ぶ。同時分布に対して、あるいはの分布は周辺分布(marginal distribution)。

式(2.1)より

 

        

                

                

を得る。ここで、

 

         

 

とおいた。これはから導かれたXの確率密度関数である。

同様にして、Yの確率密度関数

 

 

で与えられる。

の条件下でのXの条件付確率密度関数は、次式で定義されるものである。

 

 

このとき、

 

 

となっている。は、という条件の下でのの確率密度である。

同様に、の条件下でのYの条件付確率密度関数は、次式で定義される。

 

 

このとき、定義より

 

 

なので、

 

(2.2)               

 

が導かれる。

上式(2.2)は、Bayes ruleにおける基本式である。

2つの確率変数XとYは、次式

 

 

が成り立つとき独立(independent)であるという。

n個の確率変数の場合は、

 

 

なるの同時確率密度関数に対して

 

 

が成り立つとき、確率変数は独立であるという。ここで、

 

 

である。

 

 

 

3.期待値・平均・分散

 

密度関数が与えられている確率変数の期待値(expectation)あるいは平均値(meanを、次式で定義する。

 

(3.1)                

 

 上式は、で置き換えた次式で近似できる。

 

(3.2)                  

 

 (3.2)式の左辺は、変数の値とその確率(の近似値)との積の和になっている。これは、離散型の確率変数の期待値の定義に対応している。

Xの値が、と区間の範囲に限られているときは、は区間上で定義されていれば十分である。このとき期待値

 

 

で与えることができる。

が区間で与えられている密度関数であるとき、区間の外ではの値は0であると定義すれば、

 

 

と書ける。

Xの関数h(X)の期待値E(h(X))は、次式

 

 

で与えられる。

Xとその確率密度関数に対して、

 

 

で与えられるをXの分散(variance)と呼び、その平方根

 

 

を標準偏差(standard deviation)と呼ぶ。

 

 

 

3.1

 を区間、すなわち

 

 

とし、関数

 

 

として、上の確率変数を、がその密度関数となるようにとる。

すなわち、

 

 

とする。

 

3.1 一様分布u(x)

 

上のように与えられる分布は、上の一様分布(uniform distribution)と呼ばれている。このとき、確率変数Uの平均値と分散は、次のようになる。

            

           

             

             

             

             

 

 

期待値(平均値)の定義における積分の性質から、次のことが成り立つ。

 

(3.1) 2つの確率変数XとY、および2つの定数aとbに対して、

 

 

(3.2)  2つの確率変数XとY、および2つの定数aとbに対して、

 

 

ここで、は次式

         

 

で与えられるもので、相関係数(correlation coefficient)と呼ばれている。

 

(3.3) 確率変数XとYが独立であるとき、定数aとbに対して

 

 

 

 (3.2)および(3.3)は、(3.1)から次のようにして導くことができる。

 

  

                  

                  

                        

 

 いま、XとYが独立であるすると、

 

        

 

の成り立つことが導ける。したがって、

 

     

 

となる。

 

4.MCMC(Markov chain Monte Carlo)と分布関数の分析

 

 ベイズ的分析において事後確率が複雑で解析的分析が困難な場合、シミュレーションによって数値的に解析することが考えられる。このときに強力な道具となりうるのがMCMCである(岡本、2006参照)。MCMCについては別のページここをクリックすると表示される)で扱っている。

 


参考文献

 

(1)Feller,W. An introduction to probability theory and its applications, Vol.2., John Wiley & Sons, Inc., 1971.

(2)Gelman,A., Carlin,J.B., Stern,H.S. and Rubin,D.B. Bayesian data analysis. Chapman & Hall, 1995.

(3)小谷眞一「測度と確率1」岩波書店、1997.

(4)小谷眞一「測度と確率2」岩波書店、1997.

(5)日本数学会編集「岩波数学辞典」第3版、岩波書店、1985.

(6)岡本安晴「計量心理学」培風館、2006

(7)Parzen,E. Stochastic processes. Holden-Day, Inc., 1962.

(8)渡部隆一「確率」共立出版株式会社、1966.

 

 

Up