連続な確率分布
このページの改訂版を
に含めました。
1.分布関数
生起する可能性のある標本点をすべて数え上げることができる場合は、1つ1つの標本点に確率を割り当てることによって確率モデル(確率空間)を構成できる。しかし、事象が実数上の任意の値である場合は数え上げることができない。この場合は密度関数を用いて確率を与えることができる。
例として、0以上1以下の値をランダムにとる変数Xを考える。この変数Xが
; 但し、
、![]()
の範囲の値をとる確率は図1.1の青色の面積の大きさに対応すると考えられる。

図1.1 一様分布
の範囲の値はXのとりうるすべての値を含むので、赤枠で囲まれた面積に対する青色の矩形の面積の比率が、この変数Xが
の範囲の値をとる確率
を表すと考えられる。赤枠の面積は1なので、青色の矩形の面積が確率
となる。この面積は積分
![]()
で求められる。ここで、
は常に値が1である関数
![]()
を表している。
一般に、
上の確率変数Xに対して、次式
![]()
が任意の
と
に対して成り立つように関数
をとることができるとき、
をXの密度関数(density)、分布密度、あるいは確率密度(probability density)などと呼ぶ。

図1.2 密度関数
このとき、
![]()
が成り立っている。
逆に、関数
が次の条件
![]()
を満たすとき、
を実数の集合とし、
の部分集合からなる集合
が実数の任意の区間
を要素とし、次の条件
(1.1)
、![]()
(1.2)
ならば![]()
(1.3)
(
;有限個:または、
;無限個)ならば
![]()
を満たすならば、
![]()
により確率を与えることができる。このとき、
、 ![]()
で与えられる確率変数Xに対して、
![]()
![]()
となり、
は確率変数Xの確率密度になっている。
次式で与えられる関数![]()
![]()
は、分布関数(distribution function)と呼ばれている。
次式
![]()
から、
![]()
の成り立つことがわかる。
2.条件付確率密度関数・Bayes’rule・独立
まず、
から2次元空間
への関数
、 ![]()
を考える。
から
への関数
が次式
(2.1)
![]()
を満たすとき、
を同時分布(simultaneous distribution)あるいは結合分布(joint distribution)と呼ぶ。同時分布に対して、
あるいは
の分布は周辺分布(marginal distribution)。
式(2.1)より
![]()
![]()
![]()
![]()
を得る。ここで、
![]()
とおいた。これは
から導かれたXの確率密度関数である。
同様にして、Yの確率密度関数
は
![]()
で与えられる。
の条件下でのXの条件付確率密度関数
は、次式で定義されるものである。
![]()
このとき、
![]()
となっている。
は、
という条件の下での
の確率密度である。
同様に、
の条件下でのYの条件付確率密度関数
は、次式で定義される。
![]()
このとき、定義より
![]()
なので、
(2.2)
![]()
が導かれる。
上式(2.2)は、Bayes’ ruleにおける基本式である。
2つの確率変数XとYは、次式
![]()
が成り立つとき独立(independent)であるという。
n個の確率変数
の場合は、
![]()
なる
の同時確率密度関数
に対して
![]()
が成り立つとき、確率変数
は独立であるという。ここで、
![]()
である。
3.期待値・平均・分散
密度関数
が与えられている確率変数
の期待値(expectation)あるいは平均値(mean)
を、次式で定義する。
(3.1)
![]()
上式は、
を
で置き換えた次式で近似できる。
(3.2)
![]()
(3.2)式の左辺は、変数の値
とその確率(の近似値)
との積の和になっている。これは、離散型の確率変数の期待値の定義に対応している。
Xの値が、
と区間
の範囲に限られているときは、
は区間
上で定義されていれば十分である。このとき期待値
は
![]()
で与えることができる。
が区間
で与えられている密度関数であるとき、区間
の外では
の値は0であると定義すれば、
![]()
と書ける。
Xの関数h(X)の期待値E(h(X))は、次式
![]()
で与えられる。
Xとその確率密度関数
に対して、
![]()
![]()
で与えられる
をXの分散(variance)と呼び、その平方根
![]()
を標準偏差(standard deviation)と呼ぶ。
例3.1
を区間
、すなわち
![]()
とし、関数
を
![]()
として、
上の確率変数
を、
がその密度関数となるようにとる。
すなわち、
![]()
とする。

図3.1 一様分布u(x)
上のように与えられる分布
は、
上の一様分布(uniform distribution)と呼ばれている。このとき、確率変数Uの平均値
と分散
は、次のようになる。
![]()
![]()
![]()

![]()
![]()
![]()
![]()
![]()

![]()
期待値(平均値)の定義における積分
の性質から、次のことが成り立つ。
(3.1) 2つの確率変数XとY、および2つの定数aとbに対して、
![]()
(3.2) 2つの確率変数XとY、および2つの定数aとbに対して、
![]()
ここで、
は次式
![]()
で与えられるもので、相関係数(correlation coefficient)と呼ばれている。
(3.3) 確率変数XとYが独立であるとき、定数aとbに対して
![]()
(3.2)および(3.3)は、(3.1)から次のようにして導くことができる。
![]()
![]()
![]()
![]()
![]()
いま、XとYが独立であるすると、
![]()
の成り立つことが導ける。したがって、
![]()
![]()
![]()
となる。
4.MCMC(Markov
chain Monte Carlo)と分布関数の分析
ベイズ的分析において事後確率が複雑で解析的分析が困難な場合、シミュレーションによって数値的に解析することが考えられる。このときに強力な道具となりうるのがMCMCである(岡本、2006参照)。MCMCについては別のページ(ここをクリックすると表示される)で扱っている。
参考文献
(1)Feller,W. An introduction to
probability theory and its applications, Vol.2., John Wiley & Sons,
Inc., 1971.
(2)Gelman,A., Carlin,J.B., Stern,H.S. and Rubin,D.B. Bayesian data analysis. Chapman &
Hall, 1995.
(3)小谷眞一「測度と確率1」岩波書店、1997.
(4)小谷眞一「測度と確率2」岩波書店、1997.
(5)日本数学会編集「岩波数学辞典」第3版、岩波書店、1985.
(6)岡本安晴「計量心理学」培風館、2006.
(7)Parzen,E. Stochastic processes. Holden-Day, Inc., 1962.
(8)渡部隆一「確率」共立出版株式会社、1966.