連続な確率分布

このページの改訂版を

に含めました。

１．分布関数

生起する可能性のある標本点をすべて数え上げることができる場合は、１つ１つの標本点に確率を割り当てることによって確率モデル（確率空間）を構成できる。しかし、事象が実数上の任意の値である場合は数え上げることができない。この場合は密度関数を用いて確率を与えることができる。

例として、０以上１以下の値をランダムにとる変数Ｘを考える。この変数Ｘが

；　但し、、

の範囲の値をとる確率は図1.1の青色の面積の大きさに対応すると考えられる。

図1.1　一様分布

の範囲の値はＸのとりうるすべての値を含むので、赤枠で囲まれた面積に対する青色の矩形の面積の比率が、この変数Ｘがの範囲の値をとる確率を表すと考えられる。赤枠の面積は１なので、青色の矩形の面積が確率となる。この面積は積分

で求められる。ここで、は常に値が１である関数

を表している。

一般に、上の確率変数Ｘに対して、次式

が任意のとに対して成り立つように関数をとることができるとき、をＸの密度関数（density）、分布密度、あるいは確率密度（probability density）などと呼ぶ。

図1.2　密度関数

このとき、

が成り立っている。

逆に、関数が次の条件

を満たすとき、を実数の集合とし、の部分集合からなる集合が実数の任意の区間を要素とし、次の条件

(1.1)　、

(1.2)　ならば

(1.3)　（；有限個：または、；無限個）ならば

を満たすならば、

により確率を与えることができる。このとき、

、　

で与えられる確率変数Ｘに対して、

となり、は確率変数Ｘの確率密度になっている。

次式で与えられる関数

は、分布関数（distribution function）と呼ばれている。

次式

から、

の成り立つことがわかる。

２．条件付確率密度関数・Bayes’rule・独立

まず、から２次元空間への関数

、　

を考える。

からへの関数が次式

(2.1)

を満たすとき、を同時分布（simultaneous distribution）あるいは結合分布（joint distribution）と呼ぶ。同時分布に対して、あるいはの分布は周辺分布（marginal distribution）。

式（2.1）より

を得る。ここで、

とおいた。これはから導かれたＸの確率密度関数である。

同様にして、Ｙの確率密度関数は

で与えられる。

の条件下でのＸの条件付確率密度関数は、次式で定義されるものである。

このとき、

となっている。は、という条件の下でのの確率密度である。

同様に、の条件下でのＹの条件付確率密度関数は、次式で定義される。

このとき、定義より

なので、

(2.2)

が導かれる。

上式(2.2)は、Bayes’ ruleにおける基本式である。

２つの確率変数ＸとＹは、次式

が成り立つとき独立（independent）であるという。

ｎ個の確率変数の場合は、

なるの同時確率密度関数に対して

が成り立つとき、確率変数は独立であるという。ここで、

である。

３．期待値・平均・分散

密度関数が与えられている確率変数の期待値（expectation）あるいは平均値（mean）を、次式で定義する。

(3.1)

　上式は、をで置き換えた次式で近似できる。

(3.2)

　(3.2)式の左辺は、変数の値とその確率（の近似値）との積の和になっている。これは、離散型の確率変数の期待値の定義に対応している。

Ｘの値が、と区間の範囲に限られているときは、は区間上で定義されていれば十分である。このとき期待値は

で与えることができる。

が区間で与えられている密度関数であるとき、区間の外ではの値は０であると定義すれば、

と書ける。

Ｘの関数h(X)の期待値E(h(X))は、次式

で与えられる。

Ｘとその確率密度関数に対して、

で与えられるをＸの分散（variance）と呼び、その平方根

を標準偏差（standard deviation）と呼ぶ。

例3.1

　を区間、すなわち

とし、関数を

として、上の確率変数を、がその密度関数となるようにとる。

すなわち、

とする。

図3.1　一様分布u(x)

上のように与えられる分布は、上の一様分布（uniform distribution）と呼ばれている。このとき、確率変数Ｕの平均値と分散は、次のようになる。

期待値（平均値）の定義における積分の性質から、次のことが成り立つ。

(3.1)　２つの確率変数ＸとＹ、および２つの定数ａとｂに対して、

(3.2)　２つの確率変数ＸとＹ、および２つの定数ａとｂに対して、

ここで、は次式

で与えられるもので、相関係数（correlation coefficient）と呼ばれている。

(3.3)　確率変数ＸとＹが独立であるとき、定数ａとｂに対して

　（3.2）および（3.3）は、（3.1）から次のようにして導くことができる。

　いま、ＸとＹが独立であるすると、

の成り立つことが導ける。したがって、

となる。

４．ＭＣＭＣ（Markov chain Monte Carlo）と分布関数の分析

　ベイズ的分析において事後確率が複雑で解析的分析が困難な場合、シミュレーションによって数値的に解析することが考えられる。このときに強力な道具となりうるのがＭＣＭＣである（岡本、2006参照）。ＭＣＭＣについては別のページ（ここをクリックすると表示される）で扱っている。

参考文献

（１）Feller,W. An introduction to probability theory and its applications, Vol.2., John Wiley & Sons, Inc., 1971.

（２）Gelman,A., Carlin,J.B., Stern,H.S. and Rubin,D.B. Bayesian data analysis. Chapman & Hall, 1995.

（３）小谷眞一「測度と確率１」岩波書店、1997.

（４）小谷眞一「測度と確率２」岩波書店、1997.

（５）日本数学会編集「岩波数学辞典」第３版、岩波書店、1985.

（６）岡本安晴「計量心理学」培風館、2006．

（７）Parzen,E. Stochastic processes. Holden-Day, Inc., 1962.

（８）渡部隆一「確率」共立出版株式会社、1966.