• 検索結果がありません。

分布関数と密度関数

ドキュメント内 数理統計学Iノート (ページ 36-39)

36 4 確率変数・確率分布と期待値・分散

4.3 分布関数と密度関数 37

確率変数X の分布関数であることが明かな場合は省略して単にF(x)と書くことにする.

分布関数の基本的な性質には次のようなものがある.グラフの概形(図1)と合わせて理解したい.

(1), (2), (3)は基本中の基本なのできちんと押さえておこう.分布関数がわかれば確率は計算できる.

(4), (5)はこのノートで積極的に使うことはないが,分布関数を特徴付ける性質なので理論的には大事

である.

定理 4.6 (分布関数の性質).

(1) P(X > x) = 1−P(X ≤x) = 1−F(x)

(2) a < bに対してP(a < X≤b) =F(b)−F(a)(等号の有無に注意)

(3) 非減少関数である.つまりa < b=⇒F(a)≤F(b).

(4) lim

x→−∞F(x) = 0, lim

x→∞F(x) = 1. (これを F(−∞) = 0, F() = 1と書く本もある.)

(5) 右連続関数である.つまり lim

xa+0F(x) =F(a).

証明の概略. (1)確率測度の性質P(A) = 1−P(A)をA={X ≤x} に適用して分布関数に書き換え ただけ.

(2),(3) 確率測度の性質A⊂B=⇒P(B∩A) =P(B)−P(A)をA={X ≤a}, B={X ≤b} 適用すればよい.(a < bならば A⊂B である.)

(4), (5)は確率の連続性から示せるが省略する.しかし(4)は意味を考えれば明らかとしていいだろ

う. \(^o^)/

10 5 0 5 10

0 0.2 0.4 0.6 0.8 1

x F(x)

N(0,1) Exp(1)

t1 χ24 B(10,0.5)

Poi(3)

図1: 累積分布関数のグラフの例(各分布の詳細はA 節参照).二項分布やPoisson分布のように離散 型の場合はジャンプする.指数分布やχ2分布では負の値をとらないので分布関数はx= 0で立ち上が る.t 分布は正規分布より裾が重いのを反映してなだらか.このように,分布関数のグラフを見るだけ でもかなりの事はわかる.

定理の(2)より分布関数は確率変数に関する確率の全情報を持っていると言えるので,数学的には分 布関数がわかっていれば十分なのだが,実際には次で定義される密度関数を用いて議論することが多 い.(初等的な本だと分布関数には一言も触れない場合もある.)

定義4.7(密度関数(質量関数)). (1)連続的な値をとる(連続型)確率変数X の分布関数FX(x)

38 4 確率変数・確率分布と期待値・分散 に対して

FX(x) =

x

−∞

pX(t)dt

となる関数 pX(x)をX の(確率)密度関数 (density function) という.

(2) とびとびな値 x0, x1, x2, . . . をとる(離散型)確率変数X には密度関数は存在しないが,

代わりに pX(k) :=P(X =xk) (k= 0,1,2, . . .)とすると FX(x) = ∑

xkx

pX(k) となり密度関数と同じ働きをする.(ここの∑

は,xk ≤xを満たす全てのkについて足し合わ せる,という意味.)pX(k)を(確率)質量関数ということにする.

密度関数(質量関数)についても,確率変数X が明かな場合は省略して単にp(x)と書くことにする.

密度関数と累積分布関数のグラフの概形は典型的には図2のようになる.密度関数はヒストグラムの ようなもので分布の様子を直感的にイメージしやすいので,統計の議論のほとんどは密度関数を用いて 行われるが,数学的には分布関数の方が普遍的で基本的であることも一言注意しておく*17

0 1

x

0 x t

F(x) =

x

−∞

p(t)dt

F(x) p(t)

図2: 密度関数と累積分布関数の関係.

補足4.8. 測度論を知っていれば,質量関数は可算集合上のcounting measureに対する

Radon-Nikodym 導関数なので,質量関数も密度関数もどちらも密度関数と言って問題ない.(測度論を

仮定した確率論の本なら質量関数という言葉は使わない.)

ただ,ほとんどの教科書は離散型と連続型で説明を分けているので,ここでは世間一般の流儀に 従っておく.

さて,異なる確率変数でも同じ分布関数を持つことはある.(例えばサイコロ振りの1回目と2回目 は確率変数としては異なるが分布は同じである.)しかしながら,

分布関数(密度関数・質量関数)が等しい確率変数の期待値・分散などは全て一致する.

このことから,統計で確率変数を考える際には基礎の標本空間や確率測度よりも分布関数の方が重要と 言える.多くの統計の教科書で確率空間が表に出てこない(出さずに済む)のはこのためである.

具体的にどのような密度関数があるのか,代表的なものはA節とB節にまとめてあるので,ここで は一般的な性質を概観しておく.

次の命題は定義からほぼ明らかなので証明抜きで認めてしまおう.

*17そもそも定義が分布関数の方がシンプルだし,密度関数や質量関数は常に存在するとは限らないが分布関数は全ての確率 変数に対して必ず定義される.

ドキュメント内 数理統計学Iノート (ページ 36-39)