それでは , 10 打席中 3 安打以上 5 安打以下の確率を予想せよ

•

両方とも二項分布を用いて計算せよ

ポアソン分布

•

^歴史

– 1837

年にポアソン

(Poisson, S.D., 1781-1840)

は

2

項分布の極限を考え

,

ポアソン分布と呼ばれる新しい分布を導いた

.

–

その後

1898

年に，ボルケピッチ

(Bortkiewicz, L von, 1868

−

1931)

はこの分布が「稀現象の大量観察」の結果として解釈できることを示した

.

彼によれば

,

この分布は「プロシア陸軍で

1

年間にラバに蹴られて死ぬ兵士の数」にあてはまるという

.

– 1910

年

,

ラザフォードとガイガー

(Rutherford, E, and Geiger

，

H.)

は単位時間に放射性物質から放射される粒子の数にあてはまる報告している．

• Poisson

の定理

: 2

項分布で，平均

N p

_を一定値

μ

_として

, N → ∞ , p → 0

_としたときに得られる極限分布は

P o(x) = e ⁻ ^μ μ ^x

x! (59)

であらわされ

, Poisson

分布と呼ぶ

ポアソンの定理の証明

• 2

項分布で，平均

N p

_を一定値

μ

_として

, N → ∞ , p → 0

_{としたときに得ら} れる極限分布は

P o(x) = e ⁻ ^μ μ ^x

x! (60)

•

^証明

: N p → μ

_のとき，

(1 − p) ^N → e ⁻ ^μ

_を用いる

.

N lim →∞ N C _x p ^x (1 − p) ^N ⁻ ^x = lim

N →∞

N (N − 1)(N − 2) · · · (N − x + 1)

x! p ^x (1 − p) ^N ⁻ ^x

= lim

N →∞

N p(N p − p)(N p − 2p) · · · (N p − (x − 1)p)

x! (1 − p) ^N ⁻ ^x

= μ ^x

x! e ⁻ ^μ

ポアソン分布

• P o(x) = e ⁻ ^μ μ ^x

x! (61)

•

^平均

: E (x) = μ

–

証明

:

∞

x =0

xe ⁻ ^μ μ ^x x! = μ

∞

x =1

e ⁻ ^μ μ ⁽ ^x ⁻¹⁾

(x − 1)! = μ (62)

•

^分散

:V (x) = μ

–

証明

:

V (x) =

∞

x =0

x ² e ⁻ ^μ μ ^x

x! − E ² (x) =

∞

x =0

(x(x − 1) + x)e ⁻ ^μ μ ^x

x! − μ ²

= μ ²

∞

x =2

e ⁻ ^μ μ ⁽ ^x ⁻²⁾

(x − 2)! + μ − μ ² = μ ² + μ − μ ² = μ (63)

9. 連続型確率変数の分布

一様分布

•

^{確率密度関数}

f (x)

_が区間

(a, b)

において一定値をとるとき

,

その分布を−様分布

(uniform distribution)

といい

, U (a, b, x)

_で表す

.

f (x) = 1

(b − a) a < x < b (64)

•

^平均

:

E (x) = _b

a

x

(b − a) dx = a + b

2 (65)

•

^分散

:

V (x) = _b

a

x ²

(b − a) dx − (a + b) ²

4 = a + b

2 = (a − b) ²

12 (66)

となる．

指数分布

•

ある個体の今後の生存時間

(

寿命

)

が

,

現在までの存続時間と関係なく分布するとすると

.

その生存時間

x

_{は指数分布}

(exponential distribution)

に従うことがわかっている

.

したがって

,

寿命問題を研究するには有用な分布である

.

f (x) = λe ⁻ ^λx , λ > 0, x > 0 (67)

•

平均

:

E (x) =

_∞

0 xλe ⁻ ^λx dx (68)

–

証明

:

部分積分を用いる

. f (x) = x, g (x) = λe ⁻ ^λx

とおく

. df (x)g(x)

dx = f (x)g (x) + f (x)g(x) (69)

より次式が成立する

.

− xe ⁻ ^λx ^∞

0 =

_∞

0 xλe ⁻ ^λx dx −

_∞

0 e ⁻ ^λx dx (70)

ここで左辺がゼロとなるため

,

次式が得られる

. E (x) =

_∞

0 xλe ⁻ ^λx dx = 1

λ (71)

指数分布

• f (x) = λe ⁻ ^λx , λ > 0, x > 0 (72)

•

^分散

V (x) =

_∞

0 x ² λe ⁻ ^λx dx − E ² (x) = 1

λ ² (73)

–

証明

:

部分積分を用いる

. f (x) = x ² , g (x) = λe ⁻ ^λx

_とおく

. df (x)g(x)

dx = f (x)g (x) + f (x)g(x) (74)

より次式が成立する

. x ² e ⁻ ^λx ^∞

0 =

_∞

0 x ² λe ⁻ ^λx dx −

_∞

0 2xe ⁻ ^λx dx (75)

ここで左辺がゼロとなるため

,

次式が得られる

.

_∞

0 2xe ⁻ ^λx dx =

_∞

0 x ² λe ⁻ ^λx dx (76)

ところが

,

前述の平均算出結果より

,

同式の左辺は

2/λ ²

_である

.

その結果

V (x) =

_∞

0 x ² λe ⁻ ^λx dx − E ² (x) = 2

λ ² − 1

λ ² = 1

λ ² (77)

が成立する

.

正規分布

•

^前節の

2

項分布で

, N

が大きくなると平均値と分散が大きくなって分布は次第に右の方に移動し平らになるだけではなく，左右が対称の釣り鐘型になっていく

.

•

このような事実から，当初は正規分布は

2

項分布の近似と考えられていた

.

このことをドウ・モアープル

(deMoiwe A., 1667

−

1754

）が

1773

年に証明している

.

•

正規分布の利用に関するたいていの理論は，後に述べる中心極限定理に基づいている．ガウスは

1816

年に多数の独立な誤差の和の分布として正規分布を導いた

.

•

^{この分布は}

,

当初は天文学の研究に用いられたが

,

現在はあらゆる分野の研究に用いられている

.

正規分布 ( ガウス分布 )

• f (x) = 1

√ 2πσ e ⁻ ⁽

x − μ )2

2 σ 2 , − ∞ < x < ∞ (78)

•

^平均

: μ

•

^分散

:σ ²

• N (μ, σ ² )

•

^平均

0 ,

分散

1

の正規分布を標準正規分布

N (0, 1)

_とよぶ

.

正規分布 ( ガウス分布 ) 一次変換

•

^正規分布

N (μ, σ ² )

_{の確率密度関数}

f (x)

_{を利用して}

p(a < x ≤ b) =

_b

a

f (x)dx (79)

を求めれば，任意の区間に対してその確率が得られるはずであるが

,

–

正規分布の確率密度関数

f (x)

の不定積分が代数的には求められない

. –

近似計算によることになる．

–

実際には，この近似計算が標準正規分布

N (0, 1)

についてすでに行われて，数表〈標準正規分布表〉となっている

.

•

^{そこで一般の正規分布}

N (μ, σ ² )

における確率を線形変換し

N (0, 1)

_の分布に当てはめて数表より読み取るようにする

.

ξ = x − μ

σ (80)

とすると

, ξ

_は

N (0, 1)

_{の分布に従う}

.

正規分布 ( ガウス分布 ) 一次変換

•

^定理

3.3

確率変数

x

_{が正規分布に従うとき}

,

その

1

次変換

y = a + bx (81)

も正規分布に従う

.

•

^証明

:b = 0

の場合は

, y = a

となって

y

が確率変数ではなくなるので除外する

. x = y − a

b (82)

を

, f (x)dx = (1/( √

2πσ)) exp( − (x − μ) ² /(2σ ² ))dx

に代入すると

f (x)dx = 1

√ 2πσ e ⁻

(y−a b −μ)2

2σ2

1 b dy = 1

√ 2πσ e ⁻

b−a+bμ b )2 2σ2

1 b dy = 1

√ 2πbσ e ⁻

(y−(a+bμ))2

2(bσ)2

dy (83)

が得られる

.

ここで改めて

g(y) = 1

√ 2πbσ e ⁻

(y−(a+bμ))2

2(bσ)2

(84)

を

y

の確率密度関数とおくと

, y

は平均

a + bμ,

分散

bσ

の正規分布に従うことが示される

.

10. 多次元分布

2 次元分布

• 2

つのサイコロを投げたとき

,

または定期試験と中間試験の成績を比較したときのように

, 2

つの確率変数を組にして考えることがある

.

そのような組に対して

,

それがある値の組をとる

.

あるいはある範囲に含まれるという事象の確率が与えられているとき

,

組

(x, y)

_を

2

次元の確率変数という

.

• 2

次元の確率変数についても

,

離散型と連続型とに区分して考える

.

(73, 75) (79, 70) (71, 95) (64, 85) (87, 95)

(82, 95) (71, 50) (58, 75) (19, 15) (87, 75)

(74, 50) (79, 80) (74, 95) (63, 50) (74, 50)

(66, 50) (75, 50) (58, 70) (85, 70) (84, 95)

(93, 70) (20, 0) (51, 15) (75, 75) (68, 85)

(63, 75) (71, 20) (72, 70) (86, 70) (67, 95)

(75, 50) (78, 95) (65, 50) (71, 90) (42, 75)

(84, 70) (85, 75) (62, 75) (57, 95) (83, 60)

(82, 70) (72, 15) (81, 95) (75, 50) (85, 75)

(70, 64) (61, 30) (92, 95) (47, 40) ( 0, 0)

2 次元分布

•

中間試験結果と定期試験結果

0 10 20 30 40 50 60 70 80 90

0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

10 0.0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

20 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

30 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

40 0.0 0.0 0.0 0.0 0.02 0.0 0.0 0.02 0.0 0.0

50 0.0 0.02 0.02 0.0 0.0 0.0 0.0 0.04 0.0 0.02

60 0.0 0.0 0.0 0.02 0.0 0.06 0.0 0.04 0.04 0.02

70 0.0 0.0 0.02 0.0 0.0 0.12 0.02 0.08 0.02 0.08

80 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.14 0.08 0.0

90 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.0 0.02

周辺分布

•

中間試験結果と定期試験結果

0 10 20 30 40 50 60 70 80 90

0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02

10 0.0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02

20 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02

30 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

40 0.0 0.0 0.0 0.0 0.02 0.0 0.0 0.02 0.0 0.0 0.04

50 0.0 0.02 0.02 0.0 0.0 0.0 0.0 0.04 0.0 0.02 0.1

60 0.0 0.0 0.0 0.02 0.0 0.06 0.0 0.04 0.04 0.02 0.18

70 0.0 0.0 0.02 0.0 0.0 0.12 0.02 0.08 0.02 0.08 0.34

80 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.14 0.08 0.0 0.24

90 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.0 0.02 0.04

0.04 0.04 0.04 0.02 0.02 0.18 0.04 0.34 0.14 0.14 1

周辺分布

• 2

次元の確率変数

P (x, y)

_について

p(x, y) = p _x (y)p _y (x), x, y = 0, 10, 20, 30, 40, 50, 60, 70, 80, 90 (85)

となるとき，確率変数

x , y

_{は互いに独立}

(independent)

であるといい，そうでないとき従属

(dependent)

であるという．

–

定期試験の成績と中間試験の成績は互いに独立とはいえないことが前述の表からも示される

.

•

^ここで

p(x, y)

_{は同時確率であり}

• p _x (y)

_は

x

に関する周辺確率であり

• p _y (x)

_は

y

に関する周辺確率である

ドキュメント内 tokei01.dvi (ページ 41-56)

それでは , 10 打席中 3 安打以上 5 安打以下の確率を予想せよ

•

ポアソン分布

•

– 1837

(Poisson, S.D., 1781-1840)

2

,

.

–

1898

(Bortkiewicz, L von, 1868

1931)

.

,

1

.

– 1910

,

(Rutherford, E, and Geiger

H.)

• Poisson

: 2

N p

μ

, N → ∞ , p → 0

P o(x) = e − μ μ x

x! (59)

, Poisson

ポアソンの定理の証明

• 2

N p

μ

, N → ∞ , p → 0

P o(x) = e − μ μ x

x! (60)

•

: N p → μ

(1 − p) N → e − μ

.

N lim →∞ N C x p x (1 − p) N − x = lim

N →∞

N (N − 1)(N − 2) · · · (N − x + 1)

x! p x (1 − p) N − x

= lim

N →∞

N p(N p − p)(N p − 2p) · · · (N p − (x − 1)p)

x! (1 − p) N − x

= μ x

x! e − μ

ポアソン分布

• P o(x) = e − μ μ x

x! (61)

•

: E (x) = μ

–

:

∞

x =0

xe − μ μ x x! = μ

∞

x =1

e − μ μ ( x −1)

(x − 1)! = μ (62)

•

:V (x) = μ

–

:

V (x) =

∞

x =0

x 2 e − μ μ x

x! − E 2 (x) =

∞

x =0

(x(x − 1) + x)e − μ μ x

x! − μ 2

= μ 2

∞

x =2

P o(x) = e ⁻ ^μ μ ^x

P o(x) = e ⁻ ^μ μ ^x

(1 − p) ^N → e ⁻ ^μ

N lim →∞ N C _x p ^x (1 − p) ^N ⁻ ^x = lim

x! p ^x (1 − p) ^N ⁻ ^x

x! (1 − p) ^N ⁻ ^x

= μ ^x

x! e ⁻ ^μ

• P o(x) = e ⁻ ^μ μ ^x

xe ⁻ ^μ μ ^x x! = μ

e ⁻ ^μ μ ⁽ ^x ⁻¹⁾

x ² e ⁻ ^μ μ ^x

x! − E ² (x) =

(x(x − 1) + x)e ⁻ ^μ μ ^x

x! − μ ²

= μ ²

e ⁻ ^μ μ ⁽ ^x ⁻²⁾

(x − 2)! + μ − μ ² = μ ² + μ − μ ² = μ (63)

E (x) = _b

V (x) = _b

x ²

(b − a) dx − (a + b) ²

2 = (a − b) ²

f (x) = λe ⁻ ^λx , λ > 0, x > 0 (67)

_∞

xλe ⁻ ^λx dx (68)

. f (x) = x, g (x) = λe ⁻ ^λx

− xe ⁻ ^λx ^∞

_∞

xλe ⁻ ^λx dx −

_∞

e ⁻ ^λx dx (70)

_∞

xλe ⁻ ^λx dx = 1

• f (x) = λe ⁻ ^λx , λ > 0, x > 0 (72)