• 検索結果がありません。

それでは , 10 打席中 3 安打以上 5 安打以下の確率を予想せよ

ドキュメント内 tokei01.dvi (ページ 41-56)

両方とも二項分布を用いて計算せよ

ポアソン分布

歴史

– 1837

年にポアソン

(Poisson, S.D., 1781-1840)

2

項分布の極限を考え

,

ポアソン分布と 呼ばれる新しい分布を導いた

.

その後

1898

年に,ボルケピッチ

(Bortkiewicz, L von, 1868

1931)

はこの分布が「稀現 象の大量観察」の結果として解釈できることを示した

.

彼によれば

,

この分布は「プロ シア陸軍で

1

年間に ラバ に蹴られて死ぬ兵士の数」にあてはまるという

.

– 1910

,

ラザフォードとガイガー

(Rutherford, E, and Geiger

H.)

は単位時間に放射性 物質から放射される粒子の数にあてはまる報告している.

Poisson

の定理

: 2

項分布で,平均

N p

を一定値

μ

として

, N → ∞ , p 0

したときに得られる極限分布は

P o(x) = e μ μ x

x! (59)

であらわされ

, Poisson

分布と呼ぶ

ポアソンの定理の証明

2

項分布で,平均

N p

を一定値

μ

として

, N → ∞ , p 0

としたときに得ら れる極限分布は

P o(x) = e μ μ x

x! (60)

証明

: N p μ

のとき,

(1 p) N e μ

を用いる

.

N lim →∞ N C x p x (1 p) N x = lim

N →∞

N (N 1)(N 2) · · · (N x + 1)

x! p x (1 p) N x

= lim

N →∞

N p(N p p)(N p 2p) · · · (N p (x 1)p)

x! (1 p) N x

= μ x

x! e μ

ポアソン分布

P o(x) = e μ μ x

x! (61)

平均

: E (x) = μ

証明

:

x =0

xe μ μ x x! = μ

x =1

e μ μ ( x −1)

(x 1)! = μ (62)

分散

:V (x) = μ

証明

:

V (x) =

x =0

x 2 e μ μ x

x! E 2 (x) =

x =0

(x(x 1) + x)e μ μ x

x! μ 2

= μ 2

x =2

e μ μ ( x −2)

(x 2)! + μ μ 2 = μ 2 + μ μ 2 = μ (63)

9. 連続型確率変数の分布

一様分布

確率密度関数

f (x)

が区間

(a, b)

において一定値をとるとき

,

その分布を−様 分布

(uniform distribution)

といい

, U (a, b, x)

で表す

.

f (x) = 1

(b a) a < x < b (64)

平均

:

E (x) = b

a

x

(b a) dx = a + b

2 (65)

分散

:

V (x) = b

a

x 2

(b a) dx (a + b) 2

4 = a + b

2 = (a b) 2

12 (66)

となる.

指数分布

ある個体の今後の生存時間

(

寿命

)

,

現在までの存続時間と関係なく分布する とすると

.

その生存時間

x

は指数分布

(exponential distribution)

に従うことが わかっている

.

したがって

,

寿命問題を研究するには有用な分布である

.

f (x) = λe λx , λ > 0, x > 0 (67)

平均

:

E (x) =

0

xλe λx dx (68)

証明

:

部分積分を用いる

. f (x) = x, g (x) = λe λx

とおく

. df (x)g(x)

dx = f (x)g (x) + f (x)g(x) (69)

より次式が成立する

.

xe λx

0 =

0

xλe λx dx

0

e λx dx (70)

ここで左辺がゼロとなるため

,

 次式が得られる

. E (x) =

0

xλe λx dx = 1

λ (71)

指数分布

f (x) = λe λx , λ > 0, x > 0 (72)

分散

V (x) =

0

x 2 λe λx dx E 2 (x) = 1

λ 2 (73)

証明

:

部分積分を用いる

. f (x) = x 2 , g (x) = λe λx

とおく

. df (x)g(x)

dx = f (x)g (x) + f (x)g(x) (74)

より次式が成立する

. x 2 e λx

0 =

0

x 2 λe λx dx

0

2xe λx dx (75)

ここで左辺がゼロとなるため

,

 次式が得られる

.

0

2xe λx dx =

0

x 2 λe λx dx (76)

ところが

,

前述の平均算出結果より

,

同式の左辺は

2/λ 2

である

.

その結果

V (x) =

0

x 2 λe λx dx E 2 (x) = 2

λ 2 1

λ 2 = 1

λ 2 (77)

が成立する

.

正規分布

前節の

2

項分布で

, N

が大きくなると平均値と分散が大きくなって分布は 次第に右の方に移動し平らになるだけではなく,左右が対称の釣り鐘型に なっていく

.

このような事実から,当初は正規分布は

2

項分布の近似と考えられていた

.

このことをドウ・モアープル

(deMoiwe A., 1667

1754

)が

1773

年に証明 している

.

正規分布の利用に関するたいていの理論は,後に述べる中心極限定理に基 づいている.ガウスは

1816

年に多数の独立な誤差の和の分布として正規分 布を導いた

.

この分布は

,

当初は天文学の研究に用いられたが

,

現在はあらゆる分野の研 究に用いられている

.

正規分布 ( ガウス分布 )

f (x) = 1

2πσ e (

x μ )2

2 σ 2 , − ∞ < x < (78)

平均

: μ

分散

2

N (μ, σ 2 )

平均

0 ,

分散

1

の正規分布を標準正規分布

N (0, 1)

とよぶ

.

正規分布 ( ガウス分布 ) 一次変換

正規分布

N (μ, σ 2 )

の確率密度関数

f (x)

を利用して

p(a < x b) =

b

a

f (x)dx (79)

を求めれば,任意の区間に対してその確率が得られるはずであるが

,

正規分布の確率密度関数

f (x)

の不定積分が代数的には求められない

.

近似計算によることになる.

実際には,この近似計算が標準正規分布

N (0, 1)

についてすでに行われて,数表〈標準 正規分布表〉となっている

.

そこで一般の正規分布

N (μ, σ 2 )

における確率を 線形変換し

N (0, 1)

の分布 に当てはめて数表より読み取るようにする

.

ξ = x μ

σ (80)

とすると

, ξ

N (0, 1)

の分布に従う

.

正規分布 ( ガウス分布 ) 一次変換

定理

3.3

確率変数

x

が正規分布に従うとき

,

その

1

次変換

y = a + bx (81)

も正規分布に従う

.

証明

:b = 0

の場合は

, y = a

となって

y

が確率変数ではなくなるので除外する

. x = y a

b (82)

, f (x)dx = (1/(

2πσ)) exp( (x μ) 2 /(2σ 2 ))dx

に代入すると

f (x)dx = 1

2πσ e

(y−a b −μ)2

2σ2

1

b dy = 1

2πσ e

(y

b−a+bμ b )2 2σ2

1

b dy = 1

2πbσ e

(y−(a+bμ))2

2(bσ)2

dy (83)

が得られる

.

ここで改めて

g(y) = 1

2πbσ e

(y−(a+bμ))2

2(bσ)2

(84)

y

の確率密度関数とおくと

, y

は平均

a + bμ,

分散

の正規分布に従うことが示される

.

10. 多次元分布

2 次元分布

2

つのサイコロを投げたとき

,

または定期試験と中間試験の成績を比較した ときのように

, 2

つの確率変数を組にして考えることがある

.

そのような組 に対して

,

それがある値の組をとる

.

あるいはある範囲に含まれるという事 象の確率が与えられているとき

,

(x, y)

2

次元の確率変数という

.

2

次元の確率変数についても

,

離散型と連続型とに区分して考える

.

(73, 75) (79, 70) (71, 95) (64, 85) (87, 95)

(82, 95) (71, 50) (58, 75) (19, 15) (87, 75)

(74, 50) (79, 80) (74, 95) (63, 50) (74, 50)

(66, 50) (75, 50) (58, 70) (85, 70) (84, 95)

(93, 70) (20, 0) (51, 15) (75, 75) (68, 85)

(63, 75) (71, 20) (72, 70) (86, 70) (67, 95)

(75, 50) (78, 95) (65, 50) (71, 90) (42, 75)

(84, 70) (85, 75) (62, 75) (57, 95) (83, 60)

(82, 70) (72, 15) (81, 95) (75, 50) (85, 75)

(70, 64) (61, 30) (92, 95) (47, 40) ( 0, 0)

2 次元分布

中間試験結果 と 定期試験結果

0 10 20 30 40 50 60 70 80 90

0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

10 0.0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

20 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

30 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

40 0.0 0.0 0.0 0.0 0.02 0.0 0.0 0.02 0.0 0.0

50 0.0 0.02 0.02 0.0 0.0 0.0 0.0 0.04 0.0 0.02

60 0.0 0.0 0.0 0.02 0.0 0.06 0.0 0.04 0.04 0.02

70 0.0 0.0 0.02 0.0 0.0 0.12 0.02 0.08 0.02 0.08

80 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.14 0.08 0.0

90 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.0 0.02

周辺分布

中間試験結果 と 定期試験結果

0 10 20 30 40 50 60 70 80 90

0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02

10 0.0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02

20 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02

30 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

40 0.0 0.0 0.0 0.0 0.02 0.0 0.0 0.02 0.0 0.0 0.04

50 0.0 0.02 0.02 0.0 0.0 0.0 0.0 0.04 0.0 0.02 0.1

60 0.0 0.0 0.0 0.02 0.0 0.06 0.0 0.04 0.04 0.02 0.18

70 0.0 0.0 0.02 0.0 0.0 0.12 0.02 0.08 0.02 0.08 0.34

80 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.14 0.08 0.0 0.24

90 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.0 0.02 0.04

0.04 0.04 0.04 0.02 0.02 0.18 0.04 0.34 0.14 0.14 1

周辺分布

2

次元の確率変数

P (x, y)

について

p(x, y) = p x (y)p y (x), x, y = 0, 10, 20, 30, 40, 50, 60, 70, 80, 90 (85)

となるとき,確率変数

x , y

は互いに独立

(independent)

であるといい,そう でないとき従属

(dependent)

であるという.

定期試験の成績と中間試験の成績は 互いに独立とはいえないことが前述 の表からも示される

.

ここで

p(x, y)

は同時確率であり

p x (y)

x

に関する周辺確率であり

p y (x)

y

に関する周辺確率である

ドキュメント内 tokei01.dvi (ページ 41-56)

関連したドキュメント