•
両方とも二項分布を用いて計算せよポアソン分布
•
歴史– 1837
年にポアソン(Poisson, S.D., 1781-1840)
は2
項分布の極限を考え,
ポアソン分布と 呼ばれる新しい分布を導いた.
–
その後1898
年に,ボルケピッチ(Bortkiewicz, L von, 1868
−1931)
はこの分布が「稀現 象の大量観察」の結果として解釈できることを示した.
彼によれば,
この分布は「プロ シア陸軍で1
年間に ラバ に蹴られて死ぬ兵士の数」にあてはまるという.
– 1910
年,
ラザフォードとガイガー(Rutherford, E, and Geiger
,H.)
は単位時間に放射性 物質から放射される粒子の数にあてはまる報告している.• Poisson
の定理: 2
項分布で,平均N p
を一定値μ
として, N → ∞ , p → 0
と したときに得られる極限分布はP o(x) = e − μ μ x
x! (59)
であらわされ
, Poisson
分布と呼ぶポアソンの定理の証明
• 2
項分布で,平均N p
を一定値μ
として, N → ∞ , p → 0
としたときに得ら れる極限分布はP o(x) = e − μ μ x
x! (60)
•
証明: N p → μ
のとき,(1 − p) N → e − μ
を用いる.
N lim →∞ N C x p x (1 − p) N − x = lim
N →∞
N (N − 1)(N − 2) · · · (N − x + 1)
x! p x (1 − p) N − x
= lim
N →∞
N p(N p − p)(N p − 2p) · · · (N p − (x − 1)p)
x! (1 − p) N − x
= μ x
x! e − μ
ポアソン分布
• P o(x) = e − μ μ x
x! (61)
•
平均: E (x) = μ
–
証明:
∞
x =0
xe − μ μ x x! = μ
∞
x =1
e − μ μ ( x −1)
(x − 1)! = μ (62)
•
分散:V (x) = μ
–
証明:
V (x) =
∞
x =0
x 2 e − μ μ x
x! − E 2 (x) =
∞
x =0
(x(x − 1) + x)e − μ μ x
x! − μ 2
= μ 2
∞
x =2
e − μ μ ( x −2)
(x − 2)! + μ − μ 2 = μ 2 + μ − μ 2 = μ (63)
9. 連続型確率変数の分布
一様分布
•
確率密度関数f (x)
が区間(a, b)
において一定値をとるとき,
その分布を−様 分布(uniform distribution)
といい, U (a, b, x)
で表す.
f (x) = 1
(b − a) a < x < b (64)
•
平均:
E (x) = b
a
x
(b − a) dx = a + b
2 (65)
•
分散:
V (x) = b
a
x 2
(b − a) dx − (a + b) 2
4 = a + b
2 = (a − b) 2
12 (66)
となる.
指数分布
•
ある個体の今後の生存時間(
寿命)
が,
現在までの存続時間と関係なく分布する とすると.
その生存時間x
は指数分布(exponential distribution)
に従うことが わかっている.
したがって,
寿命問題を研究するには有用な分布である.
f (x) = λe − λx , λ > 0, x > 0 (67)
•
平均:
E (x) =
∞
0
xλe − λx dx (68)
–
証明:
部分積分を用いる. f (x) = x, g (x) = λe − λx
とおく. df (x)g(x)
dx = f (x)g (x) + f (x)g(x) (69)
より次式が成立する
.
− xe − λx ∞
0 =
∞
0
xλe − λx dx −
∞
0
e − λx dx (70)
ここで左辺がゼロとなるため
,
次式が得られる. E (x) =
∞
0
xλe − λx dx = 1
λ (71)
指数分布
• f (x) = λe − λx , λ > 0, x > 0 (72)
•
分散V (x) =
∞
0
x 2 λe − λx dx − E 2 (x) = 1
λ 2 (73)
–
証明:
部分積分を用いる. f (x) = x 2 , g (x) = λe − λx
とおく. df (x)g(x)
dx = f (x)g (x) + f (x)g(x) (74)
より次式が成立する
. x 2 e − λx ∞
0 =
∞
0
x 2 λe − λx dx −
∞
0
2xe − λx dx (75)
ここで左辺がゼロとなるため
,
次式が得られる.
∞
0
2xe − λx dx =
∞
0
x 2 λe − λx dx (76)
ところが
,
前述の平均算出結果より,
同式の左辺は2/λ 2
である.
その結果V (x) =
∞
0
x 2 λe − λx dx − E 2 (x) = 2
λ 2 − 1
λ 2 = 1
λ 2 (77)
が成立する
.
正規分布
•
前節の2
項分布で, N
が大きくなると平均値と分散が大きくなって分布は 次第に右の方に移動し平らになるだけではなく,左右が対称の釣り鐘型に なっていく.
•
このような事実から,当初は正規分布は2
項分布の近似と考えられていた.
このことをドウ・モアープル(deMoiwe A., 1667
−1754
)が1773
年に証明 している.
•
正規分布の利用に関するたいていの理論は,後に述べる中心極限定理に基 づいている.ガウスは1816
年に多数の独立な誤差の和の分布として正規分 布を導いた.
•
この分布は,
当初は天文学の研究に用いられたが,
現在はあらゆる分野の研 究に用いられている.
正規分布 ( ガウス分布 )
• f (x) = 1
√ 2πσ e − (
x − μ )2
2 σ 2 , − ∞ < x < ∞ (78)
•
平均: μ
•
分散:σ 2
• N (μ, σ 2 )
•
平均0 ,
分散1
の正規分布を標準正規分布N (0, 1)
とよぶ.
正規分布 ( ガウス分布 ) 一次変換
•
正規分布N (μ, σ 2 )
の確率密度関数f (x)
を利用してp(a < x ≤ b) =
b
a
f (x)dx (79)
を求めれば,任意の区間に対してその確率が得られるはずであるが
,
–
正規分布の確率密度関数f (x)
の不定積分が代数的には求められない. –
近似計算によることになる.–
実際には,この近似計算が標準正規分布N (0, 1)
についてすでに行われて,数表〈標準 正規分布表〉となっている.
•
そこで一般の正規分布N (μ, σ 2 )
における確率を 線形変換しN (0, 1)
の分布 に当てはめて数表より読み取るようにする.
ξ = x − μ
σ (80)
とすると
, ξ
はN (0, 1)
の分布に従う.
正規分布 ( ガウス分布 ) 一次変換
•
定理3.3
確率変数x
が正規分布に従うとき,
その1
次変換y = a + bx (81)
も正規分布に従う
.
•
証明:b = 0
の場合は, y = a
となってy
が確率変数ではなくなるので除外する. x = y − a
b (82)
を
, f (x)dx = (1/( √
2πσ)) exp( − (x − μ) 2 /(2σ 2 ))dx
に代入するとf (x)dx = 1
√ 2πσ e −
(y−a b −μ)2
2σ2
1
b dy = 1
√ 2πσ e −
(y
b−a+bμ b )2 2σ2
1
b dy = 1
√ 2πbσ e −
(y−(a+bμ))2
2(bσ)2
dy (83)
が得られる
.
ここで改めてg(y) = 1
√ 2πbσ e −
(y−(a+bμ))2
2(bσ)2
(84)
を
y
の確率密度関数とおくと, y
は平均a + bμ,
分散bσ
の正規分布に従うことが示される.
10. 多次元分布
2 次元分布
• 2
つのサイコロを投げたとき,
または定期試験と中間試験の成績を比較した ときのように, 2
つの確率変数を組にして考えることがある.
そのような組 に対して,
それがある値の組をとる.
あるいはある範囲に含まれるという事 象の確率が与えられているとき,
組(x, y)
を2
次元の確率変数という.
• 2
次元の確率変数についても,
離散型と連続型とに区分して考える.
(73, 75) (79, 70) (71, 95) (64, 85) (87, 95)
(82, 95) (71, 50) (58, 75) (19, 15) (87, 75)
(74, 50) (79, 80) (74, 95) (63, 50) (74, 50)
(66, 50) (75, 50) (58, 70) (85, 70) (84, 95)
(93, 70) (20, 0) (51, 15) (75, 75) (68, 85)
(63, 75) (71, 20) (72, 70) (86, 70) (67, 95)
(75, 50) (78, 95) (65, 50) (71, 90) (42, 75)
(84, 70) (85, 75) (62, 75) (57, 95) (83, 60)
(82, 70) (72, 15) (81, 95) (75, 50) (85, 75)
(70, 64) (61, 30) (92, 95) (47, 40) ( 0, 0)
2 次元分布
•
中間試験結果 と 定期試験結果0 10 20 30 40 50 60 70 80 90
0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
10 0.0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
20 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
30 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
40 0.0 0.0 0.0 0.0 0.02 0.0 0.0 0.02 0.0 0.0
50 0.0 0.02 0.02 0.0 0.0 0.0 0.0 0.04 0.0 0.02
60 0.0 0.0 0.0 0.02 0.0 0.06 0.0 0.04 0.04 0.02
70 0.0 0.0 0.02 0.0 0.0 0.12 0.02 0.08 0.02 0.08
80 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.14 0.08 0.0
90 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.0 0.02
周辺分布
•
中間試験結果 と 定期試験結果0 10 20 30 40 50 60 70 80 90
0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02
10 0.0 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02
20 0.02 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02
30 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
40 0.0 0.0 0.0 0.0 0.02 0.0 0.0 0.02 0.0 0.0 0.04
50 0.0 0.02 0.02 0.0 0.0 0.0 0.0 0.04 0.0 0.02 0.1
60 0.0 0.0 0.0 0.02 0.0 0.06 0.0 0.04 0.04 0.02 0.18
70 0.0 0.0 0.02 0.0 0.0 0.12 0.02 0.08 0.02 0.08 0.34
80 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.14 0.08 0.0 0.24
90 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.02 0.0 0.02 0.04
0.04 0.04 0.04 0.02 0.02 0.18 0.04 0.34 0.14 0.14 1
周辺分布
• 2
次元の確率変数P (x, y)
についてp(x, y) = p x (y)p y (x), x, y = 0, 10, 20, 30, 40, 50, 60, 70, 80, 90 (85)
となるとき,確率変数x , y
は互いに独立(independent)
であるといい,そう でないとき従属(dependent)
であるという.–
定期試験の成績と中間試験の成績は 互いに独立とはいえないことが前述 の表からも示される.
•
ここでp(x, y)
は同時確率であり• p x (y)
はx
に関する周辺確率であり• p y (x)
はy
に関する周辺確率である
ドキュメント内
tokei01.dvi
(ページ 41-56)