統計学 I
北門 利英(海洋生物資源学科)
Lecture 6
2項分布 (復習)
Binomial distribution
2 項分布とは
2項分布 定義
確率変数 Y が試行数 N , 試行の成功確率 p (0 ≦ p ≦ 1)
をもつ2項分布に従うとは, Y が確率関数
をもつことをいう.とくに,このことを
と略記する.
~ ( , )
Y Bin N p
( ) N y (1 ) N y ( 0,1, 2,..., )
P Y y p p y N
y
−
=
= − =
2 項分布の性質 (I)
0 1
1 1
1
1 0
1
[ ] (1 ) ! (1 )
!( )!
( 1)!
(1 )
( 1)!( )!
( 1)!
(1 )
!( 1 )!
( 1 )
N N
y N y y N y
y y
N
y N y
y N
z N z
z
N
N N
E Y y p p y p p
y y N y
Np N p p
y N y
Np N p p
z N z
Np p p Np
− −
==
− −
=
− − −
=
−
= − = −
−
=− −
− −
=− −
− −
= + − =
∑ ∑
∑
∑
2項分布
0
( )
N
N y N y
y
a b N a b
y
−
=
+ =
∑
2 項定理 より
0 0
( ) (1 ) 1
N N
y N y
y y
P Y y N p p
y
−
==
== − =
∑ ∑
2 項分布の性質 (2)
0
2 2
2
2
2 2
0
2 2
2
[ ( 1)] ( 1) (1 )
( 2)!
( 1) (1 )
( 2)!( )!
( 2)!
( 1) (1 )
!( )!
( 1) ( 1 )
( 1)
N
y N y
y
N
y N y
y
N
z N z
z
N
E Y Y y y N p p
y
N N p N p p
y N y
N N p N p p
z N y
N N p p p
N N p
−
=
− −
=
− − −
=
−
− = − −
−
= − −
− −
= − − −
−
= − + −
= −
∑
∑
∑
2項分布
2
2 2
[ ] [ ( 1)] [ ] [ ]
( 1) ( )
V Y E Y Y E Y E Y
N N p Np Np
= − + −
= − + −
= −
視聴率調査( 1 )
関東地区日曜6時40分の調査
但し,視聴率の推定値の標準
偏差を0.01以下にしたい
何世帯をサンプリングすれば
よいであろうか?
p :サザエさんを見ている人の割合
1-p :サザエを見ていない人の割合
見てない
NHK
NHK
NHK
BS
見てない
テレ朝
テレ朝
教育
サザエさん
サザエさん
サザエさん
サザエさん
サザエさん
サザエさん
~ ( , )
ˆ
Y Bin N p
p Y
= N
ハプロタイプカウントの確率分布
2項分布
視聴率調査( 2 )
[ ]
[ ]
2 2
ˆ
1 1
[ ] ˆ
1 1 (1 )
[ ] ˆ (1 )
p Y
N
E p E Y E Y Np p
N N N
Y p p
V p V V Y Np p
N N N N
=
= = = =
−
= = = − =
ただし,調査前は p は未知の値
(1 )
[ ] ˆ p p 0.01
SD p N
= − ≤
左辺は p=0.5 の時に最大.従って, p=0.5 を想定すれば
0.5(1 0.5)
[ ] ˆ 0.01 2500
SD p = − ≤ ⇔ N ≥
ハプロタイプカウントの確率分布
2項分布
視聴率調査( 3 )
しかし視聴率50%は「お化け番組」
もう少し現実な値を考え,高々p=0.2と想定すれば
0. (1 0.2)
[ ] ˆ 0.01 1600
SD p N
N
= 2 − ≤ ⇔ ≥
高々p=0.1と想定すれば
0. (1 0.1)
[ ] ˆ 0.01 900
SD p N
N
= 1 − ≤ ⇔ ≥
このように,必要とされる精度(分散)に応じてサンプル数
に関して決定を下すことができる.
(なお,ビデオリサーチでは関東で600世帯をサンプリング
している)
ハプロタイプカウントの確率分布
2項分布
ポアソン分布
Poisson distribution
ポアソン分布とは
定義 ポアソン分布
確率変数 Y が期待値 λ ( λ >0) をもつポアソン分布に従
うとは, Y が確率分布
をもつことをいう.とくに,このことを
と略記する.
~ ( )
Y Po λ
( ) ( 0,1, 2,...)
!
e y
P Y y y
y
λ λ
= = − =
ポアソン分布の性質
ポアソン分布
0 0 0
( ) 1
! !
y y
y y y
P Y y e e e e
y y
λ λ λ λ λ λ
∞ ∞ − ∞
− −
== =
= = = = =
∑ ∑ ∑
0
[ ] ( )
y
E Y y P Y y
∞
= ∑
== =
0
[ ( 1)] ( 1) ( )
y
E Y Y y y P Y y
∞
− =
=− =
=
∑
[ ] [ ( 1)] [ ] [ ] 2
V Y = E Y Y − + E Y − E Y =
Maclaurin 展開(see 補足)
ポアソン分布の例
ポアソン分布
あるアワビ漁場で区画サンプリングを行ったときの
個体数の確率分布
刺網に到達する魚の単位時間あたりの数
ミンククジラの5分間当たりの浮上回数
...
2項分布とポアソンの違いは
2項分布 Y = 0, 1, 2, …, N 上限有
ポアソン分布 Y = 0, 1, 2, 3, ………… 上限無
2 項分布のポアソン分布近似
N → ∞, p → 0 (Np → λ) の時 , Bin(N,p) は Po( λ) に近づく
ポアソン分布
各自 N, p などの値を
変えてみてグラフ書きに
トライしてみてください!
補足: Taylor 展開
ポアソン分布
「農学・水産学系学生のための数理科学入門」
第 1 章 数学 (北門著) より抜粋
補足: Maclaurin 展開
ポアソン分布
補足: Maclaurin 展開による関数の近似
ポアソン分布
4.
補足: Maclaurin 展開による関数の近似 (R コード )
ポアソン分布
curve(exp(x), xlim=c(-1,3), xlab=" ", ylab=" ", lwd=2, cex=1.5, ylim=c(0, exp(3)))
curve(1+x, lwd=2, cex=1.5, add=T, lty=2)
curve(1+x+x^2/2, lwd=2, cex=1.5, add=T, lty=3)
curve(1+x+x^2/2+x^3/6, lwd=2, cex=1.5, add=T, lty=4)
curve(1+x+x^2/2+x^3/6+x^4/24, lwd=2, cex=1.5, add=T, lty=5)
curve(1+x+x^2/2+x^3/6+x^4/24+x^5/120, lwd=2, cex=1.5, add=T, lty=6)
legend(-0.8,20,lty=c(1,6,5,4,3,2),
legend=c("exp(x)", "n=5", "n=4", "n=3", "n=2","n=1"),
bty="n", cex=1
)
三角関数にも挑戦してみてください!
連続型分布の基礎
連続型の確率変数と確率分布
連続型確率変数:整数や自然数などの離散的な値をとる
連続型確率分布:離散型確率変数に対する確率分布
離散型分布の確率関数 連続型分布
( ) b ( )
P a < ≤ = Y b ∫ a f y dy
標本空間 数直線のある区間
確率分布
標本空間の特定の
値に対して確率を
付与できない!
区間に対して確率
を定義する
確率密度関数
a b
連続型確率変数の期待値,分散,標準偏差
確率変数の特性値の定義確認 連続型分布
2 2
[ ] [ ] [ ]
[ ] [ ] [ ] ( )
A A B B A A B B
A A B B A A B B A B
E Y Y E Y E Y
V Y Y V Y V Y Y Y
ω ω ω ω
ω ω ω ω
⋅ + ⋅ = ⋅ + ⋅
⋅ + ⋅ = ⋅ + ⋅ ⊥
分散(variance)
標準偏差(standard deviation) SD Y [ ] = V Y [ ]
期待値(expectation) E Y [ ] = ∫ f y dy ( )
期待値と分散の性質 (離散型と同じ)
2 2
[ ] [( [ ]) ] ( [ ]) ( )
V Y = − V Y E Y = − ∫ y E Y f y dy
正規分布
Normal distribution
大泉ステーションのニジマスの体長組成
正規分布
体長階級(cm) 階級値 (cm) 度数
9.0-10.0 9.5 1
10.0-11.0 10.5 1
11.0-12.0 11.5 10
12.0-13.0 12.5 20
13.0-14.0 13.5 69
14.0-15.0 14.5 172
15.0-16.0 15.5 284
16.0-17.0 16.5 410
17.0-18.0 17.5 431
18.0-19.0 18.5 356
19.0-20.0 19.5 307
20.0-21.0 20.5 203
21.0-22.0 21.5 99
22.0-23.0 22.5 45
23.0-24.0 23.5 32
24.0-25.0 24.5 17
25.0-26.0 25.5 4
26.0-27.0 26.5 1
合計 2451
体長組成を数学的に
表現できないか?
正規分布とは
定義 正規分布
2 2
( ) 1
[ ] ( )
[ ] ( ) ( )
f y dy
E Y yf y dy
V Y y f y dy
µ
µ σ
∞
−∞
∞
−∞
∞
−∞
=
==
= − =
∫
∫
∫
分散
期待値
正規分布の確率密度関数のグラフ
正規分布
正規分布の確率密度関数の性質
・偶関数で平均 µ に関して対称
・平均 µ に応じて関数はシフトする
・標準偏差 σ が大きくなると横に広がる
大泉ステーションのニジマスの体長組成
正規分布
2
17.73
5.43
µ
σ
=
=
ところでパラメータは
どうやって求める?
次回から学ぶ「統計的推定」
という方法で!
正規分布に関する性質 (1)
性質 正規分布
2
2
~ ( , )
~ (0, )
~ (0,1)
Y N
Y N
Y N
µ σ
µ σ
σ µ
−
−
正規分布に関する性質 (2)
性質 正規分布
正規分布の混合
正規分布
問題
正規分布