統計学 I (H25 前期 水曜 3限 & 5限) Toshihide Kitakado's Website Lec6

30 

Loading....

Loading....

Loading....

Loading....

Loading....

全文

(1)

統計学 I

北門

利英(海洋生物資源学科)

(2)

2項分布 (復習)

(3)

2

項分布とは

定義

2項分布

確率変数

Y

が試行数

N

, 試行の成功確率

p (0

p

1)

をもつ2項分布に従うとは,

Y

が確率関数

をもつことをいう.とくに,このことを

と略記する.

~

( , )

Y

Bin N p

(

)

N

y

(1

)

N y

(

0,1, 2,...,

)

P Y

y

p

p

y

N

y

 

=

=

 

=

(4)

2

項分布の性質

(I)

0

1

1

1

1

1

0

1

!

[ ]

(1

)

(1

)

!(

)!

(

1)!

(1

)

(

1)!(

)!

(

1)!

(1

)

!(

1

)!

(

1

)

N

N

y

N y

y

N y

y

y

N

y

N y

y

N

z

N

z

z

N

N

N

E Y

y

p

p

y

p

p

y

y N

y

N

Np

p

p

y

N

y

N

Np

p

p

z N

z

Np p

p

Np

==

=

− −

=

 

=

 

=

 

=−

=−

− −

=

+ −

=

2項分布

0

(

)

N

N

y

N y

y

N

a b

a b

y

=

 

+

=  

 

2

項定理 より

0

0

(

)

(1

)

1

N

N

y

N y

y

y

N

P Y

y

p

p

(5)

2

項分布の性質

(2)

0

2

2

2

2

2

2

0

2

2

2

[ (

1)]

(

1)

(1

)

(

2)!

(

1)

(1

)

(

2)!(

)!

(

2)!

(

1)

(1

)

!(

)!

(

1)

(

1

)

(

1)

N

y

N y

y

N

y

N y

y

N

z

N

z

z

N

N

E Y Y

y y

p

p

y

N

N N

p

p

p

y

N

y

N

N N

p

p

p

z N

y

N N

p

p

p

N N

p

=

=

− −

=

 

− =

 

 

=

=

=

+ −

=

2項分布

2

2

2

[ ]

[ (

1)]

[ ]

[ ]

(

1)

(

)

V Y

E Y Y

E Y

E Y

N N

p

Np

Np

=

− +

=

+

(6)

視聴率調査(

1

関東地区日曜6時40分の調査

但し,視聴率の推定値の

標準

偏差を0.01

以下にしたい

何世帯をサンプリングすれば

よいであろうか?

p

:サザエさんを見ている人の割合

1-p

:サザエを見ていない人の割合

見てない

NHK

NHK

NHK

BS

見てない

テレ朝

テレ朝

教育

サザエさん

サザエさん

サザエさん

サザエさん

サザエさん

サザエさん

~

( , )

ˆ

Y

Bin N p

Y

p

N

=

ハプロタイプカウントの確率分布

(7)

視聴率調査(

2

[ ]

[ ]

2

2

ˆ

1

1

ˆ

[ ]

1

1

(1

)

ˆ

[ ]

(1

)

Y

p

N

Y

E p

E

E Y

Np

p

N

N

N

Y

p

p

V p

V

V Y

Np

p

N

N

N

N

=

 

=

 

=

=

=

 

 

=

 

=

=

− =

 

ただし,調査前は

p

は未知の値

(1

)

ˆ

[ ]

p

p

0.01

SD p

N

=

左辺は

p=0.5

の時に最大.従って,

p=0.5

を想定すれば

0.5(1 0.5)

ˆ

[ ]

0.01

2500

SD p

=

N

ハプロタイプカウントの確率分布

(8)

視聴率調査(

3

しかし視聴率50%は「お化け番組」

もう少し現実な値を考え,高々p=0.2と想定すれば

0. (1 0.2)

ˆ

[ ]

0.01

1600

SD p

N

N

=

2

高々p=0.1と想定すれば

0. (1 0.1)

ˆ

[ ]

0.01

900

SD p

N

N

=

1

このように,必要とされる精度(分散)に応じてサンプル数

に関して決定を下すことができる.

(なお,ビデオリサーチでは関東で600世帯をサンプリング

している)

ハプロタイプカウントの確率分布

(9)

ポアソン分布

(10)

ポアソン分布とは

定義

ポアソン分布

確率変数

Y

が期待値

λ

(

λ

>0)

をもつポアソン分布に従

うとは,

Y

が確率分布

をもつことをいう.とくに,このことを

と略記する.

~

( )

Y

Po

λ

(

)

(

0,1, 2,...)

!

y

e

P Y

y

y

y

λ

λ

(11)

ポアソン分布の性質

ポアソン分布

0

0

0

(

)

1

!

!

y

y

y

y

y

e

P Y

y

e

e

e

y

y

λ

λ

λ λ

λ

λ

== =

= =

=

=

=

0

[ ]

(

)

y

E Y

y P Y

y

=

=

= =

0

[ (

1)]

(

1) (

)

y

E Y Y

y y

P Y

y

=

− =

=

=

2

[ ]

[ (

1)]

[ ]

[ ]

V Y

=

E Y Y

− +

E Y

E Y

=

(12)

ポアソン分布の例

ポアソン分布

あるアワビ漁場で区画サンプリングを行ったときの

個体数の確率分布

刺網に到達する魚の単位時間あたりの数

ミンククジラの5分間当たりの浮上回数

...

2項分布とポアソンの違いは

(13)

2

項分布のポアソン分布近似

N

→ ∞

, p

0 (Np

λ

)

の時

,

Bin(N,p)

Po(

λ

)

に近づく

ポアソン分布

各自

N, p

などの値を

変えてみてグラフ書きに

(14)

補足:

Taylor

展開

ポアソン分布

(15)

補足:

Maclaurin

展開

(16)

補足:

Maclaurin

展開による関数の近似

ポアソン分布

(17)

補足:

Maclaurin

展開による関数の近似

(R

コード

)

ポアソン分布

curve(exp(x), xlim=c(-1,3), xlab=" ", ylab=" ", lwd=2, cex=1.5, ylim=c(0, exp(3)))

curve(1+x, lwd=2, cex=1.5, add=T, lty=2)

curve(1+x+x^2/2, lwd=2, cex=1.5, add=T, lty=3)

curve(1+x+x^2/2+x^3/6, lwd=2, cex=1.5, add=T, lty=4)

curve(1+x+x^2/2+x^3/6+x^4/24, lwd=2, cex=1.5, add=T, lty=5)

curve(1+x+x^2/2+x^3/6+x^4/24+x^5/120, lwd=2, cex=1.5, add=T, lty=6)

legend(-0.8,20,lty=c(1,6,5,4,3,2),

legend=c("exp(x)", "n=5", "n=4", "n=3", "n=2","n=1"),

bty="n", cex=1

)

(18)
(19)

連続型の確率変数と確率分布

連続型

確率変数:整数や自然数などの離散的な値をとる

連続型

確率分布:離散型確率変数に対する確率分布

離散型分布の確率関数

連続型分布

(

)

b

( )

a

P a

< ≤ =

Y

b

f y dy

標本空間

数直線のある区間

確率分布

標本空間の特定の

値に対して確率を

付与できない!

区間に対して確率

を定義する

確率密度関数

(20)

連続型確率変数の期待値,分散,標準偏差

確率変数の特性値の定義確認

連続型分布

2

2

[

]

[

]

[

]

[

]

[

]

[

]

(

)

A

A

B

B

A

A

B

B

A

A

B

B

A

A

B

B

A

B

E

Y

Y

E Y

E Y

V

Y

Y

V Y

V Y

Y

Y

ω

ω

ω

ω

ω

ω

ω

ω

⋅ + ⋅

=

+ ⋅

⋅ + ⋅

=

+ ⋅

分散(variance)

標準偏差(standard deviation)

SD Y

[ ]

=

V Y

[ ]

期待値(expectation)

E Y

[ ]

=

f y dy

( )

期待値と分散の性質 (離散型と同じ)

2

2

[ ]

[(

[ ]) ]

(

[ ])

( )

(21)

正規分布

(22)

大泉ステーションのニジマスの体長組成

正規分布

体長階級

(cm)

階級値

(cm)

度数

9.0-10.0

9.5

1

10.0-11.0

10.5

1

11.0-12.0

11.5

10

12.0-13.0

12.5

20

13.0-14.0

13.5

69

14.0-15.0

14.5

172

15.0-16.0

15.5

284

16.0-17.0

16.5

410

17.0-18.0

17.5

431

18.0-19.0

18.5

356

19.0-20.0

19.5

307

20.0-21.0

20.5

203

21.0-22.0

21.5

99

22.0-23.0

22.5

45

23.0-24.0

23.5

32

24.0-25.0

24.5

17

25.0-26.0

25.5

4

26.0-27.0

26.5

1

合計

2451

(23)

正規分布とは

定義

正規分布

2

2

( )

1

[ ]

( )

[ ]

(

)

( )

f y dy

E Y

yf y dy

V Y

y

f y dy

µ

µ

σ

−∞

−∞

−∞

=

==

= −

=

分散

(24)

正規分布の確率密度関数のグラフ

正規分布

正規分布の確率密度関数の性質

・偶関数で平均

µ

に関して対称

・平均

µ

に応じて関数はシフトする

(25)

大泉ステーションのニジマスの体長組成

正規分布

2

17.73

5.43

µ

σ

=

=

ところでパラメータは

どうやって求める?

(26)

正規分布に関する性質

(1)

性質

正規分布

2

2

~

( ,

)

~

(0,

)

~

(0,1)

Y

N

Y

N

Y

N

µ σ

µ

σ

µ

σ

(27)

正規分布に関する性質

(2)

性質

(28)

正規分布の混合

(29)

問題

正規分布

(30)

次回

(5/29)

の予定

基本事項

パラメータの推定とは?

推定の不偏性

推定の誤差

なお,その他の確率分布については,推定や検定の

ところで適宜触れます.別途配布した資料は毎回

持ってくること!

Updating...

参照

Updating...

関連した話題 :