• 検索結果がありません。

統計学 I (H25 前期 水曜 3限 & 5限) Toshihide Kitakado's Website Lec6

N/A
N/A
Protected

Academic year: 2017

シェア "統計学 I (H25 前期 水曜 3限 & 5限) Toshihide Kitakado's Website Lec6"

Copied!
30
0
0

読み込み中.... (全文を見る)

全文

(1)

統計学 I

北門 利英(海洋生物資源学科)

Lecture 6

(2)

2項分布 (復習)

Binomial distribution

(3)

2 項分布とは

2項分布 定義

確率変数 Y が試行数 N , 試行の成功確率 p (0p 1)

をもつ2項分布に従うとは, Y が確率関数

をもつことをいう.とくに,このことを

と略記する.

~ ( , )

Y Bin N p

( ) N y (1 ) N y ( 0,1, 2,..., )

P Y y p p y N

y

  −

=

=   − =

 

(4)

2 項分布の性質 (I)

0 1

1 1

1

1 0

1

[ ] (1 ) ! (1 )

!( )!

( 1)!

(1 )

( 1)!( )!

( 1)!

(1 )

!( 1 )!

( 1 )

N N

y N y y N y

y y

N

y N y

y N

z N z

z

N

N N

E Y y p p y p p

y y N y

Np N p p

y N y

Np N p p

z N z

Np p p Np

− −

==

− −

=

− − −

=

=     − = −

  −

=− −

− −

=− −

− −

= + − =

∑ ∑

2項分布

0

( )

N

N y N y

y

a b N a b

y

=

+ =    

∑  

2 項定理 より

0 0

( ) (1 ) 1

N N

y N y

y y

P Y y N p p

y

==

==     − =

∑ ∑  

(5)

2 項分布の性質 (2)

0

2 2

2

2

2 2

0

2 2

2

[ ( 1)] ( 1) (1 )

( 2)!

( 1) (1 )

( 2)!( )!

( 2)!

( 1) (1 )

!( )!

( 1) ( 1 )

( 1)

N

y N y

y

N

y N y

y

N

z N z

z

N

E Y Y y y N p p

y

N N p N p p

y N y

N N p N p p

z N y

N N p p p

N N p

=

− −

=

− − −

=

− = −    

  −

= − −

− −

= − − −

= − + −

= −

2項分布

2

2 2

[ ] [ ( 1)] [ ] [ ]

( 1) ( )

V Y E Y Y E Y E Y

N N p Np Np

= − + −

= − + −

= −

(6)

視聴率調査( 1

関東地区日曜6時40分の調査

但し,視聴率の推定値の標準

偏差を0.01以下にしたい

何世帯をサンプリングすれば

よいであろうか?

p :サザエさんを見ている人の割合

1-p :サザエを見ていない人の割合

見てない

NHK

NHK

NHK

BS

見てない

テレ朝

テレ朝

教育

サザエさん

サザエさん

サザエさん

サザエさん

サザエさん

サザエさん

~ ( , )

ˆ

Y Bin N p

p Y

= N

ハプロタイプカウントの確率分布

2項分布

(7)

視聴率調査( 2

[ ]

[ ]

2 2

ˆ

1 1

[ ] ˆ

1 1 (1 )

[ ] ˆ (1 )

p Y

N

E p E Y E Y Np p

N N N

Y p p

V p V V Y Np p

N N N N

=

=     = = =

  −

=     = = − =

 

ただし,調査前は p は未知の値

(1 )

[ ] ˆ p p 0.01

SD p N

= − ≤

左辺は p=0.5 の時に最大.従って, p=0.5 を想定すれば

0.5(1 0.5)

[ ] ˆ 0.01 2500

SD p = N

ハプロタイプカウントの確率分布

2項分布

(8)

視聴率調査( 3

しかし視聴率50%は「お化け番組」

もう少し現実な値を考え,高々p=0.2と想定すれば

0. (1 0.2)

[ ] ˆ 0.01 1600

SD p N

N

= 2 − ≤ ⇔ ≥

高々p=0.1と想定すれば

0. (1 0.1)

[ ] ˆ 0.01 900

SD p N

N

= 1 − ≤ ⇔ ≥

このように,必要とされる精度(分散)に応じてサンプル数

に関して決定を下すことができる.

(なお,ビデオリサーチでは関東で600世帯をサンプリング

している)

ハプロタイプカウントの確率分布

2項分布

(9)

ポアソン分布

Poisson distribution

(10)

ポアソン分布とは

定義 ポアソン分布

確率変数 Y が期待値 λ ( λ >0) をもつポアソン分布に従

うとは, Y が確率分布

をもつことをいう.とくに,このことを

と略記する.

~ ( )

Y Po λ

( ) ( 0,1, 2,...)

!

e y

P Y y y

y

λ λ

= = − =

(11)

ポアソン分布の性質

ポアソン分布

0 0 0

( ) 1

! !

y y

y y y

P Y y e e e e

y y

λ λ λ λ λ λ

∞ ∞ − ∞

− −

== =

= = = = =

∑ ∑ ∑

0

[ ] ( )

y

E Y y P Y y

=

=

= =

0

[ ( 1)] ( 1) ( )

y

E Y Y y y P Y y

− =

=

− =

=

[ ] [ ( 1)] [ ] [ ] 2

V Y = E Y Y − + E Y E Y =

Maclaurin 展開(see 補足)

(12)

ポアソン分布の例

ポアソン分布

 あるアワビ漁場で区画サンプリングを行ったときの

個体数の確率分布

 刺網に到達する魚の単位時間あたりの数

 ミンククジラの5分間当たりの浮上回数

...

2項分布とポアソンの違いは

2項分布 Y = 0, 1, 2, …, N 上限有

ポアソン分布 Y = 0, 1, 2, 3, ………… 上限無

(13)

2 項分布のポアソン分布近似

N → ∞, p → 0 (Np → λ) の時 , Bin(N,p) Po( λ) に近づく

ポアソン分布

各自 N, p などの値を

変えてみてグラフ書きに

トライしてみてください!

(14)

補足: Taylor 展開

ポアソン分布

「農学・水産学系学生のための数理科学入門」

1 章 数学 (北門著) より抜粋

(15)

補足: Maclaurin 展開

ポアソン分布

(16)

補足: Maclaurin 展開による関数の近似

ポアソン分布

4.

(17)

補足: Maclaurin 展開による関数の近似 (R コード )

ポアソン分布

curve(exp(x), xlim=c(-1,3), xlab=" ", ylab=" ", lwd=2, cex=1.5, ylim=c(0, exp(3)))

curve(1+x, lwd=2, cex=1.5, add=T, lty=2)

curve(1+x+x^2/2, lwd=2, cex=1.5, add=T, lty=3)

curve(1+x+x^2/2+x^3/6, lwd=2, cex=1.5, add=T, lty=4)

curve(1+x+x^2/2+x^3/6+x^4/24, lwd=2, cex=1.5, add=T, lty=5)

curve(1+x+x^2/2+x^3/6+x^4/24+x^5/120, lwd=2, cex=1.5, add=T, lty=6)

legend(-0.8,20,lty=c(1,6,5,4,3,2),

legend=c("exp(x)", "n=5", "n=4", "n=3", "n=2","n=1"),

bty="n", cex=1

)

三角関数にも挑戦してみてください!

(18)

連続型分布の基礎

(19)

連続型の確率変数と確率分布

連続型確率変数:整数や自然数などの離散的な値をとる

連続型確率分布:離散型確率変数に対する確率分布

離散型分布の確率関数 連続型分布

( ) b ( )

P a < ≤ = Y b a f y dy

標本空間 数直線のある区間

確率分布

標本空間の特定の

値に対して確率を

付与できない!

区間に対して確率

を定義する

確率密度関数

a b

(20)

連続型確率変数の期待値,分散,標準偏差

確率変数の特性値の定義確認 連続型分布

2 2

[ ] [ ] [ ]

[ ] [ ] [ ] ( )

A A B B A A B B

A A B B A A B B A B

E Y Y E Y E Y

V Y Y V Y V Y Y Y

ω ω ω ω

ω ω ω ω

⋅ + ⋅ = ⋅ + ⋅

⋅ + ⋅ = ⋅ + ⋅ ⊥

分散(variance)

標準偏差(standard deviation) SD Y [ ] = V Y [ ]

期待値(expectation) E Y [ ] = f y dy ( )

期待値と分散の性質 (離散型と同じ)

2 2

[ ] [( [ ]) ] ( [ ]) ( )

V Y = − V Y E Y = − y E Y f y dy

(21)

正規分布

Normal distribution

(22)

大泉ステーションのニジマスの体長組成

正規分布

体長階級(cm) 階級値 (cm) 度数

9.0-10.0 9.5 1

10.0-11.0 10.5 1

11.0-12.0 11.5 10

12.0-13.0 12.5 20

13.0-14.0 13.5 69

14.0-15.0 14.5 172

15.0-16.0 15.5 284

16.0-17.0 16.5 410

17.0-18.0 17.5 431

18.0-19.0 18.5 356

19.0-20.0 19.5 307

20.0-21.0 20.5 203

21.0-22.0 21.5 99

22.0-23.0 22.5 45

23.0-24.0 23.5 32

24.0-25.0 24.5 17

25.0-26.0 25.5 4

26.0-27.0 26.5 1

合計 2451

体長組成を数学的に

表現できないか?

(23)

正規分布とは

定義 正規分布

2 2

( ) 1

[ ] ( )

[ ] ( ) ( )

f y dy

E Y yf y dy

V Y y f y dy

µ

µ σ

−∞

−∞

−∞

=

==

= − =

分散

期待値

(24)

正規分布の確率密度関数のグラフ

正規分布

正規分布の確率密度関数の性質

・偶関数で平均 µ に関して対称

・平均 µ に応じて関数はシフトする

・標準偏差 σ が大きくなると横に広がる

(25)

大泉ステーションのニジマスの体長組成

正規分布

2

17.73

5.43

µ

σ

=

=

ところでパラメータは

どうやって求める?

次回から学ぶ「統計的推定」

という方法で!

(26)

正規分布に関する性質 (1)

性質 正規分布

2

2

~ ( , )

~ (0, )

~ (0,1)

Y N

Y N

Y N

µ σ

µ σ

σ µ

(27)

正規分布に関する性質 (2)

性質 正規分布

(28)

正規分布の混合

正規分布

(29)

問題

正規分布

10

(30)

次回 (5/29) の予定

基本事項

 パラメータの推定とは?

推定の不偏性

推定の誤差

なお,その他の確率分布については,推定や検定の

ところで適宜触れます.別途配布した資料は毎回

持ってくること!

https://sites.google.com/site/toshihidekitakado/statistics1

参照

関連したドキュメント

 春・秋期(休校日を除く)授業期間中を通して週 3 日(月・水・木曜日) , 10 時から 17 時まで,相談員

水素濃度 3%以上かつ酸素濃度 4%以上(可燃限界:水素濃度 4%以上かつ酸素

KK7補足-024-3 下位クラス施設の波及的影響の検討について 5号機主排気筒の波及的影響について 個別評価 (確認中).

土地賃借料を除く運営費 大企業:上限額 500 万円、中小企業:上限額 1,000 万円 燃料電池バス対応で 2 系統設備の場合 大企業:上限額

社会調査論 調査企画演習 調査統計演習 フィールドワーク演習 統計解析演習A~C 社会統計学Ⅰ 社会統計学Ⅱ 社会統計学Ⅲ.

計画断面 計画対象期間 策定期限 計画策定箇所 年間計画 第1~第2年度 毎年 10 月末日 系統運用部 月間計画 翌月,翌々月 毎月 1 日. 中央給電指令所 週間計画

計画断面 計画対象期間 策定期限 計画策定箇所 年間計画 第1~第2年度 毎年 10 月末日 系統運用部 月間計画 翌月,翌々月 毎月 1 日. 中央給電指令所

原子炉隔離時冷却系系統流量計 高圧炉心注水系系統流量計 残留熱除去系系統流量計 原子炉圧力計.