統計学 I
北門 利英(海洋生物資源学科)
Lecture 12-13
Lecture 12-13
区間推定法
・正規分布の平均の信頼区間(分散既知)
・正規分布の平均の信頼区間(分散未知)
仮説検定のロジック
様々な仮説の検定法
・正規分布の平均の検定(1標本,分散既知)
・正規分布の平均の検定(1標本,分散未知)
8 月 28 日
・正規分布の平均の検定(2標本,等分散)
・比率の検定(2項分布の正規分布近似)
正規分布の平均 (分散既知)
例題
ある海域に生息するXXマグロの1歳魚をn個体ランダムに
サンプリングし,その体長を測定した.これらが以下のよう
に独立同一に正規分布に従うとするとき, μの95%信頼
区間を求めよ.
ただし,分散は既知とする.
2
1 , 2 ,..., n ~ ( ) ( , )
Y Y Y iid N µ σ
これまでは,パラメータの値を「 1 点」で推定した
(例えば, などのように)
これとは別に,「区間」で推定する方法もある
(例えば,μの95%信頼区間 = (34.2, 58.4)など)
ˆ 45 cm SE ( 5.2 cm )
µ = =
区間推定の定式化
1. 観測データの確率分布と推定するパラメータを定義
2. 区間推定の信頼水準を定める ( 例えば 95% など)
この信頼水準の意味は,以下のような区間の決め方
を定めた時に,その区間が本当のパラメータの値を含
む頻度が 95 %であることをいう
3. 信頼水準を満たすような区間の決め方を定める
4. 観測データを得たとき,上記の方式に基づいて区間を
計算し,これを信頼水準 95% の信頼区間として与える
区間推定の定式化(例)
1. 観測データの確率分布と推定するパラメータを定義
2. 信頼水準を 95% とする
3. 信頼水準を満たすような区間の決め方を定める
4. 観測データに対して計算
例えば, n=9, σ=6, のとき
2
1 , 2 ,..., n ~ ( ) ( , )
Y Y Y iid N µ σ
1.96 1.96
Y Y
n n
σ µ σ
− ≤ ≤ +
40
Y = 36.08 ≤ ≤ µ 43.92
信頼水準の意味をもう少し
μ の値は何か分からないが,ある値
であるとする
信頼水準を 95% と定める
サンプル数 n のデータに対して信頼
区間を計算する
仮にそういう操作を何度も繰り返し
たとするとき ( 例えば 100 回 ) ,そのう
ち 95% の頻度で真の μ の値を含む
データの解析者は1セットしかデー
タをもっていないので,そのデータ
から構成した信頼区間が真の値を含
んでいるどうかは分からない ( 確率
的にしか分からない ) µ
真の値 ( 未知 )
正規分布に関する性質 (1)
2
2
~ ( , )
~ (0, )
~ (0,1)
Y N
Y N
Y N
µ σ
µ σ
σ µ
−
−
正規分布に関する性質 (2)
ところで信頼区間をどのように構成?
定めた水準 1- α に合うよう,観測データの確率分布
に基づき区間を構成する (95% 信頼水準なら α=0.05)
2
1 2
2
1 2
2
1 2
, ,..., ~ ( ) ( , )
~ ( , )
~ ( , )
n
n
n
Y Y Y iid N
Y Y Y N n n
Y Y Y
Y N
n n
µ σ
µ σ
µ σ
+ + +
+ + +
=
2
2
/ 2 / 2
~ (0, )
~ (0,1)
/
( ) 1
Y N
n
Z Y N
n
P z α Z z α
µ σ
µ
σ α
−
= −
− ≤ ≤ = − 0
Z
z α / 2
α / 2
ところで信頼区間をどのように構成?
したがって
/ 2 / 2
( ) 1
P − z α ≤ ≤ Z z α = − α
/ 2 / 2
/ 2 2 / 2
/ 2 / 2
/ 2 / 2
/ 2 / 2
/ 2 / 2
/
z Z z
z Y z
n
z Y z
n n
Y z Y z
n n
Y z Y z
n n
Y z Y z
n n
α α
α α
α α
α α
α α
α α
µ
σ σ µ σ
σ µ σ
σ µ σ
σ µ σ
− ≤ ≤
⇔ − ≤ − ≤
⇔ − ≤ − ≤
⇔ − − − ≤ − +
⇔ + ≥ ≥ −
⇔ − ≤ ≤ +
ところで信頼区間をどのように構成?
したがって
/ 2 / 2
( ) 1
P − z α ≤ ≤ Z z α = − α
/ 2 / 2
/ 2 2 / 2
/ 2 / 2
/ 2 / 2
/ 2 / 2
/ 2 / 2
/
z Z z
z Y z
n
z Y z
n n
Y z Y z
n n
Y z Y z
n n
Y z Y z
n n
α α
α α
α α
α α
α α
α α
µ
σ σ µ σ
σ µ σ
σ µ σ
σ µ σ
− ≤ ≤
⇔ − ≤ − ≤
⇔ − ≤ − ≤
⇔ − − − ≤ − +
⇔ + ≥ ≥ −
⇔ − ≤ ≤ +
演習 (1)
先程のマグロの体長の例で 9 個体のデータが下記のと
おりであった. σ=6 と仮定し, 90% 信頼区間 , 95% 信
頼区間および 99% 信頼区間を求めよ.
Y=(42, 40, 50, 39, 40, 43, 42, 48, 43)
90% 信頼区間
95% 信頼区間
99% 信頼区間
正規分布の平均 (分散未知)
分散が既知の場合と未知の場合の違いは?
2
/ 2 / 2
~ (0,1)
/ /
( ) 1
Y Y
Z N
n n
P z α Z z α
µ µ
σ σ
α
− −
= =
− ≤ ≤ = −
0
Z
z
α/ 2α / 2
残念ながら,いま上記の式は使えない
( なぜなら,分散が未知だから!)
そこで,分散の推定値を代入するが,正規分布の仮定が崩れる
2 2
1
/ 2 / 2
ˆ 1 ( )
1
~ ( 1)
ˆ /
( ) 1
n
i
i
Y Y
n
T Y t n
n
P t α T t α
σ
σ µ
α
= = −
−
=− −
− ≤ ≤ = −
∑
自由度 n-1
の t 分布
0
T
/ 2
( 1)
t
αn −
α / 2
分散が既知の場合と未知の場合の違いは?
0
Z
z
α/ 2α / 2
0
T
/ 2
( 1)
t
αn −
α / 2
n α = 0.05
Z
α/2- 1.96
t α/2(n-1) 2
3
4
5
9
10
∞
分散が既知の場合と未知の場合の違いは?
0
Z
z
α/2α / 2
0
T
/ 2