.
...
統計学
I
および演習 第
14
回 仮説検定
菅原慎矢
仮説検定とは
仮説検定
(Hypothesis testing):
母集団に関する仮説
(Hypothesis)
の妥当性を
検証する方法
帰無仮説・対立仮説を立て、どちらが正しいかを検討する
帰無仮説
(Null hypothesis):
検証する対象
対立仮説
(Alternative hypothesis):
帰無仮説の逆の仮説
ex.
母平均
µ
は
0
なのか を検定する
帰無仮説
:
µ
= 0
仮説検定の方法
標本から検定統計量を構成
検定統計量を用いて、帰無仮説が
棄却
される
(Reject)
か棄却されないかを
判断
検定統計量に関して、ここに入れば帰無仮説は棄却される、という
棄却域
を定
めて、そこに入っているかどうかを見る
用語
:
有意水準
(
または検定のサイズ
):
棄却域の面積
,
分析者が定める
用語
:
境界値
:
棄却域と棄却されない部分
(
受容域
)
との境目の値
検定の実際
:
設定
今日考える状況は下記の設定とする
母分布
:
N
(
µ, σ
2
)
{
X
1
, ..., X
n
}
は母分布からの大きさ
n
の無作為標本
平均に関する検定
帰無仮説
:
母平均が既知の定数
µ
0
である
:
µ
=
µ
0
二つの対立仮説
:
µ > µ
0:
片側検定
平均の検定
:
σ
2
既知
以下は片側検定・両側検定とも共通
σ
2
が既知とする
平均の推定量として、
X
¯
を使う
Z
= ( ¯
X
−
µ
0
)
/
√
σ
2
/n
とする
帰無仮説
µ
=
µ
0
が正しければ、
Z
∼
N
(0
,
1)
であり
,
Z
の分布は平均
0
の回
りに集中する
帰無仮説が正しくなければ、上記のように定義された
Z
の平均は、
0
から遠
いところになるはずであり、
Z
の密度関数は
0
から離れたところに大きな値
平均の検定
:
σ
2
既知
,
両側検定
対立仮説を
µ
̸
=
µ
0
とする
有意水準を
α
とする
棄却域の構成
:
Z
が
0
から離れたところに
Z
の分布がある程度集中していたら棄却する
具体的には、
Z
の裾の確率が
,
左側
(
Z <
0
)
右側
(
Z >
0)
合わせて
α
以上で
あったら棄却する
図示
⇒
境界値
R
α/2>
0
を以下のように定める
P
(
|
Z
|
> R
α/2) =
α
(1)
ただしここの
Z
は、帰無仮説が正しいと仮定した元での
Z
であり、
Z
∼
N
(0
,
1)
(
配付資料に追加
)
R
α/2の値を正規分布表から探す
検定方式
:
|
Z
|
> R
α/2の時、帰無仮説を棄却する
(
配付資料に追加
:
この
Z
平均の検定
:
σ
2
既知
,
両側検定
2
R
α/
2
の求め方
α
=
P
(
|
Z
|
> R
α/
2
)
(2)
=
P
(
Z > R
α/
2
∪
Z <
−
R
α/
2
)
(3)
=
2
P
(
Z > R
α/
2
)
(4)
=
2[1
−
P
(
Z < R
α/
2
)]
(5)
三つ目の等号については図示
.
上記の式を変形して
P
(
Z < R
α/
2
) = 1
−
α/
2
(6)
平均の検定
:
σ
2
既知
,
両側検定
3
上記は
Z
を検定統計量とする検定であったが、
X
¯
を検定統計量とする検定にす
ることも出来る。以下では
⇔
は、これを挟む二つの式が同値であることを示す
|
Z
|
> R
α/
2
⇔
Z > R
α/
2
or
Z <
−
R
α/
2
(7)
⇔
X
√
¯
−
µ
0
σ
2
/n
> R
α/
2
or
¯
X
−
µ
0
√
σ
2
/n
<
−
R
α/
2
(8)
ここで
¯
X
−
µ
0
√
σ
2
/n
> R
α/
2
⇔
¯
X > µ
0
+
R
α/
2
√
σ
2
/n
(9)
¯
X
−
µ
0
√
σ
2
/n
<
−
R
α/
2
⇔
¯
X < µ
0
−
R
α/
2
√
平均の検定
:
σ
2
既知
,
両側検定
4
従って、
X > µ
¯
0
+
R
α/
2
√
σ
2
/n
または
X < µ
¯
0
−
R
α/
2
√
σ
2
/n
の時棄却
区間推定との比較
信頼係数
1
−
α
の両側信頼区間
[
¯
X
−
z
α/2σ
√
n
,
X
¯
+
a
α/2σ
√
n
]
(11)
ただし
z
α/2=
R
α/2従って、信頼係数
1
−
α
の信頼区間の外側が、有意水準
α
の仮説検定の棄却
平均の検定
:
σ
2
既知
,
片側検定
対立仮説を
µ > µ
0
,
有意水準を
α
とする
棄却域の構成
:
Z
が
0
から離れたところに
Z
の分布がある程度集中していたら棄却する
具体的には、
Z
の裾の確率が右側
(
Z >
0
)
だけで
α
以上であったら棄却する
⇒
境界値
R
α>
0
を以下のように定める
P
(
Z > R
α) =
α
(12)
R
αの値を正規分布表から探す
平均の検定
:
σ
2
既知
,
片側検定
2
R
α
の求め方
α
=
P
(
Z > R
α
)
(13)
= 1
−
P
(
Z < R
α
)
(14)
上記の式を変形して
P
(
Z < R
α
) = 1
−
α
(15)
平均の検定
:
σ
2
既知
,
片側検定
3
Z > R
α
⇔
¯
X
−
µ
0
√
σ
2
/n
> R
α
(16)
⇔
X > µ
¯
0
+
R
α
√
σ
2
/n
(17)
従って、
X > µ
¯
0
+
R
α
√
σ
2
/n
の時棄却。両側検定の時と同様に、これは信頼係
平均の検定
:
σ
2
未知
ここから
σ
2
を未知として、
µ
に関する検定を考える
σ
2
を
S
2
で代用することを考える
T
= ( ¯
X
−
µ
0
)
/
√
S
2
/n
とする
帰無仮説
µ
=
µ
0
が正しければ、
T
∼
t
(
n
−
1)
であり
,
T
の分布は平均
0
の
回りに集中する
帰無仮説が正しくなければ、上記のように定義された
T
の平均は、
0
から遠
いところになるはずであり、
T
の密度関数は
0
から離れたところに大きな値
平均の検定
:
σ
2
未知
,
両側検定
対立仮説を
µ
̸
=
µ
0
,
有意水準を
α
とする
棄却域の構成
:
T
が
0
から離れたところに
T
の分布がある程度集中していたら棄却する
具体的には、
T
の裾の確率が
,
左側
(
T <
0
)
右側
(
T >
0)
合わせて
α
以上で
あったら棄却する
⇒
境界値
R
α/2>
0
を以下のように定める
P
(
|
T
|
> R
α/2) =
α
(18)
R
α/2の値を
t
分布表から探す
平均の検定
:
σ
2
未知
,
両側検定
2
R
α/
2
の求め方
P
(
T < R
α/
2
) = 1
−
α/
2
(19)
平均の検定
:
σ
2
未知
,
両側検定
3
|
T
|
> R
α/
2
⇔
T > R
α/
2
or
T <
−
R
α/
2
(20)
⇔
√
X
¯
−
µ
0
S
2
/n
> R
α/
2
or
¯
X
−
µ
0
√
S
2
/n
<
−
R
α/
2
(21)
ここで
¯
X
−
µ
0
√
S
2
/n
> R
α/
2
⇔
¯
X > µ
0
+
R
α/
2
√
S
2
/n
(22)
¯
X
−
µ
0
√
S
2
/n
<
−
R
α/
2
⇔
¯
X < µ
0
−
R
α/
2
√
S
2
/n
(23)
従って、
X > µ
¯
0
+
R
α/
2
√
S
2
/n
または
X < µ
¯
0
−
R
α/
2
√
雑談
分散未知の時の
T
統計量を用いた平均の検定を
t
検定と呼ぶ
開発者
: William Gosset
それ以前は正規分布を用いて検定していたようだが、
t
分布を用いた方が精度
が良いことを発見
ギネスビール社
(
アイルランド
)
のエンジニアであり、会社に隠れて行った研究
だったため、
Student
というペンネームで論文を発表
そのため
Student t test
と呼ばれる
S
2を使った統計量なので
,
その次のアルファベットということで
t
と呼んだら
分散の検定
帰無仮説
:
σ
2
=
σ
2
0
対立仮説
:
片側検定
:
σ
2> σ
20
両側検定
:
σ
2̸
分散の検定
:
片側検定
分散の推定量として、
S
2
を使う
U
= (
n
−
1)
S
2
/σ
2
0
とする
帰無仮説
σ
2
=
σ
2
0
が正しければ、
U
∼
χ
2
(
n
−
1)
である
対立仮説を
σ
2
> σ
2
0
,
有意水準を
α
とする
棄却域の構成
:
U
の右側の裾の確率が
α
以上であったら棄却する
⇒
境界値
R
α>
0
を以下のように定める
P
(
U > R
α) =
α
(24)
R
αの値を
χ
2分散の検定
:
片側検定
2
U > R
α
⇔
(
n
−
1)
S
2
σ
2
0
> R
α
(25)
⇔
S
2
> σ
2
0
R
α
/
(
n
−
1)
(26)
従って、
S
2
> σ
2
分散の検定
:
両側検定
対立仮説を
σ
2
̸
=
σ
2
0
,
有意水準を
α
とする
棄却域の構成
:
U
の左右の裾の確率が
α
以上であったら棄却する
⇒
境界値
1
−
R
α/2>
0
, R
α/2>
0
を以下のように定める
P
(
U < R
1−α/2)
=
1
−
α/
2
(27)
P
(
U > R
α/2)
=
α/
2
(28)
R
1−α/2,
R
α/2の値を
χ
2分散の検定
:
両側検定
2
U < R
1
−
α/
2
⇔
(
n
−
1)
S
2
σ
2
0
< R
1
−
α/
2
(29)
⇔
S
2
< σ
2
0
R
1
−
α/
2
/
(
n
−
1)
(30)
また
U > R
α/
2
⇔
(
n
−
1)
S
2
σ
2
0
> R
α/
2
(31)
⇔
S
2
> σ
2
2
母集団に関する検定
設定
{
X
1, ..., X
m}
:
母分布
N
(
µ
x, σ
2x)
からの大きさ
m
の無作為標本
{
Y
1, ..., Y
n}
:
母分布
N
(
µ
y, σ
2y
)
からの大きさ
n
の無作為標本
二つの母分布は独立とする
ex.
平均差の検定
:
母分散既知
帰無仮説
:
µ
x
−
µ
y
= 0
対立仮説
:
µ
x
−
µ
y
̸
= 0
(
両側検定
)
平均の差の推定量として、
D
= ¯
X
−
Y
¯
を用いる
母分散を既知とする
:
未知のケースはこの授業では扱わない
D
は正規分布
N
(
µ
x
−
µ
y
, σ
x
2
/m
+
σ
2
y
/n
)
に従う
(
証明略
)
帰無仮説が正しければ、
D
∼
N
(0
, σ
2
x
/m
+
σ
2
y
/n
)
よって
Z
=
D/
√
σ
2
x
/m
+
σ
y
2
/n
とすると、帰無仮説が正しければ
平均差の検定
:
母分散既知
2
有意水準を
α
とする
棄却域の構成
:
Z
の左右の裾の確率が
α
以上であったら棄却する
⇒
境界値
R
α/2>
0
を以下
のように定める
P
(
|
Z
|
> R
α/2) =
α/
2
(33)
これは平均に関する検定と同じ。以下同じ手順で
¯
X
−
Y > R
¯
α/2√
σ
2x
/m
+
σ
2y/n
または
X
¯
−
Y < R
¯
α/2√
σ
2x