担当:鹿野(大阪府立大学)
2014 年度前期
はじめに
前回の復習
点推定の基準:不偏性・有効性。
区間推定:95%信頼区間の推定。
今回学ぶこと
母数の仮説検定。
母平均・母分散の仮説検定。
テキスト該当箇所:12章。
1 母数の仮説検定
1.1
仮説検定とは?
母数の仮説検定:未知の母数θに対し、分析者があらかじめ置いた仮説値θ = θ∗の真偽を 判断する手続きを、 と呼ぶ。その目的で用意した統計量を、
と呼ぶ。
⊲ 科学理論や品質基準、営業上の目標など、非統計的な根拠から θ∗(理論 値、基準値)を設定。→統計的に支持されるか、判断。
⊲ 母数(未知)と仮説値の差θ − θ∗は測れない⇒推定量ˆθと仮説値の差ˆθ − θ∗に注目。
⊲ 母数の推定(講義ノート#19)とは別の、統計的推測のスタイル。
例:あるビール工場では、品質基準として製品の平均アルコール度数を4に設定してい る。→製品全体(母集団)で、この基準を満たしているか検査。∴ここで仮説値はµ = 4。
⊲ 製品を無作為にn = 16個抽出→標本平均X = 5.5¯ 、標本標準偏差s = 2。
⊲ 実測値X = 5.5¯ と基準値µ = 4の差 を、どう評価する?
Remark:仮に、母平均が本当にµ = 4だとしても、標本平均(確率変数)の実現値がちょ
うどX = 4¯ となることは、ありえない。
⊲ ∴問題は、実測値と理論値のズレX − µ = 1.5¯ が「 」にあるかどうか。 1
⊲ ¯X − µ = 1.5を、大小の判断がつく (講義ノート#17)に置換すれば良い。
検定統計量の利用:ビール工場の例で、µ = 4という前提でt統計量(この問題の検定統 計量)を求めると
t∗= X − µ¯ s/√n =
1.5
2/4 = . (1)
⊲ 一方、自由度m = 16 − 1 = 15のt分布の2.5%臨界値はt0.025= 2.131。
⊲ ∴ t∗ = 3 > 2.131。差X − µ = 1.5¯ は、t統計量(t∗ = 3)に換算すれば2.5%以下でし
か起こらないほど大きな値。µ = 4を主張するのはキツイ。
1.2
仮説検定と第
1 種・第 2 種の過誤Remark:仮説検定の手順。講義ノート#17、#18で行ったように、t・カイ2乗統計量と
分布表を使えば良い。 1. 仮説値の設定。
2. 推定値と仮説値のズレを、検定統計量に変換。
3. 求めた検定統計量がその臨界値を超える場合、仮説値を疑う。
帰無仮説と対立仮説
⊲ 帰無仮説:分析者が母数θに置いた仮説を と呼び、 : θ = θ∗と表 記。∴これまで単に「仮説値」、「基準値」と呼んでいたもの。
⊲ 対立仮説:帰無仮説H0に反する仮説を と呼び、 と表記。∴H0
が棄却されると、間接的に支持される主張。H1の選択肢として
H1 : θ θ∗, H1: θ > θ∗, H1: θ < θ∗. (2)
⊲ 検定の結果「H0はアヤシイ」と判定された場合、「H0は される」と言う。
有意水準:H0棄却の基準となる「十分低い確率」を と呼び、αと表記。
⊲ αが ⇔ H0にとって厳しい(棄却されやすい、少しのズレでもアウト)。
⊲ 通常使われる有意水準:α = 0.1, 0.05, 0.01。→この講義では、α = を採用。
Remark:この判定ルールに基づくと、仮にH0 : θ = θ∗が正しくとも、低確率ながら
(=有意水準)でH0を棄却してしまう。
⊲ 「真であるH0を棄却するエラー」を、 と呼ぶ。(誤認逮捕。)∴高 い有意水準α ⇔第1種の過誤を犯す確率高い。
⊲ 「 偽 で あ るH0 を 棄 却 し な い エ ラ ー 」を 、 と 呼 ぶ 。( 犯 人 を 見 逃 す。)その確率は一般に、有意水準αの減少関数。∴第1種vs.第2種の過誤に、
の関係。
⊲ この検定方式の最適性は?⇒大学院レベルの数理統計学で。仮説検定を、分析者が 直面する不確実性下の意思決定問題と考える。
1.3
両側検定と片側検定
両側検定と片側検定:ある帰無仮説H0: θ = θ∗に対し、対立仮説を
⊲ H1: θ θ∗と置いた検定を、 検定と呼ぶ。
⊲ H1: θ > θ∗(H1: θ < θ∗)と置いた検定を、 検定と呼ぶ。
Remark:両側検定と片側検定、どちらを使う?⇒問題に応じて、分析者が決める。
⊲ θとθ∗の大小関係が事前に 場合は両側検定、 場合 は右(or左)片側検定を使う。
⊲ どちらが適切か判断しかねる場合は、両側検定にすれば良い。
⊲ 両側・片側検定の選択で、検定の棄却域が変わる。⇒詳しくは次節で。
例:血圧降下剤を摂取した被験者の、治験後と治験前の血圧差X1,X2, . . . ,Xn。
⊲ この治療に「効果がなかった」こと(血圧変化なし)を帰無仮説とすれば、H0: µ = 0。
⊲ 対立仮説は?⇒「効果があった」こと(血圧を下げる)が期待されるので、ふさわ しい対立仮説の設定はH1 : 。∴左片側検定。
⊲ H0: µ = 0が棄却されれば、血圧降下剤の薬効H1: µ < 0が間接的に支持される。
2 母平均・母分散の仮説検定
2.1
母平均の
t 検定母平均µの両側t検定:帰無仮説、対立仮説は
H0: µ = µ∗, H1: . (3)
平均の実測値と理論値の差X − µ¯ ∗をt統計量に直すと t∗= X − µ¯ ∗
s/√n . (4)
H0を基に標本から求めたt統計量の値t∗を、単に と呼ぶ。
⊲ 図1A:両側検定→二つのケース、X − µ¯ ∗<0(⇔ t∗<0)とX − µ¯ ∗>0(⇔ t∗>0) を等しくケア。よって
or (|t∗| > t0.025) ⇒ H0: µ = µ∗を棄却. (5)
⊲ 区間[−∞, −t0.025]と[t0.025, ∞]を、両側t検定の と呼ぶ。t値を求め、コ コに落ちたらH0を棄却。
⊲ 注意:有意水準5%=両側検定なら「左右合わせて5%」の意味。
µの右片側t検定(左片側も同様):帰無仮説、対立仮説は
H0: µ = µ∗, H1: . (6)
t値は、両側検定と同じく(4)の通り。
0.00.10.20.30.4
t
f(t)
- 2. 086 0 t0. 025
=2. 086
0. 025 0. 025
棄却域 棄却域
A: 両側t 検定
0.00.10.20.30.4
t
f(t)
0 t0. 05
=1. 711 0. 05 棄却域 B: 右片側t 検定
図1:母平均µのt検定(両側vs.右片側、自由度m = 24)
⊲ 図1B:右片側検定→ ¯X − µ∗>0(⇔ t∗>0)だけをケア。よって
⇒ H0: µ = µ∗を棄却. (7)
⊲ 右片側t検定の棄却域は、区間[t0.05, ∞]。右側だけで5%。
Remark:両側・片側検定ともに、t値の計算は全く同じ。
⊲ いずれのケースでも、実測値と理論値の乖離が無視できるレベルか、判断したい。
⊲ 両者の違い:対立仮説H1の置き方⇒ の取り方。
例:母平均に関する次の仮説を、右片側t検定せよ。
H0: µ = 10, H1: µ > 10. (8)
ただし標本平均X = 10.5¯ 、標準偏差s = 10、サンプル数n = 25。
⊲ t値は
t∗= 10.5 − 10 10/√25 =
0.5
2/1 = . (9)
⊲ 自由度m = 25 − 1 = 24のt分布は、右側5%臨界値がt0.05= 。
⊲ t∗= 1 < 1.711(棄却域に入らない)。∴帰無仮説H0: µ = 10は、有意水準5%の右片 側t検定で、 。
2.2
母分散のカイ
2 乗検定母分散σ2の両側カイ2乗検定:帰無仮説、対立仮説は
H0: σ2= σ2∗, H1: . (10)
分散の実測値と理論値の比 s
2
σ2∗ をカイ2乗統計量に直すと( )
χ2∗= (n− 1)s
2
σ2∗. (11)
0.000.020.040.06
χ
2
f(χ
2 )
0 9. 591 χ0. 025 2
=34. 170
0. 025 0. 025
棄却域 棄却域
A: 両側カイ2乗検定
0.000.020.040.06
χ
2
f(χ
2 )
0 χ0. 05
2
=31. 410 0. 05 棄却域 B: 右片側カイ2乗検定
図2:母分散σ2のカイ2乗検定(両側vs.右片側、自由度m = 20)
⊲ 図2A:両側検定→二つのケース、σs22
∗
< 1(⇔ χ2∗小さ過ぎ)とσs22
∗
>1(⇔ χ2∗大き 過ぎ)を等しくケア。よって
or ⇒ H0: σ2= σ2∗を棄却. (12)
⊲ 両側カイ2乗検定の棄却域は、区間[0, χ2
L,0.025]と[χ 2
R,0.025, ∞]。左右合わせて5%。
σ2の右片側カイ2乗検定(左片側も同様):帰無仮説、対立仮説は
H0: σ2= σ2∗, H1: . (13)
H0のカイ2乗値は、両側検定と同じく(11)の通り。
⊲ 図2B:右片側検定→ σs22
∗ >1
(⇔ χ2
∗大)だけをケア。よって
⇒ H0 : σ2= σ2∗を棄却. (14)
⊲ 右片側カイ2乗検定の棄却域は、区間[χ2
R,0.05, ∞]。右側だけで5%。
例:母分散に関する次の仮説を、両側カイ2乗検定せよ。
H0: σ2 = 100, H1: σ2100. (15) ただし標本分散s = 180、サンプル数n = 21。
⊲ カイ2乗値は
χ2∗= (n− 1)s
2
σ2∗ = 20· 180
100 = . (16)
⊲ 自由度m = 21 − 1 = 20のカイ2乗分布は、左端2.5%臨界値がχ2L,0.025= 、右 端2.5%臨界値がχ2
R,0.025= 。
⊲ χ2∗ = 36 > 34.170(右端の棄却域に入る)。∴帰無仮説H0 : σ2 = 100は、有意水準 5%の両側カイ2乗検定で、 。
まとめと復習問題
今回のまとめ
仮説検定の概要。
母平均・母分散の仮説検定。
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。
1. 次の仮説を、両側t検定する。
H0 : µ = 0, H1: µ 0. (17)
ただし標本から、標本平均X = 1¯ 、標準偏差s = 1、サンプル数n = 16を得ている。
(a) t値を求めよ。(計算過程は省略してよい。以下同じ。)
(b) 適切な臨界値をt分布表から求め、棄却域(区間)を構成せよ。
(c) H0: µ = 0が棄却されれば○ 、棄却されなければ× と答えよ。
2. 次の仮説を、右片側カイ2乗検定せよ。
H0: σ2 = 10, H1: σ2>10. (18)
ただし標本から、標本分散s2= 15、サンプル数n = 21を得ている。 (a) カイ2乗値を求めよ。(計算過程は省略してよい。以下同じ。)
(b) 適切な臨界値をカイ2乗分布表から求め、棄却域(区間)を構成せよ。 (c) H0: σ2= 10が棄却されれば○ 、棄却されなければ× と答えよ。
3. 第1種の過誤をゼロにする方法を挙げよ。また、そうすることで、いかなる不都合が生じ るか?簡潔に述べよ。