母数の仮説検定経済統計鹿野研究室

(1)

担当：鹿野（大阪府立大学）

2014 年度前期

はじめに

前回の復習

点推定の基準：不偏性・有効性。

区間推定：_95%信頼区間の推定。

今回学ぶこと

母数の仮説検定。

母平均・母分散の仮説検定。

テキスト該当箇所：₁₂章。

1 ^{母数の仮説検定}

1.1

^{仮説検定とは？}

母数の仮説検定：未知の母数_θに対し、分析者があらかじめ置いた仮説値_{θ = θ}_∗の真偽を判断する手続きを、と呼ぶ。その目的で用意した統計量を、

と呼ぶ。

⊲ 科学理論や品質基準、営業上の目標など、非統計的な根拠から _θ_∗（理論値、基準値）を設定。_→統計的に支持されるか、判断。

⊲ 母数（未知）と仮説値の差_{θ − θ}_∗は測れない_⇒推定量_ˆθと仮説値の差_{ˆθ − θ}_∗に注目。

⊲ 母数の推定（講義ノート_#19）とは別の、統計的推測のスタイル。

例：あるビール工場では、品質基準として製品の平均アルコール度数を₄に設定している。_→製品全体（母集団）で、この基準を満たしているか検査。∴ここで仮説値は_{µ = 4}。

⊲ ^{製品を無作為に}_{n = 16}^個抽出_→^標本平均_{X = 5.5}^¯ ^{、標本標準偏差}_{s = 2}^。

⊲ ^実測値_{X = 5.5}^¯ ^と基準値_{µ = 4}^の差 ^{を、どう評価する？}

_Remark：仮に、母平均が本当に_{µ = 4}だとしても、標本平均（確率変数）の実現値がちょ

うど_{X = 4}¯ となることは、ありえない。

⊲ ∴問題は、実測値と理論値のズレX − µ = 1.5¯ ^が「 ^{」にあるかどうか。} 1

(2)

⊲ ¯X − µ = 1.5^{を、大小の判断がつく} ^{（講義ノート}^#17^{）に置換すれば良い。}

検定統計量の利用：ビール工場の例で、_{µ = 4}という前提で_t統計量（この問題の検定統計量）を求めると

t_∗₌ ^{X − µ}^¯ s/^√n ⁼

1.5

2/4 ⁼ ^. ⁽¹⁾

⊲ ^{一方、自由度}m = 16 − 1 = 15^の^t^分布の^2.5%^臨界値は^t0.025= 2.131^。

⊲ ∴ t_∗ = 3 > 2.131^。差X − µ = 1.5^¯ ^は、^t^統計量（^t∗ ^{= 3}^{）に換算すれば}^2.5%^以下でし

か起こらないほど大きな値。_{µ = 4}を主張するのはキツイ。

1.2

^{仮説検定と第}

1 種・第 2 種の過誤

_Remark：仮説検定の手順。講義ノート_#17、_#18で行ったように、_t・カイ₂乗統計量と

分布表を使えば良い。 1. ^{仮説値の設定。}

2. 推定値と仮説値のズレを、検定統計量に変換。

3. 求めた検定統計量がその臨界値を超える場合、仮説値を疑う。

帰無仮説と対立仮説

⊲ 帰無仮説：分析者が母数_θに置いた仮説をと呼び、 _{: θ = θ}_∗と表記。∴これまで単に「仮説値」、「基準値」と呼んでいたもの。

⊲ ^{対立仮説：帰無仮説}H0^{に反する仮説を} ^と呼び、 ^と表記。^∴H0

が棄却されると、間接的に支持される主張。_H₁の選択肢として

H1 : θ θ_∗, H1: θ > θ_∗, H1: θ < θ_∗. (2)

⊲ ^{検定の結果「}H0はアヤシイ」と判定された場合、「_H₀はされる」と言う。

有意水準：_H₀棄却の基準となる「十分低い確率」をと呼び、_αと表記。

⊲ α^が _{⇔ H}₀にとって厳しい（棄却されやすい、少しのズレでもアウト）。

⊲ 通常使われる有意水準：α = 0.1, 0.05, 0.01^。→^{この講義では、}α = ^を採用。

_Remark：この判定ルールに基づくと、仮に_H₀ _{: θ = θ}_∗が正しくとも、低確率ながら

（＝有意水準）で_H₀を棄却してしまう。

⊲ ^{「真である}H0を棄却するエラー」を、と呼ぶ。（誤認逮捕。）∴高い有意水準_{α ⇔}第₁種の過誤を犯す確率高い。

⊲ ^{「偽である}H₀ を棄却しないエラー」を、と呼ぶ。（犯人を見逃す。）その確率は一般に、有意水準_αの減少関数。∴第₁種_vs.第₂種の過誤に、

の関係。

⊲ この検定方式の最適性は？_⇒大学院レベルの数理統計学で。仮説検定を、分析者が直面する不確実性下の意思決定問題と考える。

(3)

1.3

^{両側検定と片側検定}

両側検定と片側検定：ある帰無仮説_H₀_{: θ = θ}_∗に対し、対立仮説を

⊲ H₁: θ θ_∗^{と置いた検定を、} ^{検定と呼ぶ。}

⊲ H1: θ > θ_∗^（H1: θ < θ_∗^{）と置いた検定を、} ^{検定と呼ぶ。}

_Remark：両側検定と片側検定、どちらを使う？_⇒問題に応じて、分析者が決める。

⊲ θ^とθ_∗^{の大小関係が事前に} ^{場合は両側検定、} ^場合は右（_or左）片側検定を使う。

⊲ どちらが適切か判断しかねる場合は、両側検定にすれば良い。

⊲ 両側・片側検定の選択で、検定の棄却域が変わる。_⇒詳しくは次節で。

例：血圧降下剤を摂取した被験者の、治験後と治験前の血圧差_X₁_,_X₂_{, . . . ,}_X_n。

⊲ この治療に「効果がなかった」こと（血圧変化なし）を帰無仮説とすれば、_H₀_{: µ = 0}。

⊲ ^{対立仮説は？}_⇒「効果があった」こと（血圧を下げる）が期待されるので、ふさわしい対立仮説の設定は_H₁ _: 。∴左片側検定。

⊲ H₀_{: µ = 0}が棄却されれば、血圧降下剤の薬効_H₁_{: µ < 0}が間接的に支持される。

2 母平均・母分散の仮説検定

2.1

^母平均の

t 検定

母平均_µの両側_t検定：帰無仮説、対立仮説は

H₀_{: µ = µ}_∗, H₁: . (3)

平均の実測値と理論値の差_{X − µ}¯ _∗を_t統計量に直すと t_∗₌ ^{X − µ}^¯ ^∗

s/^√n ^. ⁽⁴⁾

H0^{を基に標本から求めた}t^{統計量の値}t_∗^を、単に ^と呼ぶ。

⊲ ^図1A^{：両側検定}_→^{二つのケース、}_{X − µ}^¯ _∗<0^（_{⇔ t}_∗<0^）と_{X − µ}^¯ _∗>0^（_{⇔ t}_∗>0^）を等しくケア。よって

or _(|t_∗_{| > t}0.025) _⇒ H0: µ = µ∗^を棄却^. ⁽⁵⁾

⊲ ^区間_{[−∞, −t}_0.025]^と[t0.025_{, ∞]}^を、両側t^検定の ^と呼ぶ。t^{値を求め、コ} コに落ちたら_H₀を棄却。

⊲ ^{注意：有意水準}5%＝両側検定なら「左右合わせて_5%」の意味。

_µの右片側_t検定（左片側も同様）：帰無仮説、対立仮説は

H₀_{: µ = µ}_∗, H₁: . (6)

t値は、両側検定と同じく₍₄₎の通り。

(4)

0.00.10.20.30.4

t

f(t)

- 2. 086 0 ^t0. 025

=2. 086

0. 025 0. 025

棄却域棄却域

A: 両側t 検定

0.00.10.20.30.4

t

f(t)

0 ^t0. 05

=1. 711 0. 05 棄却域 B: 右片側t 検定

図_1:母平均_µの_t検定（両側_vs.右片側、自由度_{m = 24}）

⊲ ^図1B^{：右片側検定}_{→ ¯}_{X − µ}_∗>0^（_{⇔ t}_∗>0^{）だけをケア。よって}

⇒ ^H0: µ = µ_∗^を棄却^. ⁽⁷⁾

⊲ ^右片側t^{検定の棄却域は、区間}[t_0.05_{, ∞]}^{。右側だけで}5%^。

_Remark：両側・片側検定ともに、_t値の計算は全く同じ。

⊲ いずれのケースでも、実測値と理論値の乖離が無視できるレベルか、判断したい。

⊲ ^{両者の違い：対立仮説}H₁^の置き方_⇒ ^{の取り方。}

例：母平均に関する次の仮説を、右片側_t検定せよ。

H0: µ = 10, ^H1: µ > 10. (8)

ただし標本平均_{X = 10.5}¯ 、標準偏差_{s = 10}、サンプル数_{n = 25}。

⊲ t^値は

t_∗₌ ^{10.5 − 10} 10/^√25 ⁼

0.5

2/1 ⁼ ^. ⁽⁹⁾

⊲ ^自由度m = 25 − 1 = 24^の^t^{分布は、右側}^5%^臨界値が^t^0.05⁼ ^。

⊲ t_∗= 1 < 1.711^{（棄却域に入らない）}^。^∴^帰無仮説^H0: µ = 10^{は、有意水準}^5%^の右片側_t検定で、。

2.2

^{母分散のカイ}

2 乗検定

母分散_σ²の両側カイ₂乗検定：帰無仮説、対立仮説は

H₀: σ²_{= σ}²_∗, H₁: . (10)

分散の実測値と理論値の比 ^s

2

σ²_∗ ^をカイ²^{乗統計量に直すと（} ^）

χ²_∗_{= (n}_{− 1)}^s

2

σ²_∗^. ⁽¹¹⁾

(5)

0.000.020.040.06

χ

2

f(χ

2 )

0 9. 591 ^χ0. 025 2

=34. 170

0. 025 0. 025

棄却域棄却域

A: 両側カイ2乗検定

0.000.020.040.06

χ

2

f(χ

2 )

0 ^χ0. 05

2

=31. 410 0. 05 棄却域 B: 右片側カイ2乗検定

図_2:母分散_σ²のカイ₂乗検定（両側_vs.右片側、自由度_{m = 20}）

⊲ ^図2A^{：両側検定}_→^{二つのケース、}_σ^s²2

∗

< 1^（_{⇔ χ}²_∗^{小さ過ぎ）と}_σ^s²2

∗

>1^（_{⇔ χ}²_∗^大き過ぎ）を等しくケア。よって

or _⇒ H₀: σ²_{= σ}²_∗^を棄却. (12)

⊲ ^両側カイ2乗検定の棄却域は、区間_{[0, χ}²

L,0.025^]^と^[χ 2

R,0.025^{, ∞]}^{。左右合わせて}^5%^。

_σ²の右片側カイ₂乗検定（左片側も同様）：帰無仮説、対立仮説は

H₀: σ²_{= σ}²_∗, H₁: . (13)

H₀^のカイ2乗値は、両側検定と同じく₍₁₁₎の通り。

⊲ ^図2B^{：右片側検定}_→ _σ^s²2

∗ ^>¹

（_{⇔ χ}²

∗大）だけをケア。よって

⇒ ^H⁰ ^{: σ}²= σ²_∗^を棄却^. ⁽¹⁴⁾

⊲ ^{右片側カイ}2乗検定の棄却域は、区間_[χ²

R,0.05^{, ∞]}^{。右側だけで}^5%^。

例：母分散に関する次の仮説を、両側カイ₂乗検定せよ。

H0: σ² _{= 100,} H1: σ²100. (15) ただし標本分散_{s = 180}、サンプル数_{n = 21}。

⊲ ^カイ2^乗値は

χ²_∗_{= (n}_{− 1)}^s

2

σ²_∗ ^{= 20}^· 180

100 ⁼ ^. ⁽¹⁶⁾

⊲ ^自由度m = 21 − 1 = 20^のカイ²^{乗分布は、左端}^2.5%^臨界値が^χ²_L,0.025= ^、右端_2.5%臨界値が_χ²

R,0.025⁼ ^。

⊲ χ²_∗ = 36 > 34.170（右端の棄却域に入る）。∴帰無仮説_H₀ _{: σ}² _{= 100}は、有意水準 5%^{の両側カイ}2^{乗検定で、} ^。

(6)

まとめと復習問題

今回のまとめ

仮説検定の概要。

母平均・母分散の仮説検定。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. ^{次の仮説を、両側}t^{検定する。}

H₀ _{: µ = 0,} H₁: µ 0. (17)

ただし標本から、標本平均_{X = 1}¯ 、標準偏差_{s = 1}、サンプル数_{n = 16}を得ている。

(a) t^{値を求めよ。}（計算過程は省略してよい。以下同じ。）

(b) ^{適切な臨界値を}t分布表から求め、棄却域（区間）を構成せよ。

(c) H₀_{: µ = 0}^{が棄却されれば○} ^{、棄却されなければ×} ^{と答えよ。}

2. 次の仮説を、右片側カイ₂乗検定せよ。

H0: σ² _{= 10,} H1: σ²>10. (18)

ただし標本から、標本分散_s²_{= 15}、サンプル数_{n = 21}を得ている。 (a) ^カイ2^{乗値を求めよ。}（計算過程は省略してよい。以下同じ。）

(b) ^{適切な臨界値をカイ}2乗分布表から求め、棄却域（区間）を構成せよ。 (c) H0: σ²_{= 10}^{が棄却されれば○} ^{、棄却されなければ×} ^{と答えよ。}

3. ^第1種の過誤をゼロにする方法を挙げよ。また、そうすることで、いかなる不都合が生じるか？簡潔に述べよ。

母数の仮説検定 経済統計 鹿野研究室