• 検索結果がありません。

母数の仮説検定 経済統計 鹿野研究室

N/A
N/A
Protected

Academic year: 2018

シェア "母数の仮説検定 経済統計 鹿野研究室"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

担当:鹿野(大阪府立大学)

2014 年度前期

はじめに

前回の復習

 点推定の基準:不偏性・有効性。

 区間推定:95%信頼区間の推定。

今回学ぶこと

 母数の仮説検定。

 母平均・母分散の仮説検定。

 テキスト該当箇所:12章。

1 母数の仮説検定

1.1

仮説検定とは?

 母数の仮説検定:未知の母数θに対し、分析者があらかじめ置いた仮説値θ = θの真偽を 判断する手続きを、 と呼ぶ。その目的で用意した統計量を、

と呼ぶ。

⊲ 科学理論や品質基準、営業上の目標など、非統計的な根拠から θ(理論 値、基準値)を設定。統計的に支持されるか、判断。

⊲ 母数(未知)と仮説値の差θ − θは測れない推定量ˆθと仮説値の差ˆθ − θに注目。

⊲ 母数の推定(講義ノート#19)とは別の、統計的推測のスタイル。

 例:あるビール工場では、品質基準として製品の平均アルコール度数を4に設定してい る。製品全体(母集団)で、この基準を満たしているか検査。∴ここで仮説値はµ = 4

製品を無作為にn = 16個抽出標本平均X = 5.5¯ 、標本標準偏差s = 2

実測値X = 5.5¯ と基準値µ = 4の差 を、どう評価する?

 Remark:仮に、母平均が本当にµ = 4だとしても、標本平均(確率変数)の実現値がちょ

うどX = 4¯ となることは、ありえない。

⊲ ∴問題は、実測値と理論値のズレX − µ = 1.5¯ が「 」にあるかどうか。 1

(2)

⊲ ¯X − µ = 1.5を、大小の判断がつく (講義ノート#17)に置換すれば良い。

 検定統計量の利用:ビール工場の例で、µ = 4という前提でt統計量(この問題の検定統 計量)を求めると

t= X − µ¯ s/n =

1.5

2/4 = . (1)

一方、自由度m = 16 − 1 = 15t分布の2.5%臨界値はt0.025= 2.131

⊲ ∴ t = 3 > 2.131。差X − µ = 1.5¯ は、t統計量(t = 3)に換算すれば2.5%以下でし

か起こらないほど大きな値。µ = 4を主張するのはキツイ。

1.2

仮説検定と第

1 種・第 2 種の過誤

 Remark:仮説検定の手順。講義ノート#17#18で行ったように、t・カイ2乗統計量と

分布表を使えば良い。 1. 仮説値の設定。

2. 推定値と仮説値のズレを、検定統計量に変換。

3. 求めた検定統計量がその臨界値を超える場合、仮説値を疑う。

 帰無仮説と対立仮説

⊲ 帰無仮説:分析者が母数θに置いた仮説を と呼び、 : θ = θと表 記。∴これまで単に「仮説値」、「基準値」と呼んでいたもの。

対立仮説:帰無仮説H0に反する仮説を と呼び、 と表記。H0

が棄却されると、間接的に支持される主張。H1の選択肢として

H1 : θ  θ, H1: θ > θ, H1: θ < θ. (2)

検定の結果「H0はアヤシイ」と判定された場合、「H0は される」と言う。

 有意水準:H0棄却の基準となる「十分低い確率」を と呼び、αと表記。

⊲ α ⇔ H0にとって厳しい(棄却されやすい、少しのズレでもアウト)。

⊲ 通常使われる有意水準:α = 0.1, 0.05, 0.01この講義では、α = を採用。

 Remark:この判定ルールに基づくと、仮にH0 : θ = θが正しくとも、低確率ながら

(=有意水準)でH0を棄却してしまう。

「真であるH0を棄却するエラー」を、 と呼ぶ。(誤認逮捕。)∴高 い有意水準α ⇔1種の過誤を犯す確率高い。

「 偽 で あ るH0 を 棄 却 し な い エ ラ ー 」を 、 と 呼 ぶ 。( 犯 人 を 見 逃 す。)その確率は一般に、有意水準αの減少関数。∴第1vs.2種の過誤に、

の関係。

⊲ この検定方式の最適性は?大学院レベルの数理統計学で。仮説検定を、分析者が 直面する不確実性下の意思決定問題と考える。

(3)

1.3

両側検定と片側検定

 両側検定と片側検定:ある帰無仮説H0: θ = θに対し、対立仮説を

⊲ H1: θ  θと置いた検定を、 検定と呼ぶ。

⊲ H1: θ > θH1: θ < θ)と置いた検定を、 検定と呼ぶ。

 Remark:両側検定と片側検定、どちらを使う?問題に応じて、分析者が決める。

⊲ θθの大小関係が事前に 場合は両側検定、 場合 は右(or左)片側検定を使う。

⊲ どちらが適切か判断しかねる場合は、両側検定にすれば良い。

⊲ 両側・片側検定の選択で、検定の棄却域が変わる。詳しくは次節で。

 例:血圧降下剤を摂取した被験者の、治験後と治験前の血圧差X1,X2, . . . ,Xn

⊲ この治療に「効果がなかった」こと(血圧変化なし)を帰無仮説とすれば、H0: µ = 0

対立仮説は?「効果があった」こと(血圧を下げる)が期待されるので、ふさわ しい対立仮説の設定はH1 : 。∴左片側検定。

⊲ H0: µ = 0が棄却されれば、血圧降下剤の薬効H1: µ < 0が間接的に支持される。

2 母平均・母分散の仮説検定

2.1

母平均の

t 検定

 母平均µの両側t検定:帰無仮説、対立仮説は

H0: µ = µ, H1: . (3)

平均の実測値と理論値の差X − µ¯ t統計量に直すと t= X − µ¯

s/n . (4)

H0を基に標本から求めたt統計量の値tを、単に と呼ぶ。

1A:両側検定二つのケース、X − µ¯ <0⇔ t<0)とX − µ¯ >0⇔ t>0 を等しくケア。よって

or (|t| > t0.025) H0: µ = µを棄却. (5)

区間[−∞, −t0.025][t0.025, ∞]を、両側t検定の と呼ぶ。t値を求め、コ コに落ちたらH0を棄却。

注意:有意水準5%=両側検定なら「左右合わせて5%」の意味。

 µの右片側t検定(左片側も同様):帰無仮説、対立仮説は

H0: µ = µ, H1: . (6)

t値は、両側検定と同じく(4)の通り。

(4)

0.00.10.20.30.4

t

f(t)

- 2. 086 0 t0. 025

=2. 086

0. 025 0. 025

棄却域 棄却域

A: 両側t 検定

0.00.10.20.30.4

t

f(t)

0 t0. 05

=1. 711 0. 05 棄却域 B: 右片側t 検定

1:母平均µt検定(両側vs.右片側、自由度m = 24

1B:右片側検定→ ¯X − µ>0⇔ t>0)だけをケア。よって

H0: µ = µを棄却. (7)

右片側t検定の棄却域は、区間[t0.05, ∞]。右側だけで5%

 Remark:両側・片側検定ともに、t値の計算は全く同じ。

⊲ いずれのケースでも、実測値と理論値の乖離が無視できるレベルか、判断したい。

両者の違い:対立仮説H1の置き方 の取り方。

 例:母平均に関する次の仮説を、右片側t検定せよ。

H0: µ = 10, H1: µ > 10. (8)

ただし標本平均X = 10.5¯ 、標準偏差s = 10、サンプル数n = 25

⊲ t値は

t= 10.5 − 10 10/25 =

0.5

2/1 = . (9)

自由度m = 25 − 1 = 24t分布は、右側5%臨界値がt0.05=

t= 1 < 1.711(棄却域に入らない)帰無仮説H0: µ = 10は、有意水準5%の右片t検定で、 。

2.2

母分散のカイ

2 乗検定

 母分散σ2の両側カイ2乗検定:帰無仮説、対立仮説は

H0: σ2= σ2, H1: . (10)

分散の実測値と理論値の比 s

2

σ2 をカイ2乗統計量に直すと(

χ2= (n− 1)s

2

σ2. (11)

(5)

0.000.020.040.06

χ

2

f(χ

2 )

0 9. 591 χ0. 025 2

=34. 170

0. 025 0. 025

棄却域 棄却域

A: 両側カイ2乗検定

0.000.020.040.06

χ

2

f(χ

2 )

0 χ0. 05

2

=31. 410 0. 05 棄却域 B: 右片側カイ2乗検定

2:母分散σ2のカイ2乗検定(両側vs.右片側、自由度m = 20

2A:両側検定二つのケース、σs22

< 1⇔ χ2小さ過ぎ)とσs22

>1⇔ χ2大き 過ぎ)を等しくケア。よって

or H0: σ2= σ2を棄却. (12)

両側カイ2乗検定の棄却域は、区間[0, χ2

L,0.025] 2

R,0.025, ∞]。左右合わせて5%

 σ2の右片側カイ2乗検定(左片側も同様):帰無仮説、対立仮説は

H0: σ2= σ2, H1: . (13)

H0のカイ2乗値は、両側検定と同じく(11)の通り。

2B:右片側検定 σs22

>1

⇔ χ2

大)だけをケア。よって

H0 : σ2= σ2を棄却. (14)

右片側カイ2乗検定の棄却域は、区間2

R,0.05, ∞]。右側だけで5%

 例:母分散に関する次の仮説を、両側カイ2乗検定せよ。

H0: σ2 = 100, H1: σ2100. (15) ただし標本分散s = 180、サンプル数n = 21

カイ2乗値は

χ2= (n− 1)s

2

σ2 = 20· 180

100 = . (16)

自由度m = 21 − 1 = 20のカイ2乗分布は、左端2.5%臨界値がχ2L,0.025= 、右2.5%臨界値がχ2

R,0.025=

⊲ χ2 = 36 > 34.170(右端の棄却域に入る)。∴帰無仮説H0 : σ2 = 100は、有意水準 5%の両側カイ2乗検定で、

(6)

まとめと復習問題

今回のまとめ

 仮説検定の概要。

 母平均・母分散の仮説検定。

復習問題

出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。

1. 次の仮説を、両側t検定する。

H0 : µ = 0, H1: µ  0. (17)

ただし標本から、標本平均X = 1¯ 、標準偏差s = 1、サンプル数n = 16を得ている。

(a) t値を求めよ。(計算過程は省略してよい。以下同じ。)

(b) 適切な臨界値をt分布表から求め、棄却域(区間)を構成せよ。

(c) H0: µ = 0が棄却されれば○ 、棄却されなければ× と答えよ。

2. 次の仮説を、右片側カイ2乗検定せよ。

H0: σ2 = 10, H1: σ2>10. (18)

ただし標本から、標本分散s2= 15、サンプル数n = 21を得ている。 (a) カイ2乗値を求めよ。(計算過程は省略してよい。以下同じ。)

(b) 適切な臨界値をカイ2乗分布表から求め、棄却域(区間)を構成せよ。 (c) H0: σ2= 10が棄却されれば○ 、棄却されなければ× と答えよ。

3. 1種の過誤をゼロにする方法を挙げよ。また、そうすることで、いかなる不都合が生じ るか?簡潔に述べよ。

参照

関連したドキュメント

1880 年代から 1970 年代にかけて、アメリカの

1880 年代から 1970 年代にかけて、アメリカの

中国の農地賃貸市場の形成とその課題 (特集 中国 の都市と産業集積 ‑‑ 長江デルタで何が起きている か).

2006 年 6 月号から台湾以外のデータ源をIMF のInternational Financial Statistics に統一しました。ADB のKey Indicators of Developing Asian and Pacific

著者 研究支援部研究情報システム課.

[r]

著者 研究支援部研究情報システム課.

著者 研究支援部研究情報システム課.