配付資料スライド lecture Shinya Sugawara（菅原慎矢）

(1)

.

...

統計学 I および演習第 14 回仮説検定

菅原慎矢

July, 2016

(2)

仮説検定とは

仮説検定 (Hypothesis testing): 母集団に関する仮説 (Hypothesis) の妥当性を検証する方法

帰無仮説・対立仮説を立て、どちらが正しいかを検討する帰無仮説(Null hypothesis): 検証する対象

対立仮説(Alternative hypothesis): 帰無仮説の逆の仮説 ex.母平均 µ は 0 なのかを検定する

帰無仮説: µ = 0 対立仮説_{: µ ̸= 0}

(3)

仮説検定の方法

標本から検定統計量を構成

検定統計量を用いて、帰無仮説が棄却される (Reject) か棄却されないかを判断

検定統計量に関して、ここに入れば帰無仮説は棄却される、という棄却域を定めて、そこに入っているかどうかを見る

用語: 有意水準(または検定のサイズ): 棄却域の面積,分析者が定める用語: 境界値: 棄却域と棄却されない部分(受容域)との境目の値メモ: 仮説検定と区間推定には密接な関係がある

(4)

検定の実際: 設定

今日考える状況は下記の設定とする母分布: N(µ, σ²)

{X¹, ..., Xn}は母分布からの大きさ n の無作為標本 σ²は未知の場合と既知の場合がある

(5)

平均に関する検定

帰無仮説: 母平均が既知の定数 µ⁰である: µ = µ⁰ 二つの対立仮説:

µ > µ0: 片側検定

µ ̸= µ⁰ ^両側検定^{, µ < µ}⁰^と^{µ > µ}⁰^{両方を含む}

(6)

平均の検定: σ

²

既知

(7)

平均の検定: σ

²

既知

以下は片側検定・両側検定とも共通 σ²が既知とする

平均の推定量として、 ¯Xを使う Z = ( ¯X − µ0)/√σ²/nとする

帰無仮説 µ = µ0が正しければ、Z ∼ N(0, 1) であり, Z の分布は平均 0 の回りに集中する

帰無仮説が正しくなければ、上記のように定義された Z の平均は、0 から遠いところになるはずであり、Z の密度関数は 0 から離れたところに大きな値を取る (配付資料ミス)

(8)

平均の検定: σ

²

既知, 両側検定

対立仮説を µ ̸= µ⁰とする有意水準を α とする棄却域の構成:

Zが0から離れたところにZの分布がある程度集中していたら棄却する具体的には、Zの裾の確率が,左側(Z < 0)右側(Z > 0)合わせてα以上であったら棄却する

図示

⇒境界値R_α/2> 0を以下のように定める

P (|Z| > Rα/2^{) = α} ⁽¹⁾

ただしここのZは、帰無仮説が正しいと仮定した元でのZであり、 Z ∼ N(0, 1)(^{配付資料に追加}⁾

R_α/2の値を正規分布表から探す

検定方式: |Z| > Rα/2の時、帰無仮説を棄却する(配付資料に追加: このZ は、標本から構成されたZ)

(9)

平均の検定: σ

²

既知, 両側検定 2

Rα/2の求め方

α = P (|Z| > Rα/2) (2)

= P (Z > Rα/2∪ Z < −Rα/2) (3)

= 2P (Z > Rα/2) (4)

= 2[1 − P (Z < Rα/2)] (5) 三つ目の等号については図示. 上記の式を変形して

P (Z < Rα/2) = 1 − α/2 (6) となる R がもとめるもの. つまり、両側区間推定で求めた z と同じもの

(10)

平均の検定: σ

²

既知, 両側検定 3

上記は Z を検定統計量とする検定であったが、 ¯Xを検定統計量とする検定にすることも出来る。以下では ⇔ は、これを挟む二つの式が同値であることを示す

|Z| > Rα/2 ⇔ Z > Rα/2 or Z < −Rα/2 (7)

⇔ ^{X − µ}^¯ ⁰

√σ²/n ^{> R}^α/2^or

X − µ¯ ⁰

√σ²/n ^{< −R}^α/2 ⁽⁸⁾ ここで

X − µ¯ 0

√σ²/n ^{> R}^α/2 ^⇔

X > µ¯ 0+ R_α/2√σ²/n (9) X − µ¯ ⁰

√σ²/n ^{< −R}^α/2 ^⇔

X < µ¯ ⁰− Rα/2√σ²/n (10)

(11)

平均の検定: σ

²

既知, 両側検定 4

従って、 ¯X > µ0+ Rα/2√σ²/nまたは ¯X < µ0− Rα/2√σ²/nの時棄却区間推定との比較

信頼係数_{1 − α}の両側信頼区間

[ ¯_{X − z}_α/2_√^σ

n^{, ¯}^{X + a}^α/2

√σ n

] (11)

ただしz_α/2= R_α/2

従って、信頼係数 1 − α の信頼区間の外側が、有意水準 α の仮説検定の棄却域となっている

(12)

平均の検定: σ

²

既知, 片側検定

(13)

平均の検定: σ

²

既知, 片側検定

対立仮説を µ > µ⁰,有意水準を α とする棄却域の構成:

Zが0から離れたところにZの分布がある程度集中していたら棄却する具体的には、Zの裾の確率が右側(Z > 0)だけでα以上であったら棄却する

⇒^境界値^Rα> 0を以下のように定める

P (Z > Rα) = α (12)

Rαの値を正規分布表から探す

検定方式: Z > Rαの時、帰無仮説を棄却する

(14)

平均の検定: σ

²

既知, 片側検定 2

Rαの求め方

α = P (Z > Rα) (13)

= 1 − P (Z < Rα) (14) 上記の式を変形して

P (Z < Rα) = 1 − α (15) となる Rαがもとめるもの. つまり、片側区間推定で求めた zαと同じもの

(15)

平均の検定: σ

²

既知, 片側検定 3

Z > Rα ⇔ ^{X − µ}^¯ ⁰

√σ²/n ^{> R}^α ⁽¹⁶⁾

⇔ X > µ^¯ ⁰+ Rα√σ²/n (17) 従って、 ¯X > µ⁰+ Rα√σ²/nの時棄却。両側検定の時と同様に、これは信頼係数 1 − α の片側信頼区間の外側

(16)

平均の検定: σ

²

未知

(17)

平均の検定: σ

²

未知

ここから σ²を未知として、µ に関する検定を考える σ²を S²で代用することを考える

T = ( ¯X − µ0)/√S²/nとする

帰無仮説 µ = µ⁰が正しければ、T ∼ t(n − 1) であり, T の分布は平均 0 の回りに集中する

帰無仮説が正しくなければ、上記のように定義された T の平均は、0 から遠いところになるはずであり、T の密度関数は 0 から離れたところに大きな値を取る

(18)

平均の検定: σ

²

未知, 両側検定

対立仮説を µ ̸= µ0,有意水準を α とする棄却域の構成:

Tが0から離れたところにT の分布がある程度集中していたら棄却する具体的には、T の裾の確率が,左側(T < 0)右側(T > 0)合わせてα以上であったら棄却する

⇒^境界値^Rα/2> 0を以下のように定める

P (|T | > Rα/2^{) = α} ⁽¹⁸⁾

R_α/2の値をt分布表から探す

検定方式: |T | > Rα/2の時、帰無仮説を棄却する

(19)

平均の検定: σ

²

未知, 両側検定 2

Rα/2の求め方

P (T < Rα/2) = 1 − α/2 (19) となる Rα/2がもとめるもの. つまり、両側区間推定で求めた tα/2と同じもの

(20)

平均の検定: σ

²

未知, 両側検定 3

|T | > Rα/2 ⇔ T > Rα/2or T < −Rα/2 (20)

⇔ ^{X − µ}^¯ ⁰

√S²/n ^{> R}^α/2^or

X − µ¯ 0

√S²/n ^{< −R}^α/2 ⁽²¹⁾ ここで

X − µ¯ 0

√S²/n ^{> R}^α/2 ^⇔

X > µ¯ 0+ Rα/2√S²/n (22) X − µ¯ ⁰

√S²/n ^{< −R}^α/2 ^⇔

X < µ¯ ⁰− Rα/2√S²/n (23)

従って、 ¯X > µ⁰+ Rα/2√S²/nまたは ¯X < µ⁰− Rα/2√S²/nの時棄却

(21)

雑談

分散未知の時の T 統計量を用いた平均の検定を t 検定と呼ぶ開発者: William Gosset

それ以前は正規分布を用いて検定していたようだが、t分布を用いた方が精度が良いことを発見

ギネスビール社(アイルランド)のエンジニアであり、会社に隠れて行った研究だったため、Studentというペンネームで論文を発表

そのためStudent t testと呼ばれる

S²を使った統計量なので,その次のアルファベットということでtと呼んだらしい

(22)

分散の検定

(23)

分散の検定

帰無仮説: σ²= σ0²

対立仮説:

片側検定: σ²> σ0²

両側検定: σ²_{̸= σ}0²

(24)

分散の検定: 片側検定

分散の推定量として、S²を使う U = (n − 1)S²/σ²0とする

帰無仮説 σ²= σ0²が正しければ、U ∼ χ²(n − 1)である対立仮説を σ²> σ²0,有意水準を α とする

棄却域の構成:

Uの右側の裾の確率がα以上であったら棄却する

⇒^境界値^Rα> 0を以下のように定める

P (U > Rα) = α (24)

Rαの値をχ²分布表から探す

(25)

分散の検定: 片側検定 2

U > Rα ⇔ ^{(n − 1)S}

2

σ0²

> Rα (25)

⇔ S²> σ0²Rα/(n − 1) (26) 従って、S²> σ²0Rα/(n − 1)の時棄却

(26)

分散の検定: 両側検定

対立仮説を σ²̸= σ²0,有意水準を α とする棄却域の構成:

Uの左右の裾の確率がα以上であったら棄却する

⇒境界値1 − Rα/2^{> 0, R}α/2^{> 0}を以下のように定める

P (U < R1_−α/2) = _{1 − α/2} (27)

P (U > R_α/2) = α/2 (28)

R1_−α/2, Rα/2の値をχ²分布表から探す

(27)

分散の検定: 両側検定 2

U < R1_−α/2 ⇔ ^{(n − 1)S}

2

σ0²

< R1_−α/2 (29)

⇔ S²< σ0²R1_−α/2/(n − 1) (30) また

U > Rα/2 ⇔ ^{(n − 1)S}

2

σ0²

> Rα/2 (31)

⇔ S²> σ0²Rα/2/(n − 1) (32)

(28)

2 _{母集団の検定}

(29)

2 _{母集団に関する検定}

設定

{X¹^{, ..., X}m}: 母分布N (µx, σ²_x)からの大きさmの無作為標本 {Y¹^{, ..., Y}n}: ^母分布^{N (µ}y, σ²_y)からの大きさnの無作為標本二つの母分布は独立とする

ex.

男性のテスト点数と女性のテスト点数とで、男女差があるかを検証したい

(30)

平均差の検定: 母分散既知

帰無仮説: µx− µy= 0

対立仮説: µx− µy̸= 0 (両側検定)

平均の差の推定量として、D = ¯X − ¯Y を用いる

母分散を既知とする:未知のケースはこの授業では扱わない Dは正規分布 N(µx− µy, σ_x²/m + σ_y²/n)に従う (証明略) 帰無仮説が正しければ、D ∼ N(0, σ²_x/m + σ²_y/n)

よって Z = D/^√σ_x²/m + σ_y²/nとすると、帰無仮説が正しければ Z ∼ N (0, 1)

(31)

平均差の検定: 母分散既知 2

有意水準を α とする棄却域の構成:

Zの左右の裾の確率がα以上であったら棄却する_⇒境界値Rα/2> 0を以下のように定める

P (|Z| > Rα/2) = α/2 (33)

これは平均に関する検定と同じ。以下同じ手順で

X − ¯¯ ^{Y > R}α/2√σ²x/m + σ²y/nまたは_{X − ¯}^¯ Y < Rα/2√σx²/m + σ²y/nの時棄却

(32)

実際の検定

(33)

実際の例: 例題 10.1

母平均 µ, 母分布 σ²の母集団からの大きさ n = 10 の無作為標本として、 {x1, ..., x10} = {3.4, 4.5, 1.9, −1.6, 4.4, 0.8, 3.2, −0.3, 0.8, 3.7}が得られたとする

前回も扱ったデータ

¯

x = 2.08, s²= 4.375

(34)

平均の検定: 母分散既知

帰無仮説を µ = 2 とする

両側検定、α = 0.05, 分散 σ²= 2を機知とする Zによる検定の境界値について

P (Z < R_α/2) = 1 − α/2 ⇒ R_α/2= 1.975 (34) 検定方式は ¯x > µ0+ Rα/2√σ²/nまたは ¯x < µ0− Rα/2√σ²/nの時棄却各値を代入し,

µ0+ R_α/2√σ²/n = 2 + 1.975 ∗√2/10 = 2.87 (35) µ0− R_α/2√σ²/n = 2 − 1.975 ∗√2/10 = 1.13 (36) 今 1.12 < ¯x < 2.88 なので、有意水準 5%で帰無仮説は棄却されない

(35)

平均の検定: 母分散既知 2

帰無仮説を µ = 3.5 とする

両側検定、α = 0.05, 分散 σ²= 2を機知とする Zによる検定の境界値は同じく 1.975

検定方式も同じ各値を代入し,

µ⁰+ Rα/2√σ²/n = 3.5 + 1.975 ∗√2/10 = 4.37 (37) µ⁰− Rα/2√σ²/n = 3.5 − 1.975 ∗√2/10 = 2.67 (38) 今 ¯x < 2.67 なので、有意水準 5%で帰無仮説は棄却される

(36)

平均の検定: 母分散未知

両側検定、α = 0.05 とする Zによる検定の境界値について

P (T < Rα/2) = 1 − α/2 ⇒ Rα/2= 2.26 (39) 検定方式は ¯x > µ⁰+ Rα/2√S²/nまたは ¯x < µ⁰− Rα/2√S²/nの時棄却各値を代入し,

µ0+ Rα/2√S²/n = 2 + 2.26 ∗√2/10 = 3.49 (40) µ0− Rα/2√S²/n = 2 − 2.26 ∗√2/10 = 0.51 (41) 今 0.51 < ¯x < 3.49 なので、帰無仮説は棄却されない

(37)

追加的な概念

(38)

p 値

p値: 検定統計量 T の観測値が t であったとき、帰無仮説が正しいと仮定したもとでこれが起こる確率:

P (T = t|帰無仮説) = p (42) p < αなら、有意水準 α で帰無仮説が棄却される

(39)

第一種・第二種の過誤

第一種の過誤 (Type I error): 帰無仮説が正しいときに、帰無仮説を棄却する: これが起こる確率は有意水準 α

第二種の過誤 (Type II error): 対立仮説が正しいときに、帰無仮説を棄却しない:

(40)

アナウンス

今日の内容は期末テスト範囲外です授業アンケート

配付資料スライド lecture Shinya Sugawara（菅原慎矢）

統計学 I および演習 第 14 回 仮説検定

仮説検定とは

仮説検定の方法

検定の実際: 設定

平均に関する検定

平均の検定: σ

既知

平均の検定: σ

既知

平均の検定: σ

既知, 両側検定

平均の検定: σ

既知, 両側検定 2

平均の検定: σ

既知, 両側検定 3

平均の検定: σ

既知, 両側検定 4

平均の検定: σ

既知, 片側検定

平均の検定: σ

既知, 片側検定

平均の検定: σ

既知, 片側検定 2

平均の検定: σ

既知, 片側検定 3

平均の検定: σ

未知

平均の検定: σ

未知

平均の検定: σ

未知, 両側検定

平均の検定: σ

未知, 両側検定 2

平均の検定: σ

未知, 両側検定 3

雑談

分散の検定

分散の検定

分散の検定: 片側検定

分散の検定: 片側検定 2

分散の検定: 両側検定

分散の検定: 両側検定 2

2 母集団の検定

2 母集団に関する検定

平均差の検定: 母分散既知

平均差の検定: 母分散既知 2

実際の検定

実際の例: 例題 10.1

平均の検定: 母分散既知

平均の検定: 母分散既知 2

平均の検定: 母分散未知

追加的な概念

p 値

第一種・第二種の過誤

アナウンス

統計学 I および演習第 14 回仮説検定

2 _{母集団の検定}

2 _{母集団に関する検定}