• 検索結果がありません。

配付資料スライド lecture Shinya Sugawara(菅原慎矢)

N/A
N/A
Protected

Academic year: 2017

シェア "配付資料スライド lecture Shinya Sugawara(菅原慎矢)"

Copied!
40
0
0

読み込み中.... (全文を見る)

全文

(1)

.

...

統計学 I および演習 第 14 回 仮説検定

菅原慎矢

July, 2016

(2)

仮説検定とは

仮説検定 (Hypothesis testing): 母集団に関する仮説 (Hypothesis) の妥当性を 検証する方法

帰無仮説・対立仮説を立て、どちらが正しいかを検討する 帰無仮説(Null hypothesis): 検証する対象

対立仮説(Alternative hypothesis): 帰無仮説の逆の仮説 ex.母平均 µ は 0 なのか を検定する

帰無仮説: µ = 0 対立仮説: µ ̸= 0

(3)

仮説検定の方法

標本から検定統計量を構成

検定統計量を用いて、帰無仮説が棄却される (Reject) か棄却されないかを 判断

検定統計量に関して、ここに入れば帰無仮説は棄却される、という棄却域を定 めて、そこに入っているかどうかを見る

用語: 有意水準(または検定のサイズ): 棄却域の面積,分析者が定める 用語: 境界値: 棄却域と棄却されない部分(受容域)との境目の値 メモ: 仮説検定と区間推定には密接な関係がある

(4)

検定の実際: 設定

今日考える状況は下記の設定とする 母分布: N(µ, σ2)

{X1, ..., Xn}は母分布からの大きさ n の無作為標本 σ2は未知の場合と既知の場合がある

(5)

平均に関する検定

帰無仮説: 母平均が既知の定数 µ0である: µ = µ0 二つの対立仮説:

µ > µ0: 片側検定

µ ̸= µ0 両側検定, µ < µ0µ > µ0両方を含む

(6)

平均の検定: σ

2

既知

(7)

平均の検定: σ

2

既知

以下は片側検定・両側検定とも共通 σ2が既知とする

平均の推定量として、 ¯Xを使う Z = ( ¯X − µ0)/√σ2/nとする

帰無仮説 µ = µ0が正しければ、Z ∼ N(0, 1) であり, Z の分布は平均 0 の回 りに集中する

帰無仮説が正しくなければ、上記のように定義された Z の平均は、0 から遠 いところになるはずであり、Z の密度関数は 0 から離れたところに大きな値 を取る (配付資料ミス)

(8)

平均の検定: σ

2

既知, 両側検定

対立仮説を µ ̸= µ0とする 有意水準を α とする 棄却域の構成:

Z0から離れたところにZの分布がある程度集中していたら棄却する 具体的には、Zの裾の確率が,左側(Z < 0)右側(Z > 0)合わせてα以上で あったら棄却する

図示

境界値Rα/2> 0を以下のように定める

P (|Z| > Rα/2) = α (1)

ただしここのZは、帰無仮説が正しいと仮定した元でのZであり、 Z ∼ N(0, 1)(配付資料に追加)

Rα/2の値を正規分布表から探す

検定方式: |Z| > Rα/2の時、帰無仮説を棄却する(配付資料に追加: このZ は、標本から構成されたZ)

(9)

平均の検定: σ

2

既知, 両側検定 2

Rα/2の求め方

α = P (|Z| > Rα/2) (2)

= P (Z > Rα/2∪ Z < −Rα/2) (3)

= 2P (Z > Rα/2) (4)

= 2[1 − P (Z < Rα/2)] (5) 三つ目の等号については図示. 上記の式を変形して

P (Z < Rα/2) = 1 − α/2 (6) となる R がもとめるもの. つまり、両側区間推定で求めた z と同じもの

(10)

平均の検定: σ

2

既知, 両側検定 3

上記は Z を検定統計量とする検定であったが、 ¯Xを検定統計量とする検定にす ることも出来る。以下では ⇔ は、これを挟む二つの式が同値であることを示す

|Z| > Rα/2 ⇔ Z > Rα/2 or Z < −Rα/2 (7)

X − µ¯ 0

√σ2/n > Rα/2or

X − µ¯ 0

√σ2/n < −Rα/2 (8) ここで

X − µ¯ 0

√σ2/n > Rα/2

X > µ¯ 0+ Rα/2√σ2/n (9) X − µ¯ 0

√σ2/n < −Rα/2

X < µ¯ 0− Rα/2√σ2/n (10)

(11)

平均の検定: σ

2

既知, 両側検定 4

従って、 ¯X > µ0+ Rα/2√σ2/nまたは ¯X < µ0− Rα/2√σ2/nの時棄却 区間推定との比較

信頼係数1 − αの両側信頼区間

[ ¯X − zα/2σ

n, ¯X + aα/2

√σ n

] (11)

ただしzα/2= Rα/2

従って、信頼係数 1 − α の信頼区間の外側が、有意水準 α の仮説検定の棄却 域となっている

(12)

平均の検定: σ

2

既知, 片側検定

(13)

平均の検定: σ

2

既知, 片側検定

対立仮説を µ > µ0,有意水準を α とする 棄却域の構成:

Z0から離れたところにZの分布がある程度集中していたら棄却する 具体的には、Zの裾の確率が右側(Z > 0)だけでα以上であったら棄却する

境界値Rα> 0を以下のように定める

P (Z > Rα) = α (12)

Rαの値を正規分布表から探す

検定方式: Z > Rαの時、帰無仮説を棄却する

(14)

平均の検定: σ

2

既知, 片側検定 2

Rαの求め方

α = P (Z > Rα) (13)

= 1 − P (Z < Rα) (14) 上記の式を変形して

P (Z < Rα) = 1 − α (15) となる Rαがもとめるもの. つまり、片側区間推定で求めた zαと同じもの

(15)

平均の検定: σ

2

既知, 片側検定 3

Z > RαX − µ¯ 0

√σ2/n > Rα (16)

⇔ X > µ¯ 0+ Rα√σ2/n (17) 従って、 ¯X > µ0+ Rα√σ2/nの時棄却。両側検定の時と同様に、これは信頼係 数 1 − α の片側信頼区間の外側

(16)

平均の検定: σ

2

未知

(17)

平均の検定: σ

2

未知

ここから σ2を未知として、µ に関する検定を考える σ2を S2で代用することを考える

T = ( ¯X − µ0)/√S2/nとする

帰無仮説 µ = µ0が正しければ、T ∼ t(n − 1) であり, T の分布は平均 0 の 回りに集中する

帰無仮説が正しくなければ、上記のように定義された T の平均は、0 から遠 いところになるはずであり、T の密度関数は 0 から離れたところに大きな値 を取る

(18)

平均の検定: σ

2

未知, 両側検定

対立仮説を µ ̸= µ0,有意水準を α とする 棄却域の構成:

T0から離れたところにT の分布がある程度集中していたら棄却する 具体的には、T の裾の確率が,左側(T < 0)右側(T > 0)合わせてα以上で あったら棄却する

境界値Rα/2> 0を以下のように定める

P (|T | > Rα/2) = α (18)

Rα/2の値をt分布表から探す

検定方式: |T | > Rα/2の時、帰無仮説を棄却する

(19)

平均の検定: σ

2

未知, 両側検定 2

Rα/2の求め方

P (T < Rα/2) = 1 − α/2 (19) となる Rα/2がもとめるもの. つまり、両側区間推定で求めた tα/2と同じもの

(20)

平均の検定: σ

2

未知, 両側検定 3

|T | > Rα/2 ⇔ T > Rα/2or T < −Rα/2 (20)

X − µ¯ 0

√S2/n > Rα/2or

X − µ¯ 0

√S2/n < −Rα/2 (21) ここで

X − µ¯ 0

√S2/n > Rα/2

X > µ¯ 0+ Rα/2√S2/n (22) X − µ¯ 0

√S2/n < −Rα/2

X < µ¯ 0− Rα/2√S2/n (23)

従って、 ¯X > µ0+ Rα/2√S2/nまたは ¯X < µ0− Rα/2√S2/nの時棄却

(21)

雑談

分散未知の時の T 統計量を用いた平均の検定を t 検定と呼ぶ 開発者: William Gosset

それ以前は正規分布を用いて検定していたようだが、t分布を用いた方が精度 が良いことを発見

ギネスビール社(アイルランド)のエンジニアであり、会社に隠れて行った研究 だったため、Studentというペンネームで論文を発表

そのためStudent t testと呼ばれる

S2を使った統計量なので,その次のアルファベットということでtと呼んだら しい

(22)

分散の検定

(23)

分散の検定

帰無仮説: σ2= σ02

対立仮説:

片側検定: σ2> σ02

両側検定: σ2̸= σ02

(24)

分散の検定: 片側検定

分散の推定量として、S2を使う U = (n − 1)S220とする

帰無仮説 σ2= σ02が正しければ、U ∼ χ2(n − 1)である 対立仮説を σ2> σ20,有意水準を α とする

棄却域の構成:

Uの右側の裾の確率がα以上であったら棄却する

境界値Rα> 0を以下のように定める

P (U > Rα) = α (24)

Rαの値をχ2分布表から探す

(25)

分散の検定: 片側検定 2

U > Rα(n − 1)S

2

σ02

> Rα (25)

⇔ S2> σ02Rα/(n − 1) (26) 従って、S2> σ20Rα/(n − 1)の時棄却

(26)

分散の検定: 両側検定

対立仮説を σ2̸= σ20,有意水準を α とする 棄却域の構成:

Uの左右の裾の確率がα以上であったら棄却する

境界値1 − Rα/2> 0, Rα/2> 0を以下のように定める

P (U < R1−α/2) = 1 − α/2 (27)

P (U > Rα/2) = α/2 (28)

R1−α/2, Rα/2の値をχ2分布表から探す

(27)

分散の検定: 両側検定 2

U < R1−α/2(n − 1)S

2

σ02

< R1−α/2 (29)

⇔ S2< σ02R1−α/2/(n − 1) (30) また

U > Rα/2(n − 1)S

2

σ02

> Rα/2 (31)

⇔ S2> σ02Rα/2/(n − 1) (32)

(28)

2 母集団の検定

(29)

2 母集団に関する検定

設定

{X1, ..., Xm}: 母分布N (µx, σ2x)からの大きさmの無作為標本 {Y1, ..., Yn}: 母分布N (µy, σ2y)からの大きさnの無作為標本 二つの母分布は独立とする

ex.

男性のテスト点数と女性のテスト点数とで、男女差があるかを検証したい

(30)

平均差の検定: 母分散既知

帰無仮説: µx− µy= 0

対立仮説: µx− µy̸= 0 (両側検定)

平均の差の推定量として、D = ¯X − ¯Y を用いる

母分散を既知とする:未知のケースはこの授業では扱わない Dは正規分布 N(µx− µy, σx2/m + σy2/n)に従う (証明略) 帰無仮説が正しければ、D ∼ N(0, σ2x/m + σ2y/n)

よって Z = D/σx2/m + σy2/nとすると、帰無仮説が正しければ Z ∼ N (0, 1)

(31)

平均差の検定: 母分散既知 2

有意水準を α とする 棄却域の構成:

Zの左右の裾の確率がα以上であったら棄却する境界値Rα/2> 0を以下 のように定める

P (|Z| > Rα/2) = α/2 (33)

これは平均に関する検定と同じ。以下同じ手順で

X − ¯¯ Y > Rα/2√σ2x/m + σ2y/nまたはX − ¯¯ Y < Rα/2√σx2/m + σ2y/nの時 棄却

(32)

実際の検定

(33)

実際の例: 例題 10.1

母平均 µ, 母分布 σ2の母集団からの大きさ n = 10 の無作為標本として、 {x1, ..., x10} = {3.4, 4.5, 1.9, −1.6, 4.4, 0.8, 3.2, −0.3, 0.8, 3.7}が得られたとする

前回も扱ったデータ

¯

x = 2.08, s2= 4.375

(34)

平均の検定: 母分散既知

帰無仮説を µ = 2 とする

両側検定、α = 0.05, 分散 σ2= 2を機知とする Zによる検定の境界値について

P (Z < Rα/2) = 1 − α/2 ⇒ Rα/2= 1.975 (34) 検定方式は ¯x > µ0+ Rα/2√σ2/nまたは ¯x < µ0− Rα/2√σ2/nの時棄却 各値を代入し,

µ0+ Rα/2√σ2/n = 2 + 1.975 ∗√2/10 = 2.87 (35) µ0− Rα/2√σ2/n = 2 − 1.975 ∗√2/10 = 1.13 (36) 今 1.12 < ¯x < 2.88 なので、有意水準 5%で帰無仮説は棄却されない

(35)

平均の検定: 母分散既知 2

帰無仮説を µ = 3.5 とする

両側検定、α = 0.05, 分散 σ2= 2を機知とする Zによる検定の境界値は同じく 1.975

検定方式も同じ 各値を代入し,

µ0+ Rα/2√σ2/n = 3.5 + 1.975 ∗√2/10 = 4.37 (37) µ0− Rα/2√σ2/n = 3.5 − 1.975 ∗√2/10 = 2.67 (38) 今 ¯x < 2.67 なので、有意水準 5%で帰無仮説は棄却される

(36)

平均の検定: 母分散未知

両側検定、α = 0.05 とする Zによる検定の境界値について

P (T < Rα/2) = 1 − α/2 ⇒ Rα/2= 2.26 (39) 検定方式は ¯x > µ0+ Rα/2√S2/nまたは ¯x < µ0− Rα/2√S2/nの時棄却 各値を代入し,

µ0+ Rα/2√S2/n = 2 + 2.26 ∗√2/10 = 3.49 (40) µ0− Rα/2√S2/n = 2 − 2.26 ∗√2/10 = 0.51 (41) 今 0.51 < ¯x < 3.49 なので、帰無仮説は棄却されない

(37)

追加的な概念

(38)

p 値

p値: 検定統計量 T の観測値が t であったとき、帰無仮説が正しいと仮定し たもとでこれが起こる確率:

P (T = t|帰無仮説) = p (42) p < αなら、有意水準 α で帰無仮説が棄却される

(39)

第一種・第二種の過誤

第一種の過誤 (Type I error): 帰無仮説が正しいときに、帰無仮説を棄却す る: これが起こる確率は有意水準 α

第二種の過誤 (Type II error): 対立仮説が正しいときに、帰無仮説を棄却し ない:

(40)

アナウンス

今日の内容は期末テスト範囲外です 授業アンケート

参照

関連したドキュメント

本市においては、良好な居住環境の保全を図るため、用途地域指定

 地表を「地球の表層部」といった広い意味で はなく、陸域における固体地球と水圏・気圏の

攻撃者は安定して攻撃を成功させるためにメモリ空間 の固定領域に配置された ROPgadget コードを用いようとす る.2.4 節で示した ASLR が機能している場合は困難とな

この項目の内容と「4環境の把 握」、「6コミュニケーション」等 の区分に示されている項目の

産業廃棄物を適正に処理するには、環境への有害物質の排出(水系・大気系・土壌系)を 管理することが必要であり、 「産業廃棄物に含まれる金属等の検定方法」 (昭和

当面の間 (メタネーション等の技術の実用化が期待される2030年頃まで) は、本制度において

また、 NO 2 の環境基準は、 「1時間値の1 日平均値が 0.04ppm から 0.06ppm までの ゾーン内又はそれ以下であること。」です

第12条第3項 事業者は、その産業廃棄物の運搬又は処分を他 人に委託する場合には、その運搬については・ ・ ・