配付資料スライド lecture Shinya Sugawara(菅原慎矢)

40 

Loading.... (view fulltext now)

Loading....

Loading....

Loading....

Loading....

全文

(1)

.

...

統計学

I

および演習 第

14

回 仮説検定

菅原慎矢

(2)

仮説検定とは

仮説検定

(Hypothesis testing):

母集団に関する仮説

(Hypothesis)

の妥当性を

検証する方法

帰無仮説・対立仮説を立て、どちらが正しいかを検討する

帰無仮説

(Null hypothesis):

検証する対象

対立仮説

(Alternative hypothesis):

帰無仮説の逆の仮説

ex.

母平均

µ

0

なのか を検定する

帰無仮説

:

µ

= 0

(3)

仮説検定の方法

標本から検定統計量を構成

検定統計量を用いて、帰無仮説が

棄却

される

(Reject)

か棄却されないかを

判断

検定統計量に関して、ここに入れば帰無仮説は棄却される、という

棄却域

を定

めて、そこに入っているかどうかを見る

用語

:

有意水準

(

または検定のサイズ

):

棄却域の面積

,

分析者が定める

用語

:

境界値

:

棄却域と棄却されない部分

(

受容域

)

との境目の値

(4)

検定の実際

:

設定

今日考える状況は下記の設定とする

母分布

:

N

(

µ, σ

2

)

{

X

1

, ..., X

n

}

は母分布からの大きさ

n

の無作為標本

(5)

平均に関する検定

帰無仮説

:

母平均が既知の定数

µ

0

である

:

µ

=

µ

0

二つの対立仮説

:

µ > µ

0

:

片側検定

(6)
(7)

平均の検定

:

σ

2

既知

以下は片側検定・両側検定とも共通

σ

2

が既知とする

平均の推定量として、

X

¯

を使う

Z

= ( ¯

X

µ

0

)

/

σ

2

/n

とする

帰無仮説

µ

=

µ

0

が正しければ、

Z

N

(0

,

1)

であり

,

Z

の分布は平均

0

の回

りに集中する

帰無仮説が正しくなければ、上記のように定義された

Z

の平均は、

0

から遠

いところになるはずであり、

Z

の密度関数は

0

から離れたところに大きな値

(8)

平均の検定

:

σ

2

既知

,

両側検定

対立仮説を

µ

̸

=

µ

0

とする

有意水準を

α

とする

棄却域の構成

:

Z

0

から離れたところに

Z

の分布がある程度集中していたら棄却する

具体的には、

Z

の裾の確率が

,

左側

(

Z <

0

)

右側

(

Z >

0)

合わせて

α

以上で

あったら棄却する

図示

境界値

R

α/2

>

0

を以下のように定める

P

(

|

Z

|

> R

α/2

) =

α

(1)

ただしここの

Z

は、帰無仮説が正しいと仮定した元での

Z

であり、

Z

N

(0

,

1)

(

配付資料に追加

)

R

α/2

の値を正規分布表から探す

検定方式

:

|

Z

|

> R

α/2

の時、帰無仮説を棄却する

(

配付資料に追加

:

この

Z

(9)

平均の検定

:

σ

2

既知

,

両側検定

2

R

α/

2

の求め方

α

=

P

(

|

Z

|

> R

α/

2

)

(2)

=

P

(

Z > R

α/

2

Z <

R

α/

2

)

(3)

=

2

P

(

Z > R

α/

2

)

(4)

=

2[1

P

(

Z < R

α/

2

)]

(5)

三つ目の等号については図示

.

上記の式を変形して

P

(

Z < R

α/

2

) = 1

α/

2

(6)

(10)

平均の検定

:

σ

2

既知

,

両側検定

3

上記は

Z

を検定統計量とする検定であったが、

X

¯

を検定統計量とする検定にす

ることも出来る。以下では

は、これを挟む二つの式が同値であることを示す

|

Z

|

> R

α/

2

Z > R

α/

2

or

Z <

R

α/

2

(7)

X

¯

µ

0

σ

2

/n

> R

α/

2

or

¯

X

µ

0

σ

2

/n

<

R

α/

2

(8)

ここで

¯

X

µ

0

σ

2

/n

> R

α/

2

¯

X > µ

0

+

R

α/

2

σ

2

/n

(9)

¯

X

µ

0

σ

2

/n

<

R

α/

2

¯

X < µ

0

R

α/

2

(11)

平均の検定

:

σ

2

既知

,

両側検定

4

従って、

X > µ

¯

0

+

R

α/

2

σ

2

/n

または

X < µ

¯

0

R

α/

2

σ

2

/n

の時棄却

区間推定との比較

信頼係数

1

α

の両側信頼区間

[

¯

X

z

α/2

σ

n

,

X

¯

+

a

α/2

σ

n

]

(11)

ただし

z

α/2

=

R

α/2

従って、信頼係数

1

α

の信頼区間の外側が、有意水準

α

の仮説検定の棄却

(12)
(13)

平均の検定

:

σ

2

既知

,

片側検定

対立仮説を

µ > µ

0

,

有意水準を

α

とする

棄却域の構成

:

Z

0

から離れたところに

Z

の分布がある程度集中していたら棄却する

具体的には、

Z

の裾の確率が右側

(

Z >

0

)

だけで

α

以上であったら棄却する

境界値

R

α

>

0

を以下のように定める

P

(

Z > R

α

) =

α

(12)

R

α

の値を正規分布表から探す

(14)

平均の検定

:

σ

2

既知

,

片側検定

2

R

α

の求め方

α

=

P

(

Z > R

α

)

(13)

= 1

P

(

Z < R

α

)

(14)

上記の式を変形して

P

(

Z < R

α

) = 1

α

(15)

(15)

平均の検定

:

σ

2

既知

,

片側検定

3

Z > R

α

¯

X

µ

0

σ

2

/n

> R

α

(16)

X > µ

¯

0

+

R

α

σ

2

/n

(17)

従って、

X > µ

¯

0

+

R

α

σ

2

/n

の時棄却。両側検定の時と同様に、これは信頼係

(16)
(17)

平均の検定

:

σ

2

未知

ここから

σ

2

を未知として、

µ

に関する検定を考える

σ

2

S

2

で代用することを考える

T

= ( ¯

X

µ

0

)

/

S

2

/n

とする

帰無仮説

µ

=

µ

0

が正しければ、

T

t

(

n

1)

であり

,

T

の分布は平均

0

回りに集中する

帰無仮説が正しくなければ、上記のように定義された

T

の平均は、

0

から遠

いところになるはずであり、

T

の密度関数は

0

から離れたところに大きな値

(18)

平均の検定

:

σ

2

未知

,

両側検定

対立仮説を

µ

̸

=

µ

0

,

有意水準を

α

とする

棄却域の構成

:

T

0

から離れたところに

T

の分布がある程度集中していたら棄却する

具体的には、

T

の裾の確率が

,

左側

(

T <

0

)

右側

(

T >

0)

合わせて

α

以上で

あったら棄却する

境界値

R

α/2

>

0

を以下のように定める

P

(

|

T

|

> R

α/2

) =

α

(18)

R

α/2

の値を

t

分布表から探す

(19)

平均の検定

:

σ

2

未知

,

両側検定

2

R

α/

2

の求め方

P

(

T < R

α/

2

) = 1

α/

2

(19)

(20)

平均の検定

:

σ

2

未知

,

両側検定

3

|

T

|

> R

α/

2

T > R

α/

2

or

T <

R

α/

2

(20)

X

¯

µ

0

S

2

/n

> R

α/

2

or

¯

X

µ

0

S

2

/n

<

R

α/

2

(21)

ここで

¯

X

µ

0

S

2

/n

> R

α/

2

¯

X > µ

0

+

R

α/

2

S

2

/n

(22)

¯

X

µ

0

S

2

/n

<

R

α/

2

¯

X < µ

0

R

α/

2

S

2

/n

(23)

従って、

X > µ

¯

0

+

R

α/

2

S

2

/n

または

X < µ

¯

0

R

α/

2

(21)

雑談

分散未知の時の

T

統計量を用いた平均の検定を

t

検定と呼ぶ

開発者

: William Gosset

それ以前は正規分布を用いて検定していたようだが、

t

分布を用いた方が精度

が良いことを発見

ギネスビール社

(

アイルランド

)

のエンジニアであり、会社に隠れて行った研究

だったため、

Student

というペンネームで論文を発表

そのため

Student t test

と呼ばれる

S

2

を使った統計量なので

,

その次のアルファベットということで

t

と呼んだら

(22)
(23)

分散の検定

帰無仮説

:

σ

2

=

σ

2

0

対立仮説

:

片側検定

:

σ

2

> σ

2

0

両側検定

:

σ

2

̸

(24)

分散の検定

:

片側検定

分散の推定量として、

S

2

を使う

U

= (

n

1)

S

2

2

0

とする

帰無仮説

σ

2

=

σ

2

0

が正しければ、

U

χ

2

(

n

1)

である

対立仮説を

σ

2

> σ

2

0

,

有意水準を

α

とする

棄却域の構成

:

U

の右側の裾の確率が

α

以上であったら棄却する

境界値

R

α

>

0

を以下のように定める

P

(

U > R

α

) =

α

(24)

R

α

の値を

χ

2

(25)

分散の検定

:

片側検定

2

U > R

α

(

n

1)

S

2

σ

2

0

> R

α

(25)

S

2

> σ

2

0

R

α

/

(

n

1)

(26)

従って、

S

2

> σ

2

(26)

分散の検定

:

両側検定

対立仮説を

σ

2

̸

=

σ

2

0

,

有意水準を

α

とする

棄却域の構成

:

U

の左右の裾の確率が

α

以上であったら棄却する

境界値

1

R

α/2

>

0

, R

α/2

>

0

を以下のように定める

P

(

U < R

1α/2

)

=

1

α/

2

(27)

P

(

U > R

α/2

)

=

α/

2

(28)

R

1α/2

,

R

α/2

の値を

χ

2

(27)

分散の検定

:

両側検定

2

U < R

1

α/

2

(

n

1)

S

2

σ

2

0

< R

1

α/

2

(29)

S

2

< σ

2

0

R

1

α/

2

/

(

n

1)

(30)

また

U > R

α/

2

(

n

1)

S

2

σ

2

0

> R

α/

2

(31)

S

2

> σ

2

(28)
(29)

2

母集団に関する検定

設定

{

X

1

, ..., X

m

}

:

母分布

N

(

µ

x

, σ

2x

)

からの大きさ

m

の無作為標本

{

Y

1

, ..., Y

n

}

:

母分布

N

(

µ

y

, σ

2

y

)

からの大きさ

n

の無作為標本

二つの母分布は独立とする

ex.

(30)

平均差の検定

:

母分散既知

帰無仮説

:

µ

x

µ

y

= 0

対立仮説

:

µ

x

µ

y

̸

= 0

(

両側検定

)

平均の差の推定量として、

D

= ¯

X

Y

¯

を用いる

母分散を既知とする

:

未知のケースはこの授業では扱わない

D

は正規分布

N

(

µ

x

µ

y

, σ

x

2

/m

+

σ

2

y

/n

)

に従う

(

証明略

)

帰無仮説が正しければ、

D

N

(0

, σ

2

x

/m

+

σ

2

y

/n

)

よって

Z

=

D/

σ

2

x

/m

+

σ

y

2

/n

とすると、帰無仮説が正しければ

(31)

平均差の検定

:

母分散既知

2

有意水準を

α

とする

棄却域の構成

:

Z

の左右の裾の確率が

α

以上であったら棄却する

境界値

R

α/2

>

0

を以下

のように定める

P

(

|

Z

|

> R

α/2

) =

α/

2

(33)

これは平均に関する検定と同じ。以下同じ手順で

¯

X

Y > R

¯

α/2

σ

2

x

/m

+

σ

2y

/n

または

X

¯

Y < R

¯

α/2

σ

2

x

/m

+

σ

2y

/n

の時

(32)
(33)

実際の例

:

例題

10.1

母平均

µ

,

母分布

σ

2

の母集団からの大きさ

n

= 10

の無作為標本として、

{

x

1

, ..., x

10

}

=

{

3

.

4

,

4

.

5

,

1

.

9

,

1

.

6

,

4

.

4

,

0

.

8

,

3

.

2

,

0

.

3

,

0

.

8

,

3

.

7

}

が得られたとする

前回も扱ったデータ

¯

x

= 2

.

08

,

s

2

(34)

平均の検定

:

母分散既知

帰無仮説を

µ

= 2

とする

両側検定、

α

= 0

.

05

,

分散

σ

2

= 2

を機知とする

Z

による検定の境界値について

P

(

Z < R

α/

2

) = 1

α/

2

R

α/

2

= 1

.

975

(34)

検定方式は

x > µ

¯

0

+

R

α/

2

σ

2

/n

または

x < µ

¯

0

R

α/

2

σ

2

/n

の時棄却

各値を代入し

,

µ

0

+

R

α/

2

σ

2

/n

= 2 + 1

.

975

2

/

10 = 2

.

87

(35)

µ

0

R

α/

2

σ

2

/n

= 2

1

.

975

2

/

10 = 1

.

13

(36)

(35)

平均の検定

:

母分散既知

2

帰無仮説を

µ

= 3

.

5

とする

両側検定、

α

= 0

.

05

,

分散

σ

2

= 2

を機知とする

Z

による検定の境界値は同じく

1.975

検定方式も同じ

各値を代入し

,

µ

0

+

R

α/

2

σ

2

/n

=

3

.

5 + 1

.

975

2

/

10 = 4

.

37

(37)

µ

0

R

α/

2

σ

2

/n

=

3

.

5

1

.

975

2

/

10 = 2

.

67

(38)

(36)

平均の検定

:

母分散未知

両側検定、

α

= 0

.

05

とする

Z

による検定の境界値について

P

(

T < R

α/

2

) = 1

α/

2

R

α/

2

= 2

.

26

(39)

検定方式は

x > µ

¯

0

+

R

α/

2

S

2

/n

または

x < µ

¯

0

R

α/

2

S

2

/n

の時棄却

各値を代入し

,

µ

0

+

R

α/

2

S

2

/n

= 2 + 2

.

26

2

/

10 = 3

.

49

(40)

µ

0

R

α/

2

S

2

/n

= 2

2

.

26

2

/

10 = 0

.

51

(41)

(37)
(38)

p

p

:

検定統計量

T

の観測値が

t

であったとき、帰無仮説が正しいと仮定し

たもとでこれが起こる確率

:

P

(

T

=

t

|

帰無仮説

) =

p

(42)

(39)

第一種・第二種の過誤

第一種の過誤

(Type I error):

帰無仮説が正しいときに、帰無仮説を棄却す

:

これが起こる確率は有意水準

α

(40)

アナウンス

Updating...

参照

Updating...

関連した話題 :