• 検索結果がありません。

資料置き場 hustat2017 20171215slide

N/A
N/A
Protected

Academic year: 2018

シェア "資料置き場 hustat2017 20171215slide"

Copied!
63
0
0

読み込み中.... (全文を見る)

全文

(1)

統計学 第

11

回: 仮説検定

担当者: 高木 真吾

講義資料等は,

http://sites.google.com/site/hustat2017/

質問等は,

stakagi@econ.hokudai.ac.jp

までお願いします.

(2)

母集団分布が正規分布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布でないとき

復習

導入:仮説の検証とは

仮説検定

母集団平均 µ に関す る仮説検定

母集団比率 p に関す る仮説検定

解説編

母集団:母集団平均 µX,母集団分散 σ2 X

大きさ n の無作為標本:{X1, X2, . . . , Xn}

標本平均・標本分散

¯

X = 1

n

n

X

i=1

Xi, SX2 =

1

n 1

n

X

i=1

(3)

母集団分布が正規分布のとき

1. 標本平均について(σ2 をそのまま用いて)

¯

X µX

p

σ2/n ∼ N(0,1) (1)

n の大きさにかかわりなく成立する結果

2. 標本平均について(σ2

X を S2 で置き換えると)

¯

X µX

p

S2/n ∼ t(n − 1) 自由度 n − 1 のt分布 (2)

n の大きさにかかわりなく成立する結果

3. 標本分散について

(4)

母集団分布が正規分布でないとき

1. 標本平均について(σ2 をそのまま用いて)

¯

X µX

p

σ2/n (4)

厳密にはどのような分布に従うかは分からないが,n が大きければ,中心極限定理

から標準正規分布で近似可能

2. 標本平均について(σ2

X を S2 で置き換えると)

¯

X µX

p

S2/n = ¯

X µX

p

σX2 /n · p

σX2 /n p

S2/n (5)

厳密にはどのような分布に従うかは分からないが,n が大きければ,中心極限定理

(5)

復習

母集団分布が正規分

布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布でないとき

復習

正規母集団

導入:仮説の検証とは

仮説検定

母集団平均 µ に関す る仮説検定

母集団比率 p に関す る仮説検定

(6)

正規母集団

母集団分布:正規分布/母集団平均 µX・母集団分散 σ2 X

大きさ n の標本:{X1, X2, . . . , Xn}, Xi ∼ N(µ, σ2)

標本平均,標本分散

¯

X = 1

n

n

X

i=1

Xi, SX2 =

1

n 1

n

X

i=1

(7)

基準化した標本平均について

¯

X µX

p

σX2 /n ∼ N(0,1)

次のような統計量(確率変数)を考える

Z(k) pX¯ − k

σX2 /n (6)

この Z(k) は以下のように書き換えることができる

Z(k) = pX¯ − k

σ2 /n =

¯

X µX

p

σ2 /n +

µX − k

p

(8)

前提条件 :

¯

X µX

p

σX2 /n ∼ N(0,1)

興味ある統計量 : Z(k) =

¯

X µX

p

σX2 /n +

µX − k

p

σX2 /n

1. µX = k のとき,Z(k) ∼ N(0,1)

2. µX > k のとき,第一項は標準正規分布,第二項は正の値:中心が正の方向へ

3. µX < k のとき,第一項は標準正規分布,第二項は負の値:中心が負の方向へ

(9)

図解

0.0

0.1

0.2

0.3

0.4

Z(k) の分布: µ

X=

2 , σ

X 2

=1 , n=10

cbind(y1, y2, y3)

µX=

k

µX>

k ( ex. k=1)

µX<

(10)

基準化した標本平均について

¯

X µX

p

SX2 /n ∼ t(n − 1)

次のような統計量(確率変数)を考える

T(k) pX¯ − k

SX2 /n (8)

この T(k) は以下のように書き換えることができる

T(k) = pX¯ − k

SX2 /n =

¯

X µX

p

SX2 /n +

µX − k

p

(11)

前提条件 :

¯

X µX

p

SX2 /n ∼ t(n − 1)

興味ある統計量 : T(k) =

¯

X µX

p

SX2 /n +

µX − k

p

SX2 /n

1. µX = k のとき,Z(k) ∼ t(n − 1)

2. µX > k のとき,第一項はt分布,第二項は正の値:中心が正の方向へ

3. µX < k のとき,第一項はt分布,第二項は負の値:中心が負の方向へ

(12)

図解

-5 0 5

0.0

0.1

0.2

0.3

0.4

T(k) の分布: µ

X=

2 , n=10 ( σ

X 2

=1 )

cbind(y1, y2, y3)

µX=

k

µX>

k ( ex. k=1)

µX<

(13)

導入:仮説の検証とは

母集団分布が正規分

布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布でないとき

復習

導入:仮説の検証とは

仮説の検証

問題1:蛍光灯の 寿命

問題2:蛍光灯の 寿命

仮説検定

母集団平均 µ に関す る仮説検定

(14)

仮説の検証

統計調査には誤差が伴う

視聴率 10%%以下なら打ち切り?

例)600 世帯で調査を行う視聴率調査:目標視聴率 10%,調査結果 9.2%:目

標達成ならず?

食品の目方は大丈夫?

例)300g 入りの食品が出荷前に検査を受けた.1000 個を無作為に抜き出し,

重さを量ったところ平均 299g,分散 20g であったとき,この程度は誤差とい

えるか?

どの程度の確信を持って,結論を下せるのか?仮説検定ではこの問題に答える.

統計調査に伴う誤差 or,何か理由があって乖離している?

(15)

問題1:蛍光灯の寿命

ある蛍光灯の寿命に関して,設計通りならば定格寿命 6000 時間とされている

また寿命に関して,個々の製品ごとに製造時の異物混入や実験場の不備等で若干寿

命がばらつくものの,寿命の差異はだいたい正規分布に従うとされている.

ここから製品 6 個を抜き出し,寿命について調査をしたところ,

{6005,5930,5940,5930,6000,5970} (単位:時間)となった. 1. 寿命までの時間の平均値,分散値を求めてください.

2. 6000 時間は持続するとされているので,寿命に関する真の平均(母集団平均)

が 6000 時間であることを仮説として表現するとどうなりますか?

(16)

解答1:蛍光灯の寿命

大きさnの標本 {X1, X2, . . . , Xn} に関して,標本平均・標本分散は以下のように与 えられる

¯

X = 1

n

n

X

i=1

Xi, S2 =

1

n 1

n

X

i=1

(Xi − X¯)2

(17)

解答1(つづき)

:蛍光灯の寿命

1. 問題の観測値 {6005,5930,5940,5930,6000, 5970} を用いて,平均値,分散値を計算 すると,

¯

x = 6005 + · · · + 5970

6 ≈ 5963

s2 = 1

6 1{(6005 − 5963)

2 +

· · · + (5970 5963)2} ≈ 1178

となった.

2. 寿命の平均が 6000 時間持続すると考えると,母集団平均 µ を用いて,µ = 6000 と

表現できる.

3. 寿命の平均が 6000 時間持続することが成り立たないので µ 6= 6000 と表現できる.

µ = 6000 と µ 6= 6000,上のデータからは,この二つのうちどちらがもっともらし

(18)

問題2:蛍光灯の寿命

改良した蛍光灯の寿命に関して,設計通りならば従来の定格寿命 6000 時間を越える

とされている

また寿命に関して,個々の製品ごとに製造時の異物混入や実験場の不備等で若干寿

命がばらつくものの,寿命の差異はだいたい正規分布に従うとされている.

ここから製品 7 個を抜き出し,寿命について調査をしたところ,

{6010,6000,5980,5990,6000,6040,6100} (単位:時間)となった. 1. 寿命までの時間の平均値,分散値を求めてください.

2. 6000 時間は持続するとされているので,寿命に関する真の平均(母集団平均)

が 6000 時間であることを仮説として表現するとどうなりますか?

(19)

解答2:改良した蛍光灯の寿命

大きさnの標本 {X1, X2, . . . , Xn} に関して,標本平均・標本分散は以下のように与 えられる

¯

X = 1

n

n

X

i=1

Xi, S2 =

1

n 1

n

X

i=1

(Xi − X¯)2

(20)

解答2:改良した蛍光灯の寿命

1. 問題の観測値 {6010,6000,5980,5990,6000,6040,6100} を用いて,平均値,分散値 を計算すると,

¯

x = 6010 + · · · + 6100

7 ≈ 6017

s2 = 1

7 1{(6010 − 6017)

2 +

· · · + (6100 6017)2} ≈ 1690

となった.

2. 寿命の平均が 6000 時間持続すると考えると,母集団平均 µ を用いて,µ = 6000 と

表現できる.

3. 改良した製品の寿命の平均は 6000 時間以上持続すると考えられているので

µ > 6000 と表現できる.

µ = 6000 と µ > 6000,上のデータからは,この二つのうちどちらがもっともらし

(21)

仮説検定

母集団分布が正規分

布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布でないとき

復習

導入:仮説の検証とは

仮説検定

検定の手順

検定の手順

母集団平均 µ に関す る仮説検定

母集団比率 p に関す る仮説検定

(22)

仮説検定

仮説検定とは

帰無仮説(問題1では,µ = 6000)

対立仮説(問題1では,µ 6= 6000)

の二つをデータから判断してどちらがもっともらしいかを見る方法である

具体的には,『帰無仮説が正しい』という仮説を棄却するか,しないかで判断する

『帰無仮説が正しい』という仮説を棄却:対立仮説の方がもっともらしい

『帰無仮説が正しい』という仮説を棄却できない:帰無仮説の方がもっともら

(23)

検定の手順

考え方:

======

======

======

======

======

からどちらが妥当かを判断

帰無仮説と対立仮説

一方の仮説が正しいと想定し, 統

˜˜˜˜˜

˜˜˜˜˜

˜˜˜˜˜

の分布を考える

帰無仮説が正しいと想定,

その統計量が,あ

∼ ∼

∼ ∼

∼ ∼

∼ ∼

∼ ∼

∼ ∼

以下でしか起きないはずのことが観測

最初の想定がおかしい

帰無仮説が正しいきには起きないと思われることが起きた=対立仮説

(24)

検定の手順

1 二つの仮説を立てる(帰無仮説 H0 と対立仮説 H1) 2 有意水準を定める

上記,太破線の低い確率=有意水準(通常,5%か1%)

帰無仮説が正しいときには,マレ(5%程度の確率)にしか起きない領域が棄却

域(後述)

仮説検定では,「帰無仮説が正しいとしても,非常に小さい確率で発生するかも

しれないが,普通は対立仮説が正しいから起きるような自体」がおきたら帰無

仮説を棄てて,対立仮説を採用するという考え方

3 検定統計量を定める(上記,破線)

標本から構成できる量(未知の母数を含まない)

(25)

検定の手順

4 棄却域を決める(棄却のためのルール:検定統計量の実現値がこの領域に入ること)

棄却域とは,帰無仮説が正しいとき検定統計量の実現値が出にくく,対立仮説

が正しいときには実現しやすい領域となるように選ぶ

帰無仮説が正しいとき,この領域で実現する確率は有意水準となるようにして

設定する

5 検定統計量の値が棄却域に含まれるかどうかをみる

棄却域に含まれるとき,帰無仮説を棄てる

(26)

仮説検定における二種類の誤りと望ましい検定

第一種の過誤(Type I Error):帰無仮説が正しいのに,帰無仮説を捨てる誤り

第一種の過誤の発生確率:帰無仮説が正しいとき,検定統計量の値が棄却域に入

る確率

第二種の過誤(Type II Error):帰無仮説が正しくないのに,帰無仮説を捨てない誤り

第二種の過誤の発生確率:対立仮説が正しいとき,検定統計量の値が棄却域に入

らない確率

検出力(Statistical Power):帰無仮説が正しくないとき,帰無仮説を棄却する確率

1− 第二種の過誤の発生確率:対立仮説が正しいとき,検定統計量の値が棄却域

(27)

望ましい検定(の一つ)

なるべく検出力が高い

第一種の過誤はあまり大きくない

望ましい検定の作り方

第一種の過誤を小さい値に固定して,棄却域を選ぶ

(28)

例:コインが公平?

帰無仮説:コインが公平(p = 1/2)/ 対立仮説:コインは公平でない(ここでは,

p = 1/5 とする)

判定基準:コインを5回投げて,そのうち 表が1回以下 ならこのコインが公平でな

いと判断

Type I Error:

Pr[Y 1|p = 1/2] =5 C0

1 2 0 1 2

5−0

+5 C1

1 2 1 1 2

5−1

= 0.1875

Type II Error:

Pr[Y 2|p = 1/5] =5 C2

1 5 2 4 5

5−2

+· · ·+5C5

1 5 5 4 5

5−5

= 0.26272

(29)

例:コインが公平?

帰無仮説:コインが公平(p = 1/2)/ 対立仮説:コインは公平でない(p = 1/5)

判定基準:コインを5回投げて,そのうち 表が4回以上 ならこのコインが公平でな

いと判断

Type I Error:

Pr[Y 4|p = 1/2] =5 C4

1 2 4 1 2

5−4

+5 C5

1 2 5 1 2

5−5

= 0.1875

Type II Error:

Pr[Y 3|p = 1/5] =5 C0

1 5 0 4 5

5−0

+· · ·+5C3

1 5 3 4 5

5−3

= 0.99328

(30)

例:コインが公平?

帰無仮説:コインが公平(p = 1/2)/ 対立仮説:コインは公平でない(p = 1/5)

判定基準:コインを5回投げて,そのうち 表が2回以下 ならこのコインが公平でな

いと判断

Type I Error:

Pr[Y 2|p = 1/2] =5 C0

1 2 0 1 2

5−0

+5C1

1 2 1 1 2

5−1

+5C2

1 2 1 1 2

5−2

= 0.5

Type II Error:

Pr[Y 3|p = 1/5] =5 C3

1 5 3 4 5

5−3

+5C4

1 5 4 4 5

5−4

+5C5

1 5 5 4 5

5−5

= 0.05792

検出力: Pr[Y ≤ 2|p = 1/5] = 1 − 0.05792 = 0.94208

(31)

母集団平均

µ

に関する仮説検定

母集団分布が正規分

布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布でないとき

復習

導入:仮説の検証とは

仮説検定

母集団平均 µ に関す る仮説検定

問題2(つづき)

H0 : µ = µ0,

H1 : µ > µ0 のタ イプ

問題2:図解

問題2(つづき)

H0 : µ = µ0,

H1 : µ > µ0 のタ イプ

問題2:図解(自由 度n− 1 =

71 = 6) 問題1(つづき)

H0 : µ = µ0,

H1 : µ 6= µ0 のタ イプ

問題1:図解

問題1(つづき)

のタ イプ

問題1:図解(自由 度

練習問題 :内容量 検査:

のタ イプ

練習問題 解答: 内容量検査

練習問題 :図解 (自由度が大きいと

きは正規分布と 同じ)

練習問題 解答: 内容量検査

(32)

問題2(つづき)

H

0

:

µ

=

µ

0

,

H

1

:

µ > µ

0

のタイプ

問題2を用いて,改良した蛍光灯の寿命が平均的に 6000 時間を越えるかどうかの検定

を行う

1 帰無仮説 H0 : µ = 6000 / 対立仮説 H1 : µ > 6000

2 有意水準は5%とする

3 検定統計量として T =

¯

X6000

S2/n

を考える.

この T は H0 : µ = 6000 が正しいとき,T =

¯

X−µ

S2/n

となって(9)式より,自由

度 n − 1 = 7 − 1 = 6 のt分布に従う.

この T は H1 : µ > 6000 が正しいとき,本当の母集団平均が 6000 より大きいの

で T =

¯

X√−6000

(33)

問題2:図解

-4 -2 0 2 4 6 8

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

t : Pr[ T > t ] = 0.05

0.2

0.3

0.4 H

1

が正しい:µ > µ

0

H

1

が正しい:µ >> µ

0

H

1

が正しい:µ >>> µ

0

0.2

0.3

(34)

問題2(つづき)

H

0

:

µ

=

µ

0

,

H

1

:

µ > µ

0

のタイプ

問題2を用いて,改良した蛍光灯の寿命が平均的に 6000 時間を越えるかどうかの検定

を行う

4 棄却域は図より,有意水準を5%とすると [1.943,∞] となる.

5 検定統計量の値は以下のように 1.19 なので棄却域に含まれていない.

t = x¯p− 6000

s2/n =

6017.14 6000

p

1690.48/7 = 1.10

したがって帰無仮説 H0 : µ = 6000 は棄却されないので,新製品の寿命が延びたと

(35)

問題2:図解(自由度

n

1 = 7

1 = 6

-4 -2 0 2 4 6 8

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

t = 1.943

0.2

0.3

0.4 H

1

が正しい:µ > µ

0

H

1

が正しい:µ >> µ

0

H

1

が正しい:µ >>> µ

0

0.2

0.3

(36)

問題1(つづき)

H

0

:

µ

=

µ

0

,

H

1

:

µ

6

=

µ

0

のタイプ

問題1を用いて,蛍光灯の寿命が平均的に 6000 時間かどうかの検定を行う

1 帰無仮説 H0 : µ = 6000 / 対立仮説 H1 : µ 6= 6000

2 有意水準は5%とする

3 検定統計量として T =

¯

X6000

S2/n を考える.

この T は H0 : µ = 6000 が正しいとき,T =

¯

X−µ

S2/n

となって(9)式より,自由

度 n − 1 = 6 − 1 = 5 のt分布に従う.

この T は H1 : µ 6= 6000 が正しいとき,本当の母集団平均が 6000 より大きい,

あるいは小さいので T =

¯

X√−6000

S2/n は0から離れる値をとりやすい傾向((9)式

(37)

問題1:図解

-6 -4 -2 0 2 4 6

0.0 0.1 0.2 0.3 0.4 x H

0:µ = µ0

が正しい

t: Pr[T>t]=0.025 t: Pr[T<t]=0.025 0.2 0.3 0.4 H 1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ > µ

0

H

1

が正しい:µ >> µ

0

0.2

0.3

(38)

問題1(つづき)

H

0

:

µ

=

µ

0

,

H

1

:

µ

6

=

µ

0

のタイプ

問題1を用いて,蛍光灯の寿命が平均的に 6000 時間かどうかの検定を行う

4 棄却域は図より,有意水準を5%とすると [∞, −2.571,] あるいは [2.571,∞] となる.

5 検定統計量の値は以下のように -2.68 なので棄却域に含まれている.

t = x¯p− 6000

s2/n =

5962.50 6000

p

1177.50/6 = −2.68

したがって帰無仮説 H0 : µ = 6000 は棄却されるので,この製品の寿命が 6000 時間

(39)

問題1:図解(自由度

n

1 = 6

1 = 5

-6 -4 -2 0 2 4 6

0.0 0.1 0.2 0.3 0.4 x H

0:µ = µ0

が正しい

Pr[T>2.571]=0.025 Pr[T<-2.571]=0.025 0.2 0.3 0.4 H 1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ > µ

0

H

1

が正しい:µ >> µ

0

0.2

0.3

(40)

練習問題

A

:内容量検査:

H

0

:

µ

=

µ

0

,

H

1

:

µ < µ

0

のタ

イプ

300g 入りの食品が出荷前に検査を受けた.

1000 個を無作為に抜き出し,重さを量って検査を行った

平均値 299g,分散値 20 であったとき,この程度は誤差といえるか?

1. 真の平均を µ としてこの問題にふさわしい帰無仮説と対立仮説を立ててくだ

さい.

2. その上で,有意水準5%で検定を行ってください

ヒント)本当に知りたいことは「真の(内容量の)平均が 300 であるかどうか」で

(41)

練習問題

A

解答:内容量検査

問題の設定より n = 1000,x¯ = 299,s2 = 20 である.

1 帰無仮説 H0 : µ = 300 / 対立仮説 H1 : µ < 300 (300g 以上なら消費者に損は

ない)

2 有意水準は5%とする

3 検定統計量として T =

¯

X300

S2/n

を考える.

この T は H0 : µ = 300 が正しいとき,T =

¯

X−µ

S2/n

となって(9)式より,自由

度 n − 1 = 999 のt分布に従う

1

この T は H1 : µ < 300 が正しいとき,本当の母集団平均が 300 より小さいので

T = √X¯−300

(42)

練習問題

A

:図解(自由度が大きいときは正規分布と同じ)

-8 -6 -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

z = -1.64

0.2

0.3

0.4 H

1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ <<< µ

0

0.2

0.3

(43)

練習問題

A

解答:内容量検査

問題の設定より n = 1000,x¯ = 299,s2 = 20 である.

4 棄却域は図より,有意水準を5%とすると [∞, −1.64] となる(nが大きいとき,表 の下段を利用).

5 検定統計量の値は以下のように-7.071 なので棄却域に含まれている.

t = x¯p− 300

s2/n =

299 300

p

20/1000 = −7.071

したがって帰無仮説 H0 : µ = 300 は棄却されるので,傾向的にはほんのわずかに少

ないだけのように見えるが,1000 個も調べてこの結果であれば統計的には強く 300g

(44)

練習問題

A

:図解(自由度が大きいときは正規分布と同じ)

-8 -6 -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

z = -1.64

0.2

0.3

0.4 H

1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ <<< µ

0

0.2

0.3

(45)

母集団比率

p

に関する仮説検定

母集団分布が正規分

布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布でないとき

復習

導入:仮説の検証とは

仮説検定

母集団平均 µ に関す る仮説検定

母集団比率 p に関す る仮説検定

問題3:視聴率の 問題

問題3解答:視聴率 の問題 /

H0 : p = p0,

H1 : p < p0のタ イプ

問題3解答:視聴率 の問題:図解

問題3解答:視聴率 の問題 /

H0 : p = p0,

H1 : p < p0のタ イプ

練習問題 :視聴率 の問題

練習問題 解答:

(46)

問題3:視聴率の問題

600 人にある番組を見たかどうかを尋ねたところ,55 人が「見た」と回答した

真の視聴率が 10 %未満であると打ち切りの問題が出るので,統計的に 10 %とみな

せるのか,それとも 10 %未満とみなすべきなのかが知りたい

上の問題を有意水準5%で検定してください

ヒント)真の視聴率(母集団比率)が p であるとき,近似的に次の結果が成り立つ

Z = p X¯ − p

p(1 p)/n ∼ N(0,1),

¯

X は1(「見た」)となる割合

(47)

問題3解答:視聴率の問題 /

H

0

:

p

=

p

0

H

1

:

p < p

0

タイプ

問題の設定より n = 600,x¯ = 55/600 = 0.0917 である. 1 帰無仮説 H0 : p = 0.10 / 対立仮説 H1 : p < 0.10

2 有意水準は5%とする

3 検定統計量として Z =

¯

X0.10

0.10·(1−0.10)/n

を考える.

この Z は H0 : p = 0.10 が正しいとき,Z =

¯

X−p

p(1−p)/n

となって(10)式より,

標準正規分布に従う(p = 0.10 が成り立っていているので(10)式と比較する)

2

この Z は H1 : p < 0.10 が正しいとき,本当の母集団比率が 0.10 より小さいの

で Z =

¯

X−0.10

(48)

問題3解答:視聴率の問題:図解

-8 -6 -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

z = -1.64

0.2

0.3

0.4 H

1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ <<< µ

0

0.2

0.3

(49)

問題3解答:視聴率の問題 /

H

0

:

p

=

p

0

H

1

:

p < p

0

タイプ

問題の設定より n = 600,x¯ = 55/600 = 0.0917 である.

4 棄却域は図より,有意水準を5%とすると [∞, −1.64] となる(nが大きいとき,表 の下段を利用).

5 検定統計量の値は以下のように-0.680 なので棄却域に含まれていない.

z = p x¯ − 0.10

0.10 · (1 0.10)/600 =

0.0917 0.10

p

0.1 · 0.9/600 = −0.6804

(50)

練習問題

B

:視聴率の問題

先ほどの調査が 6000 人について行われたとすればどうなるか?

つまり,6000 人にある番組を見たかどうかを尋ねたところ,550 人が「見た」と回

答した

真の視聴率が 10 %未満であると打ち切りの問題が出るので,統計的に 10 %とみな

せるのか,それとも 10 %未満とみなすべきなのかが知りたい

(51)

練習問題

B

解答:視聴率の問題

問題の設定より n = 6000,x¯ = 550/6000 = 0.0917 である. 1 帰無仮説 H0 : p = 0.10 / 対立仮説 H1 : p < 0.10

2 有意水準は5%とする

3 検定統計量として Z =

¯

X0.10

0.10·(1−0.10)/n

を考える.

この Z は H0 : p = 0.10 が正しいとき,Z =

¯

X−p

p(1−p)/n

となって(10)式より,

標準正規分布に従う(p = 0.10 が成り立っていているので(10)式と比較する)

この Z は H1 : p < 0.10 が正しいとき,本当の母集団比率が 0.10 より小さいの

で Z =

¯

X−0.10

0.10·(10.10)/n は非常に小さい負値をとりやすい傾向がある

(52)

練習問題

B

解答:視聴率の問題:図解

-8 -6 -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

z = -1.64

0.2

0.3

0.4 H

1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ <<< µ

0

0.2

0.3

(53)

練習問題

B

解答:視聴率の問題

問題の設定より n = 6000,x¯ = 550/6000 = 0.0917 である.

4 棄却域は図より,有意水準を5%とすると [∞, −1.64] となる(nが大きいとき,表 の下段を利用).

5 検定統計量の値は以下のように-2.15 なので棄却域に含まれる.

z = p x¯ − 0.10

0.10 · (1 0.10)/6000 =

0.0917 0.10

p

0.1 · 0.9/6000 = −2.1517

したがって帰無仮説 H0 : p = 0.10 は棄却され,この調査結果からは視聴率が 10

(54)

本日の演習問題1

以下の問いについて,「帰無仮説・対立仮説」「有意水準」「検定統計量」「棄却域」を明

示的に用いて仮説検定を行って下さい.

練習問題 A について,100 個の無作為抜き取りについて,平均値が 299g,分散値が 20g であったとき,内容量の平均は 300g と主張できるか

練習問題 B について,2000 人の無作為調査を行い,188 人が視聴していたとすると,

(55)

解説編

母集団分布が正規分

布のとき

母集団分布が正規分 布のとき

母集団分布が正規分 布でないとき

復習

導入:仮説の検証とは

仮説検定

母集団平均 µ に関す る仮説検定

母集団比率 p に関す る仮説検定

解説編

宿題問題 A:内容量 検査:

H0 : µ = µ0,

H1 : µ < µ0 のタ イプ

練習問題 A 解答: 内容量検査

練習問題 A:図解 (自由度が大きいと

きは正規分布と 同じ)

練習問題 A 解答: 内容量検査

練習問題 :図解 (自由度が大きいと

(56)

宿題問題

A

:内容量検査:

H

0

:

µ

=

µ

0

,

H

1

:

µ < µ

0

のタ

イプ

300g 入りの食品が出荷前に検査を受けた.

100 個を無作為に抜き出し,重さを量って検査を行った

平均値 299g,分散値 20 であったとき,この程度は誤差といえるか?

1. 真の平均を µ としてこの問題にふさわしい帰無仮説と対立仮説を立ててくだ

さい.

2. その上で,有意水準5%で検定を行ってください

ヒント)本当に知りたいことは「真の(内容量の)平均が 300 であるかどうか」で

(57)

練習問題

A

解答:内容量検査

問題の設定より n = 100,x¯ = 299,s2 = 20 である.

1 帰無仮説 H0 : µ = 300 / 対立仮説 H1 : µ < 300 (300g 以上なら消費者に損は

ない)

2 有意水準は5%とする

3 検定統計量として T =

¯

X300

S2/n

を考える.

この T は H0 : µ = 300 が正しいとき,T =

¯

X−µ

S2/n

となって(9)式より,自由

度 n − 1 = 99 のt分布に従う

4

この T は H1 : µ < 300 が正しいとき,本当の母集団平均が 300 より小さいので

T = √X¯−300

(58)

練習問題

A

:図解(自由度が大きいときは正規分布と同じ)

-8 -6 -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

z = -1.64

0.2

0.3

0.4 H

1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ <<< µ

0

0.2

0.3

(59)

練習問題

A

解答:内容量検査

問題の設定より n = 100,x¯ = 299,s2 = 20 である.

4 棄却域は図より,有意水準を5%とすると [−∞,−1.64] となる(nが大きいとき, 表の下段を利用).

5 検定統計量の値は以下のように-2.236 なので棄却域に含まれている.

t = x¯p− 300

s2/n =

299 300

p

20/100 = −2.236

したがって帰無仮説 H0 : µ = 300 は棄却されるので,傾向的にはほんのわずかに少

ないだけのように見えるが,100 個を調べてこの結果であれば統計的には 300g 以下

(60)

練習問題

A

:図解(自由度が大きいときは正規分布と同じ)

-8 -6 -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

z = -1.64

0.1

0.2

0.3

0.4 H

1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ <<< µ

0

0.1

0.2

0.3

(61)

宿題問題

B

解答:視聴率の問題

問題の設定より n = 2000,x¯ = 188/2000 = 0.094 である. 1 帰無仮説 H0 : p = 0.10 / 対立仮説 H1 : p < 0.10

2 有意水準は5%とする

3 検定統計量として Z =

¯

X0.10

0.10·(1−0.10)/n

を考える.

この Z は H0 : p = 0.10 が正しいとき,Z =

¯

X−p

p(1−p)/n

となって(10)式より,

標準正規分布に従う(p = 0.10 が成り立っていているので(10)式と比較する)

この Z は H1 : p < 0.10 が正しいとき,本当の母集団比率が 0.10 より小さいの

で Z =

¯

X−0.10

0.10·(10.10)/n は非常に小さい負値をとりやすい傾向がある

(62)

練習問題

B

解答:視聴率の問題:図解

-8 -6 -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

H

0:µ = µ0

が正しい

z = -1.64

0.2

0.3

0.4 H

1

が正しい:µ < µ

0

H

1

が正しい:µ << µ

0

H

1

が正しい:µ <<< µ

0

0.2

0.3

(63)

問題

B

解答:視聴率の問題

問題の設定より n = 6000,x¯ = 550/6000 = 0.0917 である.

4 棄却域は図より,有意水準を5%とすると [−∞,−1.64] となる(nが大きいとき, 表の下段を利用).

5 検定統計量の値は以下のように-2.15 なので棄却域に含まれない.

z = p x¯ − 0.10

0.10 · (1 0.10)/2000 =

0.094 0.10

p

0.1 · 0.9/2000 = −0.8944272

したがって帰無仮説 H0 : p = 0.10 は棄却されず,この調査結果からは視聴率が 10

参照

関連したドキュメント

中比較的重きをなすものにはVerworn i)の窒息 読,H6ber&Lille・2)の提唱した透過性読があ

2.1で指摘した通り、過去形の導入に当たって は「過去の出来事」における「過去」の概念は

 仮定2.癌の進行が信頼を持ってモニターできる

〃o''7,-種のみ’であり、‘分類に大きな問題の無い,グループとして見なされてきた二と力判った。しかし,半

 彼の語る所によると,この商会に入社する時,経歴

昭33.6.14 )。.

地盤の破壊の進行性を無視することによる解析結果の誤差は、すべり面の総回転角度が大きいほ

 そして,我が国の通説は,租税回避を上記 のとおり定義した上で,租税回避がなされた