統計学 第
11
回: 仮説検定
担当者: 高木 真吾
講義資料等は,
http://sites.google.com/site/hustat2017/
質問等は,
stakagi@econ.hokudai.ac.jp
までお願いします.
母集団分布が正規分布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布でないとき
復習
導入:仮説の検証とは
仮説検定
母集団平均 µ に関す る仮説検定
母集団比率 p に関す る仮説検定
解説編
母集団:母集団平均 µX,母集団分散 σ2 X
大きさ n の無作為標本:{X1, X2, . . . , Xn}
標本平均・標本分散
¯
X = 1
n
n
X
i=1
Xi, SX2 =
1
n − 1
n
X
i=1
母集団分布が正規分布のとき
1. 標本平均について(σ2 をそのまま用いて)
¯
X − µX
p
σ2/n ∼ N(0,1) (1)
n の大きさにかかわりなく成立する結果
2. 標本平均について(σ2
X を S2 で置き換えると)
¯
X − µX
p
S2/n ∼ t(n − 1) 自由度 n − 1 のt分布 (2)
n の大きさにかかわりなく成立する結果
3. 標本分散について
母集団分布が正規分布でないとき
1. 標本平均について(σ2 をそのまま用いて)
¯
X − µX
p
σ2/n (4)
厳密にはどのような分布に従うかは分からないが,n が大きければ,中心極限定理
から標準正規分布で近似可能
2. 標本平均について(σ2
X を S2 で置き換えると)
¯
X − µX
p
S2/n = ¯
X − µX
p
σX2 /n · p
σX2 /n p
S2/n (5)
厳密にはどのような分布に従うかは分からないが,n が大きければ,中心極限定理
復習
母集団分布が正規分布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布でないとき
復習
正規母集団
導入:仮説の検証とは
仮説検定
母集団平均 µ に関す る仮説検定
母集団比率 p に関す る仮説検定
正規母集団
母集団分布:正規分布/母集団平均 µX・母集団分散 σ2 X
大きさ n の標本:{X1, X2, . . . , Xn}, Xi ∼ N(µ, σ2)
標本平均,標本分散
¯
X = 1
n
n
X
i=1
Xi, SX2 =
1
n − 1
n
X
i=1
基準化した標本平均について
¯
X − µX
p
σX2 /n ∼ N(0,1)
次のような統計量(確率変数)を考える
Z(k) ≡ pX¯ − k
σX2 /n (6)
この Z(k) は以下のように書き換えることができる
Z(k) = pX¯ − k
σ2 /n =
¯
X − µX
p
σ2 /n +
µX − k
p
前提条件 :
¯
X − µX
p
σX2 /n ∼ N(0,1)
興味ある統計量 : Z(k) =
¯
X − µX
p
σX2 /n +
µX − k
p
σX2 /n
1. µX = k のとき,Z(k) ∼ N(0,1)
2. µX > k のとき,第一項は標準正規分布,第二項は正の値:中心が正の方向へ
3. µX < k のとき,第一項は標準正規分布,第二項は負の値:中心が負の方向へ
図解
0.0
0.1
0.2
0.3
0.4
Z(k) の分布: µ
X=
2 , σ
X 2
=1 , n=10
cbind(y1, y2, y3)
µX=
k
µX>
k ( ex. k=1)
µX<
基準化した標本平均について
¯
X − µX
p
SX2 /n ∼ t(n − 1)
次のような統計量(確率変数)を考える
T(k) ≡ pX¯ − k
SX2 /n (8)
この T(k) は以下のように書き換えることができる
T(k) = pX¯ − k
SX2 /n =
¯
X − µX
p
SX2 /n +
µX − k
p
前提条件 :
¯
X − µX
p
SX2 /n ∼ t(n − 1)
興味ある統計量 : T(k) =
¯
X − µX
p
SX2 /n +
µX − k
p
SX2 /n
1. µX = k のとき,Z(k) ∼ t(n − 1)
2. µX > k のとき,第一項はt分布,第二項は正の値:中心が正の方向へ
3. µX < k のとき,第一項はt分布,第二項は負の値:中心が負の方向へ
図解
-5 0 5
0.0
0.1
0.2
0.3
0.4
T(k) の分布: µ
X=
2 , n=10 ( σ
X 2
=1 )
cbind(y1, y2, y3)
µX=
k
µX>
k ( ex. k=1)
µX<
導入:仮説の検証とは
母集団分布が正規分布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布でないとき
復習
導入:仮説の検証とは
仮説の検証
問題1:蛍光灯の 寿命
問題2:蛍光灯の 寿命
仮説検定
母集団平均 µ に関す る仮説検定
仮説の検証
統計調査には誤差が伴う
視聴率 10%%以下なら打ち切り?
例)600 世帯で調査を行う視聴率調査:目標視聴率 10%,調査結果 9.2%:目
標達成ならず?
食品の目方は大丈夫?
例)300g 入りの食品が出荷前に検査を受けた.1000 個を無作為に抜き出し,
重さを量ったところ平均 299g,分散 20g であったとき,この程度は誤差とい
えるか?
どの程度の確信を持って,結論を下せるのか?仮説検定ではこの問題に答える.
統計調査に伴う誤差 or,何か理由があって乖離している?
問題1:蛍光灯の寿命
ある蛍光灯の寿命に関して,設計通りならば定格寿命 6000 時間とされている
また寿命に関して,個々の製品ごとに製造時の異物混入や実験場の不備等で若干寿
命がばらつくものの,寿命の差異はだいたい正規分布に従うとされている.
ここから製品 6 個を抜き出し,寿命について調査をしたところ,
{6005,5930,5940,5930,6000,5970} (単位:時間)となった. 1. 寿命までの時間の平均値,分散値を求めてください.
2. 6000 時間は持続するとされているので,寿命に関する真の平均(母集団平均)
が 6000 時間であることを仮説として表現するとどうなりますか?
解答1:蛍光灯の寿命
大きさnの標本 {X1, X2, . . . , Xn} に関して,標本平均・標本分散は以下のように与 えられる
¯
X = 1
n
n
X
i=1
Xi, S2 =
1
n − 1
n
X
i=1
(Xi − X¯)2
解答1(つづき)
:蛍光灯の寿命
1. 問題の観測値 {6005,5930,5940,5930,6000, 5970} を用いて,平均値,分散値を計算 すると,
¯
x = 6005 + · · · + 5970
6 ≈ 5963
s2 = 1
6 − 1{(6005 − 5963)
2 +
· · · + (5970 − 5963)2} ≈ 1178
となった.
2. 寿命の平均が 6000 時間持続すると考えると,母集団平均 µ を用いて,µ = 6000 と
表現できる.
3. 寿命の平均が 6000 時間持続することが成り立たないので µ 6= 6000 と表現できる.
µ = 6000 と µ 6= 6000,上のデータからは,この二つのうちどちらがもっともらし
問題2:蛍光灯の寿命
改良した蛍光灯の寿命に関して,設計通りならば従来の定格寿命 6000 時間を越える
とされている
また寿命に関して,個々の製品ごとに製造時の異物混入や実験場の不備等で若干寿
命がばらつくものの,寿命の差異はだいたい正規分布に従うとされている.
ここから製品 7 個を抜き出し,寿命について調査をしたところ,
{6010,6000,5980,5990,6000,6040,6100} (単位:時間)となった. 1. 寿命までの時間の平均値,分散値を求めてください.
2. 6000 時間は持続するとされているので,寿命に関する真の平均(母集団平均)
が 6000 時間であることを仮説として表現するとどうなりますか?
解答2:改良した蛍光灯の寿命
大きさnの標本 {X1, X2, . . . , Xn} に関して,標本平均・標本分散は以下のように与 えられる
¯
X = 1
n
n
X
i=1
Xi, S2 =
1
n − 1
n
X
i=1
(Xi − X¯)2
解答2:改良した蛍光灯の寿命
1. 問題の観測値 {6010,6000,5980,5990,6000,6040,6100} を用いて,平均値,分散値 を計算すると,
¯
x = 6010 + · · · + 6100
7 ≈ 6017
s2 = 1
7 − 1{(6010 − 6017)
2 +
· · · + (6100 − 6017)2} ≈ 1690
となった.
2. 寿命の平均が 6000 時間持続すると考えると,母集団平均 µ を用いて,µ = 6000 と
表現できる.
3. 改良した製品の寿命の平均は 6000 時間以上持続すると考えられているので
µ > 6000 と表現できる.
µ = 6000 と µ > 6000,上のデータからは,この二つのうちどちらがもっともらし
仮説検定
母集団分布が正規分布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布でないとき
復習
導入:仮説の検証とは
仮説検定
検定の手順
検定の手順
母集団平均 µ に関す る仮説検定
母集団比率 p に関す る仮説検定
仮説検定
仮説検定とは
帰無仮説(問題1では,µ = 6000)
対立仮説(問題1では,µ 6= 6000)
の二つをデータから判断してどちらがもっともらしいかを見る方法である
具体的には,『帰無仮説が正しい』という仮説を棄却するか,しないかで判断する
『帰無仮説が正しい』という仮説を棄却:対立仮説の方がもっともらしい
『帰無仮説が正しい』という仮説を棄却できない:帰無仮説の方がもっともら
検定の手順
考え方:
二
======
つ
======
の
======
仮
======
説
======
からどちらが妥当かを判断
帰無仮説と対立仮説
一方の仮説が正しいと想定し, 統
˜˜˜˜˜
計
˜˜˜˜˜
量
˜˜˜˜˜
の分布を考える
帰無仮説が正しいと想定,
その統計量が,あ
∼ ∼
る
∼ ∼
低
∼ ∼
い
∼ ∼
確
∼ ∼
率
∼ ∼
以下でしか起きないはずのことが観測
→
最初の想定がおかしい
帰無仮説が正しいきには起きないと思われることが起きた=対立仮説
検定の手順
1 二つの仮説を立てる(帰無仮説 H0 と対立仮説 H1) 2 有意水準を定める
上記,太破線の低い確率=有意水準(通常,5%か1%)
帰無仮説が正しいときには,マレ(5%程度の確率)にしか起きない領域が棄却
域(後述)
仮説検定では,「帰無仮説が正しいとしても,非常に小さい確率で発生するかも
しれないが,普通は対立仮説が正しいから起きるような自体」がおきたら帰無
仮説を棄てて,対立仮説を採用するという考え方
3 検定統計量を定める(上記,破線)
標本から構成できる量(未知の母数を含まない)
検定の手順
4 棄却域を決める(棄却のためのルール:検定統計量の実現値がこの領域に入ること)
棄却域とは,帰無仮説が正しいとき検定統計量の実現値が出にくく,対立仮説
が正しいときには実現しやすい領域となるように選ぶ
帰無仮説が正しいとき,この領域で実現する確率は有意水準となるようにして
設定する
5 検定統計量の値が棄却域に含まれるかどうかをみる
棄却域に含まれるとき,帰無仮説を棄てる
仮説検定における二種類の誤りと望ましい検定
第一種の過誤(Type I Error):帰無仮説が正しいのに,帰無仮説を捨てる誤り
第一種の過誤の発生確率:帰無仮説が正しいとき,検定統計量の値が棄却域に入
る確率
第二種の過誤(Type II Error):帰無仮説が正しくないのに,帰無仮説を捨てない誤り
第二種の過誤の発生確率:対立仮説が正しいとき,検定統計量の値が棄却域に入
らない確率
検出力(Statistical Power):帰無仮説が正しくないとき,帰無仮説を棄却する確率
1− 第二種の過誤の発生確率:対立仮説が正しいとき,検定統計量の値が棄却域
望ましい検定(の一つ)
なるべく検出力が高い
第一種の過誤はあまり大きくない
望ましい検定の作り方
第一種の過誤を小さい値に固定して,棄却域を選ぶ
例:コインが公平?
帰無仮説:コインが公平(p = 1/2)/ 対立仮説:コインは公平でない(ここでは,
p = 1/5 とする)
判定基準:コインを5回投げて,そのうち 表が1回以下 ならこのコインが公平でな
いと判断
Type I Error:
Pr[Y ≤ 1|p = 1/2] =5 C0
1 2 0 1 2
5−0
+5 C1
1 2 1 1 2
5−1
= 0.1875
Type II Error:
Pr[Y ≥ 2|p = 1/5] =5 C2
1 5 2 4 5
5−2
+· · ·+5C5
1 5 5 4 5
5−5
= 0.26272
例:コインが公平?
帰無仮説:コインが公平(p = 1/2)/ 対立仮説:コインは公平でない(p = 1/5)
判定基準:コインを5回投げて,そのうち 表が4回以上 ならこのコインが公平でな
いと判断
Type I Error:
Pr[Y ≥ 4|p = 1/2] =5 C4
1 2 4 1 2
5−4
+5 C5
1 2 5 1 2
5−5
= 0.1875
Type II Error:
Pr[Y ≤ 3|p = 1/5] =5 C0
1 5 0 4 5
5−0
+· · ·+5C3
1 5 3 4 5
5−3
= 0.99328
例:コインが公平?
帰無仮説:コインが公平(p = 1/2)/ 対立仮説:コインは公平でない(p = 1/5)
判定基準:コインを5回投げて,そのうち 表が2回以下 ならこのコインが公平でな
いと判断
Type I Error:
Pr[Y ≤ 2|p = 1/2] =5 C0
1 2 0 1 2
5−0
+5C1
1 2 1 1 2
5−1
+5C2
1 2 1 1 2
5−2
= 0.5
Type II Error:
Pr[Y ≥ 3|p = 1/5] =5 C3
1 5 3 4 5
5−3
+5C4
1 5 4 4 5
5−4
+5C5
1 5 5 4 5
5−5
= 0.05792
検出力: Pr[Y ≤ 2|p = 1/5] = 1 − 0.05792 = 0.94208
母集団平均
µ
に関する仮説検定
母集団分布が正規分布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布でないとき
復習
導入:仮説の検証とは
仮説検定
母集団平均 µ に関す る仮説検定
問題2(つづき)
H0 : µ = µ0,
H1 : µ > µ0 のタ イプ
問題2:図解
問題2(つづき)
H0 : µ = µ0,
H1 : µ > µ0 のタ イプ
問題2:図解(自由 度n− 1 =
7−1 = 6) 問題1(つづき)
H0 : µ = µ0,
H1 : µ 6= µ0 のタ イプ
問題1:図解
問題1(つづき)
のタ イプ
問題1:図解(自由 度
)
練習問題 :内容量 検査:
のタ イプ
練習問題 解答: 内容量検査
練習問題 :図解 (自由度が大きいと
きは正規分布と 同じ)
練習問題 解答: 内容量検査
問題2(つづき)
H
0:
µ
=
µ
0,
H
1:
µ > µ
0のタイプ
問題2を用いて,改良した蛍光灯の寿命が平均的に 6000 時間を越えるかどうかの検定
を行う
1 帰無仮説 H0 : µ = 6000 / 対立仮説 H1 : µ > 6000
2 有意水準は5%とする
3 検定統計量として T =
¯
X√−6000
S2/n
を考える.
この T は H0 : µ = 6000 が正しいとき,T =
¯
X−µ
√
S2/n
となって(9)式より,自由
度 n − 1 = 7 − 1 = 6 のt分布に従う.
この T は H1 : µ > 6000 が正しいとき,本当の母集団平均が 6000 より大きいの
で T =
¯
X√−6000
問題2:図解
-4 -2 0 2 4 6 8
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
t : Pr[ T > t ] = 0.05
0.2
0.3
0.4 H
1
が正しい:µ > µ
0
H
1
が正しい:µ >> µ
0
H
1
が正しい:µ >>> µ
0
0.2
0.3
問題2(つづき)
H
0:
µ
=
µ
0,
H
1:
µ > µ
0のタイプ
問題2を用いて,改良した蛍光灯の寿命が平均的に 6000 時間を越えるかどうかの検定
を行う
4 棄却域は図より,有意水準を5%とすると [1.943,∞] となる.
5 検定統計量の値は以下のように 1.19 なので棄却域に含まれていない.
t = x¯p− 6000
s2/n =
6017.14 − 6000
p
1690.48/7 = 1.10
したがって帰無仮説 H0 : µ = 6000 は棄却されないので,新製品の寿命が延びたと
問題2:図解(自由度
n
−
1 = 7
−
1 = 6
)
-4 -2 0 2 4 6 8
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
t = 1.943
0.2
0.3
0.4 H
1
が正しい:µ > µ
0
H
1
が正しい:µ >> µ
0
H
1
が正しい:µ >>> µ
0
0.2
0.3
問題1(つづき)
H
0:
µ
=
µ
0,
H
1:
µ
6
=
µ
0のタイプ
問題1を用いて,蛍光灯の寿命が平均的に 6000 時間かどうかの検定を行う
1 帰無仮説 H0 : µ = 6000 / 対立仮説 H1 : µ 6= 6000
2 有意水準は5%とする
3 検定統計量として T =
¯
X√−6000
S2/n を考える.
この T は H0 : µ = 6000 が正しいとき,T =
¯
X−µ
√
S2/n
となって(9)式より,自由
度 n − 1 = 6 − 1 = 5 のt分布に従う.
この T は H1 : µ 6= 6000 が正しいとき,本当の母集団平均が 6000 より大きい,
あるいは小さいので T =
¯
X√−6000
S2/n は0から離れる値をとりやすい傾向((9)式
問題1:図解
-6 -4 -2 0 2 4 6
0.0 0.1 0.2 0.3 0.4 x H
0:µ = µ0
が正しい
t: Pr[T>t]=0.025 t: Pr[T<t]=0.025 0.2 0.3 0.4 H 1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ > µ
0
H
1
が正しい:µ >> µ
0
0.2
0.3
問題1(つづき)
H
0:
µ
=
µ
0,
H
1:
µ
6
=
µ
0のタイプ
問題1を用いて,蛍光灯の寿命が平均的に 6000 時間かどうかの検定を行う
4 棄却域は図より,有意水準を5%とすると [∞, −2.571,] あるいは [2.571,∞] となる.
5 検定統計量の値は以下のように -2.68 なので棄却域に含まれている.
t = x¯p− 6000
s2/n =
5962.50 − 6000
p
1177.50/6 = −2.68
したがって帰無仮説 H0 : µ = 6000 は棄却されるので,この製品の寿命が 6000 時間
問題1:図解(自由度
n
−
1 = 6
−
1 = 5
)
-6 -4 -2 0 2 4 6
0.0 0.1 0.2 0.3 0.4 x H
0:µ = µ0
が正しい
Pr[T>2.571]=0.025 Pr[T<-2.571]=0.025 0.2 0.3 0.4 H 1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ > µ
0
H
1
が正しい:µ >> µ
0
0.2
0.3
練習問題
A
:内容量検査:
H
0:
µ
=
µ
0,
H
1:
µ < µ
0のタ
イプ
300g 入りの食品が出荷前に検査を受けた.
1000 個を無作為に抜き出し,重さを量って検査を行った
平均値 299g,分散値 20 であったとき,この程度は誤差といえるか?
1. 真の平均を µ としてこの問題にふさわしい帰無仮説と対立仮説を立ててくだ
さい.
2. その上で,有意水準5%で検定を行ってください
ヒント)本当に知りたいことは「真の(内容量の)平均が 300 であるかどうか」で
練習問題
A
解答:内容量検査
問題の設定より n = 1000,x¯ = 299,s2 = 20 である.
1 帰無仮説 H0 : µ = 300 / 対立仮説 H1 : µ < 300 (300g 以上なら消費者に損は
ない)
2 有意水準は5%とする
3 検定統計量として T =
¯
X−300
√
S2/n
を考える.
この T は H0 : µ = 300 が正しいとき,T =
¯
X−µ
√
S2/n
となって(9)式より,自由
度 n − 1 = 999 のt分布に従う
1
.
この T は H1 : µ < 300 が正しいとき,本当の母集団平均が 300 より小さいので
T = √X¯−300
練習問題
A
:図解(自由度が大きいときは正規分布と同じ)
-8 -6 -4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
z = -1.64
0.2
0.3
0.4 H
1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ <<< µ
0
0.2
0.3
練習問題
A
解答:内容量検査
問題の設定より n = 1000,x¯ = 299,s2 = 20 である.
4 棄却域は図より,有意水準を5%とすると [∞, −1.64] となる(nが大きいとき,表 の下段を利用).
5 検定統計量の値は以下のように-7.071 なので棄却域に含まれている.
t = x¯p− 300
s2/n =
299 − 300
p
20/1000 = −7.071
したがって帰無仮説 H0 : µ = 300 は棄却されるので,傾向的にはほんのわずかに少
ないだけのように見えるが,1000 個も調べてこの結果であれば統計的には強く 300g
練習問題
A
:図解(自由度が大きいときは正規分布と同じ)
-8 -6 -4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
z = -1.64
0.2
0.3
0.4 H
1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ <<< µ
0
0.2
0.3
母集団比率
p
に関する仮説検定
母集団分布が正規分布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布でないとき
復習
導入:仮説の検証とは
仮説検定
母集団平均 µ に関す る仮説検定
母集団比率 p に関す る仮説検定
問題3:視聴率の 問題
問題3解答:視聴率 の問題 /
H0 : p = p0,
H1 : p < p0のタ イプ
問題3解答:視聴率 の問題:図解
問題3解答:視聴率 の問題 /
H0 : p = p0,
H1 : p < p0のタ イプ
練習問題 :視聴率 の問題
練習問題 解答:
問題3:視聴率の問題
600 人にある番組を見たかどうかを尋ねたところ,55 人が「見た」と回答した
真の視聴率が 10 %未満であると打ち切りの問題が出るので,統計的に 10 %とみな
せるのか,それとも 10 %未満とみなすべきなのかが知りたい
上の問題を有意水準5%で検定してください
ヒント)真の視聴率(母集団比率)が p であるとき,近似的に次の結果が成り立つ
Z = p X¯ − p
p(1 − p)/n ∼ N(0,1),
¯
X は1(「見た」)となる割合
問題3解答:視聴率の問題 /
H
0:
p
=
p
0,
H
1:
p < p
0の
タイプ
問題の設定より n = 600,x¯ = 55/600 = 0.0917 である. 1 帰無仮説 H0 : p = 0.10 / 対立仮説 H1 : p < 0.10
2 有意水準は5%とする
3 検定統計量として Z =
¯
X−0.10
√
0.10·(1−0.10)/n
を考える.
この Z は H0 : p = 0.10 が正しいとき,Z =
¯
X−p
√
p(1−p)/n
となって(10)式より,
標準正規分布に従う(p = 0.10 が成り立っていているので(10)式と比較する)
2
この Z は H1 : p < 0.10 が正しいとき,本当の母集団比率が 0.10 より小さいの
で Z =
¯
X−0.10
√
問題3解答:視聴率の問題:図解
-8 -6 -4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
z = -1.64
0.2
0.3
0.4 H
1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ <<< µ
0
0.2
0.3
問題3解答:視聴率の問題 /
H
0:
p
=
p
0,
H
1:
p < p
0の
タイプ
問題の設定より n = 600,x¯ = 55/600 = 0.0917 である.
4 棄却域は図より,有意水準を5%とすると [∞, −1.64] となる(nが大きいとき,表 の下段を利用).
5 検定統計量の値は以下のように-0.680 なので棄却域に含まれていない.
z = p x¯ − 0.10
0.10 · (1 − 0.10)/600 =
0.0917 − 0.10
p
0.1 · 0.9/600 = −0.6804
練習問題
B
:視聴率の問題
先ほどの調査が 6000 人について行われたとすればどうなるか?
つまり,6000 人にある番組を見たかどうかを尋ねたところ,550 人が「見た」と回
答した
真の視聴率が 10 %未満であると打ち切りの問題が出るので,統計的に 10 %とみな
せるのか,それとも 10 %未満とみなすべきなのかが知りたい
練習問題
B
解答:視聴率の問題
問題の設定より n = 6000,x¯ = 550/6000 = 0.0917 である. 1 帰無仮説 H0 : p = 0.10 / 対立仮説 H1 : p < 0.10
2 有意水準は5%とする
3 検定統計量として Z =
¯
X−0.10
√
0.10·(1−0.10)/n
を考える.
この Z は H0 : p = 0.10 が正しいとき,Z =
¯
X−p
√
p(1−p)/n
となって(10)式より,
標準正規分布に従う(p = 0.10 が成り立っていているので(10)式と比較する)
この Z は H1 : p < 0.10 が正しいとき,本当の母集団比率が 0.10 より小さいの
で Z =
¯
X−0.10
√
0.10·(1−0.10)/n は非常に小さい負値をとりやすい傾向がある
練習問題
B
解答:視聴率の問題:図解
-8 -6 -4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
z = -1.64
0.2
0.3
0.4 H
1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ <<< µ
0
0.2
0.3
練習問題
B
解答:視聴率の問題
問題の設定より n = 6000,x¯ = 550/6000 = 0.0917 である.
4 棄却域は図より,有意水準を5%とすると [∞, −1.64] となる(nが大きいとき,表 の下段を利用).
5 検定統計量の値は以下のように-2.15 なので棄却域に含まれる.
z = p x¯ − 0.10
0.10 · (1 − 0.10)/6000 =
0.0917 − 0.10
p
0.1 · 0.9/6000 = −2.1517
したがって帰無仮説 H0 : p = 0.10 は棄却され,この調査結果からは視聴率が 10
本日の演習問題1
以下の問いについて,「帰無仮説・対立仮説」「有意水準」「検定統計量」「棄却域」を明
示的に用いて仮説検定を行って下さい.
練習問題 A について,100 個の無作為抜き取りについて,平均値が 299g,分散値が 20g であったとき,内容量の平均は 300g と主張できるか
練習問題 B について,2000 人の無作為調査を行い,188 人が視聴していたとすると,
解説編
母集団分布が正規分布のとき
母集団分布が正規分 布のとき
母集団分布が正規分 布でないとき
復習
導入:仮説の検証とは
仮説検定
母集団平均 µ に関す る仮説検定
母集団比率 p に関す る仮説検定
解説編
宿題問題 A:内容量 検査:
H0 : µ = µ0,
H1 : µ < µ0 のタ イプ
練習問題 A 解答: 内容量検査
練習問題 A:図解 (自由度が大きいと
きは正規分布と 同じ)
練習問題 A 解答: 内容量検査
練習問題 :図解 (自由度が大きいと
宿題問題
A
:内容量検査:
H
0:
µ
=
µ
0,
H
1:
µ < µ
0のタ
イプ
300g 入りの食品が出荷前に検査を受けた.
100 個を無作為に抜き出し,重さを量って検査を行った
平均値 299g,分散値 20 であったとき,この程度は誤差といえるか?
1. 真の平均を µ としてこの問題にふさわしい帰無仮説と対立仮説を立ててくだ
さい.
2. その上で,有意水準5%で検定を行ってください
ヒント)本当に知りたいことは「真の(内容量の)平均が 300 であるかどうか」で
練習問題
A
解答:内容量検査
問題の設定より n = 100,x¯ = 299,s2 = 20 である.
1 帰無仮説 H0 : µ = 300 / 対立仮説 H1 : µ < 300 (300g 以上なら消費者に損は
ない)
2 有意水準は5%とする
3 検定統計量として T =
¯
X−300
√
S2/n
を考える.
この T は H0 : µ = 300 が正しいとき,T =
¯
X−µ
√
S2/n
となって(9)式より,自由
度 n − 1 = 99 のt分布に従う
4
.
この T は H1 : µ < 300 が正しいとき,本当の母集団平均が 300 より小さいので
T = √X¯−300
練習問題
A
:図解(自由度が大きいときは正規分布と同じ)
-8 -6 -4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
z = -1.64
0.2
0.3
0.4 H
1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ <<< µ
0
0.2
0.3
練習問題
A
解答:内容量検査
問題の設定より n = 100,x¯ = 299,s2 = 20 である.
4 棄却域は図より,有意水準を5%とすると [−∞,−1.64] となる(nが大きいとき, 表の下段を利用).
5 検定統計量の値は以下のように-2.236 なので棄却域に含まれている.
t = x¯p− 300
s2/n =
299 − 300
p
20/100 = −2.236
したがって帰無仮説 H0 : µ = 300 は棄却されるので,傾向的にはほんのわずかに少
ないだけのように見えるが,100 個を調べてこの結果であれば統計的には 300g 以下
練習問題
A
:図解(自由度が大きいときは正規分布と同じ)
-8 -6 -4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
z = -1.64
0.1
0.2
0.3
0.4 H
1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ <<< µ
0
0.1
0.2
0.3
宿題問題
B
解答:視聴率の問題
問題の設定より n = 2000,x¯ = 188/2000 = 0.094 である. 1 帰無仮説 H0 : p = 0.10 / 対立仮説 H1 : p < 0.10
2 有意水準は5%とする
3 検定統計量として Z =
¯
X−0.10
√
0.10·(1−0.10)/n
を考える.
この Z は H0 : p = 0.10 が正しいとき,Z =
¯
X−p
√
p(1−p)/n
となって(10)式より,
標準正規分布に従う(p = 0.10 が成り立っていているので(10)式と比較する)
この Z は H1 : p < 0.10 が正しいとき,本当の母集団比率が 0.10 より小さいの
で Z =
¯
X−0.10
√
0.10·(1−0.10)/n は非常に小さい負値をとりやすい傾向がある
練習問題
B
解答:視聴率の問題:図解
-8 -6 -4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
H
0:µ = µ0
が正しい
z = -1.64
0.2
0.3
0.4 H
1
が正しい:µ < µ
0
H
1
が正しい:µ << µ
0
H
1
が正しい:µ <<< µ
0
0.2
0.3
問題
B
解答:視聴率の問題
問題の設定より n = 6000,x¯ = 550/6000 = 0.0917 である.
4 棄却域は図より,有意水準を5%とすると [−∞,−1.64] となる(nが大きいとき, 表の下段を利用).
5 検定統計量の値は以下のように-2.15 なので棄却域に含まれない.
z = p x¯ − 0.10
0.10 · (1 − 0.10)/2000 =
0.094 − 0.10
p
0.1 · 0.9/2000 = −0.8944272
したがって帰無仮説 H0 : p = 0.10 は棄却されず,この調査結果からは視聴率が 10