応用統計 第 11 回
仮説検定 (1)
応用情報工学科
准教授 松野 裕
http://matsulab.org
2016 年 7 月 14 日
1 前回の演習について
解答はmoodleにあげてある。(1)で、もし95%の信頼区間を求めると、[0.54592, 0.73408]となり、信頼 区間の幅は広くなり、昨年度の支持率より上がったとは言えなくなる。また1000人中、640人支持すると答 えた場合、90%の信頼区間は、[0.615, 0.665]となり、信頼区間の幅は狭くなり、標本数を増やすほど、より 正確な推定が行えることがわかる。
2 仮説検定
仮説検定 hypothesis testingの目的は、母集団について仮定された命題(仮説)を、標本に基いて検証
す る こ と で あ る 。コ イ ン を 振 る こ と を 考 え る 。我 々 は 通 常 、表 が 出 る 確 率 はp =
1
2 で あ る と 考 え る( 仮 説
hypothesisを立てる)。コインを20回振ったところ、14回表が出たとする。仮説が正しいとすると、2項
分布の計算から、表が14回以上出る確率は0.0577になり、めったに起こらない確率であることがわかる。こ のような仮説からのずれは有意 significantであるという。めったに起こらない(有意である)から、仮説は
棄却rejectされる、という。しかし有意であるかどうかは基準が必要である。確率α = 0.1で有意とすると
0.0577は稀と判断されるが、α = 0.01で有意とすると、この確率は「十分に起こりうる」ということだから、
X = 14は有意にずれているとは言えない。このような基準となる確率を、有意水準 significance levelと
いう。
2.1 帰無仮説と対立仮説
先ほどのコインでは、表が出る確率が
1
2である(歪みのないコインである)という仮説は、有意水準α = 0.1 だと棄却される。棄却されたことで判断が終わるという考え方もあるが、さらに積極的な判断をしたい場合 は、あらかじめもう一つの仮説p ̸=
1
2 あるいはp > 1
2 を立てておき、もう一つの仮説が採択acceptされたと しよう。この時、元の仮説p =
1
2を帰無仮説null hypotheis、これと対立する仮説を対立仮説alternative
hypotheisという。帰無仮説とか、大げさだが「可能性が低い仮説」、で対立仮説が「本当に示したい仮説」、
ぐらいの意味である。この考え方は数学における背理法である。
1
帰無仮説と対立仮説は互いに反する関係にある。それぞれH0, H1、あるいはH1, H2(H はHypothesis(仮 説)の意味)などと表す。ただしp =
1 2, p >
1
2 以外にもp ≤ 12の可能性もあり、否定は完全なものではない。 H0, H1どちらかを採択する、H0, H1のどちらかが正しい、の組み合わせが4通り考えられる(表1)。表1
表1 帰無仮説を棄却する、しないの決定に関しての4つの場合 H0正しい H0誤り(H1正しい) H0を棄却しない(採択する) 1 2
H0を棄却する 3 4
において、1,4は正しく検定していることになる。3,2はそれぞれ、以下のように呼ばれる。
• 3 : 帰無仮説が正しいのに、それを棄却する第一種の誤りerror of the first kind
• 2 : 帰無仮説が誤っているのに、それを採択する第二種の誤り error of the second kind
この四通りの分け方は、刑事訴訟で無罪を有罪とする誤り、逆に有罪を無罪にする誤りなど、判断の誤りに対 する一般的思考基準を与える。
仮説が棄却されなかったといって、積極的に支持されたわけではない。単に結果が帰無仮説と「矛盾はしな い」ことが言われただけである。仮説が採択されたからといって、仮説が真であることを積極的に「証明」し たわけではない。
2.2 棄却域と両側・片側検定
仮説検定の基本的な考え方をt検定t-testを例にあげて説明する。 正規母集団N (µ, σ
2)から大きさn = 25の標本を抽出して、X = 13.7、s = 2.3を得た。
これを元に
• 帰無仮説 H0: µ = 15
• 対立仮説 H1: µ ̸= 15
として、有意水準α = 0.05で検定する。
ま ず 、H0が 正 し い と す る 。つ ま りµ = 15。検 定 に 用 い る 統 計 量(検 定 統 計 量 test statistic)と し て 、 Studentのt統計量:
t = X − µ s/√n を用いる。値を代入すると、
t = 13.7 − 15
2.3/√25 = −2.83
自由度25 − 1 = 24、信頼係数95%のt分布の範囲はt0.05(24) = 2.06(両側確率)だから、 P (−2.06 ≤ t ≤ 2.06) = 0.95
であり、これが有意水準α = 0.05に相当する。−2.83はこの範囲外であるから、帰無仮説H0は棄却され、 H1が採択される。
2
今、帰無仮説H0はそのままとし、H1′ : µ < 15とすると、Xがµ = 15より相当に小さくなった場合にだ け帰無仮説を棄却すれば良いから、
t = X − 15 s/√n
において、tが十分負になったときにだけ、帰無仮説を棄却すれば良い。いま、t0.10(24) = 1.71(両側で確率 0.1なので、片側だと0.05)であるから、−2.83 < −1.71。よって、この場合も、有意水準5%で帰無仮説を 棄却する。
帰無仮説が棄却すべき統計量の値の集合を棄却域 rejection regionといい、棄却しない領域を採択域と いう。採択域は、t = 0の周辺(15に近いXに対応)になるが、棄却域は対立仮説がH1の様な両側対立仮説 two-sided alternative hypothesisの時は、tの値が著しく(これは有意水準で決める)0から左右にはず れた領域
|t| > tα(n − 1)
となる。これを両側検定two-sided testという。確率αを左右(著しく大きい所と小さい所)に按分して いる。H1′ のような片側対立仮説 one-sided alternative hypothesisに対しては、X が十分小さい所に棄 却域が定められ、片側検定one-sided test
t < −t2α(n − 1)
となる。またµ > cの形の片側対立仮説もあるが、そのときは t > t2α(n − 1)
が棄却域となる。これは片側検定である。 両側か片側か
• 一般に、両側検定は母数θの値がある目標値θ0と等しいかどうか調べる場合に用いられる。例えば工 場で新しく機械を購入したとき、機械の機能が目標値を満たしているか計測する場合である。
• 片側検定は母数の大きさが理論的・経験的に予測される場合に使われる。例えば英語の特別授業があっ たとしよう。特別授業に効果があれば、試験の点数がよくなっているはずである。この場合、特別授業 の前後で、点数が異なるかどうかではなく、点数が向上したかどうかが知りたいことである。このよう な場合には対立仮説を不等号で与える片側検定を用いる。
3 正規母集団に対する仮説検定 : 母平均の差の検定
前回説明した区間推定に対応して、種々の仮説検定の手法がある。今回は例として、母平均の差の検定を説 明する。実用上も非常に重要である。例えば、新しい治療法の効果を調べる場合を考え、患者を二つのグルー プに分けて、一方のみに新しい治療法を行い、二つのグループで結果に差があるかどうかを検定する。これを 2標本検定 two-sample testという。
二つの正規母集団N (µ1, σ 2
1), N (µ2, σ22)それぞれから大きさm, nの標本X1, . . . , Xm, Y1, . . . , Ynを抽出 したとする。このとき、帰無仮説は
H0: µ1= µ2
であり、対立仮説は
3
• 両側ならばH1: µ1̸= µ2
• 片側ならば、H1: µ1> µ2またはH1: µ1< µ2
である。両側か片側かは、他の検定と同様その目的から決定される。 以下では、二つの分散が等しく、σ
2
1= σ22= σ2の時を考える。このとき、未知のσ
2
の代わりに下記の合併 した分散 pooled varianceで推定する。
s2= (m − 1)s
2
1+ (n − 1)s 2 2
m + n − 2
s21, s22は各々の標本の標本不偏分散である。このように標本分散を定義すると、
t = (X − Y ) − (µ1− µ2) s√(m1 +1n)
は自由度m + n − 2のt分布t(m + n − 2)に従う。これはH0: µ1= µ2のもとでは t = (X− Y )
s√(m1 +1n)
となる。この統計量を用い、
• 両側検定ならば|t| > tα(m + n − 2)のとき帰無仮説を棄却し、それ以外は棄却しない、
• 片側検定ならば、t > t2α(m + n − 2), t < t2α(m + n − 2)のとき帰無仮説を棄却し、それ以外は棄却 しない。
例題 20匹のラットを10匹ずつ2群に分け、一方には普通の餌を与え、他方には血中の赤血球を減らす と考えられている薬を餌に混ぜて与えた。下記はその結果の、ラットの血液1mm
3
中の赤血球数である。
• 投薬群 7.97,7.66,7.59,8.44,8.05,8.08,8.35,7.77,7.98,8.15
• 対照群 8.06,8.27,8.45,8.05, 8.51,8.14,8.09,8.15, 8.16,8.42
このとき、両者の平均は異なるといえるか、有意水準5%で検定せよ。
m = n = 10, X = 8.004, Y = 8.230, X− Y = −0.226。また、s21= 0.0761, s22= 0.0294, s2 = 0.0528, s = 0.230。よってt = −2.200。t0.05(18) = 2.101, t0.1(18) = 1.734(本講義で使用しているt分布表の添字 は、両側確率である)から、H0: µ1= µ2は、両側検定でも、左片側検定でも棄却され、薬効はあると認めら れる。
4