• 検索結果がありません。

検定論の初歩

ドキュメント内 数理統計学Iノート (ページ 75-81)

ファイルを見ているなら拡大すれば読めるようになっている.が,欲しいのはこんな厳密な値では なく大体何%なのかという数字だろう.

8.2 検定論の初歩

8.2.1 基本手順

唐突で天下り的だが,仮説検定の標準的な手順を以下に示す.初版と書いてあるのは,いくつかの考

察を経て8.2.6節で改訂するからである.

仮説検定の手順(初版) (1) 帰無仮説 (null hypothesis) H0 をたてる.

(2) 検定統計量 X を問題に合わせて選択する.(帰無仮説の下で未知母数を含まず確率分布も わかる統計量を選ぶ.)

(3) 有意水準 (significance level)(危険率ともいう)と呼ばれる定数0< α <1 を決める.

これはある事象(後述)の起こる確率であり,慣習では α= 0.05,0.01 などの「低い確率」

に設定する.

(4) 帰無仮説 H0 の下でPH0(X ∈A) =αとなる事象(普通は区間)Aを求める.(存在しな い場合はPH0(X ∈A)≤αを満たすもののうち最も大きいものを求める.(例8.4 参照))

A を棄却域(critical region) という.基本的に有意水準は低く設定するので,棄却域の 値は滅多に出てこないはずである.

(5) X の実現値 xが与えられたとき, x∈Aなら(帰無仮説からは説明できない珍事が起き ていると考え) H0 を棄却 (reject) し,x /∈Aのときは(帰無仮説と矛盾することは起 こっていないと考え) H0 を棄却しない.

(1)から(4)は全てセッティングで,(5)が実際に判断する工程である.

注8.2. 用語の読み方は,帰無仮説(きむかせつ),有意水準(ゆういすいじゅん),棄却(ききゃ く)である.

詳細の説明に入る前に,例をいくつか見てみよう.最初は疑問や違和感を感じるだろうが,とりあえ ずざっと目を通して欲しい.

76 8 統計的仮説検定

8.3 (計算を伴わない例). 甘く上質な桃で有名なM農園が出荷する桃は,その99%が糖度13 度以上,15度以上のものが95%にもなるというa.さて,近所のスーパーでたまたまM農園産の 桃が売られていたので買ってきて食べてみたところ,期待したほど甘く感じないので糖度計で測っ てみたら糖度は13.5度だった.この桃は本当にM農園産なのだろうか.

【解説】 帰無仮説H0 を「M農園産の桃である」とする.検定統計量X は桃の糖度にするしか ない.仮説 H0 の下ではP(X 13) = 0.99, P(X 15) = 0.95ということが分かっているから P(X <13) = 0.01, P(X <15) = 0.05,つまり有意水準5%の棄却域はA5={x <15}1%の 棄却域はA1={x <13}である.

今回の実現値x= 13.5はA5 に入っているので,有意水準5%で検定するならH0は棄却され

「これは偽物である」という結論になる.しかし A1 には入っていないので,もし有意水準1%で 検定するならH0 は棄却されず「偽物と断言できるほどじゃないし,こんなものなのかなぁ…」と

いう結論になる. \(^o^)/

a私は桃が好きなわけではないので詳しくないが,糖度13度以上なら上等品らしい.

8.4 (冒頭のコイン投げ). 帰無仮説H0 を「このコインは表も裏もθ= 1/2の確率で出る」と する.そんなコインを n回投げて表が出る回数をSn とすればこれは二項分布 B(n, θ)に従うこ とが分っているのでSn を検定統計量として採用する.

一例としてn= 100の場合を挙げれば,P(S10058)0.044, P(S10057)0.067なので,

有意水準5%で検定するなら棄却域はS10058にとるのが適切.(このように,離散型の場合は 丁度P(X ∈A) =αとなる区間は取れないので,できるだけ大きい区間を棄却域にせよというの が手順(4)の意味.)今回観測された60回という実現値はこの棄却域に入っているので,有意水準 5%で帰無仮説を棄却し「このコインは表が出易いようだ」と結論する.

以下の二つの例は正規母集団の母平均に関する検定の基本型で,検定の基本的な仕組みを理解するの に重要である.

8.5 (母分散既知正規母集団の母平均). あるメーカーが販売する掃除機の従来品は稼動時の音 の大きさが平均65 dBである.これに対し開発中の新製品の試作機15個を計測すると標本平均は

64 dBだった.従来品から変化があると言えるか?音の大きさは母分散σ2= 5 の正規分布に従う

として有意水準5%で検定せよ.

【解説】 検定対象は母平均µ で帰無仮説は H0 :µ = 65(従来通りということ).正規母集団 で分散も既知なので,標本平均を標準化した Z = Xn−µ

σ2/n を検定統計量とすれば H0 の下で Z∼N(0,1)である.有意水準α= 0.05に対してPH0(|Z|>1.96) = 0.05 だから |Z|>1.96 棄却域.実現値はz= 6465

√5/15 =−√

3≈ −1.73で棄却域に入らないので,有意水準5%で H0

は棄却されず「変化があるとは言えない」となる.(担当者は「でも全く同じわけはないと思うん

だけどなぁ…」と言うかもしれないが.) \(^o^)/

ちなみに,有意水準10%で検定する場合,PH0(|Z|>1.64) = 0.1なので 1.73は棄却域に入 りH0 は棄却される.(注8.8も参照.)

1 dBの違い*37が分かる人は少数派ではないかと思われるので,多くの人にとっては納得のいく結論 ではないだろうか.ところが,この例を次のように少しだけ変更すると状況は一変する.

*37音圧にして1.1倍の違いだが,私は64 dB65 dBの違いがどれ程か実体験したことがないので分からない.

8.2 検定論の初歩 77

例8.6. あるメーカーが販売する掃除機の従来品は稼動時の音の大きさが平均65 dBなのだが,う るさいとの苦情が多いため改良することになった.新製品の試作機15個を計測すると標本平均は

64 dBだった.新製品は改善していると言えるか?音の大きさは母分散σ2= 5 の正規分布に従う

として有意水準5%で検定せよ.

【解説】 帰無仮説はやはり H0 : µ = 65 であり,検定統計量 Z = Xn−µ

σ2/n H0 の下で Z ∼N(0,1). 有意水準 α= 0.05 に対してP(Z <1.645) = 0.05 だから Z <−1.645が棄却 域.実現値はz= 6465

√5/15 =−√

3≈ −1.73で棄却域に入るので,有意水準5%でH0 は棄却さ

れ「新製品で改善されました」となる. \(^o^)/

「観測データは同じなのに結論が変わるなんてそんなバカな話があるか!いんちきだ!」と思う かもしれないが,仮説検定とはそういうものである.

実は私は仮説検定が嫌いなので少し煽り気味に書いていることは認めるが,そのような個人的感情を 抜きにしても,仮説検定のこの本質を理解せずに

検定の結果はあくまでも参考,より詳細な研究のための手掛かりに過ぎないのであり,絶対的正 義のように盲信することがあってはならない.

それを理解した上で正しく誠実に使うなら強力な道具であることも間違いないが,それが存外に難しい ようでもある.ともあれ,詳細を紐解いていこう.

8.2.2 帰無仮説と棄却の意味

まず帰無仮説の意味するところだが,漢語的に読んで解釈すれば「無に帰する仮説」「なかったことに する仮説」である.英語だとnull hypothesisだが,hypothesisが仮説でnullは元はドイツ語で zero

やnothingと同義なので「無意味な仮説」とでもいったところだろう.いずれにしても肯定的・積極的

なものではなく,否定的・消極的な言葉である.さらに,今から述べるように,仮説検定は帰無仮説を 棄却する場合のみ結論に意味がある手法である.従って

本音では否定したいことを敢えて帰無仮説にするのが基本方針

である.肯定したいことは後述する対立仮説に設定するので帰無仮説にはしない.

帰無仮説の下で棄却域を求めておくのだが,これは「帰無仮説が正しいなら容易には発生しないよう な極端な値の範囲」である.それゆえ,実際のデータから計算した検定統計量の実現値が棄却域に入っ たならば,帰無仮説と矛盾すると考え帰無仮説を棄却する.つまり

仮説検定の論理は背理法と同じ

である.一方,実現値が棄却域に入らなければ,ありふれたことが起きただけで帰無仮説と矛盾してい るとは言えないので,帰無仮説が間違っているとは判断しない.大事なことは,棄却するときは明確に 否定しているが,棄却しないときは否定も肯定も何もしていない,

「棄却しない̸= 帰無仮説は正しい」

ということである.納得できない人は,あまり良い例えではないが,次のように考えたらどうだろうか.

78 8 統計的仮説検定

「悪いとは言ってないよ」 ← 良いとも言っていない

「返さないとは言ってないよ」 ← 返すとも言っていない

どんな教科書にも書いてあるはずの最重要注意事項なので,絶対に勘違いしないこと.

注8.7. 帰無仮説を棄却しないことを「採択する (accept)」と書いてある教科書は数多く存在す る.私も以前はそれらの本に影響されて使っていたので偉そうに言うのは気が引けるが,百害あっ て一利もない表現なので使うべきではない.帰無仮説は棄却することがあるだけで,採択すること はない.(Aのことを採択域と呼ぶ本もあるが,これも不適切だろう.)

アメリカ心理学会で発表されたレポート“Statistical methods in psychology journals: Guide-lines and explanations”にもNever use the unfortunate expression “accept the null hypothesis.”

と強調して書かれているし,現代統計学確立の立役者の一人Fisherも有名な著書で“... the null hypothesis is never proved or established, but is possibly disproved, ...” と書いているらしい.

(Fisherの本は手元にないので伝聞.)

8.2.3 検定における2種類の過誤

仮説検定はその原理から,間違った判断をしてしまう可能性を0 にすることはできない.例えば 例8.4 では,帰無仮説 H0:θ= 1/2 が正しい状況でもS100= 100となる確率は0ではないのでその ような事象は起こり得るが,そのときH0 は棄却され「このコインはおかしい」と結論されてしまう.

このように間違った結論を出してしまうことを過誤(かご)と言うが,検定の過誤には次の二種類があ る*38

帰無仮説が本当は正しいにも関わらず,実現値がたまたま棄却域に入ってしまったために棄却さ れてしまうことを第1種の過誤 (error of the first kind / type I error) という*39

帰無仮説が本当は間違っている(棄却されるべき)にも関わらず棄却されないことを第2種の過 (error of the second kind / type II error)という.

確率的な現象を相手にする以上,これらの過誤が起こる確率を0にすることはできないが,できる限 り小さく抑えることが望ましい.第1種の過誤が起こる確率をα,第2種の過誤が起こる確率をβ とす ると,それぞれの過誤が起こる状況と確率は次のようになる.

H0が棄却されない H0 が棄却される H0は正しい OK (1−α) Type I error (α) H0は間違い Type II error (β) OK (1−β)

第1種の過誤が起こる状況(帰無仮説は正しい)を考えると,そもそも棄却域の決め方がPH0(A) =α なので,帰無仮説が正しいときには確率α で棄却域の数値が観測され,結果として帰無仮説は正し いからこそ確率αで棄却されてしまう.従って,第1種の過誤が起こる確率は有意水準 α そのもの である*40.第1種の過誤を避けることはできないが,有意水準は検定の実行者が任意に決めるものな ので確率の制御は可能である.棄却域は広くとった方が帰無仮説を棄却しやすくなるが,確率の性質 A⊂B =⇒P(A)≤P(B)があるので危険率は上がる.逆に危険率を低く抑えると棄却域は狭まるの で帰無仮説は棄却されにくく(意味のある結果が出にくく)なる.これは仮説検定が本質的に抱えるト レードオフである.

*38他にも数種類考える流儀があるがこのノートでは割愛する.

*39「第1種の誤り」と書く本もある.

*40従って有意水準のことを危険率とも言うのは自然だし,むしろ危険率の方が適切な用語とすら言える.

ドキュメント内 数理統計学Iノート (ページ 75-81)