• 検索結果がありません。

単一の正規母集団に関する検定

ドキュメント内 数理統計学Iノート (ページ 81-86)

側検定では通常,有意水準αを両サイドに均等に分けて PH0((∞, c]) =PH0([c,∞)) =α/2 となるよ うにとる.

H0 H1? H1?

A B C

z(α/2) 0 z(α)

−z(α)

−z(α/2)

図13: 対立仮説がµ̸= 0の場合.どちらか片方に寄せることによる検出力の向上は見込めないので両 側検定を行う.

ここまで正規母集団の母平均を例に考察してきたが,正規母集団以外の場合でも帰無仮説と対立仮説 の分布(密度関数)の位置関係から判断できることが多い.例えば冒頭のコイン投げの例では,暗黙の 対立仮説が「このコインは表が出易い」なのでSn ≥N という形の棄却域をとったわけである.なお,

実際の問題では対立仮説が明確でないことも少なくない.対立仮説なしでは片側検定を正当化できない ときは両側検定を採用する*42

実務で検定を行った際には実際の検出力がどの程度であるかの見積もりも合わせて行うことが求めら れるが,それについては8.9節で解説する.

8.2.6 仮説検定の手順(改訂版)

ここまでをまとめて,仮説検定の手順を改めて整理すれば次のようになる.

仮説検定の手順(改訂版)

(1) 帰無仮説をH0, 対立仮説をH1とする.

(2) 検定統計量を選択し,有意水準(危険率)αを決める.

(3) PH0(X ∈A)≤αを満たしPH1(X ∈A)が最大になる棄却域Aを(何らかの方法で)求 める.(大抵の場合は上側αPH0(X > u(α)) =αと下側αPH0(X < l(α)) =αに よって

右片側検定ならA= [u(α),)

左片側検定ならA= (−∞, l(α)]

両側検定ならA= (−∞, l(α/2)]∪[u(α/2),) を棄却域にすればよい.)

(4) X の実現値xx∈AならH0を棄却し,x /∈Aなら棄却しない.

8.3 単一の正規母集団に関する検定

正規母集団,つまり母集団分布が正規分布の場合,標本平均や不偏分散などの分布を厳密に求められ る(B節参照)ため正確な推定や検定が可能である.正規母集団に対する精密な推定・検定論は伝統的 な統計学の教程で重視されてきたもので,χ2, t, F の3分布を用いた検定は常識とも言える.

ただし,以下でも指摘する通り,社会科学など人的要因の絡む問題で母集団に正規性を仮定できるこ

*42χ2検定のように対立仮説がなくても片側検定になるものもある.

82 8 統計的仮説検定

とは決して多くないため,正規母集団への精密理論だけに注力しても不十分である*43.まして,明らか に正規母集団ではない問題に対して正規性を仮定した手法を用いるのは論外である.

問題の状況や各手法が前提とする条件を何も考えず,ただのパターン暗記で「これは平均だから t 検定,分散だからχ2 検定」などとやるのは危険極まりない統計の誤用

なのだが,そんな誤用が蔓延・横行しているかもしれないので注意しよう.

注8.9 (試験の成績は正規分布には従わない?). 図14は2015年度(平成27年度)全国学力・学 習状況調査の中学校数学A(主に知識を問う問題,全36問)の正答数の分布と,同じ平均・標準 偏差をもつ正規分布の密度関数を比較したものである.離散型か連続型か,値域が有限か無限かな どの細かい話をするまでもなく,正規母集団と仮定できるようには見えない.

お行儀のいい教科書の例題や,偏差値の使われ方,学校の成績の相対評価システムでは暗黙に正 規分布を仮定していることがほとんどだが,そもそも試験の成績は正規分布していないというのが 現場の感覚ではないだろうか.

0 4 8 12 16 20 24 28 32 36 0

0.02 0.04 0.06

正答数

比率

調査結果 正規分布

図14: 2015年度全国学力・学習状況調査,中学校数学Aの正答数分布(全36問)と,同じ平均・標準

偏差をもつ正規分布の密度関数.

正規母集団に関する検定を例題を通して解説するのは,検定の基本的な流れを学習する教材とし ては丁度いいからである.それを通して,正規母集団でなくとも検定方法を考案できるように基 本となる考え方を理解することが何より重要である.正規母集団にしか適用できない手法を丸暗 記して誤用するようになってはいけない.

8.3.1 母分散既知のとき(Z 検定)

正規母集団に関する検定の初歩として,改めて 例 8.5, 例8.6 を見てみよう.正規母集団N(µ, σ2) について便宜上σ2は既知として,帰無仮説 H0:µ= 65を検定せよという問題である.検定統計量と してZ = Xn−µ

σ2/n を用いるのは,µの値は帰無仮説で指定するのでσ2 が既知なら未知母数を含まず 分布も分かるからである.しばしばZ 検定と呼ばれている.対立仮説は, 例8.5 では「変化があると 言えるか」なのでH1:µ̸= 65だが, 例8.6 では「改善していると言えるか」なのでH1 :µ <65 で あるところが異り,対応して 例8.5は両側検定, 例 8.6 は左片側検定を行う.そのため同じ有意水準

*43もちろん,正規性を仮定できる状況ならばこれほど精密で確立された手法もない.自然科学では正規性を仮定できる状況 も多い.

8.3 単一の正規母集団に関する検定 83

5%でも棄却域が異なり,標本の実現値は同じ64であるにも関わらず, 例8.5 ではH0 は棄却されな いが 例8.6 ではH0 が棄却されるという結果となる.つまり対立仮説が変われば結論も変わりえると いうことで,これだけでも十分に注意に値するが,さらに大事な,検定に関する最も重要な注意点は

帰無仮説も対立仮説も有意水準も,全て解析者が(本人は客観的に決めているつもりかもしれない が)主観的に選択しているのであり,それにより同じデータであっても検定の結果は左右される

ということである.

8.3.2 母分散未知のとき(t検定)

実際の問題において,母平均が不明であるにも関わらず母分散がわかっているとは考えにくい.前節 までに解説した例8.5, 例8.6で用いた統計量Z =Xn−µ

σ2/n は,母分散σ2が既知だからこそ,帰無仮 説で母平均µ を特定の値に仮定することでZ の分布を Z ∼N(0,1) と確定できたのである.母分散 σ2が未知の状況ではZ= Xn−µ

σ2/n の分布を確定することはできない.

そこで思い浮かぶ素朴なアイディアは,母分散σ2 の部分を不偏分散u2n で置き換えたT = Xn−µ

u2n/n を用いることである.そうすればT に含まれる未知母数はµのみなので,帰無仮説でµに値を与えれ ばT の分布を特定することができるだろう.実際,Tt分布に従う(定理B.8)ので検定が可能に なる.t分布を用いるのでt検定と呼ばれる.

8.10. 歴史的には,上述のように考えて T の分布を何とかして正確に求めようとしたのが

Gossetであり, Tt 分布に従うのではなく,T の確率分布にt分布という名前を付けたので

ある.

8.11 (母分散未知正規母集団の母平均,t検定,[6]より引用). 水泳100m自由形のある選手 のタイムは平均58.8秒だった.有名コーチとの合宿トレーニング後に10回タイムを計測すると

57.6,58.2,56.2,57.3,58.7,58.8,56.3,57.1,57.3,57.1

で平均57.46秒だった.選手は速くなったと言えるか,有意水準10%で検定せよ.ただし合宿前

後ともタイムは正規分布に従うとする.

【解説】 (1) 平均タイムµが検定対象でH0:µ= 58.8 (変化なし)速くなったかかどうかが 問題なので H1:µ <58.8.

(2) 母分散未知の正規分布なので,検定統計量として T =Xn−µ

u2n/n (n= 10)を用いる.H0 の 下では T ∼tn1=t9.

(3) H1 の形から左片側検定でPt9(T <1.383) = 0.1. (分布表からt9(0.1) = 1.383.) (4) 不偏分散はu210= 0.794でT の実現値はt= 57.4658.8

√0.794/10 =4.755で棄却域に入るので H0 を棄却.有意水準10%でこの選手は速くなったと言える.

\(^o^)/

8.12. 今どき上のような計算を手計算でやるのは,勉強になるとは思うが,実務的ではない.

統計処理ソフトを積極的に用いるべきである.例えば代表的な統計処理ソフトウェアであるR で は次のようにする.

> t.test(c(57.6, 58.2, 56.2, 57.3, 58.7, 58.8, 56.3, 57.1, 57.3, 57.1),

84 8 統計的仮説検定

alternative="less", mu=58.8) # 実際には1行で入力する One Sample t-test

data: c(57.6, 58.2, 56.2, 57.3, 58.7, 58.8, 56.3, 57.1, 57.3, 57.1) t = -4.7561, df = 9, p-value = 0.0005176

alternative hypothesis: true mean is less than 58.8 95 percent confidence interval:

-Inf 57.97646 sample estimates:

mean of x 57.46

入力するのは最初の1行だけで後は出力である.これだけでtの値や,p値(後述)が約0.05%で 有意水準より小さいので棄却できることだけでなく95%信頼区間も自動的に計算してくれる.(こ こで信頼区間が(−∞,57.97646]となっていることに気付いた人は鋭い.8.6節で述べるように,

一般に信頼区間も対立仮説によって変化する.)

統計処理ソフトの使用を前提に考えれば,統計の学習をする際に大事なのは,細かい計算を気に することではなく

どのような統計量・確率分布を用いるべきか判断できること(この例では t.testを使い alternative="less"を指定できること)

出てきた結果を正しく解釈できること

と思われる.しかしそのためには,複雑な問題になればなるほど,確率論の基礎が重要になるだ ろう.

補足8.13. 上の補足でp (p-value) という言葉が出てきたが,これは簡単に言えば 帰無仮説の下で計算した「その実現値よりもさらに起きにくい範囲の値が生じる確率」

である.上の例では,自由度 9 の t 分布で実測値 t = 4.7561 よりも外れた値が出る確率が P(T <−4.7561) = 0.0005176 ということである.

まともな統計処理ソフトであればp値は自動的に計算してくれるため,統計処理ソフトの使用 を前提とした実務上は,p値が有意水準より小さければ帰無仮説を棄却しそうでなければ棄却しな ければよい.

ただしここで注意しなければならないのだが,よくある誤解に,p値が小さければ小さいほど対 立仮説の正しさが強まる,といったものがあるがそんなことは断じてない!p 値が大きいからと いって帰無仮説が正しいわけでもない! p値については批判や注意点があまりに多い.丁寧に 説明すべきなのかもしれないが,このノートでは敢えて触れないことで,意味も分からず積極使用 することはやめなさいという意思表示としたい.(だからp値の定義も正確には与えていないのだ が,場所によってはp値を使って説明したい所もあるのが悩ましい.)

ドキュメント内 数理統計学Iノート (ページ 81-86)