第 3 章 統計的推測 - 推定と検定
3.4 帰無仮説に基く検定
そこで、表計算の関数などで、P(F > f2) = α/2なる f2 を求め、f2 = (n−x)p
(x+ 1)(1−p)をpについて解いた値をp2とする。
p2= (x+ 1)f2
(x+ 1)f2+ (n−x)
すると、nZがB(n, p2)に従うならP(nZ≤x) =α/2である。
これらより、pの信頼係数100(1−α)%での信頼区間は、[p1, p2]である。
例 3.3.2. 比率の区間推定
喫煙率をランダムに選んだ20人の中で求めて0.35を得た。母比率の95%信 頼区間を求めよ。エクセルファイル
3.3.3 母分散の区間推定
正規母集団から採った標本に対して、標本分散をS2とおけば、χ2=nS2 σ2 が 自由度n−1のカイ自乗分布に従うことを利用する。
100(1−α)%信頼区間は以下のようになる。
nS2 χ2n−1(α
2
) < σ2< nS2 χ2n−1(
1−α2)
イコロならこんなことは起こるはずがない、よってサイコロは正常ではない。」
という仮定を否定する推論になっている。ではもう少し微妙な場合を考える。
あるサイコロは1の目の出方がどうも他の目に比べ多いような気がする。そこ で、そのサイコロを4回振ってみたら、4回とも1が出たとする。サイコロが正 常ではないような気もするが、正常なサイコロでもあり得ない話でもない。これ をどう判断するか。
まずつぎのように仮定してみる。
仮説:「1の目が出る確率は6分の1である」
この仮定は「否定される(無に帰す)ときに積極的な結論を導く」と言うもので
「帰無仮説」と呼ばれる。この帰無仮説のもとでは
1の出る確率 16= 0.166666667 4回とも1が出る確率 (1
6
)4
= 0.000771605
と計算される。帰無仮説のもとでは、4回とも1が出る確率は非常に小さい。つま り、ほとんど起こり得ない事象であるといえる(1000回の場合ほどでもないが)。
実際は4回とも1が出ることは公平なサイコロでもあり得る。しかしその確率 はほとんど0に等しい(再び1000回ほどではないが)。よってこのときも帰無 仮説を否定して、「サイコロは1の目が出易い」と結論する。
ただし統計的に否定はしながらも、帰無仮説が誤りでない可能性も確率的に 0.0771605. . . %ある。この確率をP値という。ここで、このP値より大きな値 α%をとって帰無仮説は危険率(または有意水準)α%で棄却されるという。
ある危険率では棄却できないときは、帰無仮説は採択されるという。検定にお いては、帰無仮説が棄却されたときのみ危険率という結論の信頼度を示す確率的 数値を伴った「積極的な主張」ができ、帰無仮説が採択されるときは「矛盾する とはいえない」という「消極的な結論」でしかないことに注意しよう。ある主張 が矛盾することが証明できないからといって、主張の証明が得られたことにはな らないのと同様である。
この例ではサイコロの目のうち1が出やすいのではないかと、1に着目して検 定した。しかし、もっと一般にこのサイコロは各目の出方が均一ではないので ないかという検定をするならば、帰無仮説は「1の目が出る確率は6分の1であ る」ではなく、「各目が出る確率は6分の1である」となる。さらに「4回とも 1の目が出た」という事象を「4回とも同じ目が出た」と見て「各目が出る確率
は6分の1である」という帰無仮説のもとでP値を求めれば上で求めたP値の 6倍になることは簡単に分る。このように同じ事象でも検定の設定のしかたで結 論は大きく違ってくることに注意しよう。
ここで強調しておきたい点は、意志決定においては「数値」が求められている のではなく、ある事実が起こっているかいないかという2者択一の「判断」が迫 られているということである。すなわち、「ふんぎり」をつけなければならない、
もしくは判断の正当化が必要なわけで、そういった状況で検定がその判断基準と して使われるのである。
3.4.1 母平均の検定
正規分布を使う方法(正規母集団か大標本で、母分散既知の場合)
ここでは母平均µの推定区間を使った検定と同様の原理を使って、仮説検定を 行う。これは推定区間を使った検定の焼き直しであることがわかる。
[両側検定]
最初にある定数µ0に関してµ=µ0であるかないかの検定を考える。帰無仮 説H0:µ=µ0のもとでは、X¯−µ0は正規分布N(
0, σ2/n)
に従う。
表計算などの関数でN(
0, σ2/n)
に関し、
P(z > z(α/2)) =α/2
なるz(α/2)を計算すれば、危険率αでの棄却域(棄却条件)は、
X¯ −µ0<−z(α/2), z(α/2)<X¯ −µ0
あるいは、
|X¯ −µ0|> z(α/2)
である。すなわち、この範囲にX¯−µ0が落ちれば、観測されたX¯ はµ0と違い すぎて非常に起こりにくい値であると判断されるわけである。z(α/2)は区間推 定でも使った正規分布N(0, σ2/n)の両側α点(両側100α%点)である。
なお、帰無仮説H0:µ=µ0が採択されてもこれは積極的な結論ではないので あるから、µ=µ0と積極的に結論することは(この方法では)できない。
z(α/2) α/2 -z(α/2)
α/2
さいころの検定で、「帰無仮説のもとで計算した、実際におきた事象の確率」
をP値と呼んだ。ここでも、P値を計算してみよう。標本データから実際に計算 されたX¯ −µ0をζとすれば、実際に起きた事象はX¯ −µ0=ζであるが、連続 型の分布ではこの確率は定義されない。よって実際に起きた事象を、帰無仮説か らより遠い方向に拡張してX¯−µ0≧ζと考える。帰無仮説を否定しようとして いるのだから、帰無仮説を否定する方向に範囲を拡張してその確率を考えるため である。さらに、X > µ¯ 0の仮定があるわけではないので、|X¯−µ0|≧ζと拡張 する。拡張すればするほどP値は大きくなってしまうが、考えうる範囲をすべ て含めて慎重に検定を行うためである。
さて、P値が求まれば、これを最低の危険率として帰無仮説は棄却できる。
今日ではコンピュータで簡単にこの事象の確率を計算できる。
ζ p -ζ
p
正規分布を使う母平均の両側検定の手順
1. (前提)母集団が正規分布にしたがうか、あるいは標本の個数nが十分大 きいかを確かめる(どちらかが満たされていないとこの方法は使えない)。
2. (前提)母分散σ2が既知かを確かめる(これが満たされていないとこの 方法は使えない)。
3. (前提)「母平均µがある数µ0と等しい(帰無仮説)」が正しいかを検定 する。ここで、母平均µがµ0より以上か以下かの先見的知識はないもの とする(両側検定の前提)。
4. あらかじめ与えられた(決めた)危険率をαとする。
5. 統計量|X¯ −µ0|を計算する。
6. 既知のσ2と標本の数nを使って、正規分布N(0, σ2/n)の両側α点z(α/2) を求める(表計算などで)。
7. |X¯ −µ0| > |z(α/2)|であれば、帰無仮説を棄却(否定)する、すなわち µ̸=µ0と結論する。
P値を使う方法では上の4以下が次のようになる。
5. 統計量|X¯ −µ0|を計算する。
6. 既知のσ2と標本の数nを使って、正規分布N(0, σ2/n)にしたがうZにつ いて確率P(|X¯−µ0|< Z) =pを求める(表計算などで)。
7. p < αなるαについて、危険率2αで帰無仮説を棄却(否定)できる、す なわちµ̸=µ0と結論する。
[右片側検定]
つぎに、µ≥µ0であるという先見的知識がありこれを前提とするとき、µ > µ0
であるかないかの検定を考えてみよう。
帰無仮説はµ≤µ0となるがµ≥µ0の前提のもとではH0 :µ=µ0と同値で ある。この帰無仮説のもとではX¯−µ0は上と同じく正規分布N(
0, σ2)
に従う。
そこで表計算などの関数でN( 0, σ2)
に関し、今度は P(t > z(α)) =α なるz(α)を計算すれば、危険率αでの棄却域は、
z(α)<X¯−µ0
である。すなわち、この範囲にX¯−µ0が落ちれば、X¯ はµより大きすぎて非常 に起こりにくい値であると判断されるわけである。z(α)は正規分布N(0, σ2/n) の右片側(上側)α点という。
z(α) α
こうしてH0:µ=µ0が棄却されたとしよう。つぎにµ1< µ0なるµ1につい て帰無仮説H0:µ=µ1を考える。この仮定のもとではX¯ は(µ=µ0のもとで に比べ)いっそうµより大きいと評価されµ=µ1はいっそう棄却されやすくな るべきだろう。実際そうなることを確かめよう。
µ=µ1のもとでもX¯−µ1は上と同じ正規分布N( 0, σ2)
に従う。ところが、
X¯ −µ0<X¯−µ1
であるのでX¯ −µ1の方が右側にある棄却域に入りやすくなる。
したがって、この検定法は「より小さいものとの比較になるほど標本値が大き いと判断される」という意味で健全なものといえる。
左片側検定も同様にできる。
t分布を使う方法(正規母集団で母分散未知の場合)
帰無仮説H0:µ=µ0のもとでの両側検定について述べる。このときも、同じ 仮定の元での母平均の区間推定の原理が使える。
母集団が正規分布N(µ, σ2)に従うとき、大きさnの標本X1, . . . , Xnの標本 平均をX¯とし、不偏分散の平方根をUとする。すると、
t= X¯ −µ
√Un
は自由度n−1のt分布とよばれる分布に従う。U2は母分散の不偏推定値であ るから母分散であるとみなせば、両側検定はやはり|t|の大きなときに棄却すれ ばよい。
表計算などの関数でこの分布に関し、
P(t > tn−1(α)) =α/2 なるtn−1(α)を計算できるので、危険率αでの棄却域は、
|t|> tn−1(α) である。
正規分布を使う方法を参考に片側検定についてはどうすればよいか考えてみよ。
例 3.4.2. 平均身長の主張の検定
ある地域の成人男子身長のサンプル平均がX¯ であった。母平均はµ(未知)と する。
全国の成人男子平均身長はµ0であると知られているとする。またこの地域の 17歳男子身長の平均がν0であると知られているとする。
以下のような3つの問題を考える。
1. µ̸=µ0であるかないか?
2. µ > µ0であるかないか?
3. µ < ν0であるかないか?
• (1のケース)このケースは両側検定である。
この地域の成人男子身長が全国平均以上である、あるいは以下である、の どちらかの先見的知識がないのであれば両側検定が適当と考えられる。こ の場合帰無仮説H0 : µ = µ0が棄却されたときの結論は、文字通りには
「差がある」であるが実際は片側検定より狭い棄却域で棄却できているの で「高いといえる」「低いといえる」としてよいだろう。
• (2のケース) この地域の成人男子身長が全国平均以上であるという先見的 知識があり(例えば若者が多いとか)それを前提とすれば、この問題設定と なり右片側検定である。H0:µ=µ0を立ててX¯ が大きすぎないかを検定 する。前提によりµ < µ0は問題にしなくてよい。
• (3のケース) この地域の成人男子身長がこの地域の17歳男子身長以下で あるという先見的知識があるといえるなら、この問題設定となり左片側検 定である。H0:µ=ν0を立ててX¯ が小さすぎないか(だけ)を検定する。