帰無仮説に基く検定

第 3 章統計的推測 - 推定と検定

3.4 帰無仮説に基く検定

そこで、表計算の関数などで、P(F > f2) = α/2なる f2 を求め、f2 = (n−x)p

(x+ 1)(1−p)をpについて解いた値をp₂とする。

p2= (x+ 1)f2

(x+ 1)f₂+ (n−x)

すると、nZがB(n, p2)に従うならP(nZ≤x) =α/2である。

これらより、pの信頼係数100(1−α)%での信頼区間は、[p1, p₂]である。

例 3.3.2. 比率の区間推定

喫煙率をランダムに選んだ20人の中で求めて0.35を得た。母比率の95%信 頼区間を求めよ。エクセルファイル

3.3.3 母分散の区間推定

正規母集団から採った標本に対して、標本分散をS²とおけば、χ²=nS² σ² が自由度n−1のカイ自乗分布に従うことを利用する。

100(1−α)％信頼区間は以下のようになる。

nS² χ²_n₋₁(_α

) < σ²< nS² χ²_n₋₁(

1−^α₂)

イコロならこんなことは起こるはずがない、よってサイコロは正常ではない。」

という仮定を否定する推論になっている。ではもう少し微妙な場合を考える。

あるサイコロは1の目の出方がどうも他の目に比べ多いような気がする。そこで、そのサイコロを４回振ってみたら、４回とも1が出たとする。サイコロが正常ではないような気もするが、正常なサイコロでもあり得ない話でもない。これをどう判断するか。

まずつぎのように仮定してみる。

仮説：「1の目が出る確率は6分の1である」

この仮定は「否定される(無に帰す)ときに積極的な結論を導く」と言うもので

「帰無仮説」と呼ばれる。この帰無仮説のもとでは

1の出る確率 ¹₆= 0.166666667 4回とも1が出る確率 (₁

= 0.000771605

と計算される。帰無仮説のもとでは、4回とも1が出る確率は非常に小さい。つまり、ほとんど起こり得ない事象であるといえる（1000回の場合ほどでもないが）。

実際は4回とも1が出ることは公平なサイコロでもあり得る。しかしその確率はほとんど0に等しい（再び1000回ほどではないが）。よってこのときも帰無仮説を否定して、「サイコロは1の目が出易い」と結論する。

ただし統計的に否定はしながらも、帰無仮説が誤りでない可能性も確率的に 0.0771605. . . ％ある。この確率をP値という。ここで、このP値より大きな値 α％をとって帰無仮説は危険率(または有意水準)α％で棄却されるという。

ある危険率では棄却できないときは、帰無仮説は採択されるという。検定においては、帰無仮説が棄却されたときのみ危険率という結論の信頼度を示す確率的数値を伴った「積極的な主張」ができ、帰無仮説が採択されるときは「矛盾するとはいえない」という「消極的な結論」でしかないことに注意しよう。ある主張が矛盾することが証明できないからといって、主張の証明が得られたことにはならないのと同様である。

この例ではサイコロの目のうち1が出やすいのではないかと、1に着目して検定した。しかし、もっと一般にこのサイコロは各目の出方が均一ではないのでないかという検定をするならば、帰無仮説は「1の目が出る確率は6分の1である」ではなく、「各目が出る確率は6分の1である」となる。さらに「4回とも 1の目が出た」という事象を「4回とも同じ目が出た」と見て「各目が出る確率

は6分の1である」という帰無仮説のもとでP値を求めれば上で求めたP値の 6倍になることは簡単に分る。このように同じ事象でも検定の設定のしかたで結論は大きく違ってくることに注意しよう。

ここで強調しておきたい点は、意志決定においては「数値」が求められているのではなく、ある事実が起こっているかいないかという２者択一の「判断」が迫られているということである。すなわち、「ふんぎり」をつけなければならない、

もしくは判断の正当化が必要なわけで、そういった状況で検定がその判断基準として使われるのである。

3.4.1 母平均の検定

正規分布を使う方法(正規母集団か大標本で、母分散既知の場合)

ここでは母平均µの推定区間を使った検定と同様の原理を使って、仮説検定を行う。これは推定区間を使った検定の焼き直しであることがわかる。

[両側検定]

最初にある定数µ0に関してµ=µ0であるかないかの検定を考える。帰無仮説H0:µ=µ0のもとでは、X¯−µ0は正規分布N(

0, σ²/n)

に従う。

表計算などの関数でN(

0, σ²/n)

に関し、

P(z > z(α/2)) =α/2

なるz(α/2)を計算すれば、危険率αでの棄却域（棄却条件）は、

X¯ −µ0<−z(α/2), z(α/2)<X¯ −µ0

あるいは、

|X¯ −µ0|> z(α/2)

である。すなわち、この範囲にX¯−µ₀が落ちれば、観測されたX¯ はµ₀と違いすぎて非常に起こりにくい値であると判断されるわけである。z(α/2)は区間推定でも使った正規分布N(0, σ²/n)の両側α点（両側100α％点）である。

なお、帰無仮説H₀:µ=µ₀が採択されてもこれは積極的な結論ではないのであるから、µ=µ0と積極的に結論することは（この方法では）できない。

z(α/2) α/2 -z(α/2)

α/2

さいころの検定で、「帰無仮説のもとで計算した、実際におきた事象の確率」

をP値と呼んだ。ここでも、P値を計算してみよう。標本データから実際に計算されたX¯ −µ₀をζとすれば、実際に起きた事象はX¯ −µ₀=ζであるが、連続型の分布ではこの確率は定義されない。よって実際に起きた事象を、帰無仮説からより遠い方向に拡張してX¯−µ₀≧ζと考える。帰無仮説を否定しようとしているのだから、帰無仮説を否定する方向に範囲を拡張してその確率を考えるためである。さらに、X > µ¯ 0の仮定があるわけではないので、|X¯−µ0|≧ζと拡張する。拡張すればするほどP値は大きくなってしまうが、考えうる範囲をすべて含めて慎重に検定を行うためである。

さて、P値が求まれば、これを最低の危険率として帰無仮説は棄却できる。

今日ではコンピュータで簡単にこの事象の確率を計算できる。

ζ p -ζ

正規分布を使う母平均の両側検定の手順

1. （前提）母集団が正規分布にしたがうか、あるいは標本の個数nが十分大きいかを確かめる（どちらかが満たされていないとこの方法は使えない）。

2. （前提）母分散σ²が既知かを確かめる（これが満たされていないとこの方法は使えない）。

3. （前提）「母平均µがある数µ0と等しい（帰無仮説）」が正しいかを検定する。ここで、母平均µがµ₀より以上か以下かの先見的知識はないものとする（両側検定の前提）。

4. あらかじめ与えられた（決めた）危険率をαとする。

5. 統計量|X¯ −µ₀|を計算する。

6. 既知のσ²と標本の数nを使って、正規分布N(0, σ²/n)の両側α点z(α/2) を求める（表計算などで）。

7. |X¯ −µ₀| > |z(α/2)|であれば、帰無仮説を棄却（否定）する、すなわち µ̸=µ0と結論する。

P値を使う方法では上の4以下が次のようになる。

5. 統計量|X¯ −µ0|を計算する。

6. 既知のσ²と標本の数nを使って、正規分布N(0, σ²/n)にしたがうZについて確率P(|X¯−µ₀|< Z) =pを求める（表計算などで）。

7. p < αなるαについて、危険率2αで帰無仮説を棄却（否定）できる、すなわちµ̸=µ₀と結論する。

[右片側検定]

つぎに、µ≥µ0であるという先見的知識がありこれを前提とするとき、µ > µ0

であるかないかの検定を考えてみよう。

帰無仮説はµ≤µ0となるがµ≥µ0の前提のもとではH0 :µ=µ0と同値である。この帰無仮説のもとではX¯−µ₀は上と同じく正規分布N(

0, σ²)

に従う。

そこで表計算などの関数でN( 0, σ²)

に関し、今度は P(t > z(α)) =α なるz(α)を計算すれば、危険率αでの棄却域は、

z(α)<X¯−µ0

である。すなわち、この範囲にX¯−µ0が落ちれば、X¯ はµより大きすぎて非常に起こりにくい値であると判断されるわけである。z(α)は正規分布N(0, σ²/n) の右片側（上側）α点という。

z(α) α

こうしてH₀:µ=µ₀が棄却されたとしよう。つぎにµ₁< µ₀なるµ₁について帰無仮説H0:µ=µ1を考える。この仮定のもとではX¯ は(µ=µ0のもとでに比べ)いっそうµより大きいと評価されµ=µ₁はいっそう棄却されやすくなるべきだろう。実際そうなることを確かめよう。

µ=µ₁のもとでもX¯−µ₁は上と同じ正規分布N( 0, σ²)

に従う。ところが、

X¯ −µ0<X¯−µ1

であるのでX¯ −µ1の方が右側にある棄却域に入りやすくなる。

したがって、この検定法は「より小さいものとの比較になるほど標本値が大きいと判断される」という意味で健全なものといえる。

左片側検定も同様にできる。

t分布を使う方法(正規母集団で母分散未知の場合)

帰無仮説H0:µ=µ0のもとでの両側検定について述べる。このときも、同じ仮定の元での母平均の区間推定の原理が使える。

母集団が正規分布N(µ, σ²)に従うとき、大きさnの標本X1, . . . , Xnの標本平均をX¯とし、不偏分散の平方根をUとする。すると、

t= X¯ −µ

√Un

は自由度n−1のt分布とよばれる分布に従う。U²は母分散の不偏推定値であるから母分散であるとみなせば、両側検定はやはり|t|の大きなときに棄却すればよい。

表計算などの関数でこの分布に関し、

P(t > tn−1(α)) =α/2 なるtn−1(α)を計算できるので、危険率αでの棄却域は、

|t|> t_n₋₁(α) である。

正規分布を使う方法を参考に片側検定についてはどうすればよいか考えてみよ。

例 3.4.2. 平均身長の主張の検定

ある地域の成人男子身長のサンプル平均がX¯ であった。母平均はµ（未知）と する。

全国の成人男子平均身長はµ0であると知られているとする。またこの地域の 17歳男子身長の平均がν₀であると知られているとする。

以下のような３つの問題を考える。

1. µ̸=µ0であるかないか?

2. µ > µ0であるかないか?

3. µ < ν₀であるかないか?

• (1のケース)このケースは両側検定である。

この地域の成人男子身長が全国平均以上である、あるいは以下である、のどちらかの先見的知識がないのであれば両側検定が適当と考えられる。この場合帰無仮説H₀ : µ = µ₀が棄却されたときの結論は、文字通りには

「差がある」であるが実際は片側検定より狭い棄却域で棄却できているので「高いといえる」「低いといえる」としてよいだろう。

• (2のケース) この地域の成人男子身長が全国平均以上であるという先見的知識があり(例えば若者が多いとか)それを前提とすれば、この問題設定となり右片側検定である。H0:µ=µ0を立ててX¯ が大きすぎないかを検定する。前提によりµ < µ₀は問題にしなくてよい。

• (3のケース) この地域の成人男子身長がこの地域の17歳男子身長以下であるという先見的知識があるといえるなら、この問題設定となり左片側検定である。H0:µ=ν₀を立ててX¯ が小さすぎないか(だけ)を検定する。

ドキュメント内 x y 1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... x ( ) 2 (ページ 55-78)

第 3 章 統計的推測 - 推定と検定

3.4 帰無仮説に基く検定

3.3.3 母分散の区間推定

3.4.1 母平均の検定

第 3 章統計的推測 - 推定と検定