いわゆる χ 2 検定の代表例 - 数理統計学Iノート

正規母集団の母分散に対しては，不偏分散とχ²分布を用いれば検定を行うことができる．ところで，

分散とは確率変数の値のばらつきの指標であることと，中心極限定理よりサンプルサイズが大きいときは何らかの形で正規分布が現われることを加味すると，「ばらつき」とか「ずれ」に関する検定ではχ² 分布を使える可能性がある．特に有名なのが適合度検定と独立性の検定であり，標語的に

χ²=∑{^観測度数 (Observed)−^期待度数(Expected)}²

期待度数(Expected) =∑(O−E)²

E と書かれる検定統計量を用いる．

8.5 ^いわゆるχ² ^{検定の代表例} 89

8.5.1 適合度のχ² 検定(χ² goodness of fit test)

一回の試行で起こる結果がK個の排反事象A₁, A₂, . . . , A_K に分かれており，各々の確率が帰無仮説 H0:P(A1) =p1, P(A2) =p2,· · · , P(AK) =pK

と与えられているとする．実際に観測データが与えられたとき，それが帰無仮説の分布と適合するかどうかを検定したい．

n 回試行を行うとすれば H0 の下での各事象の期待度数（発生回数）は m1 = np1, m2 = np2,· · · , mK = npK である．これに対して実際の観測度数は f1,· · · , fK (∑K

i=1fi = n) だとしよう．

A1 A2 · · · AK 計観測度数 f₁ f₂ · · · f_K n 期待度数 m₁ m₂ · · · m_K n このとき次の定理が知られている．

定理 8.20. nが大きい（全ての mi が mi≥10 を満たすことが一つの目安とされる）とき，帰無仮説 H0 の下で

χ²=∑(O−E)²

E =

∑k i=1

(f_i−m_i)² mi

は近似的に自由度k−1のχ²分布χ²_k₋₁に従う．

特別な場合の証明. K= 2の場合は難しくないのでここに示す（一般の場合は??節参照）．f2=n−f1, p2= 1−p1なので

χ²= (f1−m1)²

m₁ +(f2−m2)² m₂

= (f1−np1)² np1

+(n−f1−(n−np1))² n(1−p1)

= (f1−np1)² np1(1−p1)=

{

f1−np1

√np₁(1−p₁) }2

となる．ここでf1は二項分布B(n, p1)に従うのでnが大きければ中心極限定理から中括弧内は標準正規分布に収束し，ゆえにその二乗は自由度1のχ²分布に従う．（一般の場合は二項分布ではなく多項分

布から極限をとる．） \(^o^)/

さて，もし観測データが帰無仮説に完全に適合していればfi=miでχ²= 0となり，適合度が悪くなればなるほど（fiとmiのずれが大きくなるほど）χ²の値は大きくなるはずである．従って棄却域は上側α点により

P(χ²> χ²_k₋₁(α)) =α で定める片側検定を行えばよい．

例 8.21. サイコロを120回ふった結果が下表のようになった．このサイコロはいびつかどうか有

意水準5%で検定せよ．

1 2 3 4 5 6 計

回数 18 25 17 20 22 18 120

【解説】帰無仮説H0:P(A1) =P(A2) =· · ·=P(A6) = 1/6で期待度数はm1=· · ·=m6=

90 8 ^{統計的仮説検定} 120×1/6 = 20である．

χ²=(18−20)²

20 +(25−20)²

20 +· · ·+(18−20)² 20 = 2.3

だが，自由度6−1 = 5のχ²分布ではP[χ² >11.07] = 0.05なのでχ² = 2.3は5%棄却域には入らない．従ってこのサイコロは有意水準5%でいびつとは言えない． \(^o^)/

例 8.22(メンデルの実験). エンドウの種子の形態について，丸型/しわ型と黄色/緑色の四つの組合せがどのような割合で生まれるか実験したデータが下表である．ただし「理論確率」はメンデルの法則から導かれる理論値である．

黄・丸黄・しわ緑・丸緑・しわ計理論確率 9/16 3/16 3/16 1/16 1 期待度数 312.75 104.25 104.25 34.75 556 観測度数 315 101 108 32 556 このデータからχ²値を計算すると

χ²=(315−312.75)²

321.75 +(101−104.25)²

104.25 +(108−104.25)² 104.25 +(32−34.75)²

34.75 = 0.470 自由度4−1 = 3のχ²分布では

P[χ²>7.815] = 0.05

なので実測値は棄却域に入らず，有意水準5%でメンデルの法則は棄却されない．

補足 8.23. 上の例はメンデルによる有名な実験に関するものである．実は，自由度3のχ²分布で，メンデルの報告数値よりもよい数値（理論に近い数値）が得られる確率は

P[χ²<0.470] = 0.075

ほどしかないため，メンデルのデータは出来過ぎで，捏造ではないかという話も過去にはあったらしい．現在の一般的な見解として，メンデルが本当に捏造していたと考える人はほとんどおらず，

むしろメンデルの研究の凄さを示す逸話としてよく紹介される．ちなみに，メンデルの論文が世に認められたのは彼の死後なので，本人が反論することはできなかったらしい．

例 8.24. 例A.36のデータでは，ある300日間の救急車の出動回数に関するデータは下表のようになり，平均と分散はそれぞれ2.07と2.04だった．出動回数の分布がPoisson分布に適合していると言えるか有意水準5%で検定せよ．

回数 0 1 2 3 4 5 6 計日数 38 75 89 54 20 19 5 300

【解答らしきもの】帰無仮説を平均λ= 2.07のPoisson分布として p(k) =e⁻^λλ^k

k! ^{から期待度} 数を300×p(k)で計算すると

回数 0 1 2 3 4 5 6 計観測度数 38 75 89 54 20 19 5 300 期待度数 38 78 81 56 29 12 6 300

8.5 ^いわゆるχ² ^{検定の代表例} 91

自由度7−1 = 6ではP_χ2

6(χ²>12.59) = 0.05だが，実現値χ²=(38−39)²

39 +· · ·+(5−3)²

3 =

8.02は棄却域に入らないので，Poisson分布に適合していないとは言えない． \(^o^)/

注8.25. 上で「解答らしきもの」と書いたのは，実は正確ではないからである．というのも，この

例では平均をデータから推定しているので，自由度は7−1 = 6よりさらに下がるはずであり，安全策をとるなら自由度5 のχ² 分布で検定すべきである．その場合でもP_χ2

5(χ²>11.07) = 0.05 で実現値はやはり棄却域には入らないので結論は変わらない．

もちろん，あらかじめλ= 2 のように母平均が与えられているなら自由度は6でよい．厳密さに欠けるが一般な目安として，期待度数を出す際の母数に推定値を用いると，推定値で置き換えた母数の数だけ自由度が下がる．（正規母集団の不偏分散も標本平均を含むので自由度が1下がった χ² 分布に従うのだった．）

こんな事も気にしなければならないのは検定の嫌なところだが，検定の拠り所は確率なのだからその計算を出鱈目にやるわけにはいかない．

8.5.2 独立性のχ² 検定

n個の標本が二つの属性A, Bによって次のように分類されているとする．（このような表をr×s分割表という．）

B1 B2 · · · Bs 計 A₁ n₁₁ n₁₂ · · · n_1s n₁_· A₂ n₂₁ n₂₂ · · · n_2s n₂_· ... ... ... . .. ... ... A_r n_r1 n_r2 · · · n_rs n_r_·

計 n_·1 n_·2 · · · n_·s n

ni·=

∑s j=1

nij, n_·j =

∑r i=1

nij

このとき属性AとBが独立であるかどうかを検定したい．

表からはまずP(Ai) = ni·

n , P(Bj) = n_·j

n ^{と推定される．もし}AとBが独立ならばP(Ai∩Bj) = P(Ai)P(Bj)なので(Ai, Bj)の期待度数mijは

mij =n×P(Ai∩Bj) =n·ni·

n ·n_·j

n = ni·n_·j

n となるはずである．従って，適合度検定と全く同じ考え方を使うことができる．

定理 8.26. nが大きいとき（全てのmij ≥5が一つの目安），帰無仮説「AとBは独立」の下で

χ²∑(O−E)²

E =

∑r i=1

∑s j=1

(n_ij−m_ij)² mij

ただしmij =n_i_·n_·_j n は近似的に自由度(r−1)(s−1)のχ²分布に従う．

自由度については，Aに関する和とBに関する和でそれぞれ1減るものが掛け合わさるので(r−1)(s−1) になるとでも思っておけばよい．（注8.25の考え方によるなら，期待度数を出すために用いる確率が推定値なので，その数r−1個とs−1個がよけいに落ちてrs−1−(r−1)−(s−1) = (r−1)(s−1) になる．）

92 8 ^{統計的仮説検定}

適合度検定のときと考え方は同じで，もし独立ならχ²= 0になり，ずれが大きいほどχ²の値は大きくなるはずなので，上側α点により棄却域を

P(χ²> χ²_(r₋_1)(s₋₁₎(α)) =α で定めればよい．

注 8.27. 適合度検定もそうだが，独立性の検定にχ²分布を使うのはあくまでも近似であり，状

況によってはχ²検定が適切でないこともある．特に2×2分割表で小さい要素を含むものでは近似の精度がよくないのでそれを補正するために

χ²=

∑2 i=1

∑2 j=1

(

|n_ij−m_ij| − 1 2

mij

を使うのがよいとされる．これをイエィツの補正 (Yates’ correction) という．Rなどの統計ソフトであれば自動的に実行してくれる．

例 8.28. （時代遅れな例なので後で差し替える．）ある会社の社員60名についてパチンコをする

かどうかと喫煙者かどうかを聞くと下表のようになったとする．

パチンコするしない

煙草吸う 9 3 12

吸わない 18 30 48

27 33 60

帰無仮説「煙草とパチンコは無関係」の下での期待度数は

パチンコするしない煙草吸う 27×12/60 = 5.4 33×12/60 = 6.6 吸わない 27×48/60 = 21.6 33×48/60 = 26.4 自由度(2−1)(2−1) = 1ではP_χ2

1(χ²>3.84) = 0.05だが，χ²値を計算するとχ²= 5.4545（イエーツの補正するとχ² = 4.0446）なので，危険率5%で帰無仮説は棄却され，（少なくともこの会社の社員については）煙草とパチンコは独立ではない．

例 8.29. インターネット広告としてA, Bの二種類を用意し，閲覧数と購入者数を集計すると次

のようになった．二つの広告の効果に差はあるか有意水準5%で検定するとどうなるだろうか．

閲覧数購入者数広告A 5555 256 広告B 6012 321

一つの方法は帰無仮説を「広告の種類と売上は独立」として独立性検定に持ち込むことである．この場合，上の表から

非購入者数購入者数広告A 5299 256 広告B 5691 321 となる．上側5%点は先程の例と同じくP_χ2

1(χ²>3.84) = 0.05だが，χ² 値はχ²= 3.1016で棄却域に入らないので，帰無仮説は棄却されず，広告の種類と売上は無関係であることを否定できない．

ドキュメント内数理統計学Iノート (ページ 88-93)