Classes Yutaka Matsuno's Homepage 20160715

(1)

応用統計第 ₁₂ 回

仮説検定 ₍₂₎

応用情報工学科

准教授松野裕

http://matsulab.org

2016 年 7 月 15 日

連絡

• 7^月29^日(^金)2^限、342教室で期末試験を行う。 – A4^の紙²枚持ち込み可（手書きに限る）。

– 計算機の持ち込み可。ネットワークへの接続は不可。

– 試験範囲は中間試験より後の内容（推測統計）。試験時間は₆₀分。

1 ^{前回の演習について}

1においてもし被験者数が_{n = 10}人であった場合₍標本平均、標本分散は変わらず_{X = 2, s}²_{= 6.5}とする₎、_{t =} _s/√n^X−µ ₌√ ²

6.5/^√10 ^{= 2.48069}^、^t^0.1(9) = 1.833^となりt^{の値は棄却域にあり、}帰無仮説を棄却できる。問題_1,2とも帰無仮説を棄却することができなかったが、これは帰無仮説を否定することができる十分なデータがなかったに過ぎず、積極的に帰無仮説を支持しているわけではない。

検定を行い、帰無仮説を棄却できない、できるという結果を得たとしても、当然その結果が_100%正しいとは限らない。帰無仮説が間違っているにも関わらず、棄却できなかったり、正しいのにも関わらず、棄却してしまうこともありうる。検定を行う際には、これら₂通りの誤りの可能性をできるだけ小さくする必要がある。本授業では詳しく扱わないが興味があれば調べてほしい。

2 ^{母平均（母分散既知）} 、母分散、母比率の検定

2.1 ^母平均 ( ^{母分散既知} ) ^の検定

母分散既知の場合、_{z =} _σ/√n^X−µ が標準正規分布に従うことから、これを検定統計量として検定を行える。

• ^帰無仮説 H0: µ = µ0

• ^{対立仮説検定統計量}z = ^X−µ_σ/√n⁰ ^{を計算する。}

– H1: µ ̸= µ0両側検定となる。棄却域は_{|z| > z}^α

2

(2)

– H1: µ < µ0左側検定となる。棄却域は_{z < −z}^α

2

– H1: µ > µ0右側検定となる。棄却域は_{z > z}^α

2

2.2 ^{母分散の検定}

帰無仮説_H₀_{: σ}²_{= σ}²₀の検定は標本不偏分散_s²による検定統計量： χ²=^{(n − 1)s}

2

σ² に_{σ = σ}₀を代入して行われる。

• ^対立仮説 H1: σ²̸= σ₀²^の場合、

χ²_1−α/2(n − 1) < χ²< χ²_α/2(n − 1)

の時は_H₀は棄却せず、それ以外は棄却する。

• ^対立仮説 H1: σ²< σ₀²^{の場合、左片側検定}

χ²< χ²_1−α(n − 1)

のとき_H₀を棄却し、それ以外は棄却しない。

• ^対立仮説 H1: σ²> σ₀²^{の場合、右片側検定}

χ²> χ²_α(n − 1)

のとき_H₀を棄却し、それ以外は棄却しない。例題能力のばらつきの検定

ある小学校では入学時に知能テストを行っていたが、従来は平均₅₀で分散₃₆であった。本年度の児童について₂₅人をランダムに選び、例年と同じ条件でテストしたところ、平均₅₃で分散₄₈を得た。本年度は児童の揃い方（ばらつき）が例年と違うと見てよいか。

• ^帰無仮説 H0: σ²= 36

• ^対立仮説 H1: σ²̸= 36

有意水準を_10%で両側検定を行う。

χ²= ^{24 · 48} 36 ^{= 32}

χ²_0.95(24) = 13.848^、χ²_0.05(24) = 36.415^{であるから}H0は棄却されない。本年度の児童の質の揃い方が特に例年と変わっているとはいえない。分散が大きいことが特別の対応を要するときは、対立仮説を_H₁_{: σ}²_{> 36} とすればよい。

2.3 ^{母比率の検定}

内閣支持率の調査のように、母集団が十分に大きく、母集団が_{p : 1 − p}で_{A, B}二つのグループに分かれている場合に、それから大きさ_nの標本を無作為に抽出するとき、_Aに属するもの（たとえば内閣を支持する人数）の数の確率変数を_Xとすれば、_Xは₂項分布に従う。

P (X = x) =nCx p^x(1 − p)^n−x

(3)

E(X) = np^であり、q = 1 − p^とするとV (X) = npqである。標本の大きさが大きい場合、中心極限定理より、正規分布N (np, npq)に従うと見なせる。標本比率_X/nは、

E(^X n^{) =}

1

n^{E(X) = p} V (^X

n^{) =} 1

n²^{V (X) =} pq

n を満たし、正規分布_{N (p,}

pq

n⁾に従う。これを正規化した Z =

X n ^{− p}

√pq n

=

X n ^{− p}

√p(1−p) n

を統計検定料として、検定を行う。帰無仮説、対立仮説、棄却域の設定は、平均の検定などと同様である。例題_1. ある政党の支持率は昨年度_55%であった。今年、無作為に抽出した有権者₁₀₀人に聞き取り調査を行ったところ、₆₄人が支持すると答えた。支持率は昨年度より上昇したと言えるか、_5%の有意水準で検定せよ。

• ^帰無仮説 p = 0.55

Z =

X n ^{− p}

√p(1−p) n

=

64 100^{− 0.55}

√0.55(1−0.55) 100

• (^右側)^対立仮説 p > 0.55

Z =

X n ^{− p}

√p(1−p) n

=

64 100^{− 0.55}

√0.55(1−0.55) 100

= 1.81

Z0.05 = 1.64^より、1.81 > 1.64より、棄却域にあり、帰無仮説は棄却される。よって、支持率は昨年度より上昇したといえる。

3 χ

²

^{分布による適合性検定}

χ²^分布は、χ²^検定（「検定」については後の講義で説明する）でよく使われる。_χ²検定とは

観測されたデータの分布は、理論値の分布とほぼ同じと見なせるだろうか？

ということを示すための検定である。例を３つ示す^*1。

•^{（例１）通行人}100人を無作為に抽出したら男：女の比率が_59:41だった。これは「男女比が_1:1の集団から、ランダムに抽出された₁₀₀人である」と言えるか。（このくらいのバラつきは普通にあることなのか？それとも近くにあるお店などの影響で、そもそも男性の多い場所と判断できるか？）

•^{（例２）サイコロを}120回ふったら、出た目がそれぞれ₁の目₂₅回、₂の目₂₇回、₃の目₂₀回、₄の目 10^回、5^の目13^回、6^の目25回だった。このサイコロは歪んでいると言えるか。（このくらいのバラつきは、普通のサイコロでも起こることなのか？それとも、やはり、このサイコロが歪んでいるのか？）

*1http://d.hatena.ne.jp/Zellij/20111202/p1

(4)

•（例３）日本人の血液型の割合は_A型_40%,B型_20%,AB型_10%,O型_30%である。ある学校の生徒 100^{人の血液型は}A^型40^人,B^型28^人,AB^型12^人,O^型26^{人だった。}「この学校の生徒の血液型分布は，日本人全体の血液型分布とほぼ同じである」と言えるか。（このくらいの血液型のバラつきは普通なのか？それとも、この学校には（なぜかわからないけど）_B型の生徒が多くいると判断してよいか？）これらを_χ²分布を用いて示すことができる（証明などは余裕があればぜひ調べて欲しい）原理は、

∑_{(O − E)}² E

が_χ²分布に従うことである。ここで_Oは「観測された_(Observed)」、_Eは理論によって「予測された₍期待

された_)Expected」の意味である。サイコロの例を用いて、手順を示す。

1. 次の様な表を用意する。

サイコロの目 _O _E _{(O − E)} _{(O − E)}² ^(O−E)

2

E

1 2 3 4 5

6

2. Oに実際に出た回数を記入する。

3. Eに、理論的に期待される値を記入する。₁₂₀回振ったのだから、理論的には、それぞれの目は₂₀回出るはずである。

4. O − E, (O − E)²の値をそれぞれ埋める。その結果下の様になる。

サイコロの目 _O _E _{(O − E)} _{(O − E)}² ^(O−E)

2

E

1 25 20 5 25 1.25

2 27 20 7 49 2.45

3 20 20 0 0 0

4 10 20 -10 100 5

5 13 20 -7 49 2.45

6 25 20 5 25 1.25

5. 右端の値の合計を求める。これが_χ²値になる。今回は

1.25 + 2.45 + 0 + 5 + 2.45 + 1.25 = 12.4

6. χ²分布の自由度を求める。_χ²検定の自由度は、「カテゴリー」から１を引いた数である。サイコロの目の場合、目の種類がカテゴリーである。よって自由度は₅である。

(5)

7. ^自由度5^の時、χ²^値12.4^{がどれだけ珍しいか、}5%^{の確率（有意水準}5%^）の時のχ²^値χ²_0.05(5) = 11.0705と比較する。この場合、11.0705 < 12.4^だから、5%の確率よりも低い確率であることが分かる。よって、このような目がでるサイコロは、正しいサイコロである可能性は極めて低いことがわかる。

4 χ

²

^{分布による独立性検定}

χ²分布は母分散についてのいろいろな検定に用いられたが、広く_“ばらつき_”についての検定の基準としても、近似的に用いられる。_χ²分布の紹介として、適合度の検定を紹介した。今回は、独立性の検定について説明する。

n個の個体に対して、二つの異なる属性_{A, B}（例えば_Aとして性別、_Bとして車を所有しているかどうかなど）を同時に測定したとする。_Aは_A₁, . . . , Ar^、B ^はB1, . . . , Bcのカテゴリーに分割されているとする。例をあげる。表₁はある大学の工学部の代数と解析の期末試験の成績である。縦軸は代数の成績の優、良、可の人数、横軸は解析の優、良、可の人数を示している。例えば、全受講生₄₂名のうち、代数が優で、解析が良の学生は₂名いることがわかる。このような表を分割表という。このような分割表において、独立とは、

表₁ ある大学の工学部の期末試験の成績

代数₍下₎ 解析（右）優良可計

優 ₄ ₂ ₃ ₉

良 ₈ ₄ ₆ ₁₈ 可 ₆ ₃ ₆ ₁₅ 計 ₁₈ ₉ ₁₅ ₄₂

P (Ai∩ Bj)^{の各確率に対して、}

H0:^すべてのi, j ^に対しP (Ai∩ Bj) = P (Ai)P (Bj)

であることを言う。_H₁はこの否定である。要するに、_A_i_{, B}_jは互いの起こり方に影響し合わない。_A_iの方から見れば、_{P (A}_i_|B_j_{) = P (A}_i₎である。_H₀が成り立つ場合の理論値に基づく分割表を作ってみる。それが表₂である。_χ²による独立検定は、実際の分割表が、理論値に基づく分割表に有意に差があるかを検定する。例えば、代数、解析ともに優である確率を_H₀が成立するとして計算する。代数が優である確率_{P (A}_優₎は

表₂ 表₁の理論度数

代数₍下₎ 解析（右）優良可計優 _3.86 _1.93 _3.21 ₉ 良 _7.71 _3.86 _6.43 ₁₈ 可 _6.43 _3.21 _5.36 ₁₅ 計 ₁₈ ₉ ₁₅ ₄₂

(6)

9

42^{、解析が優である確率}^{P (B}^優⁾^は 18

42 ^である。^H⁰^{が正しければ、}

P (A優∩ B優) = P (A優)P (B優) = ⁹ 42^·

18 42 である。全受講生は₄₂名であるから、理論度数は

9 42^·

18 42^{· 42 =}

9 · 18 42 ^{= 3.86}

となる。これを一般化して、_H₀を仮定した場合の、_{P (A}_i_{∩ B}_i₎の理論度数は

|Ai| · |Bj| n

で与えられる。ここで_|A_i_{|, |B}_j_|はそれぞれ_A_i_{, B}_jの個数である。独立性検定は、_χ²による適合性検定で用いた

χ²=^∑^{(O − E)}

2

E

が_χ²分布に従うことを利用する。独立性検定の場合、_Oが得られた分割表、_Eが理論度数に基づく分割表である。この例では

χ²= (4 − 9 · 18/42)² 9 · 18/42 ⁺

(2 − 9 · 9/42)²

9 · 9/42 ^{+ · · · +}

(6 − 15 · 15/42)² 15 · 15/42 ^{= 0.19}

となる。これと棄却域となる_χ²分布の値と比較する。自由度は₍縦のカテゴリ数_{− 1) · (}横のカテゴリ数_{− 1)} で与えられる。この場合、(3 − 1) · (3 − 1) = 4^{となる。有意水準を}5%^{とすると、}χ²_0.05(4) = 9.488^である。 0.19 < 9.488^より、H0は棄却されない。すなわち、有意水準_5%で、代数と幾何の成績の独立性の仮説は棄却されず、両者に関係があるとは言えない。

Classes Yutaka Matsuno's Homepage 20160715

応用統計 第 12 回

仮説検定 (2)

応用情報工学科

准教授 松野 裕

http://matsulab.org

2016 年 7 月 15 日

連絡

1 前回の演習について

2 母平均（母分散既知） 、母分散、母比率の検定

2.1 母平均 ( 母分散既知 ) の検定

2.2 母分散の検定

2.3 母比率の検定

3 χ

分布による適合性検定

4 χ

分布による独立性検定

応用統計第 ₁₂ 回

仮説検定 ₍₂₎

准教授松野裕

1 ^{前回の演習について}

2 ^{母平均（母分散既知）} 、母分散、母比率の検定

2.1 ^母平均 ( ^{母分散既知} ) ^の検定

2.2 ^{母分散の検定}

2.3 ^{母比率の検定}

^{分布による適合性検定}

^{分布による独立性検定}