• 検索結果がありません。

t χ 2 F Q t χ 2 F 1 2 µ, σ 2 N(µ, σ 2 ) f(x µ, σ 2 ) = 1 ( exp (x ) µ)2 2πσ 2 2σ 2 0, N(0, 1) (100 α) z(α) t χ 2 *1 2.1 t (i)x N(µ, σ 2 ) x µ σ N(0, 1

N/A
N/A
Protected

Academic year: 2021

シェア "t χ 2 F Q t χ 2 F 1 2 µ, σ 2 N(µ, σ 2 ) f(x µ, σ 2 ) = 1 ( exp (x ) µ)2 2πσ 2 2σ 2 0, N(0, 1) (100 α) z(α) t χ 2 *1 2.1 t (i)x N(µ, σ 2 ) x µ σ N(0, 1"

Copied!
11
0
0

読み込み中.... (全文を見る)

全文

(1)

正規分布・

t

分布・

χ

2

分布・

F

分布とは何か?

分散分析第1回講義:資料1

土居正明

Q統計の勉強をしていると、t分布・χ2分布・F分布などと、色々分布が出てきます。互いにつながりがあるという話を 聞いたことがあるのですが、どういう風につながっているのですか。

1

はじめに

本稿では、基本的に具体例は医薬の話を持ってきます。その際に「別々の人から取ったデータは独立」という点は、特に 断らなくても常に成り立つものと仮定します。

2

正規分布とは

正規分布は、データのばらつき・誤差のばらつきをモデル化するためによく用いられる分布です。平均µ,分散σ2の正規 分布N (µ, σ2)の確率密度関数は、 f (x|µ, σ2) = 1 2πσ2exp ( −(x− µ)2 2 ) で表されます。特に、平均0,分散1の正規分布N (0, 1)のことを「標準正規分布」と言います。また、標準正規分布の下側 (100· α)%点をz(α)と書きます。 ここで、注意していただきたいことは、分布というものが「最初からある」と考えるのではなく、「何かを(ここではたと えば誤差を)調べた結果、出てきた」と考えるのが重要だということです。以下の内容は、たとえば「最初からt分布とい うものがある。χ2分布というものがある」などという風に考えると分かりにくくなってしまいますのでご注意ください*1

2.1

正規分布の重要な性質 

t分布の説明に入る前に、正規分布の重要な性質を3つだけ整理しておきます。 (i)xN (µ, σ2)のとき、x−µ σ2∼N (0, 1)である。 (ii)x1,· · · , xnが独立にN (µ, σ2)に従うとき、¯x = x1+···+xn nN (µ,σ 2 n)である。 (iii) (i),(ii)より、z =x¯−µ σ2 nN (0, 1)である。 ここでは正規分布をN (0, 1)に帰着させることにこだわっています。これには理論的な要請もあったでしょうが、現実的 な利益もあったと思われます。というのは、昔正規分布のパーセント点(上側95%点、97.5%点など)を数表で見て調べて いた頃に、例えばN (10, 2), N (9, 4)など色々なデータのパーセント点を知りたかったとします。このときに別々の数表を見 るのではなく、全ての正規分布をN (0, 1)に結び付けることができれば、数表が1つですむことになり、大変便利です。。 *1ただ、歴史的には正規分布は理論的に導かれたものだそうです。1733 年、de Moivre が導出したそうですが、あまり詳しく知らないので 100 %は 信頼しないでください。また、ご存知の方がいらっしゃれば教えてください。

(2)

さて、本稿の主役は上の(iii)、もう一度書きますとx1,· · · xnN (µ, σ2)に独立に従うときに、 z = x¯√− µ σ2 nN (0, 1) (1) です。この(1)をしっかり押さえて、先に進んでください

3

t

分布はどのようにして生まれたか

まずt分布などなかった時代から話を始めます。t分布を「発見」したのは、Student(本名Gosset:1876-1937)ですが、彼 がどのように「発見」したのかを後追いしてみることにしましょう。以下の問題を考えます。 「問題1」 1クラス40人の収縮期血圧(x1,· · · , x40とする)の平均が120であるかどうかを検定(両側5%)によって判断してくだ さい。 (考え方) とりあえず、最初にヒストグラムを描いて「正規分布に従っている」ことが大体確認できたとします*2。次に、「平均」な のでx =¯ x1+···+x40 40 を考えます。2.1(ii)より、仮に平均が120だったとすると、x¯はN (120, σ2 40)に従うことになります。 したがって、2.1(iii)よりz = x¯√−120 σ2 40 ∼N (0, 1)となるので、これより正規分布に従った検定ができそうな気がします。 ところが、ここで困るのです。なぜならσ2の値が分からないからです。そこで代替案として、「σ2の値を推定値で置き 換える」という方法を考えます。σ2の推定値は、以下のようにして求めます。 c σ2= 1 40− 1 40 ∑ i=1 (xi− ¯x)2 この値をzにあてはめると、 z0= x¯√− 120 c σ2 40    (2) はきちんと求まります。さて、ここで質問です。このz0は正規分布N (0, 1)に従うでしょうか? 正解は「従わない」です。もう少し詳しく言いますと、「いい線いっているけれど、厳密には従わない」です。なぜなら、 推定値σˆ2σ2そのものではないからです。別のもので置き換えているので、分布が変わってくるのは当たり前なのです。 ですけれど、「いい線」はいっているのです。つまり「推定精度が上りさえすれば、かなり正規分布に近くなる」のです。で は、推定精度を上げるにはどうしたらいいでしょうか?簡単ですね。データの数を増やせばいいのです。つまり、(2)は 「データの数が十分に大きければ(近似的に)正規分布に従っているとみなせるが、データがそれほど大きくないときには正 規分布から外れてくる」ということになります。 そこで、Gossetは考えました(彼が考えたのは多分ビールの酵母とかの話ですけれど)、「じゃあ、(2)の従う分布は厳密 にはどうなっているのだろう?」と。そのようにして「発見」されたのがt分布なのです。ここで、「分布を調べる」という 行為は、直感的には分かりづらいと思いますので少しご説明します。直感的には、「x1,· · · , x40を乱数で発生させてz0を求 める」ということを100万回繰り返します。そして、100万個のz0のヒストグラムを描いてみます。そのときのヒストグラ ムを式で表したものが「確率密度関数」と呼ばれるもので、(2)の従う分布となります。この「確率密度関数」の式を、正確 には式の計算のみで導くことになります。 さて、一般的な教科書などでは「(2)はt分布という分布に従う」、という、さも「t分布というものが最初からあって、 (2)が偶然それに当てはまっている」かのような書き方をしているものが多いように見受けられます。しかし、そうではな *2例数が十分に大きい場合は、中心極限定理から「とりあえず t 検定でよい」ことが広く言えるのですが、データを見たらまずプロットしておく習慣 をつけておくことは重要です。

(3)

くて、これがt分布発見の経緯なのです。このような問題を彼が考えなければ、そもそもt分布などというものは存在しな かった、ということです。ですから、「どうして(2)がt分布に従うのですか?」という質問には、「だってそれにt分布と 名前をつけたから」という答えが正解となります(厳密な数式の意味での質問の場合を除いてですが)。 さて、データの数が増えると正規分布に近づく、ということから明らかのように、 t分布の分布形は「データの数」に影響を受けます。正規分布とt分布の違いは、「σ2を真の値にするか推定値にするか」だ けであり、データが増えることでσ2の推定精度がよくなるためです。そのσ2の推定精度を示す指標が「自由度」と言われ るもので、1群のt検定の場合は「(データ数)− 1」と一致します*3。つまり、今回は自由度39t分布に従う、というこ とになります。そして「自由度*4t分布はN (0, 1)」となります。 まとめます((2)のz0は一般には「t」と書かれるので、下ではtと書くことにします)。 「t分布」 n個のデータx1,· · · , xnが独立にN (µ, σ2)に従うとき、 t = x¯√− µ c σ2 n ( ここで、x =¯ 1 n ni=1 xi, cσ2= 1 n− 1 ni=1 (xi− ¯x)2 ) の従う分布のことを、自由度(n− 1)t分布と名付け、t(n− 1)と書きます。また、t(n− 1)の下側(100· α)%点を t(n− 1, α)と書くことにします。  考えていることは正規分布の場合(1)と同じことなのですが、σ2が分からないから仕方なく上のtを使っている、とい う感じが分かっていただければよいと思います。

4

χ

2

分布とはどういう分布か

4.1

定義と基本的な性質

以下の問題を考えます。 「問題2」 n個の独立なデータx1,· · · , xnが「全て一斉にN (0, 1)に従っているかどうか検定するにはどうすればよいでしょうか? (考え方) 1つ1つ、正規分布の検定をしていけばよさそうに思えるのですが、そうすると「検定の多重性(今回はご説明しません)」 の問題というやっかいなことが出てきてしまいます。そこで「1個の統計量で、1回で検定したい」という風に考えます。そ のとき、 χ2= x21+· · · + x2n (3) の従う分布を考えるとうまくいきます*5。そこで、t分布と同じように、「この統計量(3)の従う分布を調べる」ということ をします。このようにして考えられたχ2x 1,· · · , xnN (0, 1)(すべて独立)のときに従う分布 のことを「自由度nχ2分布」と呼んでいるわけです。当然これもデータの数に影響を受けますが、自由度は2乗する標準正規分布の数と等し くなります。自由度nχ2分布をχ2(n)で、その下側(100· α)% 点をχ2(n, α)とおきます。 特殊な例として、自由度1のχ2分布を考えてみましょう。このときχ2= x2 1となりますので、 (標準正規分布N (0, 1)の統計量)2= (自由度1のχ2分布の統計量) となります。 *3この部分をきちんと理解するには、χ2分布のところで出てくる「定理」と、χ2分布の「性質」(i) が必要になりますが、実際に重要なのは「分母の 分散の推定精度(つまり自由度)」です。このため、たとえば 1 群 n 例の2群比較では、σ2の推定量として各群別々に自由度 (n− 1) で推定して、 それを足し合わせたものを考えるので、自由度は 2(n− 1) となります。 *4n→ ∞ のとき(つまりデータが無限個あるとき)σ2の推定量は σ2に一致します(やや厳密に言うと、σ2に収束します) *5どうして単純に足さないで2乗してから足すのか、という点なども今回はご説明しません。

(4)

ここで、N (0, 1)χ2(1)のパーセント点を比較 してみます。N (0, 1)の上側2.5%点がχ2(1)の上側2.5%に対応、と なってくれたら楽なのですが、そこまで簡単にはいきません。  記号を整理して、zN (0, 1)として、χ2 1= z2と置き直します*6と、χ21∼χ2(1)は上で見た通りです。ここで、N (0, 1)の 上側2.5%点(下側97.5%点)を2乗してみたものを f χ2= (z(0.975))2(= 3.84) とおくとき、これはχ2(1)において何%点を示すのでしょうか?  たとえばz = 2のときとz =−2のときを考えてみましょう。z(0.975) = 1.96, z(0.025) =−1.96より、z = 2 > 1.96N (0, 1)の上側2.5%棄却域に、z =−2 < −1.96N (0, 1)の下側2.5%棄却域にあることになります。このとき、ど ちらのzに対してもχ21= 4となり、fχ2= (z(0.975))2= 3.84より大きくなります。つまり、χ21> fχ2には「標準正規分布 の大きい方の棄却域と小さい方の棄却域の両方」が含まれていることになります。  式で書きますと、χ2 1= z2であり、z(0.025) =−z(0.975)からχf2= (z(0.025))2でもあるため、 χ21> fχ2⇐⇒z < z(0.025)またはz(0.975) < z (4) となります。ここで⇐⇒の両側の確率を考えてみます。まず右側は明らかに P r(z < z(0.025)またはz(0.975) < z) = 0.05 です。これより左側の確率も P r ( χ21> fχ2)= 0.05 となります*7χ2 1∼χ2(1)なので、χf2はχ2(1)の上側5%点、つまりχf2= χ2(1, 0.95)ということになります。 まとめますと、 (標準正規分布の上側2.5%点)2= (自由度1のχ2分布の上側5%点) つまり、(z(0.975))2= χ2(1, 0.95)となります。 さらに一般的には(z(1− α))2= χ2(1, 1− 2α)が成り立ちます。  ここで重要なのは、(4)より標準正規分布で両側検定を考える場合でも、χ2分布で検定する場合は上側棄却域のみで十 分ということです。この点は、今回は自由度1の場合にご説明しましたが、自由度がnの場合でも同様に成り立ちます。本 稿のこれ以降でも出てきますので、下の図1、図2と共によく理解しておいてください。 -1.96 1.96 0.1 0.2 0.3 0.4 0.5 -1.96 1.96 0.1 0.2 0.3 0.4 0.5 図1 標準正規分布の両側5%棄却域(z(0.975) = 1.96) 3.84 0.1 0.2 0.3 0.4 0.5 3.84 0.1 0.2 0.3 0.4 0.5 図2 対応するχ2(1)の棄却域2(1, 0.95) = 3.84) *6少し見にくいですが、χ2 1は「カイ2乗の1番目」という意味の1つの記号、z2は z が1つの記号で、その2乗です。 *7式がごちゃごちゃしてきますが、χ2 1は確率変数、fχ2は数字であることに注意してください。

(5)

χ2分布についてはこれが一番基本的なことなのですが、困ったこと(?)に、χ2分布は、上のような形とは一見関わり のないところにたくさん出てきます。けれど、イメージとして、「標準正規分布を2乗して足し合せている」というものを 持っていただけると、正規分布とのつながりも分かってよいかと思います*8。また、「たくさんのものを一括で検定してい る」「検定で帰無仮説が棄却されたとしても、x1,· · · , xnのどれがN (0, 1)から外れているかは分からない」などの特徴も 重要です。 では、まとめます。 「χ2分布」 x1,· · · , xnが独立にN (0, 1)に従うとき、χ2= x21+· · · x2nの従う分布を自由度nχ2分布と名づけχ2(n)と書く。 また、χ2(n)の下側100·α%点をχ2(n, α)で表す。 「性質」 (i)χ2 1∼χ2(n), χ22 ∼χ2(m)が独立のとき、χ21+ χ22∼χ2(n + m) (ii) x1∼N (µ1, σ21), x2∼N (µ2, σ22),· · · , xnN (µn, σn2)のとき(全て独立。従う正規分布は全て違ってもよい)、 χ2= (x1− µ1) 2 σ2 1 +· · · + (xn− µn) 2 σ2 n は自由度nχ2分布に従う(各項が正規分布の性質(ii)の式 x√i−µi σ2 i の2乗になっていることに注意)。 (iii) ((ii)の特殊な場合) x1,· · · , xnN (µ, σ2)(全て独立)のとき、 χ2=(x1− µ) 2 σ2 +· · · + (xn− µ)2 σ2 は自由度nχ2分布に従う。

4.2

(iii)

の補足

4.2.1 重要な定理 さて、上の(iii)は一見分かりやすいのですが、平均µと分散σ2が分かっていないと使えません。これはあまり現実的な 状況ではありません。そこでせめてµは分かっていなくても使えるようなものがあれば、という気がします。実は、そのご 要望にお答えする定理があるのです。 「定理」 x1,· · · xnN (µ, σ2)(全て独立)のとき、 ¯ x = 1 n ni=1 xi c σ2= 1 n− 1 ni=1 (xi− ¯x)2 とおくと、 (n− 1)cσ2 σ2 = 1 σ2 ni=1 (xi− ¯x)2= (x1− ¯x)2 σ2 + (x2− ¯x)2 σ2 +· · · + (xn− ¯x)2 σ2 はχ2(n− 1)に従う。 (iii)と比べて、平均値を真の平均値µから標本平均値x¯に変更することで、自由度がnからn− 1に減少していること に注意してください*9 *8あとは中心極限定理が理解できれば、ほとんどの χ2検定は理解できます。 *9長くなるので証明は省略します。数理統計学の基本的な本にはほぼ必ず書いてあるはずです。

(6)

4.2.2 定理の応用 では、上の定理を臨床に(比較的)即した例で考えてみます。次のような状況を考えてみてください。 「問題3」 降圧薬A、B、Cの3種類をそれぞれ5人ずつに投与します。このとき、Aを投与された人の投与後の血圧のベースライ ンからの差をx11, x12, x13, x14, x15∼N (µ1, σ2)、B、Cも同様にx21, x22, x23, x24, x25∼N (µ2, σ2)、x31, x32, x33, x34, x35 ∼N (µ3, σ2)とします(分散σ2は共通で 既知 とします)。このとき、  帰無仮説:µ1= µ2= µ3 (つまり3種類の薬で薬効が全て等しい)  対立仮説:それ以外 を両側5%で検定するにはどうすればよいでしょうか*10 「解答」 帰無仮説1= µ2= µ3に従うとしたら、各群が「全て同じ分布」に従うことになります。そのため、先の「定理」を使っ てχ2検定ができるのではないか、という方向で考えてみましょう。 さて、比べたいのは平均値なので、まず各群で平均値を計算しますと x1= 1 5 5 ∑ j=1 x1jN ( µ1, σ2 5 ) x2= 1 5 5 ∑ j=1 x2jN ( µ2, σ2 5 ) x3= 1 5 5 ∑ j=1 x3jN ( µ3, σ2 5 ) となります。さらに、全体15人の平均を考えると ¯ ¯ x = 1 3(x1+ x2+ x3) = 1 15 3 ∑ i=1 5 ∑ j=1 xijN (µ 1+ µ2+ µ3 3 , σ2 15 ) が成り立ちます。ここで、帰無仮説のもとでは µ1= µ2= µ3となるため、これをµと書くことにします。 このときにx1, x2, x3 ∼N ( µ,σ2 5 ) と3つとも同じ分布に従うことになりますので、これに対して先の「定理」を使いま す。すると、帰無仮説のもとでは χ2= σ12 5 3 ∑ i=1 (xi− ¯¯x)2 がχ2(2)に従います(分散σ2は既知なので、これが計算できる量であることに注意してください)。これよりχ2(2, 0.95) < χ2のときに帰無仮説を棄却すればよい」ということになります*11 *10何か分散分析っぽいな、と気付かれた方は、どこが同じでどこが違うかに意識を向けつつ読んでみてください *11χ2分布のところで述べましたとおり、正規分布に従うデータの「両側検定」は χ2分布の「片側棄却域」のみを用いてできます。

(7)

5

F

分布とはどのような分布か

5.1

数値例

t分布のところでも述べましたが、現実問題として「データを取る前に分散が分かっている」というのは非現実的な状況 です。そこで同様に 上の問題を分散未知のケースで考えてみましょう。 「問題4」 降圧薬A、B、Cの3種類をそれぞれ5人ずつに投与します。このとき、Aを投与された人の投与後の血圧のベースライ ンからの差をx11, x12, x13, x14, x15∼N (µ1, σ2)、B、Cも同様にx21, x22, x23, x24, x25∼N (µ2, σ2)、x31, x32, x33, x34, x35 ∼N (µ3, σ2)とします(分散σ2は共通で 未知 とします)。このとき、  帰無仮説:µ1= µ2= µ3 (つまり3種類の薬で薬効が全て等しい)  対立仮説:それ以外 を両側5%で検定するにはどうすればよいでしょうか*12 「解答」 帰無仮説のもとでµ1 = µ2= µ3をµとおいて、x1, x2, x3 ∼N ( µ,σ52 ) を考えるところは同じです。さらに、「問題3」 で考えたように χ2= σ12 5 3 ∑ i=1 (xi− ¯¯x)2 (5) は自由度2のχ2分布に従います。しかしこれを実際に計算しようとしても、分散σ2が未知なので計算できません。そこt分布のところで行ったように、σ2を不偏推定量で置き換えましょう。ここで、不偏推定量の計算としては、まず各薬ご とに考えます。 降圧薬A,B,Cのそれぞれにおけるσ2の不偏推定量は c σ2 A= 1 4 5 ∑ j=1 (x1j− x1)2 c σ2 B= 1 4 5 ∑ j=1 (x2j− x2)2 c σ2 C= 1 4 5 ∑ j=1 (x3j− x3)2 さて、これより、 c χ2= (x1− ¯¯x) 2 c σ2 A 5 +(x2− ¯¯x) 2 c σ2 B 5 +(x3− ¯¯x) 2 c σ2 C 5 を考えます。これで検定を行ってもよいのですが、もうひと工夫しましょう。いま、分散σ2は各群で共通です。そして、 推定は例数が増えれば増えるほど精度がよくなります。そこで、σˆ2 A, ˆσ 2 B, ˆσ 2 Cを組み合わせてσ 2の推定精度を上げる ことを 考えます。 4 cσ2 A σ2 , 4 cσ2 B σ2 , 4 cσ2 C σ2 はそれぞれ独立に自由度4のχ 2分布に従いますので、χ2分布の性質(i)より、 4 cσ2 A σ2 + 4 cσ2 B σ2 + 4 cσ2 C σ2 = 5 ∑ j=1 (x1j− x1)2 σ2 + 5 ∑ j=1 (x2j− x2)2 σ2 + 5 ∑ j=1 (x3j− x3)2 σ2   (6) *12これはよくある分散分析の問題そのものですね。

(8)

は自由度12のχ2分布に従います。これより、χ2分布の性質*13から、 c σ2= 1 12(4 cσ 2 A+ 4 cσB2 + 4 cσ2C) = 1 3( cσ 2 A+ cσ2B+ cσ2C) は、σc2 A, cσ 2 B, cσ 2 Cよりも精度のよいσ 2の不偏推定量になります*14。そこで、(5)式中のσ2cσ2で置き換えてやると、以下 のようになります。 f χ2= 1 c σ2 5 3 ∑ i=1 (xi− ¯¯x)2 これはパラメータの真の値を含まないので、計算できる統計量 ですね。これを利用して検定してやりましょう。 このfχ2が従う分布をF 分布と呼んでやってもよいのですが、もう少し変形しましょう。式の形を「知っている分布に引 きつけて」整理します。まず、σc2の部分ですが、12cσ2 σ2 が自由度12のχ2分布に従いますので、「分子分母がχ2分布(の定 数倍)」となるように整理すると、 f χ2= 1 σ2 ∑3 i=1(xi− ¯¯x) 2 c σ2 σ2 1 5 = 1 σ2 5 ∑3 i=1(xi− ¯¯x)2 1 12· 12cσ2 σ2 となります*15。ここで、分子は(5)と一致するので、自由度2χ2分布に従います。一方、分母は自由度12χ2分布を 自由度12で割ったものとなっています。分母が「(χ2統計量)/(自由度)」となっていますので、分子も同じ形に合わせま しょう。つまり統計量FF = 1 2· 1 σ2 5 ∑3 i=1(xi− ¯¯x)2 1 12· 12cσ2 σ2 = 1 2fχ 2 とするのです。ここで、実は分子のχ2統計量と分母のχ2統計量は独立になっています。このF の従う分布のことを、 自由度(2,12)のF分布と呼びます*16*17。ここで、自由度(2,12)F 分布の下側95%点をF (2, 12, 0.95)とおくと*18 F > F (2, 12, 0.95) となったときに棄却すればよい、ということになります。 なお、この性質に基づいた検定を一般的に分散分析と呼びます。χ2分布を使いたいのだけれど分散未知なので、t分布の 時と同じような手法で不偏推定量で置き換えた、という点がご理解いただけたでしょうか。 5.1.1 定義 では、F分布を数式を用いて定義しましょう。 「定義」 χ21∼χ2(n), χ22∼χ2(m)(独立)とします。このとき、 F = χ2 1 n χ2 2 m の従う分布を自由度(n, m)F 分布と呼び、F (n, m)と書きます*19。また、F (n, m)の下側(100· α)%点をF (n, m, α) と書きます。 *13χ2が自由度 n の χ2分布に従うとすると E[χ2] = n。 *14(6) より、12 cσ2 σ2 が自由度 12 の χ2分布に従います。 *15ここで、分子分母ともに σ2という未知の値が出てきますが、fχ2はすでに計算できているので、σ2が分からなければ計算できない、などというこ とはありません。あくまで「χ2分布の形にする」ために便宜的に分子分母を割ってやっただけです。 *16ここで、自由度の2とは「薬の数-1」であり、12 とは「薬の数」×「各群の人数ー1」です。 *17どうして fχ2自身の分布を考えないで、わざわざ定数倍しないといけないのか、という点については、今のところ著者には分かりません。こうして おくと F 分布がある種の対称性をもつので、その方が都合がよかったのかもしれません。 *18χ2分布の場合と同じく、F 分布の場合も上側棄却域のみで「両側検定」を考えることができます。 *19n, m の順番は逆にすると別の分布になってしまいます。n が分子、m が分母なので間違えないようにしてください。

(9)

5.1.2 一般式(分散分析) 先の「問題4」を文字を用いて一般化させましょう。 「問題5」 降圧剤1,· · · , Iを、それぞれn人ずつに投与するとします(全体の被験者数はN = nI人です)。このときの、ある時点 での各被験者の血圧のベースラインからの差を 薬剤1:x11,· · · , x1nN (µ1, σ2) 薬剤2:x21,· · · , x2nN (µ2, σ2) .. . ... 薬剤IxI1,· · · , xInN (µI, σ2) とおきます(σ2は 未知 とします)。このとき、  帰無仮説:µ1=· · · = µI  対立仮説:それ以外 を両側5%で検定するにはどうしたらよいですか。 「解答」 x1= 1 n nj=1 x1j, · · · , xI = 1 n nj=1 xIj, x =¯¯ 1 In Ii=1 nj=1 xij とおくと、帰無仮説のもとで、µ1=· · · = µIµとおくと、x1,· · · , xIN ( µ,σn2 ) であり、 χ2= (x1− ¯¯x) 2 σ2 n +· · · + (xI− ¯¯x) 2 σ2 n = σ12 n Ii=1 (xi− ¯¯x)2 (7) は自由度(I− 1)χ2分布に従います。ところがσ2は未知なので、不偏推定量で置き換えることを考えます。 各薬剤におけるσ2の不偏推定量を計算すると、 c σ2 1 = 1 n− 1 nj=1 (x1j− x1)2 c σ2 2 = 1 n− 1 nj=1 (x2j− x2)2 .. . ... c σ2 I = 1 n− 1 nj=1 (xIj− xI)2 となり、これらをまとめた c σ2= 1 I(n− 1)((n− 1)cσ 2 1+· · · + (n − 1)cσI2) = 1 I(n− 1) Ii=1 nj=1 (xij− xi)2 もまた、σ2の不偏推定量であり、 I(n− 1)cσ2 σ2 = (x11− ¯x1)2 σ2 +· · · + (xIn− ¯xI)2 σ2   ∼χ 2(I(n− 1)) に従います。

(10)

ここで、(7)におけるσ2σc2で置き換えると、 f χ2= 1 c σ2 n Ii=1 (xi− ¯¯x)2 = 1 σ2 nI i=1(xi− ¯¯x)2 c σ2 σ2 = χ 2 c σ2 σ2 = χ 2 1 I(n−1)· I(n−1)cσ2 σ2 ここで、分子のχ2は(7)より自由度(I−1)χ2分布に従います。一方、分母のσσc22 = 1 I(n−1)· I(n−1)cσ2 σ2 は、自由度I(n−1)χ2分布に従う統計量を自由度で割ったものとなっています。これより、分子をχ2分布の自由度で割ってやった、 F = 1 I−1· χ 2 1 I(n−1)· I(n−1)cσ2 σ2 = 1 I− 1χf 2 が、帰無仮説のもとで自由度(I− 1, I(n − 1))F分布に従います*20。これより、 F > F (I− 1, I(n − 1), 0.95) のときに棄却すればよい、ということになります。

5.2

F

分布のまとめ

このように、F 分布の使い方としては、「χ2分布の分散未知版の計算」という風に解釈できるため、イメージとして「F 分布」=「t分布」×「χ2分布」*21のように考えていただければよいかと思います。 分散分析において、一般的には「群内平方和と群間平方和の比をとってF分布を用いて検定する」という風に言われるこ とが多く、著者はどうしてそのような発想で「よい検定」が出来上がるのかが大変不思議でした。ですが、本稿の解釈をす ると「別に分散の比をとることが目的ではなく、χ2分布を使いたいけれど分散未知のため使えないので、しょうがなく分散 の不偏推定量で置き換えた結果、分母も分子も(定数倍を除いて)χ2分布になった」という風に解釈でき、ごく自然な検定 をしている、と言えるのではないでしょうか*22 5.2.1 F統計量に関する補足1 F 統計量の分母を構成するときに、「σ2の推定を、できるだけ例数を多くしてしたい」と考えるならば、 c σ2= Ii=1 nj=1 (xij− ¯¯x)2 とする方が標準誤差は小さくなるので妥当のようにも思えます。確かに分母のことだけを考えるとこれは正しいです。しか し、こうしてしまうと分子と分母のχ2統計量が独立でなくなってしまい、分布が大変複雑になると同時に、検定の性能が 落ちているのではないかと思われます。結果的に、「どちらを使おうが同値な検定」となってしまいます。 5.2.2 F統計量に関する補足2 群の数がI = 2(つまり「分子の自由度」= 1)のとき、実はt統計量の2乗はF統計量と一致します。正規分布とχ2分 布の関係と同じように、一般に、 (t(m, 1− α))2= F (1, m, 1− 2α) *20一般的には、この F 統計量の分子の部分を少し変形して、χ2 = 1 σ2 nI i=1(xi− ¯¯x)2 = σ12 ∑I i=1n(xi− ¯¯x)2 としてやった∑ の部分 ∑I i=1n(xi− ¯¯x)2を群間平方和、分母の∑の部分、∑Ii=1n j=1(xij− bxi)2を群内平方和と言います。 *21あくまでイメージです。 *22もちろん、「群内平方和と群間平方和の比をとる」という発想は大変重要です。本格的に分散分析を勉強される際は、そのような考え方ができない と読める本がありません。しかし、初学者にとって「不自然さ」の残る解釈であるようにも思います。

(11)

が成り立ちます。

6

まとめ

正規分布:(1,2群のデータが)ある正規分布に従うかどうかの検定(分散既知) t分布  :(1,2群のデータが)ある正規分布に従うかどうかの検定(分散未知) χ2分布 :たくさんの群(3群以上)のデータが、ある正規分布に従うかどうかを1回の検定で判断する(分散既知) F分布 :たくさんの群(3群以上)のデータが、ある正規分布に従うかどうかを1回の検定で判断する(分散未知)。 です。他にもこれらの分布の使い方はたくさんありますが、お互いの関係を理解するためには、このまとめ方が良いと思い ます。

参照

関連したドキュメント

If the interval [0, 1] can be mapped continuously onto the square [0, 1] 2 , then after partitioning [0, 1] into 2 n+m congruent subintervals and [0, 1] 2 into 2 n+m congruent

(This construction of the classical linking number was later generalized by U Kaiser [16] to the case of arbitrary submanifolds of the linking dimension that are homologous into

7   European Consortium of Earthquake Shaking Tables, Innovative Seismic Design Concepts f or New and Existing Structures; ”Seismic Actions”, Report No.. Newmark, &#34;Current Trend

Abstract: The existence and uniqueness of local and global solutions for the Kirchhoff–Carrier nonlinear model for the vibrations of elastic strings in noncylindrical domains

(The Elliott-Halberstam conjecture does allow one to take B = 2 in (1.39), and therefore leads to small improve- ments in Huxley’s results, which for r ≥ 2 are weaker than the result

Poisson algebras of geodesic functions for the bordered Riemann surfaces Σ g,δ 1 and Σ g,δ 2 that differ only by distributions of marked points among their boundary components

the log scheme obtained by equipping the diagonal divisor X ⊆ X 2 (which is the restriction of the (1-)morphism M g,[r]+1 → M g,[r]+2 obtained by gluing the tautological family

Taking care of all above mentioned dates we want to create a discrete model of the evolution in time of the forest.. We denote by x 0 1 , x 0 2 and x 0 3 the initial number of