(iii) x, x N(µ, ) z = x µ () N(0, ) () 0 (y,, y 0 ) (σ = 6) 3 0 y y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 y ( ) 4 H 0 : µ

(1)

t

検定について

第

2 回

Armitage

勉強会

土居正明

1 はじめに

本稿の目的は、「t分布・t検定とは何か」と「分散をプールするとはどういうことか」をご理解いただくことです。また本稿は、分散分析講義第1回資料1「正規分布・t分布・χ2分布・F分布とは何か」の前半部分を膨らませたものです。χ2分布やF分布については触れませんので、それらに興味のある方は上の資料をご覧ください。

2 正規分布とは

正規分布は、データのばらつき・誤差のばらつきをモデル化するためによく用いられる分布です。平均µ,分散σ2の正規分布N (µ, σ2)の確率密度関数は、 f (x|µ, σ2) = √ 1 2πσ2exp ( −(x− µ)2 2σ2 ) で表されます。特に、平均0,分散１の正規分布N (0, 1)のことを「標準正規分布」と言います。また、標準正規分布の下側(100· α)％点をz(α)と書きます。ここで、注意していただきたいことは、分布というものが「最初からある」と考えるのではなく、「何かを（ここではたとえば誤差を）調べた結果、出てきた」と考えるのが重要だということです。以下の内容は、たとえば「最初からt分布というものがある」という風に考えると分かりにくくなってしまいますのでご注意ください*1_。

2.1 正規分布の重要な性質

t分布の説明に入る前に、正規分布の重要な性質を３つだけ整理しておきます。 (i)x∼N (µ, σ2₎_のとき、x_√−µ σ2∼N (0, 1)である。 (ii)x1,· · · , xnが独立にN (µ, σ2)に従うとき、¯x = x1+···+x_n n ∼N ( µ,σ_n2 ) である。 (iii) (i),(ii)より、x1,· · · , xnが独立にN (µ, σ2)に従うとき、z = √x¯−µ σ2 n ∼N (0, 1)である。ここでは正規分布をN (0, 1)に帰着させることにこだわっています。これには理論的な要請もあったでしょうが、現実的な利益もあったと思われます。というのは、昔正規分布のパーセント点(下側95％点、97.5％点など）を数表で調べていた頃に、例えばN (10, 2), N (9, 4)など色々な分布のパーセント点を知りたかったとします。このときにN (10, 2)とN (9, 4) で別々の数表を見るのではなく、全ての正規分布をN (0, 1)に結び付けることができれば、数表が１つですむことになり、大変便利です*2_。 *1_{ただ、歴史的には正規分布は理論的に導かれたものだそうです。1733 年、de Moivre が導出したそうですが、あまり詳しく知らないので 100 ％は} 信頼しないでください。また、ご存知の方がいらっしゃれば教えてください。 *2_{(i)∼(iii) を用いれば、たとえば、N (10, 2) の下側 95 ％点は 10 +}√_{2z(0.95) ですし、N (9, 4) の場合は 9 +}√_{4z(0.95) という風に求まります。}

(2)

さて、本稿の主役は上の(iii)、もう一度書きますとデータが全て独立でx1,· · · xn∼N (µ, σ2)のときに、 z = x¯√− µ σ2 n ∼N (0, 1) (1) となることです。この(1)をしっかり押さえて、まずは例題を1問解きましょう。「例題1」以下の10人の収縮期血圧(y1,· · · , y10とする)の平均が120であるかどうかを有意水準5％の両側検定によって判断せよ。なお、データは以下の通りであり、データの標準偏差は16 (σ = 16)であることが分かっているとする*3_。表1 10人の収縮期血圧 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 112 110 105 81 102 134 130 94 110 117 (解答) では、解答です。とりあえず、最初にヒストグラムを描いて「正規分布に従っている」ことが大体確認できたとします*4_。次に帰無仮説・対立仮説ですが、両側検定よりこれは H0: µ = 120 H1: µ6= 120 となります。また、上の(iii)よりデータy1,· · · , y10に対して z = y¯√− µ σ2 10 (2) が帰無仮説が正しければN (0, 1)に従うのでした。具体的に数値を当てはめるとy =¯ y1+···+y10 10 = 109.5, µ = 120であり、今回標準偏差はσ = 16 (既知)より z = 109.5√− 120 162 10 =−2.08 となります。これより、N (0, 1)の両側5％の棄却限界z(0.975) = 1.96, z(0.025) =−1.96から (−2.08 =) z < z(0.025) となり、帰無仮説H0: µ = 120は棄却されます。

3 t

分布はどのようにして生まれたか

3.1

1 群の

t

検定

まずt分布などなかった時代から話を始めます。t分布を「発見」したのは、Student(本名Gosset:1876-1937)ですが、彼がどのように「発見」したのかを後追いしてみることにしましょう。以下の「例題2」を考えます。「例題1」と問題自体はほとんど同じです。 *3_{医薬品開発においては一般的にデータを取る前に標準偏差が分かっていることはありませんが、今後のご説明のために一時的にこういう状況を考え} ています。 *4_{ここの確認はお任せします。}

(3)

「例題2」以下の10人の収縮期血圧(y1,· · · , y10とする)の平均が120であるかどうかを有意水準5％の両側検定によって判断せよ。なお、データは以下の通りであり、データの標準偏差は未知とする。表2 10人の収縮期血圧(値は例題1と同じ) y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 112 110 105 81 102 134 130 94 110 117 (解答とだらだらとした解説) 「例題1」と同様、最初にヒストグラムを描いて「正規分布に従っている」ことが大体確認できたとします*5_。「例題₁_」と同じく帰無仮説・対立仮説は、 H0: µ = 120 H1: µ6= 120 であり、標本平均はy = 109.5¯ です。「2.1 正規分布の重要な性質」の(ii)より、仮に帰無仮説が正しかったとすると、 ¯ y∼N ( 120,σ₁₀2 ) となります。したがって、2.1の(iii)より、帰無仮説のもとで z = y¯√− 120 σ2 10 ∼N (0, 1) (3) となり、zを用いて正規分布に従った検定ができそうな気がします。ところが、ここで困るのです。なぜなら今回はσ2の値が分からないからです。つまり、(3)のzが数字にならないのです。zが数字にならなければ、z(0.975) = 1.96, z(0.025) =−1.96とzの大小を比較することができませんので、検定ができません。そこで代替案として、「σ2の値を推定値で置き換える」という方法を考えるのです。σ2の推定値は、以下のようにして求めます。 c σ2₌ 1 10− 1 10 ∑ i=1 (yi− ¯y)2≒245.8 です。この値をzのσ2_{にあてはめたものを}_z0_{とおくと、} z0= y¯√− µ c σ2 10 = y¯√− 120 c σ2 10 = 109.5√ − 120 245.8 10 ≒− 2.12 (4) はきちんと数値で求まります。では、ここで質問です。このz0は帰無仮説のもとで正規分布N (0, 1)に従う確率変数の実現値と考えてもよいでしょうか？正解は「よくない」です。もう少し詳しく言いますと、「いい線いっているけれど、厳密にはよくない」です。なぜなら、推定値cσ2_は_σ2_{そのものではないからです}*6_{。別のもので置き換えているので、}_z_と_z0_{の分布が変わってくるのは当たり前} *5_{例数が十分に大きい場合は、中心極限定理から「とりあえず t 検定でよい」ことが広く言えるのですが、データを見たらまずプロットしておく習慣} をつけておくことは重要です。なお、今回もこの部分はお任せします。 *6_つまり、_{「分散の推定値が偶然真の値より小さめに出てきてしまった場合」には、帰無仮説のもとでも z}0_{の値（の絶対値）が大きくなります。この} ような場合を考慮に入れて、「保守的」つまり、上側の棄却限界を z(0.975) = 1.96 よりも大きめに、下側の棄却限界を z(0.025) =−1.96 よりも 小さめにしておいて棄却されにくくする、という風にイメージしておいてください。また、例数が増えれば「cσ2_{は大体 σ}2_{」と見なせますので、例} 数が増えれば増えるほど上側棄却限界は 1.96 に、下側棄却限界は−1.96 に近づいていきます。

(4)

なのです。ですけれど、推定値を用いているので「いい線」はいっています。つまり「推定精度が上れば、かなり正規分布に近くなる」のです。では、推定精度を上げるにはどうしたらいいでしょうか？これは（理論的には）簡単です。データの数を増やせばよいのです*7_{。つまり、}₍₄₎_の_z0_{は「データの数が十分に大きければ（近似的に）正規分布に従っているとみな} せるが、データがそれほど大きくないときには正規分布から外れてくる」ということになります。そこで、Gossetは考えました（彼が考えたのは多分ビールの酵母とかの話ですけれど）、「じゃあ、z0の従う分布は厳密にはどうなっているのだろう？」と。そのようにして「発見」されたのがt分布なのです。ここで、「分布を調べる」という行為は、直感的には分かりづらいと思いますので少しご説明します。直感的には、「y1,· · · , y10を乱数で発生させてz0を求める」ということを100万回繰り返します。そして、100万個のz0のヒストグラムを描いてみます。そのときのヒストグラムを式で表したものが「確率密度関数」と呼ばれるもので、z0の従う分布となります。この「確率密度関数」の式を、正確には式の計算のみで導くことになります。さて、一般的な教科書などでは「z0はt分布という分布に従う」、という、さも「t分布というものが最初からあって、z0 が偶然それに当てはまっている」かのような書き方をしているものが多いように見受けられます。しかし、そうではなくて、これがt分布発見の経緯なのです。このような問題を彼が考えなければ、そもそもt分布などというものは存在しなかった、ということです。ですから、「どうしてz0がt分布に従うのですか？」という質問には、「だってz0の従う分布をt 分布と名付けたから」という答えが正解となります（厳密な数式の意味での質問の場合を除いてですが）。データ数が増えると正規分布に近づく、ということから明らかのようにt分布の分布形は「データの数」に影響を受けます。正規分布とt分布の違いは、「σ2_{を真の値にするか推定値にするか」だけであり、データが増えることで}c_σ2_{の推定精度がよ} くなるため、データが増えれば増えるほど正規分布に近くなるのでした。そのσ2_{の推定精度を示す指標が「自由度」と言} われるもので、1群のt検定の場合は「(データ数)− 1」と一致します*8_{。つまり、今回は自由度}₍₁₀− 1) = 9_の_t_分布に従う、ということになります。そして「自由度∞*9_の_t_分布は_{N (0, 1)}_{」となります。} まとめます((4)のz0は一般には「t」と書かれるので、下ではtと書くことにします)。「t分布」 n個のデータy1,· · · , ynが独立にN (µ, σ2)に従うとき、 t = y¯√− µ c σ2 n ( ここで、y =¯ 1 n n ∑ i=1 yi, cσ2= 1 n− 1 n ∑ i=1 (yi− ¯y)2 ) の従う分布のことを、自由度(n− 1)のt分布と名付け、t(n− 1)と書きます。また、t(n− 1)の下側(100· α)％点を tn−1(α)と書くことにします。考えていることは正規分布の場合(1)と同じことなのですが、σ2_{が分からないからしょうがなく上の}_t_{を使っている、と} いう感じが分かっていただければよいと思います。では、解答の続きにいきましょう。今、帰無仮説の下でtは自由度9のt分布に従いますので、有意水準5％の両側検定は t < t9(0.025) t9(0.975) < t *7_{実際の臨床試験で例数を多くするのは大変ですが。} *8_{この部分をきちんと理解するには χ}2_{分布に対する理解が必要になりますが、実際に重要なのは「分母の分散の推定精度（つまり自由度）}_{」です。こ} のため、たとえば 1 群 n 例の 2 群比較では、σ2の推定量として各群別々に自由度 (n− 1) で推定して、それを足し合わせたものを考えるので、 自由度は 2(n− 1) となります。 *9_n→ ∞ で c_σ2_{は σ}2_{に一致します（少し正確に言うと、c}_σ2_{は σ}2_{に収束します）}_{。このようなとき、}_「c_σ2_{は σ}2_{の一致推定量である」と言います。}

(5)

で棄却すればよくなります。今t9(0.025) =−2.26, t9(0.975) = 2.26より、(4)のz0(= t) =−2.12と比べると t9(0.025) ≤ t ≤ t9(0.975) となる、帰無仮説H0: µ = 120は棄却されません。 (解答終わり)

3.2 正規分布と

t

分布を用いた

1 群の比較のまとめ

実は、「例題1」「例題2」のデータは、正規乱数N (115, 16)からデータを10個発生させて、小数を整数に直したりなど、少し加工したものです。同じデータを用いているのに、正規分布を用いた検定(分散既知)のときは帰無仮説が棄却され、t検定では棄却されませんでした。上にも書きましたように、t検定は分散が未知でそれを推定値で置き換えていますので、正規分布を用いた検定より保守的、つまり棄却されにくくなっています。

3.3

2 群の

t

検定

1 ：対応のない

t

検定

1群のt検定は理論のご説明のためにはどうしても必要なのですが、医薬品開発の現状からはあまり現実的ではありません。実際によく使われるのは2群比較の場合ですので、それを見ていきましょう。まず「対応のないt検定」を見て、次に「対応のあるt検定」を見ていくことにします。なお、本稿において、データが全て独立であること、両群の分散が等しいこと、両側検定であることは仮定します。 3.3.1 データと仮説実薬群n1例、プラセボ群n2例としましょう。このときある検査値のデータが全て独立に y11, y12, · · · , y1n1 ∼N (µ1, σ 2₎ y21, y22, · · · , y2n2 ∼N (µ2, σ 2₎ に従うとします。ここで、帰無仮説・対立仮説は H0：µ1= µ2 H1：µ16= µ2 とします。 3.3.2 計算の準備データについてみていきます。まず平均値が比べたいので両群の平均値の推定量 bµ1= 1 n1 n1 ∑ j=1 y1j(= ¯y1·), bµ2= 1 n2 n2 ∑ j=1 y2j(= ¯y2·) を求めます。ここで、bµ1, bµ2の従う分布はそれぞれ bµ1∼N ( µ1, 1 n1 σ2 ) , bµ2∼N ( µ2, 1 n2 σ2 ) です。ここで、「平均値の差」の推定量dbは b d =bµ1− bµ2∼N ( µ1− µ2, ( 1 n1 + 1 n2 ) σ2 )

(6)

となります*10_{。ここで、帰無仮説}_H₀_{: µ1}_{= µ2}_{のもとでは} b d∼N ( 0, ( 1 n1 + 1 n2 ) σ2 ) に従います。正規分布のときの議論と同じく z = √( db 1 n1 + 1 n2 ) σ2 ∼N (0, 1) (5) となりますが、σ2が未知のためこれは計算できません。そのため、分散σ2を推定量σc2_{で置き換えて、}_t_{検定を利用します。} 3.3.3 分散をプールするでは、分散の推定の方法を見ていきましょう。まず、1群の場合に習ってそれぞれの群において別々にσ2_{を推定すると、} c σ2 1= 1 n1− 1 n1 ∑ j=1 (y1j− ¯y1_·)2, cσ22= 1 n2− 1 n2 ∑ j=1 (y2j− ¯y2_·)2 (6) となります。この2つの値は同じσ2_{の値を別々に推定しています。しかし、やりたいことは「本当の}_σ2_{が分からないか} ら推定量で置き換える」ことです。したがって、「例数を増やして推定精度を上げたい」と思うのは当然です。そこで「両群のデータを合わせて推定してやることで推定精度を良くする」ことを考えます。これをプールするといいます。このとき、両群のデータを合わせて、検定で用いるσ2_の推定量 c σ2₌ 1 (n1− 1) + (n2− 1)  ∑n1 j=1 (y1j− ¯y1_·)2+ n2 ∑ j=1 (y2j− ¯y2_·)2   (7) を得ます*11*12_。また、₍₇₎_を₍₆₎_のc_σ2 1, cσ22を用いて表すと c σ2₌ 1 (n1− 1) + (n2− 1) { (n1− 1)cσ2 1+ (n2− 1)cσ22 } (8) と書くこともできます。こうみると、cσ2 1, cσ22 にわざわざ(n1− 1)や(n2− 1)をかけてやっているようですが、意味合いとしてはこれはcσ2 1, cσ22の定義式 c σ2 1= 1 n1− 1 n1 ∑ j=1 (y1j− ¯y1·)2, cσ22= 1 n2− 1 n2 ∑ j=1 (y2j− ¯y2·)2 の分母をとってやっているだけということにご注意ください。なお、t検定では2群比較ですので2群しかプールしませんが、たとえば3群以上の分散分析や多重比較のような場合では「全てのデータを利用して分散をプールする」ようにすれば、分散の推定効率が良くなるためより効率のよい検定になります*13_。 *10_{分散はデータの独立性より、} V [ bd] = V [bµ1− bµ2] = V [bµ1]− V [bµ2] = 1 n1 σ2+ 1 n2 σ2= ( 1 n1 + 1 n2 ) σ2 と計算できます。 *11_{分母の (n}₁− 1) + (n₂− 1) = (n₁_{+ n}₂− 2) は c_σ2_{の定数倍の従う χ}2_{分布の自由度を指します。大まかな説明として「分散の推定のために} µ1, µ2の 2 つを推定していますので、その分自由度が 2 つ減っている」という風に言われることがよくあります。 *12_H₀_{: µ}₁_{= µ}₂_{のもとで考えるのなら、両群の分布は完全に一致します。そのため、分散の推定には両群合わせて、¯}_{y =} 1 n1+n2 2 ∑ i=1 n1 ∑ j=1 yijとして f σ2₌ 1 n1+ n2− 1 2 ∑ i=1 ni ∑ j=1 (yij− ¯y)2 を用いた方がよいと思う方がいらっしゃるかもしれません。分散分析の少し面倒な計算をしていただくと分かるのですが、実は、この fσ2_を用いた 検定とプールした分散を用いた検定は、検定の効率としては変わりません。また、こうした場合統計量が t 分布には従わなくなり、扱いが面倒にも なるため、これは使わずに通常「プールさせた分散」を用います。 *13_{多重比較の Dunnett や Tukey の検定統計量は、本質的には分散を全群でプールした t 検定統計量を用いています。分散分析の F 統計量の分母}

(7)

3.3.4 検定の実行では、検定統計量を考えます。(5)のσ2_{を推定量で置き換えた、} t = √( db 1 n1 + 1 n2 ) c σ2 がH0: µ1= µ2のもとで自由度(n1− 1) + (n2− 1) = (n1+ n2− 2)のt分布に従います。そのため、両側5％の検定は t < tn1+n2−2(0.025) tn1+n2−2(0.975) < t のときに棄却されます。 3.3.5 例題3 では、例題を考えていきましょう。「例題3」実薬群・プラセボ群のデータが以下のように与えられたとする(n1= 6, n2= 5)。実薬群 8 19 6 14 11 8 プラセボ群 18 9 5 7 14 実薬群・プラセボ群の収縮期血圧の平均値をそれぞれµ1, µ2とおくとき、 H0: µ1= µ2 H1: µ16= µ2 について有意水準5％の両側検定を行え。 (解答) まず、両群の平均値の推定値を求めると c µ1= ¯y1= 1 6(8 + 19 + 6 + 14 + 11 + 8) = 11.0, cµ2= ¯y2= 1 5(18 + 9 + 5 + 7 + 14) = 10.6 です。これより、 b d =µc1− cµ2= 11.0− 10.6 = 0.4 であり、プールした分散の推定値は c σ2₌ 1 5 + 4 [{ (8− 11)2+ (19− 11)2+ (6− 11)2+ (14− 11)2+ (11− 11)2+ (8− 11)2} +{(18− 10.6)2+ (9− 10.6)2+ (5− 10.6)2+ (7− 10.6)2+ (14− 10.6)2}] = 25.5 です。従って、t統計量は t = √( db 1 n1 + 1 n2 ) c σ2 = √( 0.4 1 6+ 1 5 ) 25.5 ≒0.13 は、「群内の平方和 (の定数倍)」のように言われることもありますが、私は「全群でプールした分散の推定値 (の定数倍)」という解釈の方が好きです。

(8)

です。H0: µ1= µ2のもとではtは自由度(n1− 1) + (n2− 1) = (6 − 1) + (5 − 1) = 9のt分布に従います。従って、tを t9(0.025) =−2.26, t9(0.975) = 2.26と比べると、 t9(0.025) ≤ t (= 0.13) ≤ t9(0.975) となり、帰無仮説H0: µ1= µ2は棄却されません。 3.3.6 例題4 ついでにもう1問例題を考えましょう。今度はデータの要約統計量のみが与えられた状況です。「例題4」実薬群5例、プラセボ群4例に対して治験薬を投与した(n1= 5, n2= 4)。収縮期血圧のベースラインからの減少の（標本）平均・（標本）標準偏差*14_{は以下のようになった。} 例数（標本）平均（標本）標準偏差実薬群 5 15 3 プラセボ群 4 10 2 実薬群・プラセボ群の収縮期血圧のベースラインからの減少の平均値をそれぞれµ1, µ2とおくときに、 H0: µ1= µ2 H1: µ16= µ2 について有意水準5％の両側検定を行え。 (解答) 1つ1つのデータはなくても上にある情報だけでt 統計量が作成できる、ということを見ていきましょう。まずは c µ1= 15, cµ2= 10, bσ1= 3, bσ2= 2です。次にdbですが、これは（標本）平均値の差なので b d =cµ1− cµ2= 15− 10 = 5 です。次にプールした分散ですが、上の表よりbσ1= 3, bσ2= 2と、例数がそれぞれn1 = 5とn2= 4であることから(8) を用いて c σ2₌ 1 (n1− 1) + (n2− 1) { (n1− 1)cσ2 1+ (n2− 1)cσ22 } = 1 7(4· 3 2_{+ 3}_{· 2}2₎_≒_6.9 となります。これより、t統計量は t = √( db 1 n1 + 1 n2 ) c σ2 =√( 5 1 5+ 1 4 ) 6.9 ≒2.84 となります。これが帰無仮説のもとで自由度7のt分布に従いますので、t7(0.025) =−2.36, t7(0.975) = 2.36より t7(0.975) < t (= 2.84) となり、帰無仮説H0: µ1= µ2は棄却されます。 *14_{データ y}₁_,· · · , y_n_{の標本標準偏差}bσ は ¯x = 1 n n ∑ i=1 xiとしたときに bσ = v u u t 1 n− 1 n ∑ i=1 (xi− ¯x)2 で計算されます。

(9)

3.4

2 群の

t

検定

2 ：対応のある

t

検定

3.4.1 データの構造・仮説まず最初に対応のあるt検定の枠組みを示します。状況としては、n人の被験者の「『治療前』と『治療後』」「『右手』と『左手』」などの比較したい場合です。このとき、たとえば降圧剤の場合、被験者1が「日頃から血圧が高い」人の場合、治療前も治療後もどちらもある程度高めになって当然ですし、逆に「日頃から血圧が低い」人の場合、治療前も治療後も低めで当たり前です。このように、同じ被験者の「治療前」と「治療後」にはこの被験者特有の情報が含まれていると考え、この情報を活用して、つまり「被験者1の『治療前』と『治療後』」「被験者2の『治療前』と『治療後』」・・・のそれぞれに対応をつけて考えるのが対応のあるt検定です。データの分布を考えていきます。対応のあるt検定の特徴は「1人1人のデータがそれぞれ別々の分布に従う」ということです。つまりたとえば、「治療前の被験者1」の平均は「治療前の全体の平均」に「被験者1の効果」を加えたもの、としてやるのです。このように、「全体の平均」とは別に、「個人の効果」を1人1人別々に持つような分布を考えるのです。文字で表わすと、全体の平均「µ1：治療前」「µ2：治療後」に、個人の効果p1,· · · , pnを足してやります*15。このとき、データは以下のように書けます。ここで同じ被験者の「治療前」と「治療後」のデータも独立であると仮定します。被験者治療前治療後 (1人目) y11∼N (µ1+ p1, σ2) y12∼N (µ2+ p1, σ2) (2人目) y21∼N (µ1+ p2, σ2) y22∼N (µ2+ p2, σ2) (3人目) y31∼N (µ1+ p3, σ2) y32∼N (µ2+ p3, σ2) .. . ... ... (n人目) yn1∼N (µ1+ pn, σ2) yn2∼N (µ2+ pn, σ2) ここで、µ1, µ2を全体の平均とするために、制約条件p1+ p2+ p3+· · · + pn = 0を入れてやります*16。仮説は H0：µ1= µ2 H1：µ16= µ2 とおきます。 3.4.2 検定の方法検定の方法を考えます。各データの「治療前」「治療後」の両方にその人特有の効果p1,· · · , pnがあるのですが、これは検定には関係ない部分ですので「引き算で消し去る」という考え方をします。つまり、「治療後」−「治療前」のデータ di = yi2− yi1 (i = 1,· · · , n) を用いて解析を行います。このとき、diはまた正規分布に従い*17、 E[di] = E[yi2− yi1] = (µ2+ pi)− (µ1+ pi) = µ2− µ1 V [di] = V [yi2− yi1] = V [yi2− yi1] = V [yi2] + V [yi1] = σ2+ σ2= 2σ2 *15_{個人の効果は定数（固定効果）で考えます。変量効果にしない理由はわかりません。ご存知の方がいらっしゃれば、教えてください。} *16_{この制約条件があるおかげで、たとえば治療前の全員のデータの平均 ¯}_y_·1₌ 1 n n ∑ i=1 yi1について E[¯y·1] = E [ 1 n n ∑ i=1 yi1 ] = 1 n n ∑ i=1 E[yi1] = 1 n n ∑ i=1 (µ1+ pi) = µ1+ 1 n(p1+ p2+· · · + pn) = µ1 となり、µ1が治療前の全体の平均という意味を持ちえます。 *17_{正規分布に従う確率変数の和・差・定数倍などはまた正規分布に従う確率変数となります。これを正規分布の「再生性」と言います。}

(10)

より、 di ∼N (µ2− µ1, 2σ2) となり、各diからは被験者個人の効果が全て消え去ってしまいます。そしてさらに、帰無仮説H0: µ1= µ2のもとでは di∼N (0, 2σ2)となります。ここでさらに記号を見やすくするためeσ2= 2σ2としてやると、結局全データは d1,· · · , dn∼N (0,eσ2) となります。このd, · · · , dnに対して1群のt検定を行います*18。つまり、 ¯ d = 1 n n ∑ i=1 di c eσ2₌ 1 n− 1 n ∑ i=1 (di− ¯d)2 (9) とおくと、 t = ¯ d √ c e σ2 n が帰無仮説のもとでtn₋₁に従います。したがって、両側5％検定において t < tn₋₁(0.025) tn₋₁(0.975) < t で棄却すればよい、ということになります。 3.4.3 例題5 「例題5」ある薬の血糖値降下作用について検討した。６人の被験者に対して、この薬の投与前と投与後の空腹時血糖(mg/dL)のデータをとった。データは以下の通りである。被験者番号 1 2 3 4 5 6 投与前 130 135 152 133 140 150 投与後 120 130 140 138 142 140 このとき、対応のあるt検定統計量を求め、この薬の血糖降下作用について考察せよ*19_。 (解答) 処置前と後で引き算して、1群のt検定を行います。つまりデータを被験者番号 1 2 3 4 5 6 投与前 130 135 152 133 140 150 投与後 120 130 140 138 142 140 (投与前)−(投与後) 10 5 12 −5 −2 10 *18_{帰無仮説は H}₀_{: µ}₂− µ₁_{= 0、つまり d}₁_,· · · , d_n_{の平均が 0 になることです。} *19_{t 検定の棄却限界は「大体」の数値を思い出して用いよ。}

(11)

としてやります。帰無仮説は「投与前と投与後が同じ」ですので、「（投与前）−（投与後）」のデータに対して、平均が0 かどうかの1群のt検定をすることになります。 ¯ d =1 6(10 + 5 + 12 + (−5) + (−2) + 10) = 5.0 c σ2₌1 5{(10 − 5) 2_{+ (5}_{− 5)}2_{+ (12}_{− 5)}2_{+ (}_{−5 − 5)}2_{+ (}_{−2 − 5)}2_{+ (10}_{− 5)}2_} ≒49.6 から、検定統計量は t = 5.0√− 0 49.6 6 = 1.739 となります。データが6個の1群のt検定より、これが帰無仮説の下で自由度5のt分布に従うため、2.5％点t5(0.025) = −2.57, t5(0.975) = 2.57と比較すると t5(0.025) < (1.739 =) t < t5(0.975) より、正の値で棄却限界より小さいため、帰無仮説H0: µ1= µ2は棄却されません。したがってこの薬は血糖値降下作用があるとはいえないという結論となります。 3.4.4 SASプログラム上の対応のあるt検定を、SASで行うと以下のようなプログラムになります。 data d1;

input before after @@; cards;

130 120 135 130 152 140 133 138 140 142 150 140

; run;

proc ttest data=d1;

paired after*before; run;

(iii) x, x N(µ, ) z = x µ () N(0, ) () 0 (y,, y 0 ) (σ = 6) *3 0 y y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 y ( ) *4 H 0 : µ

t

検定について

第

2

回

Armitage

勉強会

土居正明

1

はじめに

2

正規分布とは

2.1

正規分布の重要な性質

3

t

分布はどのようにして生まれたか

3.1

1

群の

t

検定

3.2

正規分布と

t

分布を用いた

1

群の比較のまとめ

3.3

2

群の

t

検定

1

：対応のない

t

検定

3.4

2

群の

t

検定

2

：対応のある

t

検定

(iii) x, x N(µ, ) z = x µ () N(0, ) () 0 (y,, y 0 ) (σ = 6) 3 0 y y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 y ( ) 4 H 0 : µ