担当:鹿野(大阪府立大学)
2014 年度前期
はじめに
前回の復習
仮説検定の概要。
母平均のt検定・母分散のカイ2乗検定。
今回学ぶこと
二標本問題の仮説検定。
処置効果と因果関係。
テキスト該当箇所:12.2章。
1 二標本問題の仮説検定
1.1
母平均の差:二標本
t 検定二標本問題(講義ノート#18):二つの正規母集団N(µX, σ2
X)、N(µY, σ 2
Y)の、母平均・母分
散の差。
⊲ 例:「新薬を投与した被験者」と「非投与の被験者」で、血糖値の平均に差がある?
⊲ N(µX, σ2X)−−−−−−−−→X1,X2,...,Xn
無作為抽出
標本平均X¯、標本分散s2
X(サンプル数n)。
⊲ N(µY, σ2Y)−−−−−−−−→Y1,Y2,...,Yk
無作為抽出
標本平均Y¯、標本分散s2
Y(サンプル数k)。
⊲ 母平均の差 を、標本平均の差 で推定。
Remark:二標本問題でテストしたい仮説値は、多くの場合「母平均に差が無い」D∗= 0。
つまり
H0: D = µX− µY = 0 ⇔ . (1)
⊲ 実測値D = ¯ˆ X − ¯Yと理論値D = 0の差を二標本t統計量(講義ノート#18)に直すと t∗= D − 0ˆ
s√1/n + 1/k =
X − ¯Y¯
s√1/n + 1/k ∼ T(n + k − 2). (2) ここでs2は合併分散。
1
母平均の差の両側t検定:「母平均に差が無い」を帰無仮説と置くと、対立仮説は
H0: µX = µY, H1: . (3)
このときt値は
t∗= X − ¯Y¯
s√1/n + 1/k. (4)
⊲ 有意水準を5%とする。両側検定なので、
or (|t∗| > t0.025) ⇒ H0: µX = µYを棄却. (5) t0.025は自由度m = n + k − 2のt分布の2.5%臨界値。
⊲ ∴t値の求め方は異なるが、検定の手順は一標本のt検定(講義ノート#20)と同じ。
⊲ 検定の結果H0: µX = µYが棄却された場合、「µXとµYは統計的に 」、
「二つの母平均に有意差がある」と言う。
母平均の差の右片側t検定(左片側も同様):帰無仮説、対立仮説は
H0: µX = µY, H1: . (6)
t値の求め方は、(4)式と同様。
⊲ 有意水準を5%とする。右片側検定なので、
⇒ H0: µX = µY を棄却. (7)
t0.05は自由度m = n + k − 2のt分布の5%臨界値。
⊲ 検定の結果H0: µX = µYが棄却され、H1: µX > µYが間接的に支持された場合、「µX はµYより(統計的に)有意に大きい」と言う。
例:母平均の差に関する次の仮説を、両側t検定。
H0: µX = µY, H1: µX µY. (8) ただしX = 50¯ 、Y = 60¯ 、合併分散s = 20、サンプル数n = 8、k = 8。
⊲ 平均の差のt値は
t∗= 10
20√1/4 = . (9)
⊲ 自由度m = n + k − 2 = 14のt分布の右端臨界値はt0.025= 。
⊲ −2.145 < t∗= −1 < 2.145 →棄却域に入らない。∴母平均に 。
⊲ ...この問題、講義ノート#18の例(焼き肉店の売り上げの比較)を正式な仮説検定に 模様替えしただけ。
1.2
母平均の差の検定:分析例
Remark:母平均の差の検定は、非常に多くの場面で利用される。
⊲ 特に実験データの分析。詳しくは次節。
⊲ 例:医療技術の治験。治療を受けた被験者グループ(処置群)と、比較のため何も 治療を受けない被験者グループ(制御群)で、血糖値や血圧に差があるか検定。
例:30代男性の飲酒グループXiと飲酒しないグループYiで、血圧の差µX− µYを右片側 検定。厚生労働省『第5次循環器疾患基礎調査』(2000年)より、
血圧(上) 標本平均 標本分散 サンプル数 毎日3合以上 X = 130.02¯ s2
X = 13.1
2 n = 33
飲酒なし Y = 121.50¯ s2
Y = 12.92 k = 136
差 X − ¯Y = 8.52¯
⊲ 合併分散の公式(講義ノート#18)から、
s2 = 32 · 171.61 + 135 · 166.41
32 + 135 = 167.41. (10)
合併標準偏差はs = 12.94。∴t値は
t∗= 8.52
12.94√1/33 + 1/136 = 3.39. (11)
⊲ 自由度が大きい→標準正規分布の臨界値で近似:t0.05≈ Z0.05= 1.645。
⊲ t∗= 3.39 > 1.645 ⇒ H0 : µX = µY棄却。飲酒グループの血圧は 。
例:Carmichale & Thomas (2005)。サッカーにおける、ホーム・アドバンテージに関する 実証分析。
⊲ 英国の1997-1998 Premier Leagu、380試合について、ホーム・チームとアウェー・ チームのプレーを比較。(一部抜粋。)
ホーム標本平均 アウェー標本平均 平均差 t値 ゴール数 1.56 1.12 0.43 4.64 枠内シュート数 4.39 3.36 1.03 6.19 バイタルエリアでのパス 7.18 4.93 2.24 8.49
味方GKセーブ数 3.33 4.30 -0.97 -5.94
被イエローカード 1.29 1.98 -0.68 -7.42
⊲ 臨界値を標準正規分布で近似したt0.025 = 1.960で両側t検定すると、これらの変数
全てに 。
⊲ Carmichale and Thomas (2005), “Home-Field Effects and Team Performance: Evidence from English Premiership Football”, Journal of Sports Economics 6(3), pp264-281.
2 処置効果と因果関係
2.1
処置効果
処置群・制御群とアウトカム:新しい治療法や新薬に関する臨床実験(治験)でも、母平 均の差の検定は使われる。専門用語として
⊲ :治療、投薬など何らかの処置を施された被験者グループ。
⊲ :比較のため、何も処置を施していない被験者グループ。
⊲ :処置の結果、差が生じると期待される変数(血糖値、血圧、発がん リスク、余命など)。
処置効果の検定:処置群のアウトカムXiと制御群のアウトカムYiの母平均の差
D = µX − µY (12)
を、 と呼ぶ。その推定値は、標本平均の差D = ¯ˆ X − ¯Y。
⊲ 処置効果の検定の基本は、(6)式の右片側検定。
⊲ H0: µX = µYが棄却されれば、対立仮説H1: µX > µY(期待通りの処置効果あり)の 統計的な証拠となる。
Remark:被験者の「これは新薬だから聞くはず」という思い込みや、「お医者さんの期
待に応えなければ」という気負いが、人体に影響を与え得る。
⊲ これを (placebo effect)と呼ぶ。いわゆる「病は気から」。
⊲ 分析上の問題点:処置群と制御群の平均に有意差が検出されても、それが真の薬効 によるものか、プラシーボ効果によるものか、識別できない。...極端な話、薬効が 無いのに有意差が出る可能性がある。
二重盲検法:プラシーボ効果による検定結果のかく乱を防ぐため、現在は次のようなサン プリングが行われる。これを (double-blind test)と呼ぶ。
1. に、彼(彼女)が処置群・制御群のどちらであるかを伝えない。そのうえ で、処置群に新薬を、制御群に効果のない偽薬を投与。→思い込みによるプラシー ボ効果を防ぐ。
2. も、処置群・制御群の区別がつかない状態で被験者を診断。→「新薬が 効いてほしい」という分析者側の思い込みや、不正を排除。
2.2
「有意差」は「因果関係」なのか?
「有意差」の意味するもの: で統計的な有意差が出れば、その原因は分析 者の介入。
⊲ 例:「発がん物質を投与したマウス(処置群)と投与しないマウス(制御群)で、が んの発生割合は処置群が有意に高かった」→がんを引き起こした原因は、分析者の 投与した発がん物質。
⊲ ∴実験データは、 が明確。
⊲ 一方、 では、統計的な有意差が、必ずしも因果関係を意味しない。
例:「検定の結果、喫煙者は、非喫煙者よりも肺がんリスクが有意に高いことが判明した。」
⊲ 喫煙者は、非喫煙者よりも自分の健康に関心が低い。→たばこによる害ではなく、 健康管理の違い( )が肺がんリスクに影響しているのでは?
⊲ ∴いくら有意差があっても、必ずしも「喫煙」→「肺がん」の因果関係を意味しない。
例:「検定の結果、学生時代バスケットボール部だった社会人は、そうでない社会人より 身長が有意に高いことが判明した。」
⊲ バスケで身長が伸びたのではなく、身長が高い人がバスケをしていただけでは?(想 定とは の因果関係。)
⊲ ∴いくら有意差があっても、必ずしも「バスケ」→「身長」の因果関係を意味しない。
Remark:非実験データでは、統計的な有意差 因果関係。自分のor他者が提示し
た検定結果を解釈する際、注意。
⊲ 一方、コスト面や倫理上の制約から、実験が行えない問題も多い。
⊲ 非実験データから、どうやって因果関係を推測するか?⇒ の重要な テーマ。
まとめと復習問題
今回のまとめ
母平均の差の二標本t検定。
処置効果と因果関係:統計的な有意差因果関係。
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。 1. 母平均の差に関する次の仮説を、右片側t検定する。有意水準は5%。
H0: µX = µY, H1: µX > µY. (13) ただし二標本から、X = 130¯ 、Y = 100¯ 、s = 20、n = 8、k = 8を得ている。
(a) t値を求めよ。(計算過程は省略してよい。以下同文。)
(b) 適切な臨界値をt分布表から求め、棄却域を構成せよ。
(c) H0が棄却されれば○、されなければ× と答えよ。
2. 「自宅に本がたくさんある子供は、本が少ない子供よりも学力テストのスコアが統計的に 有意に高い。よって各家庭に本を配布して回れば、子どもの学力格差を解消できる!」... この能天気な意見(しかし正当な検定手順を踏まえている)を、因果関係の観点から批評 せよ。