• 検索結果がありません。

二標本問題の仮説検定 経済統計 鹿野研究室

N/A
N/A
Protected

Academic year: 2018

シェア "二標本問題の仮説検定 経済統計 鹿野研究室"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

担当:鹿野(大阪府立大学)

2014 年度前期

はじめに

前回の復習

 仮説検定の概要。

 母平均のt検定・母分散のカイ2乗検定。

今回学ぶこと

 二標本問題の仮説検定。

 処置効果と因果関係。

 テキスト該当箇所:12.2章。

1 二標本問題の仮説検定

1.1

母平均の差:二標本

t 検定

 二標本問題(講義ノート#18):二つの正規母集団N(µX, σ2

X)N(µY, σ 2

Y)の、母平均・母分

散の差。

例:「新薬を投与した被験者」と「非投与の被験者」で、血糖値の平均に差がある?

⊲ N(µX, σ2X)−−−−−−−−→X1,X2,...,Xn

無作為抽出

標本平均X¯、標本分散s2

X(サンプル数n

⊲ N(µY, σ2Y)−−−−−−−−→Y1,Y2,...,Yk

無作為抽出

標本平均Y¯、標本分散s2

Y(サンプル数k

母平均の差 を、標本平均の差 で推定。

 Remark:二標本問題でテストしたい仮説値は、多くの場合「母平均に差が無い」D= 0

つまり

H0: D = µX− µY = 0 . (1)

実測値D = ¯ˆ X − ¯Yと理論値D = 0の差を二標本t統計量(講義ノート#18)に直すと t= D − 0ˆ

s1/n + 1/k =

X − ¯Y¯

s1/n + 1/k ∼ T(n + k − 2). (2) ここでs2は合併分散。

1

(2)

 母平均の差の両側t検定:「母平均に差が無い」を帰無仮説と置くと、対立仮説は

H0: µX = µY, H1: . (3)

このときt値は

t= X − ¯Y¯

s1/n + 1/k. (4)

有意水準を5%とする。両側検定なので、

or (|t| > t0.025) H0: µX = µYを棄却. (5) t0.025は自由度m = n + k − 2t分布の2.5%臨界値。

⊲ ∴t値の求め方は異なるが、検定の手順は一標本のt検定(講義ノート#20)と同じ。

検定の結果H0: µX = µYが棄却された場合、µXµYは統計的に

「二つの母平均に有意差がある」と言う。

 母平均の差の右片側t検定(左片側も同様):帰無仮説、対立仮説は

H0: µX = µY, H1: . (6)

t値の求め方は、(4)式と同様。

有意水準を5%とする。右片側検定なので、

H0: µX = µY を棄却. (7)

t0.05は自由度m = n + k − 2t分布の5%臨界値。

検定の結果H0: µX = µYが棄却され、H1: µX > µYが間接的に支持された場合、「µXµYより(統計的に)有意に大きい」と言う。

 例:母平均の差に関する次の仮説を、両側t検定。

H0: µX = µY, H1: µX µY. (8) ただしX = 50¯ 、Y = 60¯ 、合併分散s = 20、サンプル数n = 8k = 8

平均の差のt値は

t= 10

201/4 = . (9)

自由度m = n + k − 2 = 14t分布の右端臨界値はt0.025=

⊲ −2.145 < t= −1 < 2.145 →棄却域に入らない。母平均に

⊲ ...この問題、講義ノート#18の例(焼き肉店の売り上げの比較)を正式な仮説検定に 模様替えしただけ。

(3)

1.2

母平均の差の検定:分析例

 Remark:母平均の差の検定は、非常に多くの場面で利用される。

⊲ 特に実験データの分析。詳しくは次節。

⊲ 例:医療技術の治験。治療を受けた被験者グループ(処置群)と、比較のため何も 治療を受けない被験者グループ(制御群)で、血糖値や血圧に差があるか検定。

 例:30代男性の飲酒グループXiと飲酒しないグループYiで、血圧の差µX− µYを右片側 検定。厚生労働省『第5次循環器疾患基礎調査』(2000年)より、

血圧(上) 標本平均 標本分散 サンプル数 毎日3合以上 X = 130.02¯ s2

X = 13.1

2 n = 33

飲酒なし Y = 121.50¯ s2

Y = 12.92 k = 136

X − ¯Y = 8.52¯

⊲ 合併分散の公式(講義ノート#18)から、

s2 = 32 · 171.61 + 135 · 166.41

32 + 135 = 167.41. (10)

合併標準偏差はs = 12.94。∴t値は

t= 8.52

12.941/33 + 1/136 = 3.39. (11)

自由度が大きい標準正規分布の臨界値で近似:t0.05≈ Z0.05= 1.645

t= 3.39 > 1.645 ⇒ H0 : µX = µY棄却。飲酒グループの血圧は 。

 例:Carmichale & Thomas (2005)。サッカーにおける、ホーム・アドバンテージに関する 実証分析。

英国の1997-1998 Premier Leagu380試合について、ホーム・チームとアウェー・ チームのプレーを比較。(一部抜粋。)

ホーム標本平均 アウェー標本平均 平均差 t値 ゴール数 1.56 1.12 0.43 4.64 枠内シュート数 4.39 3.36 1.03 6.19 バイタルエリアでのパス 7.18 4.93 2.24 8.49

味方GKセーブ数 3.33 4.30 -0.97 -5.94

被イエローカード 1.29 1.98 -0.68 -7.42

⊲ 臨界値を標準正規分布で近似したt0.025 = 1.960で両側t検定すると、これらの変数

全てに 。

⊲ Carmichale and Thomas (2005), “Home-Field Effects and Team Performance: Evidence from English Premiership Football”, Journal of Sports Economics 6(3), pp264-281.

(4)

2 処置効果と因果関係

2.1

処置効果

 処置群・制御群とアウトカム:新しい治療法や新薬に関する臨床実験(治験)でも、母平 均の差の検定は使われる。専門用語として

⊲ :治療、投薬など何らかの処置を施された被験者グループ。

⊲ :比較のため、何も処置を施していない被験者グループ。

⊲ :処置の結果、差が生じると期待される変数(血糖値、血圧、発がん リスク、余命など)。

 処置効果の検定:処置群のアウトカムXiと制御群のアウトカムYiの母平均の差

D = µX − µY (12)

を、 と呼ぶ。その推定値は、標本平均の差D = ¯ˆ X − ¯Y

⊲ 処置効果の検定の基本は、(6)式の右片側検定。

⊲ H0: µX = µYが棄却されれば、対立仮説H1: µX > µY(期待通りの処置効果あり)の 統計的な証拠となる。

 Remark:被験者の「これは新薬だから聞くはず」という思い込みや、「お医者さんの期

待に応えなければ」という気負いが、人体に影響を与え得る。

これを placebo effect)と呼ぶ。いわゆる「病は気から」。

⊲ 分析上の問題点:処置群と制御群の平均に有意差が検出されても、それが真の薬効 によるものか、プラシーボ効果によるものか、識別できない。...極端な話、薬効が 無いのに有意差が出る可能性がある。

 二重盲検法:プラシーボ効果による検定結果のかく乱を防ぐため、現在は次のようなサン プリングが行われる。これを (double-blind test)と呼ぶ。

1. に、彼(彼女)が処置群・制御群のどちらであるかを伝えない。そのうえ で、処置群に新薬を、制御群に効果のない偽薬を投与。思い込みによるプラシー ボ効果を防ぐ。

2. も、処置群・制御群の区別がつかない状態で被験者を診断。「新薬が 効いてほしい」という分析者側の思い込みや、不正を排除。

2.2

「有意差」は「因果関係」なのか?

 「有意差」の意味するもの: で統計的な有意差が出れば、その原因は分析 者の介入。

例:「発がん物質を投与したマウス(処置群)と投与しないマウス(制御群)で、が んの発生割合は処置群が有意に高かった」がんを引き起こした原因は、分析者の 投与した発がん物質。

⊲ ∴実験データは、 が明確。

一方、 では、統計的な有意差が、必ずしも因果関係を意味しない。

(5)

 例:「検定の結果、喫煙者は、非喫煙者よりも肺がんリスクが有意に高いことが判明した。」

⊲ 喫煙者は、非喫煙者よりも自分の健康に関心が低い。たばこによる害ではなく、 健康管理の違い( )が肺がんリスクに影響しているのでは?

⊲ ∴いくら有意差があっても、必ずしも「喫煙」「肺がん」の因果関係を意味しない。

 例:「検定の結果、学生時代バスケットボール部だった社会人は、そうでない社会人より 身長が有意に高いことが判明した。」

⊲ バスケで身長が伸びたのではなく、身長が高い人がバスケをしていただけでは?(想 定とは の因果関係。)

⊲ ∴いくら有意差があっても、必ずしも「バスケ」「身長」の因果関係を意味しない。

 Remark:非実験データでは、統計的な有意差 因果関係。自分のor他者が提示し

た検定結果を解釈する際、注意。

⊲ 一方、コスト面や倫理上の制約から、実験が行えない問題も多い。

⊲ 非実験データから、どうやって因果関係を推測するか? の重要な テーマ。

まとめと復習問題

今回のまとめ

 母平均の差の二標本t検定。

 処置効果と因果関係:統計的な有意差因果関係。

復習問題

出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。 1. 母平均の差に関する次の仮説を、右片側t検定する。有意水準は5%

H0: µX = µY, H1: µX > µY. (13) ただし二標本から、X = 130¯ 、Y = 100¯ 、s = 20n = 8k = 8を得ている。

(a) t値を求めよ。(計算過程は省略してよい。以下同文。)

(b) 適切な臨界値をt分布表から求め、棄却域を構成せよ。

(c) H0が棄却されれば○、されなければ× と答えよ。

2. 「自宅に本がたくさんある子供は、本が少ない子供よりも学力テストのスコアが統計的に 有意に高い。よって各家庭に本を配布して回れば、子どもの学力格差を解消できる!」... この能天気な意見(しかし正当な検定手順を踏まえている)を、因果関係の観点から批評 せよ。

参照

関連したドキュメント

問題例 問題 1 この行為は不正行為である。 問題 2 この行為を見つかったら、マスコミに告発すべき。 問題 3 この行為は不正行為である。 問題

「文字詞」の定義というわけにはゆかないとこ ろがあるわけである。いま,仮りに上記の如く

 仮定2.癌の進行が信頼を持ってモニターできる

現実感のもてる問題場面からスタートし,問題 場面を自らの考えや表現を用いて表し,教師の

例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する

例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する

〃o''7,-種のみ’であり、‘分類に大きな問題の無い,グループとして見なされてきた二と力判った。しかし,半

• また, C が二次錐や半正定値行列錐のときは,それぞれ二次錐 相補性問題 (Second-Order Cone Complementarity Problem) ,半正定値 相補性問題 (Semi-definite