• 検索結果がありません。

相関

ドキュメント内 PowerPoint プレゼンテーション (ページ 31-68)

相関 Pearson correlation coefficient

二つの連続変数の直線的な相関の程度を 表す

順位相関 Spearman rank correlation

(ノンパラメトリック法、順位に基づく解析、

正規分布を仮定しない)

単回帰 y=ax+b

y:従属変数、x:独立変数

相関係数 Correlation coefficient

r =(xとyの共分散) /( xの標準偏差×yの標準偏差)

(Rosner 2005) 強い正の相関

弱い負の相関 強い負の相関

弱い正の相関

母相関係数の検定

帰無仮説H

0

:ρ=0、対立仮説H

1

:ρ≠0

検定統計量 t= (r-0)/{(1- r

2

)/(n-2)}

1/2

tの絶対値が t

n-2, 0.975

より大きい場合、

帰無仮説は棄却され、二つの変数の間

に有意な相関があると結論される。

本日の授業 3群以上の平均値の差の検定

(一元配置分散分析法)

多重比較(Bonferroni法、Scheffe法)

ノンパラメトリック法(Kruskal-Wallis test)

単回帰分析(回帰係数のt検定、F検定)

重回帰分析(回帰係数のt検定、F検定)

2群の割合の検定

独立2群 カイ2乗検定

対応のある2群 マクネマー検定 補足 2項検定とマクネマー検定

分散分析法

3群以上の平均値の差の検定 多重比較

いくつかの比較を行なう際に、有意水準αの 補正を行なうもの

(3群以上の平均値の差の検定にt-検定を 繰り返して行うことはできない)

Bonferroni、 Scheffe 、 Tukeyなど

4. 3群以上の比較

分散分析法 Analysis of variance, ANOVA 3群以上の平均値の差の検定

正規性

等分散性 を満たすことが必要

全体変動=群間変動 + 群内変動

=要因による変動+誤差による変動

帰無仮説H0:各群の平均値がすべて等しい

群間変動大、郡内変動小の場合

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45

1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127 133 139 145 151 157 163 169 175 181 187 193 199 205 211 217 223 229 235 241 247 253 259 265 271 277 283

群間変動小、郡内変動大の場合

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127 133 139 145 151 157 163 169 175 181 187 193 199 205 211 217 223 229 235 241 247 253 259 265 271 277 283

(個々のデ-タ ー全体平均)

= (個々のデ-タ ー個々の群平均)

+ (個々の群の平均 ー全体平均)

全体変動=(個々のデ-タ ー全体平均)2 の総和

群内変動=(個々のデ-タ ー個々の群平均)2 の総和

群間変動=(個々の群平均 ー全体平均) 2 の総和

両辺を二乗して総和をとる

SSB SSA

(Rosner 2005)

H0:各群の平均値がすべて等しい

SS, 平方和; MS, 平均平方

A

B

一元配置分散分析のためのF検定における棄却域

Rosner 2005

Bonferroni’s method

1.一回当たりの有意水準を調整する α * = 0.05/ n C 2

2.込みにした分散として、群内平均 平方を用いる。

3.自由度はn-群の数となる。

(Rosner 2010)

{(n1-1)s12 + (n2-1)S22 + (n3-1)S32}/(n1 + n2 + n3 -3)

例:0.05/3

SPSSではP-値を3倍している

(Rosner 2010)

(Rosner 2010)

ノンパラメトリック法

Kruskal-Wallis test(3群以上の比較)

等分散性 必要なし 正規性 必要なし

ノンパラメトリック法による多重比較もある

従属変数と独立変数の回帰式を推定し、

従属変数が独立変数によってどのくらい説明 できるかを定量的に分析する。

回帰係数~xが1単位の変化すると、yがどの 位変化することが期待されるかを示す。

回帰直線を生のデータの散布図とともに示す ことが望ましい。

回帰直線は、実測点と予測点の誤差(残差)の 2乗の和が最小になるように求められる(最小2 乗法)。

5.回帰

Rosner 1994

残差 回帰直線 最小2乗法で求める

残差の2乗の和が最小になるように

回帰係数の有意性の検定

帰無仮説H

0

:β=0、対立仮説H

1

:β≠0 回帰係数の推定値bをその標準誤差

se (b)で割った値tの絶対値が、

自由度n-2のt分布表の上側2.5%

に対応する値t

n-2,0.975

より大きれば、

帰無仮説は棄却され、yとxとの間に

有意な関連があると結論される。

= b/s.e.(b)

(Rosner 2010)

寄与率、決定係数

従属変数の変動のどの位の割合を独立変 数xで説明できるかを表す指標

相関係数の2乗となる。

Model SS/Total SS

モデルのあてはまりのよさの指標

Model Sum of Squares Error Sum of Squares

Total Sum of Squares

Σ( yi – y )2

Σ( yi – yi )2

Σ( yi – y )2

F-検定による回帰係数の有意性の検定 帰無仮説H0:β=0、対立仮説H1:β≠ 0

(y実測値ー y平均) = (y期待値ー y平均)+(y実測値ー y期待値)

両辺を2乗して総和を求める

Σ(y実測値ー y平均)2 = Σ(y期待値ー y平均)2+Σ(y実測値ー y期待値)2 Total SS = model SS + residual SS

帰無仮説のもとで、F = model MS/residual MSが自由度1、n-2のF分布に従う ことを利用して、回帰係数の有意性の検定を行う。

F > F1,n-2, 1-αならば帰無仮説を棄却する。

F <= F1,n-2, 1-αならば帰無仮説を棄却しない。

残差について確認すること

1.残差の正規性の確認

(P-P プロット)

2.残差の分散均一性の確認

(従属変数の予測値あるいは独立変数 と残差の散布図を描いてみる)

SPSS: *zresisのヒストグラム、P-Pプロット

*zresid vs. *zpred の散布図作成

6.重回帰分析

y=β0 + β1 x1+ β2x2 + ---+βkxk + ε

従属変数は数量データ。独立変数はカテゴカル データ(1,0)でもよい。

偏回帰係数βiは、実測値と予測値の誤差(残差)の 2乗の和が最少になるように求められる(最小2乗法)

他の独立変数の影響を調整した際、xiが1単位変化し た場合のyの変化量を示す。

回帰係数の有意性の検定

帰無仮説H

0

i

=0、対立仮説H

1

i

≠0 回帰係数の推定値b

i

をその標準誤差

se (b

i

)で割った値tの絶対値が、

自由度n-p-1のt分布表の上側2.5%

に対応する値t

n-p-1,0.975

より大きれば、

帰無仮説は棄却され、yとx

i

との間に

有意な関連があると結論される。

標準化偏回帰係数

Standardized regression coefficient 標準化偏回帰係数 bs

bs = b × (sx/sy)

xiが1標準偏差増加した場合にyがどの位 増加するかを示す(単位はyの標準偏差)

(他のすべての独立変数の影響を調整した 後で)

F-検定による回帰係数の有意性の検定(1)

帰無仮説H0:すべてのβi =0、対立仮説H1:少なくとも一つのβi ≠ 0

(y実測値ー y平均) = (y期待値ー y平均)+(y実測値ー y期待値)

両辺を2乗して総和を求める

Σ(y実測値ー y平均)2 = Σ(y期待値ー y平均)2+Σ(y実測値ー y期待値)2 Total SS = model SS + residual SS

帰無仮説のもとで、F = model MS/residual MSが自由度k、n-k-1のF分布に従う ことを利用して、回帰係数の有意性の検定を行う。

F > Fk,n—k-1, 1-αならば帰無仮説を棄却する。

F <= Fk,n—k-1, 1-αならば帰無仮説を棄却しない。

Partial F-testによる偏回帰係数の検定

(Rosner 2010)

共線性の検討

Variance Inflation Factor < 10 であることを 確認

ドキュメント内 PowerPoint プレゼンテーション (ページ 31-68)

関連したドキュメント