• 検索結果がありません。

7 重症度の評価:相関係数,偏相関係数,内的整合性

N/A
N/A
Protected

Academic year: 2021

シェア "7 重症度の評価:相関係数,偏相関係数,内的整合性"

Copied!
46
0
0

読み込み中.... (全文を見る)

全文

(1)

北村メンタルヘルス学術振興財団は定期的に統計学に関する研修会を行な

っております。また、北村メンタルヘルス研究所からは「臨床で働きながら研究

をしよう:統計の裏わざと SPSS の使い方」という書籍を発行し、ご好評を得

ています。現在、この書籍は改訂を行なっており、新たに上級コースに該当す

る内容を加える予定です。その一部をPDF資料として皆様に提供しているの

がこの資料です。

北 村 メ ン タ ル ヘ ル ス 研 究 所 の 出 版 物 に ご 興 味 に あ る 方 は ⇒

http://www.institute-of-mental-health.jp/books.html

北 村 メ ン タ ル ヘ ル ス 学 術 振 興 財 団 の 研 修 に ご 興 味 の あ る 方 は ⇒

http://www.kitamura-foundation.org/training.html

北村メンタルヘルス学術振興財団主催のセミナーにご興味のある方は ⇒

http://www.kitamura-foundation.org/training.html

その他のお問い合わせは ⇒ info@institute-of-mental-health.jp

〒151-0063 東京都渋谷区富ヶ谷 2-26-3 リバーランドハウス富ヶ谷A棟

(2)

7

重症度の評価

相関係数,偏相関係数,内的整合性

1

順序変数(順序変数)の関連を見たい

1. 実例から

産後うつ病の母親の方が対照群に比較して,赤ちゃんへの微笑の回数が少ないことを見出した A クリニックの 助産師たちは,支援をすることで微笑の回数が増加することも見出した。そこで,「抑うつ状態が重症なほど微 笑の回数が少なくなるのではないか」と考えるようになった。そこで,母親たちの抑うつ重症度を 0 点から 10 点 までの段階で評価してみた。抑うつが全くないのが 0 点,最重度の抑うつが 10 点とした(表 7-1)。 表 7-1. 使用した変数と変数名 項目 変数名 内容 価 被験者番号 ID 産後 3 ヵ月目の診断 W3_MDE SCID 面接による DSM 診断 対照群 1:産後うつ病群 2 微笑回数 SMILE 10 分あたりの赤ちゃん に微笑みかける回数 抑うつ重症度 DEPRES 0 点から 10 点の抑う つの程度 高得点ほど重症 友 人 と の 電話 で の お 1 日当たり友人との電

(3)

また,彼女たちは,抑うつの強い母親たちほど,友人と電話(主として携帯電話)でおしゃべりをする時間が 短いような印象を得た。電話での会話時間も抑うつ重症度と関連しているのではないかと考えた助産師たちは, 面接中に「1 日に合計で何分ほどお友達とおしゃべりをしますか」という質問をしてみた。この研究で使用した 変数の変数名とその内容は表 7-1 に示すとおりである。 結果は以下の通りであった。ここで,「抑うつ状態が強いほど赤ちゃんに微笑みかける回数は少ない(赤ちゃ んに微笑みかける回数が少ないほど抑うつ状態が強い)」,そして「抑うつ状態が強いほど友人と電話でおしゃ べりする時間が短い(友人と電話でおしゃべりする時間が短いほど抑うつ状態が強い)」と言えるかについて検 討しよう。このリサーチクエスチョンに回答を出すのが相関 (correlation) である。 最初に,「抑うつ状態が強いほど赤ちゃんに微笑みかける回数は少ない(赤ちゃんに微笑みかける回数が少な いほど抑うつ状態が強い)」という仮説について考えてみよう。そのために,微笑回数(変数名 SMILE)と抑う つ重症度(変数名 DEPRES)の散布図 (scatter diagramme/scatter plot) を描いてみよう。

「グラフ (G)」をクリックしてプルダウン・メニューを出し,ここから「レガシーダイアログ (L)」を選び, さらに下位メニューから「散布図/ドット (S)」を選びクリックする。

(4)

「散布図/ドット」のダイアログ・ボックスが出るので,「単純な散布」を選びクリックする。そして「定義」 をクリックする。 「単純散布図」のダイアログ・ボックスが出る。変数一覧表から微笑回数(変数名 SMILE)を選びクリックし 色を変えてから上の → をクリックして,変数名を「Y軸 (Y)」に移動する。同様に,変数一覧表から抑うつ重 症度(変数名 DEPRES)をクリックし色を変えてから下の → をクリックして,変数名を「X軸 (X)」に移動す る。「貼り付け (P)」をクリックしてシンタックス文を出す。

(5)

以下のシンタックス文が現れる。 これを選択実行すると以下が出力される。 図 7-1. 微笑回数と抑うつ重症度の散布図 これを見ると確かに,微笑の回数は抑うつの重症度が進むにつれて「右肩下がりに」低下しているように見え る。しかし,その反比例はどれ程であるといえるのであろうか。 また友人との電話でのおしゃべり(変数名 CONVERS)と抑うつ重症度(変数名 DEPRES)の関連の散布図は 次のようであった。これも反比例しているようだ。

(6)

図 7-2. 友人との電話でのおしゃべりと抑うつ重症度の散布図

「一方の変数の値が高くなるほど他方の変数の値が高くなる(あるいは低くなる)」ことを確認したので,次 にこの関連の強さを測定してみよう。

2. 分散と共分散

第 1 章で勉強した,偏差 (deviation),変動(平方和) (sum of squares/mean square),不偏分散 (unbiased variance),標準偏差 (standard deviation) について復習しよう。

ある変数(たとえば抑うつの重症度)の平均値 (m) を求め,各ケースの値が平均よりどれほどバラツキがある かを見たのが偏差 (deviation) である。n 人のケースで i 番目のケースの値を xiとすると,その偏差は

𝑑

𝑖

= 𝑥

𝑖

− 𝑚

こうしたバラツキの大きさを数値として表現したい場合に,各ケースの偏差を単純に足し合わせるとゼロにな る。それでは意味がない。そこで,偏差を 2 乗させる。負の値でも 2 乗すれば正の値になるからだ。 各ケースの偏差を二乗し合算(二乗和)した値をその標本の変動(平方和) (sum of squares:

ss

) という。 変動はこの標本の特定変数の値のバラツキの程度を示す指標であるといえる。変動の値が大きければその変数の バラツキは著しく,変動の値が小さければバラツキは僅少である。 𝑛

(7)

しかし,当該変数の各ケースでの値と平均値との差(偏差)の 2 乗和の絶対値は,標本の大きさ(

n

)が大き ければ必然的に大きくなる。従って異なる

n

の複数標本間の比較には適さない。そこで,1 ケースごとの変動を 求める。これが分散(平均平方) (variance/mean square:

s

2) である。

𝑠

2

=

∑ (𝑥

ni=1 𝑖

− 𝑚)

2

𝑛

この値は実は誤差が生じやすいことが知られていて,上記の式の

n

(n – 1)

と置き換えて補正することが 多い。これを不偏分散 (unbiased variance) という。SPSS では不偏分散を採用している。 そもそも各ケースの値のバラツキの程度を表現しようとして始まったことである。偏差の概念に戻るべく,分 散の平方根を求め,これを標準偏差 (standard deviation) という。

s = √

∑ (𝑥

𝑖

− 𝑚)

2 n i=1

𝑛 − 1

ところで今回のデータの散布図に赤ちゃんへ微笑かける回数の平均値と抑うつ状態の重症度の平均値を書き込 んでみよう。

𝑚

𝑆𝑀𝐼𝐿𝐸

= 4.15

𝑚

𝐷𝐸𝑃𝑅𝐸𝑆𝑆𝐼𝑂𝑁

= 4.85

図の上でこの値を持つ座標を通り,上下左右に走る仮想の直線を引いておこう。そして,被験者番号「5」の母 親を注目してみよう。5 番目の被験者は

y

軸(微笑の回数)でも

x

軸(抑うつ重症度)でも全体の平均からズ レている。その偏差は

𝑑

𝑦5

= 𝑦

5

− 𝑚

𝑆𝑀𝐼𝐿𝐸

= 6 − 4.15 = 1.85

𝑑

𝑥5

= 𝑥

5

− 𝑚

𝐷𝐸𝑃𝑅𝐸𝑆𝑆𝐼𝑂𝑁

= 6 − 4.85 = 1.15

(8)

図 7-3. 微笑回数とうつ重症度の散布図から偏差を見る 5 番目の被験者の平均の座標

(

𝑚𝑥,𝑚𝑦

)

からのズレを,図の四角の面積で表すとすると,それ(

𝑠𝑠

𝑥5𝑦5)は

𝑠𝑠

𝑥5𝑦5

= 𝑑

𝑦5

∗ 𝑑

𝑦5

= 1.85 ∗ 1.15 = 2.1275

となる。2 変数の散布図の上で,ケースの平均の座標からのこうしたズレの和を共変動という。共変動は,つま り偏差積和である。式としては

𝑠𝑠

𝑋𝑌

= ∑(𝑥

𝑖

− 𝑚

𝑋

)(𝑦

𝑖

− 𝑚

𝑌

)

𝑛 𝑖=1 である。 そして 1 自由度あたりの共変動を共分散 (

𝑠

𝑋𝑌) という。これが各ケースの平均座標からのズレの程度であ る。共分散の特徴は,正の値も負の値も取ることである。平均座標の右上の象限と左下の象限に位置するケース の共分散は正の値をとる。一方,平均座標の右下の象限と左上の象限に位置するケースの共分散は負の値をとる。 また,

x

あるいは

y

の標準偏差が大きいほど

x

y

の共分散の値も大きくなる。 微笑みかける回数の平均値 抑 う つ 重 症 度 の 平 均 値 x の偏差 y の偏差 平均の座標

(

𝑚𝑥,𝑚𝑦) 被験者 #5

(9)

3. 分散・共分散から相関係数へ

ここで,相関係数の指標のひとつであるピアソンの積率相関係数 (Pearson’s product moment correlation

coefficient) について計算を進める1 2 つの変数(

x

y

)の共変動および共分散は,偏差の積から導かれているので,2 変数の関係が直線的であ るほどその値は大きくなる。つまり,2 つの変数(

x

y

)の共変動および共分散の値が大きいほど 2 変数の散 布図は直線に近づくと推定できる。しかし,先に述べたように,

x

あるいは

y

の標準偏差が大きいほど

x

y

の 共分散の値も大きくなるので,これを補正しなければならない。これを行ったのが相関係数(

r

)である。

𝑟 =

𝑠

𝑋𝑌

𝑠

𝑋

∗ 𝑠

𝑌

=

𝑛

(𝑥

𝑖

− 𝑚

𝑋

)(𝑦

𝑖

− 𝑚

𝑌

)

𝑖=1

𝑛 − 1

√∑

𝑛𝑖=1

(𝑥

𝑖

− 𝑚

𝑋

)

2

𝑛 − 1

∗ √

𝑛𝑖=1

(𝑦

𝑖

− 𝑚

𝑦

)

2

𝑛 − 1

=

(𝑥

𝑖

− 𝑚

𝑋

)(𝑦

𝑖

− 𝑚

𝑌

)

𝑛 𝑖=1

√∑

𝑛𝑖=1

(𝑥

𝑖

− 𝑚

𝑋

)

2

∗ ∑

𝑛𝑖=1

(𝑦

𝑖

− 𝑚

𝑌

)

2 実際の数値を当てはめてみよう。

𝑟 =

𝑠

𝑋𝑌

𝑠

𝑋

∗ 𝑠

𝑌

=

𝑛𝑖=1

(𝑥

𝑖

− 𝑚

𝑋

)(𝑦

𝑖

− 𝑚

𝑌

)

𝑛 − 1

√∑

𝑛𝑖=1

(𝑥

𝑖

− 𝑚

𝑋

)

2

𝑛 − 1

∗ √

𝑛

(𝑦

𝑖

− 𝑚

𝑦

)

2 𝑖=1

𝑛 − 1

=

−7.391

2.734 ∗ 3.158

= 0.856037

繰り返すと

𝑟 =

𝑥 と 𝑦 の共分散

𝑥 の標準偏差 ∗ 𝑦 の標準偏差

である。 ところで

𝑠

𝑋𝑌

< 𝑠

𝑋

∗ 𝑠

𝑌 という関係があるので,相関係数の絶対値は常に 1.0 以下である。また

𝑠

𝑋

∗ 𝑠

𝑌 は常に正であるが,

𝑠

𝑋𝑌 は正 も負もありうる。したがって相関係数は -1.0 から +1.0 の間の値を示す。

x

の標準偏差と

y

の標準偏差の積が常に,

x

y

の共分散より大きいのはなぜか。実はシュワルツの不等式 (Schwartz inequality) という公式がある。

(𝑎

12

+ 𝑎

22

+ ⋯ + 𝑎

𝑛2

) ∗ (𝑏

12

+ 𝑏

22

+ ⋯ + 𝑏

𝑛2

) >= (𝑎

1

𝑏

1

+ 𝑎

2

𝑏

2

+ ⋯ + 𝑎

𝑛

𝑏

𝑛

)

2 ここの

a

(𝑥

𝑖

− 𝑚

𝑋

)

を,

b

(𝑦

𝑖

− 𝑚

𝑌

)

を代入すればよい。

1

(product)

の率

(moment)

による相関の指標であるからこのように呼ばれる

(10)

4. 相関係数の有意水準

ところで,「微笑の回数は抑うつ状態が重症なほど微笑の回数が少なくなる」という対立仮説と対をなす帰無 仮説は「微笑の回数は抑うつ状態の重症度は相関を示さない」である。つまり r = 0 が帰無仮説である。そこで 対立仮説を支持するには,観察された 2 変数の相関が偶然のそれをはるかに超えたものであることを示さなけれ ばならない。 F 比を利用する。

F 比 =

𝑟

2

変数の個数

− 1

1 − 𝑟

2

𝑛 − 変数の個数

分子にある

𝑟

2 は相関の強さを表す説明率である(第 8 章 1 相関から回帰へ を参照)。一方,分母の

1 − 𝑟

2 は相関によって説明できない偶然誤差の率である。

F 比 =

0.856

2

2 − 1

1 − 0.856

2

13 − 2

=

1 − 0.856

0.856

2 2

11

F 比が臨界値を超えれば有意であると判断する。

5. SPSS を使って

上記のデータが「第 5 回教材 t-test 01」に入力されている。これを用いて相関係数を計算してみよう。 「分析 (A)」をクリックしてプルダウン・メニューを出し,ここで「相関 (C)」を選び,下位メニューから「2 変量 (B)」を選択する。

(11)

「2 変量の相関分析」のダイアログ・ボックスが出てくる。変数一覧表から微笑の回数(変数名 SMILE)と抑 うつ重症度(変数名 DEPRES)を選びクリックして色を変え,矢印をクリックして変数名を「変数 (U)」に移動 する。 そして「貼り付け (P)」をクリックしてシンタックス文を出す。 このシンタックス文を選択実行する。 結果は以下のようになる。列と行に変数名が表示される。微笑の回数(変数名 SMILE)と抑うつ重症度(変数 名 DEPRES)が交差するマスを見ると,「Pearson の相関係数 -.856」と記載されている(SPSS では相関係数 が小数点以下 3 桁まで表示されるが,論文上で記載する場合は,通常 2 桁で記載することが多い)。また,そ の有意水準が p < .001 であることも分かる。 なお,相関係数は -1.0 から +1.0 の間の値を取り(つまり相関係数の絶対値は 1.0 以下),1 位の数はゼ ロであることが通常であることから,1位の 0 (ゼロ)を省略し,小数点から記載される2 同様に「抑うつ状態が強いほど友人と電話でおしゃべりする時間が短い(友人と電話でおしゃべりする時間が 短いほど抑うつ状態が強い)」という仮説についても検討してみよう。

2 APA format と同様である.

(12)

相関係数 SMILE Smile frequency DEPRES Severity of depression 3 month postnatally

SMILE Smile frequency Pearson の相関係数 1 -.856**

有意確率 (両側) .000 N 13 13 DEPRES Severity of depression 3 month postnatally Pearson の相関係数 -.856** 1 有意確率 (両側) .000 N 13 13 **. 相関係数は 1% 水準で有意 (両側) です。

6. 名義尺度か比尺度か

前章ではサンプルデータを用い,産後 1 ヵ月目にうつ病が認められた群と対照群において妊娠後期の不安や抑 うつの重症度の平均値に差があるかを検討した。その結果,うつ病群の方が妊娠後期の不安は有意に重症であっ たが,妊娠後期の抑うつについては両群に差を認めなかった。そこで研究者は「妊娠後期に見られる不安が強い ほど産後 1 か月のうつ病の危険性は高い。しかし妊娠後期の抑うつではそのような傾向はない」と結論したはず である。 そこで,産後 1 か月のうつ病を「大うつ病エピソードに合致するか否か」で 2 群に分ける(つまり名義変数を 作る)のではなく,産後 1 か月の抑うつの程度を EPDS をもって当てるとして再考してみよう。 産後 1 か月の EPDS 得点(変数名 W2EPDSTALSM)の記述統計を下のシンタックス文で求めると,最小値= 0.0, 最大値 = 26.0,平均 = 5.6,標準偏差 = 4.6,分散 = 21.2,歪度 = 1.2,尖度 = 1.7 であった。相当の広が りがあり,ひどく偏った分布でもないことを確認したので,これと妊娠後期の不安の重症度および抑うつの重症 度との相関を見てみよう。 シンタックス文は次のようになる。

(13)

これを選択実行すると産後 1 ヵ月の EPDS 得点は妊娠後期の不安と r = 0.348 (p < .001),妊娠後期の抑うつ と r = .273 (p < .001) の有意の相関を示した。 ここから分かるように,2 変数(例えば産後 1 ヵ月の抑うつと妊娠後期の抑うつ)の関係を見るのに,一方を 名義尺度としてt検定を行う場合と,両方を比尺度(あるいは順序尺度)として相関係数を求めたのでは導ける 結論が異なることがある。「産後の抑うつを『あり・なし』の名義尺度で解析すると妊娠後期の抑うつとは関連 がなかったが,産後の抑うつとを順位尺度として解析すると妊娠後期の抑うつと相関がみられた」といった記載 は,査読者に「著者は何を言いたいのか?!」といった否定的な印象を与えてしまう。データセットを目の前に して研究者はいずれかの手法を取ることになる。いずれを取るかは論文の全体の流れのなかで決めればよい。た だし,本来連続量であると推定できる現象を「あり・なし」の名義尺度にすると,例えば軽症のうつ病も重症の うつ病も「うつ病あり」の群に含まれてしまい,微妙な差異が『希釈』されてしまうことがありうるのである。 研究の中で扱う重要変数を「名義尺度にするか順序尺度にするか」は慎重に検討しなければいけない。できる のであれば,名義尺度とした場合の解析と順序尺度とした場合の解析を両方行っておき,いずれの結果が研究者 の述べたいことに合致しているのかと照らし合わせることも賢明であろう。同時に,他人の論文を読む際も「こ こでは順序尺度として扱って有意の所見を得ているが,名義尺度に変換すれば有意性が消失するかもしれない」 といった批判力も併せ持つべきである。

7. 産後うつ病の事例に戻って

第 1 章で児童期の虐待体験の尺度を対数変換して新尺度を作った。これらの体験の程度が産後 1 ヵ月の抑う つ重症度とどれほど相関しているか見てみよう。新尺度は次のシンタックス文で作成してあった。 これらと産後 1 ヵ月目の EPDS 得点との相関を求めるシンタックス文は次のようになる。 この出力は次のようになる。

(14)
(15)

▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽ 裏技コーナー

例えばサンプルデータで妊娠後期の不安症状の重症度(変数名 HAD_ANX),妊娠後期の不 安症状の重症度(変数名 HAD_DEP)と対数変換された児童期の被虐待体験(変数名 NEWW1Q32X1, NEWW1Q32X2, NEWW1Q32X3, NEWW1Q32X4, NEWW1Q32X5,

NEWW1Q32X6, NEWW1Q32X7)の相互の相関を求めようとしたとする。プルダウン・メニ ューで行った場合,シンタックス文は次のようになる。 これで現れる出力は 9 行x9 列の非常に大きいものになり,概観するのも困難である。 しかし研究者はで妊娠後期の 2 症状が児童期の被虐待体験でどれほど説明できるかを知り たいのである。児童期の被虐待体験相互の相関についてはここでは検討課題に上がっていない。 この場合,プルダウン・メニューでは書けないシンタックス文がある。それは次のようなもの である。一群の変数名ともう一群の変数名の間を WITH で結びつける。 これを選択実行すると次のような結果が出力される。これは 2 列x7 行の見やすい一覧表 になっている。

(16)

相関係数 HAD_ANX ANXIETY OF HAD HAD_DEP DEPRESSION OF HAD NEWW1Q31X1 Pearson の相関係数 .232** .271** 有意確率 (両側) .000 .000 N 241 241 NEWW1Q31X2 Pearson の相関係数 .257** .249** 有意確率 (両側) .000 .000 N 241 241 NEWW1Q31X 3 Pearson の相関係数 .303** .249** 有意確率 (両側) .000 .000 N 240 240 NEWW1Q31X 4 Pearson の相関係数 .103 .167** 有意確率 (両側) .112 .009 N 240 240 NEWW1Q31X5 Pearson の相関係数 .161* .139* 有意確率 (両側) .012 .031 N 241 241 NEWW1Q31X6 Pearson の相関係数 .129* .187** 有意確率 (両側) .045 .004 N 240 240 NEWW1Q31X7 Pearson の相関係数 .252** .239** 有意確率 (両側) .000 .000 N 241 241 **. 相関係数は 1% 水準で有意 (両側) です。 *. 相関係数は 5% 水準で有意 (両側) です。 ▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽

(17)

8. 相関係数同士の差の検定

同一の標本から得られた 2 つの相関係数の強さに有意の差があるか確認したいことがある。サンプルデ ータでは,産後 1 ヵ月の EPDS 得点は妊娠後期の不安と r = 0.348 (p < .001),妊娠後期の抑うつと r = .273 (p < .001) の有意の相関を示した。r = 0.348 (p < .001) の方が r = .273 (p < .001) より強いとい えるであろうか。 相関係数 r を次式でフィッシャーの Z 変換を行い,その差のt検定を行えばよい。

𝑍

𝑟

=

1

2

ln (

1 + 𝑟

1 − 𝑟

)

𝑍

𝑟 は,平均値が 1 2

ln (

1+𝑟 1−𝑟

)

,分散が 1 𝑛−3 の正規分布を示す。2 つの相関のZ値の差は

𝑍

0

=

𝑍

1

− 𝑍

1

2

√𝑛 − 3

でt検定する。実際のデータを代入すれば

𝑍

𝑟𝐴𝑁𝑋

=

1

2

ln (

1 + 0.348

1 − 0.348

) = 3.3632

𝑍

𝑟𝐷𝐸𝑃

=

1

2

ln (

1 + 0.273

1 − 0.273

) = 0.2801

𝑍

0

=

𝑍

1

− 𝑍

1

2

√𝑛 − 3

=

3.3632 − 0.2801

1

√228 − 3

=

03.0831

1

15

= 46.2465

であり,5 % の臨界値(1.96)を超えるので帰無仮説は棄却され,従って両相関係数は有意に異なると言 える。 同一標本で 2 つの相関係数を求め,一方が有意であり,もう一方が有意でないときに,両相関係数の間 には有意の差があると自動的に述べるのは,誤りである。

(18)

9. 相関係数の解釈

相関係数を計算した場合、まずその値が有意水準に達しているかどうかを確認する。もし、有意でなけ れば、それは「両変数の間の相関はゼロである」という帰無仮説を却下できなかったのである。相関係数 の有意水準はサンプルサイズに左右される。例えば r = .85 といった値でも、サンプルがごく少数であれ ば有意水準に達しない。この場合、「有意の相関は認められなかった」が結論となる。相関係数が有意で なければそれ以上先に行かない。 一方、相関係数が有意水準に達したならば、その値そのものの大きさが問われることになる。「相関係 数はどれほど大きいか?」という問いに答えることになる。相関係数が 0.0 ~ 0.1 で trivial, very small, insubstantial, tiny, practically zero、0.1 ~ 0.3 で small, low, minor、0.3 ~ 0.5 で moderate, medium、0.5 ~ 0.7 で large, high, major、0.7 ~ 0.9 で very large, very high, huge、0.9 ~ 1.0 で nearly, practically, or almost perfect, distinct, infinite などの表現がされることがあるが、言葉そのものには重要な意味はない。

(19)

2

交絡と偏相関係数

1. 交絡

この章の最初の例に戻ってみよう。産後の抑うつの重症度,微笑の回数,友人との電話の分数との間に は次のような相関がみられた。 表 7-2. 産後の抑うつ重症度,微笑の回数,友人との電話の分数の相関 産後の抑うつ重症度 微笑の回数 友人との電話の分数 産後の抑うつ重症度

---

-.856 **

-.624 *

微笑の回数

-.856 **

---

.640 *

友人との電話の分数

-.624 *

.640 *

---

(n = 13)

図 7-3. 1 つの説明変数と 2 つの基準変数 抑うつ状態が強い(原因?)ほど赤ちゃんに対して微笑むことも少なくなる(結果?)だろう。また, 抑うつ状態が強い(原因?)ほど友人と電話でおしゃべりすることも少なくなる(結果?)だろう。とこ ろで,微笑の回数と友人との電話の分数との間に見られた

r = .64 ( p < .05)

,という正の相関はどう考え

(20)

ればよいのであろうか。赤ちゃんに対して微笑むことも少なくなると友人と電話でおしゃべりすることも 少なくなるのであろうか。あるいは,友人と電話でおしゃべりすることが少なくなると赤ちゃんに対して 微笑むことも少なくなるのであろうか。そもそも両者の間には本当に関連があるのであろうか。 もし,研究者が抑うつ状態の重症度を考慮せず,従ってそれを評価しなかったら,微笑の回数と友人と の電話の分数との間に見られた

r = .64 ( p < .05)

,という正の相関は真正のものと考えられてしまう。し かし,抑うつ状態の存在とそれが微笑の回数と友人との電話の分数のそれぞれに強い相関関係を有するこ とから,我々は微笑の回数と友人との電話の分数の間の関連は「見かけ上のもの」であり,本当はそれほ ど強い相関はないかもしれないという可能性を想定することができる。これを交絡 confounding という。 後に細述するように,交絡は臨床研究上大変重要な概念である。これまでの臨床研究は交絡現象の同定と 同じあると言っても過言でない。交絡検討の基本的統計法が偏相関係数である。

2. 偏相関係数

3 つの比尺度変数,X,Y,Z があった場合,相互の相関係数が計算できる。つまり,

𝑟

𝑋𝑌

𝑟

𝑋𝑍

𝑟

𝑌𝑍で ある。ここでXY の関係に Z が交絡しているとして,Z を「固定」して

𝑟

𝑋𝑌 を求める式は次のよ うになる。

𝑟

𝑋𝑌

𝑍

=

𝑟

𝑋𝑌

− 𝑟

𝑋𝑍

∗ 𝑟

𝑌𝑍

√(1 − 𝑟

𝑋𝑍2

)(1 − 𝑟

𝑌𝑍2

)

分子は XY の相関関係から Z との相関を文字通り引き算している。分母では Z によって説明で きる相関の部分を引き算してX Y の分散の部分を算出している。これを偏相関 partial correlation と いう。微笑の回数をX,友人との電話での会話分数をY,抑うつの重症度を Zとして計算してみよう。

𝑟

𝑋𝑌𝑍

=

0.640 − (−0.856 ∗ −0.624)

√(1 − (−0.856)

2

)(1 − (−0.624)

2

)

=

0.105856

√0.267264 ∗ 0.610624

= 0.262

𝑟

𝑋𝑌𝑍

= 0.262

は有意水準には届かない。従って,単純な二変数の相関で見られた微笑の回数 (X) と友人との電話での会話分数 (Y) の間の有意の相関は,抑うつの重症度 (Z) の影響による交絡現象であ った。つまり見かけ上の相関であった。

(21)

3. SPSS で偏相関係数を求める

「partial correlation 01」を開いてみよう。ここで,「抑うつ状態の重症度(変数名 DEPRES)」「微 笑の回数(変数名 SMILE)」「友人と電話で会話する分数(変数名 CONVERS)」の相互の相関係数を見 てみよう。シンタックス文は次のようになる。 その結果は次のようになる。 相関係数 SMILE Smile frequency DEPRES Severity of depression 3 month postnatally CONVERS Conversation with friends

SMILE Smile frequency Pearson の相関係数 1 -.856** .640*

有意確率 (両側) .000 .019 N 13 13 13 DEPRES Severity of depression 3 month postnatally Pearson の相関係数 -.856** 1 -.624* 有意確率 (両側) .000 .023 N 13 13 13

CONVERS Conversation with friends Pearson の相関係数 .640* -.624* 1 有意確率 (両側) .019 .023 N 13 13 13 **. 相関係数は 1% 水準で有意 (両側) です。 *. 相関係数は 5% 水準で有意 (両側) です。 「微笑の回数(変数名 SMILE)」「友人と電話で会話する分数(変数名 CONVERS)」の間には

r = 0.640

(p < 0.05)

の有意の相関がみられた。

(22)

次に,この関係を「抑うつ状態の重症度(変数名 DEPRES)」による影響を統制してみてみよう。まず, 「分析 (A)」をクリックしてプルダウン・メニューを出し,「相関 (C)」を選び,その下位項目から「偏 相関 (R)」を選びクリックする。 「偏相関分析」のダイアログ・ボックスが現れる。変数一覧表から「微笑の回数(変数名 SMILE)」「友 人と電話で会話する分数(変数名 CONVERS)」を選びクリックして色を変えてから,上の→をクリック して変数名を「変数 (V)」に移動する。次に,変数一覧表から「抑うつ状態の重症度(変数名 DEPRES)」 を選びクリックして色を変えてから,下の → をクリックして変数名を「制御変数 (C)」に移動する。 ここで「貼り付け (P)」をクリックしてシンタックス文を出す。シンタックス文は次のようになる。こ こで選択実行する。

(23)

以下が出力される。 相関係数 制御変数 SMILE Smile frequency CONVERS Conversation with friends DEPRES Severity of depression 3 month postnatally SMILE Smile frequency 相関 1.000 .261 有意確率 (両側) . .412 df 0 10 CONVERS Conversation with friends 相関 .261 1.000 有意確率 (両側) .412 . df 10 0

.261 が SMILE と CONVERS の間の偏相関係数である。交絡要因であった DEPRES が制御変数とし て表の左の欄に示されている。

4. 交絡と偏相関係数の意味

もうひとつ架空の事例を検討してみよう。Aクリニックの助産師たちは村役場の保健師と共同で,産後 3 ヵ月の訪問事業を行い,ここで赤ちゃんにどなりつける,赤ちゃんを無視するなどの「虐待的育児(変 数名 abuse)」と,同時に「抑うつ(変数名 depression)」と「不安(変数名 anxiety)」を評価した。 仮説は「抑うつが強いほど虐待的育児が強い」と「不安が強いほど虐待的育児が強い」であった。以下が 22 名の母親のデータである(教材 partial correlation 02)。

(24)

例によって 3 変数の相互の相関を見てみよう。結果は表 7-3 のようであった。 表 7-3. 虐待的育児,抑うつ,不安の相関 虐待的育児 抑うつ 不安 虐待的育児 abuse

---

抑うつ depression

.67 **

---

不安 anxiety

.95 **

.87 **

---

(n = 22)

ここから彼女たちは,「虐待的育児(変数名 abuse),抑うつ(変数名 depression),不安(変数名 anxiety)

の 3 三者間にはそれぞれ強い相関感があり,従って虐待的育児は抑うつと不安の結果である」と結論した。 特にAクリニックの助産師たちは産後うつ病援助プログラムをもっていたので,「抑うつを軽減させるこ とが育児を良い方向に向けることができる」と考えた。しかし,こう考えて良いのであろうか。

まず,虐待的育児(変数名 abuse)と抑うつ(変数名 depression)の関係を散布図でみてみよう。次 のようになる。予想通り右肩上がりの図が得られた。

(25)

図 7-4. 虐待的育児と抑うつの散布図 しかし,ここで不安(変数名 anxiety)を統制した偏相関を虐待的育児(変数名 abuse)と抑うつ(変 数名 depression)の間で求めてみよう。結果は以下のようであった。虐待的育児(変数名 abuse)と抑 うつ(変数名 depression)の間には驚くことに強い (p < .001) 負の相関 (r = -.984) がみられたので ある。 相関係数 制御変数 depression abuse anxiety depression 相関 1.000 -.984 有意確率 (両側) . .000 df 0 19 abuse 相関 -.984 1.000 有意確率 (両側) .000 . df 19 0

(26)

そこで先ほどの散布図について不安(変数名 anxiety)の値を入れてみよう。そのためには,「グラフ (G)」 →「レガシーダイアログ」→「散布図/ドット」→ダイアログ・ボックス→「単純な散布」→「定義」→「単 純散布図」のダイアログ・ボックスに至り,ここで anxiety をクリックして色を変え,これを「マーカー の設定 (S)」に移動する。その上で「貼り付け (P)」をクリックしてシンタックス文を出す。 以下のシンタックス文を選択実行して結果を出す。 結果は以下のようになる。

不安が存在しない (anxiety = 1) 3 ケースだけで見ると,抑うつ (depression) と虐待的育児 (abuse) の相関は右肩下がりであった。このことは,不安が非常に少ない (anxiety = 2) 4 ケース,やや不安があ る (anxiety = 3) 4 ケースといったように,不安の程度ごとに検討してもまったく同様であった。

(27)

図 7-5. 虐待的育児と抑うつの散布図を不安 (anxiety) の値ごとに見ると つまり,不安の値を固定すると,抑うつが強いほど虐待的育児は低くなっているのである。ではここか らどのような臨床的提言が出来るであろうか。

anxiety = 1

anxiety = 2

anxiety = 3

anxiety = 4

anxiety = 5

anxiety = 6

(28)

▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽ 裏技コーナー 論文の結果 (Results) 欄を記載する場合,その研究で用いたすべての変数の(少なくとも) 平均,標準偏差,度数,変数間の相関を記載することが望ましい(=査読者の『受け』が良い)。 実は,これだけの情報があれば全データがなくてもこの標本での共分散構造分析が可能になる。 査読者や読者が論文の結果を再検討できるのである。例えば次のような一覧表を加えるのがよ い。 1 2 3 4 5 1 産後 1 ヵ月の抑う つ重症度 --- 2 妊娠後期の不安重 症度 .35 ** --- 3 妊娠後期の抑うつ 重症度 .27 ** .50 ** --- 4 年齢 -.05 -.10 -.06 --- 5 夫の年齢 -.01 -.05 0.02 .74 *** --- 平均 5.6 11.0 13.9 29.7 31.7 標準偏差 4.6 1.7 1.8 4.7 5.7 N 233 242 242 241 240 * p < .05; ** p < .01; p < .001 必要に応じてこれに最小値,最大値,(合成変数であれば)クロンバックのα係数,歪度な どを加えることもある。 相関係数の小数点は多くて小数点 3 桁まで記載するが,通常は 2 桁である。相関係数の 「0.xxx」の「0」は省略する。上付きアスタリスク (*) で有意水準を記入する。 ▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽△▽

4. 名義変数の交絡

交絡現象は臨床研究でよく認められるものである。上記のような比尺度のような連続性を示す変数ばか りでなく,名義変数でも起こる。したがって,カイ二乗検定でも同様の現象が起こりうる。次に例を挙げ

(29)

て検討してみよう。 うつ病3や心的外傷後ストレス障害4の患者は健常者に比較して、脳内の海馬の大きさが減少しているとい う報告が時々見られる。そこで,「海馬体積の減少 ⇒ うつ病」という因果関係を主張したくなるであろう。 ここで交絡について考えなければいけない。たとえば心的外傷後ストレス障害5,うつ病6,その他の精神症 状7を呈するものが児童期の被虐待体験を多く報告することは良く知られている。 そこで次のような架空研究事例を考えてみよう。いま非臨床対象者(一般の人々)1,000 人について構 造化面接による精神科診断面接調査を行った。同時に脳画像検査を実施して海馬体積を計測した。その結 果,次のような所見を得たとしよう(表 7-4)。1000 人の対象者のうち,海馬が明らかに小さくなってい たものが 1.8%,うつ病を経験したものが 1.8%であった。海馬体積が正常のもののなかで 14.9%がうつ 病を経験していた。一方,海馬体積が縮小したいたもののなかでうつ病を経験したものは 32.2%であった。 両者の差は歴然としている。どうみても海馬減少とうつ病には関連があるように見える。 表 7-4. 架空事例による海馬体積減少とうつ病の関係(全体) 海馬体積 正常 減少 合計 うつ病の生涯の有病率 なし 698 (85.1%) 122 (67.8%) 820 あり 122 (14.9%) 58 (32.2%) 180 合計 820 180 1,000 ところで 1000 人の対象者のうち2割のものが児童虐待の被害者であることがわかったとしよう。そこ で児童虐待を受けなかった 800 人と,児童虐待を受けた 200 人に分けて,上記の計算を再度行ってみた。 虐待を受けなかったものの中で,海馬体積の正常群および減少群におけるうつ病の有病率はいずれも

3 Zhao, Z., Taylor, W. D., Styner, M., Steffens, D. C., Krishnan, R. R., & McFall, J. R. (2008). Hippocanpus shape analysis and

late-life depression. PLoS ONE, 3, 1837.

4 Gilbetson, M. W., Shenton, M. E., Ciszewski, A., Kasai, K., Lasko, N., Orr, S. P., & Pitman, R. K. (2002). Smaller hippocampal

volume predicts pathologic vulnerability to psychological trauma. Nature Neuroscience, 5, 1242-1247.

Wignall, E. L., Dickson, J. M., Vaughan, P., Farrow, T. F. D., Wilkinson, I . D., Hunter, M. D., & Woodruff, P. W. R. (2004). Smaller hippocampal volume in patients with recent-onset posttaumatic stress disorder. Biological Psychiatry, 56, 832-836.

Kitayama, N., Vaccarino, V., Kutner, M., Weiss, P., & Bremner, J. D. (2005). Magnetic resonance imaging (MRI) measurement of hippocampal volume in posttaumatic stress disorder: A meta-analysis. Journal of Affective Disorders, 88, 79-86.

5 Bremner, J. D., Randall, P., Vermetten, E., Staib, L., Bronen, R. A., Mazure, C., Capelli, S., McCarthy, G., Innis, R. B., &

Charney, D. S. (1997). Magnetic resonance imaging-based measurement of hippocampal volume in posttraumatic stress disorder related to childhood physical and sexual abuse: A preliminary report. Biological Psychiatry, 41, 23-32.

6 Kitamura, T., Sakamoto, S., Yasumiya, R., Sumiyama, T., & Fujihara, S. (2000). Child abuse, other early experiences and

depression: II. Single episode and recurrent/chronic subtypes of depression and their link to early experiences. Archives of Women’s

Mental Health, 3, 53-58.

7 Teicher, M. H., Samson, J. A., Polcari, A., & McGreenery, C. E. (2006). Sticks, stones, and hurtful words: Relative effects of

(30)

10.0%で,正常群と減少群の間に関連はなかった(表 7-5)。 表 7-5. 架空事例による海馬体積減少とうつ病の関係(児童虐待を経験しなかったもの) 海馬体積 正常 減少 合計 うつ病の生涯の有病率 なし 648 (90.0%) 72 (90.0%) 720 あり 72 (10.0%) 8 (10.0%) 80 合計 720 80 800 一方,子どもの頃に虐待を受けた人々のなかでも,海馬体積の正常・減少とうつ病の有病率の間には関 連はなかった(表 7-6)。ただし,虐待を受けた人々のなかにおけるうつ病の有病率は 50.0%と高率であ る。同様に,被虐待歴のある人々の中で海馬体積の減少も大変高率(50.0%)であった。事実,児童虐待 を受けたことのあるものにおいてさまざまな領域で海馬8や皮質容量9が減少しているという報告もある。 表 7-6. 架空事例による海馬体積減少とうつ病の関係(児童虐待の経験があるもの) 海馬体積 正常 減少 合計 うつ病の生涯の有病率 なし 50 50 100 あり 50 50 100 合計 100 100 200 このことから,次の推定ができるかもしれない。 (1) 被虐待体験⇒うつ病 (2) 被虐待体験⇒海馬体積の減少 しかし,うつ病と海馬体積減少との間には関連はないのである。対象者全体で見たときに確認できた,う つ病と海馬体積の減少との間の関連性は,実は児童虐待を受けたことによる交絡の結果だったのである。 おそらく児童虐待を受けたとことの影響が生物学的経路と心理学的経路にわかれて,それぞれ海馬体積の 減少とうつ病という表現として現れたのであろう。 メンタルヘルス領域の研究のいくつかの重要ポイントのひとつが交絡である(いまひとつは介在現象と 調整現象)。何が交絡要因として関与しているかを統計学が教えることはない。本当は交絡要因である現象 を測定していないのであれば,データが収集されてから解析のしようがない。つまり,研究を開始する前

8 Stein, M. B., Koverola, C., Hanna, C., Torchia, M. G., & McClarty, B. (1997). Hippocamcal volume in women victimized by

childhood sexual abuse. Psychological Medicine, 27, 951-959.

9 Teicher, M. H., Dumont, N. L., Ito, Y., Vaituzis, C., Giedd, J. N., & Andersen, S. L. (2004). Childhood neglect is associated with

reduced corpus callosum area. Biological Psychiatry, 56, 80-85.

(31)

の準備段階で十分時間をかけて考察するしか方法がない。十分な時間をかけたリサーチミーティングはそ うした方法のひとつである。指導者との打ち合わせもここに焦点を当てるべきである。 一方,先行研究を批判的に読むということは,その論文で扱わなかった変数が,実は交絡要因として所 見に影響しているかも知れないと考えて,それを推定することである。先行研究が見逃した可能な交絡要 因を考えることは次の研究計画に直結する。研究者の普段からの論文の読み込みと臨床的「直感」が求め られるところである。研究者のセンスの良し悪しが如実に現れる部分であろう。

(32)

3

内的整合性

1. 複数項目から構成されるテストの妥当性

複数の項目を用いてある事象を測定しようというのであれば,いずれの項目もその事象を測定している ものでなければならない。メンタルヘルス領域で評価・測定しようとする現象は直接に測定できない事象 が多い。例えば「抑うつ状態」は直接には測定できない。そこで直接測定できる現象を複数集め,その評 価の総体をもって測定したい事象を表していると考える。例えば EPDS には 10 項目が準備されており, 第 1 項目は「興味の喪失」,第 3 項目は「自責感」,第 4 項目は「浮動性不安」,第 7 項目は「不眠」 を訊くように編集されている。いずれも抑うつ状態を代表する体験であるが,どれかひとつが抑うつ状態 そのものであるとは言い難い。そこで「抑うつ状態」という抽象的概念的現象の一部を表す(と考えられ る)具体的かつ測定可能な項目を複数集めて,その合算をもって「抑うつ状態」を観測しているとする。 これがメンタルヘルス領域の評価・測定方法の基本的考え方である。 ところで,「興味の喪失」,「自責感」,「浮動性不安」,「不眠」などは抑うつ状態を表している一 方で,抑うつ状態以外の理由でその値を上下する。パニック障害があり「浮動性不安」が強くなるかもし れないが,パニック障害が理由で「自責感」が強くなることはあまりない。各種の精神疾患や環境のスト レス(例:夜間の騒音)で「不眠」が起こることも多い。つまり,抑うつ状態を評価するために集めた 10 個の項目は,その一部が抑うつ状態の程度で規定されているが,他の(多種多様の)要因でも規定されて いる。直接測定する項目に着目すれば,それは「テストが測ろうとしている抽象的現象」と「他の(多種 多様の)要因」の 2 つから規定されていることになる。後者を誤差 (error) と呼ぶ。 図 7-6. 内的整合性

(33)

これをイメージとして描いたのが図 7-6 である。上にある円形が「テストが測ろうとしている抽象的現 象」(ここでは抑うつ状態)である。これが 10 個の測定項目を(一部)規定している。四角が測定項目 である。円形から四角に向かう矢印が「規定している」ことを表している。一方,それぞれの四角の下側 に小さい丸が並んでいる。これが誤差である。誤差もまた,10 個の測定項目をそれぞれ(一部)規定して いる。それぞれの測定項目への誤差はそれぞれ独自である。 ところで EPDS の 10 項目は臨床的経験と直感で決めたものである。10 項目が均等に抑うつ状態を表 現している保証はない。あるいは 10 項目のうちいくつかは抑うつ状態との関連は薄いものかもしれない。 しかし,そもそも抑うつ状態を直接測定する方法がないため,10 項目を集めたという経緯がある。従って, どの項目が抑うつ状態の指標として良いか悪いかは絶対的なものではなく,相対的なものである。つまり, 選んだ 10 個の測定項目が似たものであり,異なる振る舞いを取る項目がないことが,抑うつ状態測定の 手段として信用できることのひとつの証拠となる。これをテストの信頼性 (reliability) という。

内的整合性 (internal consistency) ともいう。テストの信頼性(内的整合性)を測定する方法として (a) good-poor analysis (b) item-total correlation analysis (c) split-half correlation (d) Cronbach’s coefficient alpha がある。 1) Good-poor analysis そのテストの成績で最上位 4 分の 1 と最下位 4 分の 1 のケースについて,テストの各項目得点に有 意の差があるかを確認する。もし差がなければこの項目はテスト項目として目的にあっていないと判断す る。 サンプルデータの EPDS 合算点で見てみよう。4 分位を求めてみよう。 統計量 W2EPDSTALSM ‘WAVE 2 EPDS

度数 有効 233

欠損値 14

パーセンタイル 25 2.0000

50 5.0000

(34)

ここから EPDS 2 点以下のケースを最下位グループ,8 点以上を最上位グループとする。ここから

を選択実行する。結果は次のようになる。EPDS のすべての項目得点は最上位グループと最下位グループ

の間で平均に有意の差を見た(p < .05)。ここから,いずれの項目もテストの目的に合致していると考え

(35)

281

独立サンプルの検定 等分散性のための Levene の検定 2 つの母平均の差の検定 F 値 有意確率 t 値 自由度 有意確率 (両 側) 平均値の差 差の標準誤差 差の 95% 信頼区間 下限 上限 W2E1 等分散を仮定する。 189.711 .000 -6.753 125 .000 -.62121 .09199 -.80327 -.43916 等分散を仮定しない。 -7.027 65.000 .000 -.62121 .08841 -.79777 -.44465 W2E2 等分散を仮定する。 55.491 .000 -7.768 125 .000 -.83209 .10712 -1.04409 -.62009 等分散を仮定しない。 -8.067 68.363 .000 -.83209 .10314 -1.03789 -.62630 W2E4 等分散を仮定する。 18.934 .000 -19.184 125 .000 -1.82837 .09531 -2.01699 -1.63974 等分散を仮定しない。 -19.784 82.212 .000 -1.82837 .09241 -2.01220 -1.64453 W2E3 等分散を仮定する。 33.526 .000 -13.118 125 .000 -1.59364 .12148 -1.83407 -1.35321 等分散を仮定しない。 -13.446 95.367 .000 -1.59364 .11852 -1.82893 -1.35835 W2E5 等分散を仮定する。 139.218 .000 -11.648 125 .000 -1.28539 .11035 -1.50379 -1.06700 等分散を仮定しない。 -12.078 71.334 .000 -1.28539 .10642 -1.49757 -1.07322 W2E6 等分散を仮定する。 3.585 .061 -10.543 124 .000 -1.26734 .12021 -1.50527 -1.02941 等分散を仮定しない。 -10.561 123.987 .000 -1.26734 .12000 -1.50486 -1.02982 W2E7 等分散を仮定する。 141.861 .000 -7.391 125 .000 -.78788 .10660 -.99886 -.57690 等分散を仮定しない。 -7.690 65.000 .000 -.78788 .10245 -.99249 -.58327 W2E8 等分散を仮定する。 151.457 .000 -13.982 125 .000 -1.33209 .09527 -1.52065 -1.14353 等分散を仮定しない。 -14.514 69.273 .000 -1.33209 .09178 -1.51518 -1.14901 W2E9 等分散を仮定する。 152.169 .000 -6.561 125 .000 -.63636 .09699 -.82831 -.44442 等分散を仮定しない。 -6.827 65.000 .000 -.63636 .09321 -.82252 -.45021 W2E10 等分散を仮定する。 192.340 .000 -5.191 125 .000 -.46970 .09048 -.64877 -.29063 等分散を仮定しない。 -5.401 65.000 .000 -.46970 .08696 -.64336 -.29603

(36)

2) Item-total correlation analysis テストの総合点と各項目得点の相関を求める。総合点との相関が著しく低い項目があれば,それはテス トの目的に合致していないと判断できる。 サンプルデータの EPDS で見てみよう。 これを実行する。結果は 相関係数

W2EPDSTALSM ‘WAVE 2 EPDS

W2E1 Pearson の相関係数 .635** 有意確率 (両側) .000 N 233 W2E2 Pearson の相関係数 .607** 有意確率 (両側) .000 N 233 W2E4 Pearson の相関係数 .710** 有意確率 (両側) .000 N 233 W2E3 Pearson の相関係数 .643** 有意確率 (両側) .000 N 232 W2E5 Pearson の相関係数 .606** 有意確率 (両側) .000 N 233

(37)

W2E6 Pearson の相関係数 .582** 有意確率 (両側) .000 N 232 W2E7 Pearson の相関係数 .721** 有意確率 (両側) .000 N 233 W2E8 Pearson の相関係数 .792** 有意確率 (両側) .000 N 233 W2E9 Pearson の相関係数 .693** 有意確率 (両側) .000 N 233 W2E10 Pearson の相関係数 .540** 有意確率 (両側) .000 N 233 **. 相関係数は 1% 水準で有意 (両側) です。 いずれの項目と有意の相関を示した。ここから,いずれに項目もテストの目的に合致していると考えら れる。 3) split-half correlation テストの全項目が均質にある現象を評価しているのであれば,項目を 2 群に分けて,各群の合計点が相 互に高い相関があればテストの目的に合致していると考えられる。たとえば項目番号が奇数のもので第 1 グループ、偶数のもので第 2 グループし,各グループの合算点の相関をみてみる。 サンプルデータの EPDS で見てみよう。次のように奇数番号の項目合計点と偶数番号の項目合計点を求 める。 そうして両者の相関を求める。

(38)

結果は次のように出てくる。 相関係数 EPDS_GROUP1 EPDS_GROUP2 EPDS_GROUP1 Pearson の相関係数 1 .768** 有意確率 (両側) .000 N 232 231 EPDS_GROUP2 Pearson の相関係数 .768** 1 有意確率 (両側) .000 N 231 232 **. 相関係数は 1% 水準で有意 (両側) です。 奇数番号の項目合計点と偶数番号の項目合計点の相関は

r = .77

と高かった。ここから,いずれの項目 もテストの目的に合致していると考えられる。 split-half correlation は 2 群の分け方が多数存在するため判断が困難になることがある。

4) Cronbach’s coefficient alpha

上記の split-half correlation の欠点を補うのがクロンバックのアルファ係数である10。テストの項目数

𝑚

,テスト全体の分散を

σ

𝑥2,各項目の分散を

𝜎

𝑗2 として,アルファ係数は,

α =

𝑚

𝑚 − 1

(1 −

𝑚𝑗=1

𝜎

𝑗2

σ

𝑥2

)

で表される。

(39)

アルファ係数はゼロから 1.0 までの値を示す。高いほど信頼性があると評価できる。通常 0.7 から 0.8 を超える値があれば信頼性ありと評価できる。 サンプルデータの EPDS で見てみよう。「分析 (A)」をクリックしてプルダウン・メニューを出し,「尺 度 (A)」を選ぶ。ここで下位メニュー「信頼性分析 (R)」を選びクリックする。 「信頼性分析」のダイアログ・ボックスが出てくる。変数一覧表から EPDS の各項目得点を選び,クリッ クして色を変えてから,→ をクリックして変数名を「項目 (I)」に移動する。

(40)

ここで「統計量 (S)」をクリックする。

「信頼性分析:統計量」のダイアログ・ボックスが出たら,「項目間」の「相関係数 (L)」の前の□を クリックして ✓ をつける。その上で「続行」をクリックして「信頼性分析」のダイアログ・ボックスに 戻る。

(41)

「貼り付ける (P)」をクリックして下記のシンタックス文を出す。 これを選択実行する。結果は以下のようになる。 信頼性統計量 Cronbach のア ルファ 標準化された項 目に基づいた Cronbach のア ルファ 項目の数 .835 .856 10 10 項目から構成される EPDS 得点はそのアルファ係数が 0.84 であり,十分高い。ここから EPDS の 信頼性は確認できたといえる。 「信頼性分析:統計量」のダイアログ・ボックスで「記述統計」「項目を削除した時の尺度 (A)」を選 ぶと,ある特定の項目をテストからいったん除外した時のアルファ係数を算出する。全項目によるアルフ ァ係数よりこの値の方が高ければ,いったん除外された項目は異端の項目であり,全体とはそぐわないこ とが分かる。この場合,こうした特異的な項目をテストから削除することを検討したほうがよい。 サンプルデータでは次のような結果が出ている。いずれの項目を削除してもアルファ係数は 10 項目すべ て使用した際のそれ(0.835)を越えない。従って削除すべき項目はないと判断できる。

(42)

項目合計統計量 項目が削除され た場合の尺度の 平均値 項目が削除され た場合の尺度の 分散 修正済み項目合 計相関 重相関の 2 乗 項目が削除された 場合の Cronbach のアルファ W2E1 5.3506 18.298 .560 .532 .821 W2E2 5.2251 17.766 .505 .502 .823 W2E4 4.6017 15.536 .580 .360 .817 W2E3 4.6320 16.373 .496 .289 .827 W2E5 5.0043 16.952 .490 .276 .825 W2E6 4.1818 17.036 .432 .210 .833 W2E7 5.3247 17.446 .645 .544 .812 W2E8 4.9913 16.226 .718 .566 .801 W2E9 5.3723 18.122 .637 .558 .817 W2E10 5.4199 18.906 .476 .291 .828

2. α係数が低い場合の対応

本来,すべての測定項目が「テストが測ろうとしている抽象的現象」を均等に表していればアルファ係 数は高くなる.しかしある特定の測定項目が,他の測定項目と同様の働きを示していなければ全体のアル ファ係数は低くなる.SPSS で「項目を除外したときの尺度」の結果を見て,「項目が削除された場合の Cronbach のアルファ」が全体でのアルファ係数よりひどく高くなれば,この項目が全体のアルファを低 くしている原因だと考えられるのでこれをテストから削除することが推奨される.なお,α係数は尺度を 構成する測定項目数が小さいほど低くなることも考慮に入れるべきである。 研究者が理論的に意味のある項目を集めたつもりであるにも関わらず,α係数が十分高い値を示さない こともある。この場合はどう考えればよいのか。α係数がテストの信頼度を示すと考える前提(古典的テ スト理論)が満たされた時にα係数の値を認めることができるが,この前提に反する場合,α係数は低く なる11。その前提は, (1) 尺度全体が1因子構造を持っている (2) 観察変数の誤差間に相関がない (3) 測定が τ 等値である

(43)

尺度が1因子構造であることを確認するには探索的因子分析を行い,それに基づいて確認的因子分析に より1因子構造モデルが他のモデルに勝ることを確認できる。例えば 9 つの項目でひとつの潜在的概念 (例えば抑うつ状態)を測定しているとしよう。図のように,すべての項目がその概念に高い因子負荷量 を持っているのであれば,α係数は内的整合性を正しく表していると考えられる。 しかし,9 項目が実は 2 つの因子(潜在的概念)から成り立っているなら,ひとつひとつの概念を作っ ている項目どうしのα係数は高いが,9 項目全体のα係数は低めに出てしまう。こうした事柄は探索的因 子分析と確認的因子分析で検討できる。 観察変数の誤差間に相関がないことを確認するには確認的因子分析において誤差間にパス(共分散・相 関)を引かないモデルがそれらにパスを引いたモデルより劣らないことをみればよい。図のように独自因

(44)

子(誤差変数)の間に共分散を設定し(図ではすべてを表わしてはいない),この適合度を検討する。 測定がτ等値であるというのは,因子からの全観察変数へのパス係数が状況を意味している。図では潜 在的概念からすべての項目へのパス係数がほぼ一定の値を示している。これがτ等値である。こうであれ ばα係数は正しく内的整合性を示す。 一方,次のようなパス係数を示す場合,パス係数がばらついている。この場合,α係数は不当に低く出 てしまう。

(45)

確認的因子分析でパス係数がすべて等値であるという制約を置いたモデルが,制約を置かないモデルに 劣らないことを確認すればよい。 複数項目から構成された測定方法が,1因子であり,誤差変量間に相関を設定しないモデルが設定した モデルに劣るものでなく,かつパス係数がすべて等値というモデルが等値制約のないモデルに劣らないに もかかわらず,そのα係数が非常に低いということはほとんどないであろう。 こうした理論的背景を考慮して、次にα係数が低い場合の対応を考えてみよう。 (1)項目数が 5 以下で構成される尺度の場合 使用する全項目間の相関行列を求める。他の項目と著しく低い相関を示す項目があればそれを外して再 度α係数を計算する(SPSS のシンタックスを利用)。これで十分に高いαが得られればこの項目を外した 状態を当該尺度として用いる。 あるいは全項目を indicators とした確認的因子分析を実施し,適合度を求める。適合度が低ければ,修 正指標を利用して観察変数の誤差間に共分散(相関)を設定し,その上で確認的因子分析を再度実施する。 これで十分な適合度を得られれば,潜在変数から観察変数へのパス係数が有意であることを確認した上で, 全項目を含めたものを当該尺度として用いる。内定整合性は適合度をもって証明する。 (2)項目数が 6 以上で構成される尺度の場合 観察変数に対して探索的因子分析(因子抽出は最尤法、因子数は scree test で決定、いずれかの斜交回 転)を行う。探索的因子分析の結果,1因子構造であることが明らかになれば、「項目数が 5 以下で構成 される尺度の場合」と同一の手続きで作業を続ける。 探索的因子分析の結果,複数因子構造が確認できたら,それぞれの因子に高い因子負荷量 (> 0.3) を有 する観測変数のみを集めて下位尺度を構成する。複数の因子に高い因子負荷量を示す項目(観察変数)や いずれの因子にも高い因子負荷量を示さない項目(観察変数)についてはその原因(たとえば著しく高い

(46)

歪度や尖度)について十分な考察を行い,下位尺度から外すことも考慮する。各下位尺度を構成する項目 ごとに「項目数が 5 以下で構成される尺度の場合」と同一の手続きで作業を続ける。内定整合性は適合度 をもって証明する。

参照

関連したドキュメント

Assessment subcategories were: skills to predict life risk in older adults (seven skill items); skills to predict life risk in older adults based on the action of nursing care

7.A Ogura, K Hayakawa, T Miyati, F Maeda: The effect of susceptibility of gadolinium contrast media on Diffusion-weighted imaging and the apparent Diffusion coefficient. Dose MD,

(問5-3)検体検査管理加算に係る機能評価係数Ⅰは検体検査を実施していない月も医療機関別係数に合算することができる か。

東京都は他の道府県とは値が離れているように見える。相関係数はこう

Step 2: Reconstruction of the signal from the derived trace data by deconvolution (ill-posed)...

We investigate a version of asynchronous concurrent process calculus based on linear logic. In our framework, formulas are identified with processes and inference rules are

In recent years, its abuse has been spreading, especially among the youth in their 20's, and the number of arrests for cannabis abuse in 2004 reached a record high of 2,209 (108.7%

・関  関 関税法以 税法以 税法以 税法以 税法以外の関 外の関 外の関 外の関 外の関係法令 係法令 係法令 係法令 係法令に係る に係る に係る に係る 係る許可 許可・ 許可・