• 検索結果がありません。

Microsoft PowerPoint _R勉強会ichikura.ppt [互換モード]

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft PowerPoint _R勉強会ichikura.ppt [互換モード]"

Copied!
51
0
0

読み込み中.... (全文を見る)

全文

(1)

公益社団法人日本心理学会 第4回「心理・医学系研究者のためのRによる統計学の研究会」 第4回 心理 医学系研究者のためのRによる統計学の研究会」

初心者による初心者のための

探索的

分析

探索的因子分析

東京医科歯科大学医歯学総合研究科

東京医科歯科大学医歯学総合研究科

博士課程1年 市倉加奈子

(ichikura lppm@tmd ac jp) ([email protected]

(2)

本日のMENU

本日のMENU

1. 探索的因子分析とは

2. 探索的因子分析の原理

3. 探索的因子分析の手順

4. 「データ解析環境R」による探索的

因子分析の手順

(3)

本日のMENU

本日のMENU

1. 探索的因子分析とは

2. 探索的因子分析の原理

3. 探索的因子分析の手順

4. 「データ解析環境R」による探索的

因子分析の手順

(4)

探索的因子分析とは

探索

分析

観測される一連の変数から直接観察すること

観測

変数

直接観察す

のできない因子(潜在変数)を見出す方法

探索的因子分析 Exploratory Factor Analysis

⇒直交解では因子パターン 独自性 斜交解

⇒直交解では因子パタ ン、独自性、斜交解

では因子パターン、独自性、因子間相関を

自由

母数

として行う因子分析

母数

として行う因子分析

確認的因子分析 Confirmatory Factor Analysis

実質科学的知見をもと

子パタ

⇒実質科学的知見をもとに、因子パターン、

独自性、因子間相関を

固定母数または制約母

とし 行う分析

として行う分析

(5)

探索的因子分析とは

探索

分析

観測される一連の変数から直接観察すること

自由に値を取りうる未知な母数(母集団に固有

観測

変数

直接観察す

のできない因子(潜在変数)を見出す方法

自由に値を取りうる未知な母数(母集団に固有の定数)のことで、自分の仮定したモデルにお いて どのような値をとるか全く分からない場合

探索的因子分析 Exploratory Factor Analysis

⇒直交解では因子パターン 独自性 斜交解

いて、どのような値をとるか全く分からない場合 に用いる。

⇒直交解では因子パタ ン、独自性、斜交解

では因子パターン、独自性、因子間相関を

自由

母数

として行う因子分析

母数

として行う因子分析

確認的因子分析 Confirmatory Factor Analysis

実質科学的知見をもと

子パタ

⇒実質科学的知見をもとに、因子パターン、

独自性、因子間相関を

固定母数または制約母

とし 行う分析

として行う分析

(6)

探索的因子分析とは

探索

分析

探索的因子分析では・・・

説明変数 1 説明変数 2 説明変数 1 目的変数 1 目的変数 2 目的変数 3 目的変数 1 目的変数 2 目的変数 3 独自因子 1 独自因子 1 独自因子 1 独自因子 1 独自因子 1 独自因子 1 1 1 1 1 1 1 何個の共通因子を持 た 何個の共通因子を持った モデルが適切かを検討

(7)

探索的因子分析とは

探索

分析

確認的因子分析では・・・

説明変数 1 説明変数 2 説明変数 1 説明変数 2 目的変数 1 目的変数 2 目的変数 3 目的変数 1 目的変数 2 目的変数 3 独自因子 1 独自因子 1 独自因子 1 独自因子 1 独自因子 1 独自因子 1 1 1 1 1 1 1 どのような共通因子の影響性を持 た どのような共通因子の影響性を持った モデルが適切かを検討

(8)

本日のMENU

本日のMENU

1. 探索的因子分析とは

2. 探索的因子分析の原理

3. 探索的因子分析の手順

4. 「データ解析環境R」による探索的

因子分析の手順

(9)

探索的因子分析の原理

探索

分析

目的:「共通因子」を見つけだすこと

目的:「共通因子」を見つけだすこと

説明変数 1 説明変数 2 目的変数 目的変数 目的変数 目的変数 目的変数 1 2 3 4 5 独自因子 1 独自因子 2 独自因子 3 独自因子 4 独自因子 5

(10)

探索的因子分析の原理

探索

分析

共通因子 説明変数 1 説明変数 2 a11 a21 a31 a41 a51 a12 a22 a 32 a42 a52 因子負荷量 観測値 目的変数 1 目的変数 2 目的変数 3 目的変数 4 目的変数 5 a41 a51 a32 1 2 3 4 5 独自因子 1 独自因子 2 独自因子 3 独自因子 4 独自因子 5 独自因子

(11)

探索的因子分析の原理

探索

分析

f1 文系能力 f2 理系能力 例) 因子負荷量: 共通因子の目的変数への影響性 f1 文系能力 f2 理系能力 a a31 a a 共通因子の目的変数への影響性 ※例)「理科」と「数学」にも多少は「文系能力」が影響 a11 a21 a31 a41 a51 a12 a22 a 32 a42 a52 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学

e

1

e

2

e

3

e

4

e

5 独自性 個別の独自因子の目的変数 の影響性 独自性:個別の独自因子の目的変数への影響性 ※例)「国語」「英語」「社会」の違いを規定

(12)

探索的因子分析の原理

探索

分析

f1 文系能力 f2 理系能力 f1 文系能力 f2 理系能力 a11 a21 a31 a42 a52 a11 a41 a51 a12 a22 a 32 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学

e

e

e

e

e

e

1

e

2

e

3

e

4

e

5

u

= a f + a f + e

u

1

= a

11

f

1

a

12

f

2

e

1 目的変数1 共通因子1の影響性 共通因子2の影響性 独自因子1

(13)

探索的因子分析の原理

探索

分析

u

= a f + a f + e

u

1

= a

11

f

1

a

12

f

2

e

1 目的変数1 共通因子1の影響性 共通因子2の影響性 独自因子1

u

2

= a

21

f

1

a

22

f

2

e

2

u

3

= a

31

f

1

a

32

f

2

e

3

u

4

= a

41

f

1

a

42

f

2

e

4

u

5

= a

51

f

1

a

52

f

2

e

5

(14)

探索的因子分析の原理

探索

分析

≪注意①≫主成分分析との違い

説明変数 1 説明変数 2 説明変数 1 説明変数 2 説明変数 3 1 2 3 目的変数 1 目的変数 2 目的変数 3 目的変数 主成分分析:観測値が独立変数 因子分析:観測値が従属変数

f = 

u

1

a

1

u

2

a

2

u

3

a

3

u

1

= a

11

f

1

+ a

12

f

2

+ e

1

u

2

= a

21

f

1

+ a

22

f

2

+ e

2

u

2

 a

21

f

1

+ a

22

f

2

+ e

2

u

3

= a

31

f

1

+ a

32

f

2

+ e

3

(15)

探索的因子分析の原理

探索

分析

≪注意②≫納得いくモデルが2つ得られたら・・・

説明変数 1 説明変数 2 目的変数 目的変数 目的変数 目的変数 目的変数 目的変数 1 目的変数 2 目的変数 3 目的変数 4 目的変数 5 研究者の主観(仮説)を重要視して選択する 説明変数 2 説明変数 1 説明変数 3 研究者の主観(仮説)を重要視して選択する 目的変数 目的変数 目的変数 目的変数 目的変数 目的変数 1 目的変数 2 目的変数 3 目的変数 4 目的変数 5

(16)

本日のMENU

本日のMENU

1. 探索的因子分析とは

2. 探索的因子分析の原理

3. 探索的因子分析の手続き

4. 「データ解析環境R」による探索的

因子分析の手順

(17)

探索的因子分析の手続き

探索

分析

① 因子の抽出

② 共通因子数の選定

③ 因子の回転

④ 各共通因子の意味の解釈

析結

精度

⑤ 分析結果の精度の確認

(18)

①因子の抽出

因子の抽出

とは:因子負荷量と独自因子の分散を推定 反復 収束 の速さ 推定誤差 の大きさ 計算 の容易さ の速さ の大きさ の容易さ 主因子法 × 大 易 ○ 遅 大 易 反復主因子法 ○ 遅 大 易 最小2乗法 ○ 速 大 難 最尤法 ○ 速 小 難 ※推定誤差の大きさは「正規分布」仮定時 ※推定誤差の大きさは「正規分布」仮定時

手計算 → 反復主因子法

ソフト

→ 最尤法

が好まれる

(19)

①因子の抽出

これらの抽出方法はどのようなことをしているのか? (1) 目的変数の標準化 f1 文系能力 f2 理系能力 (1) 目的変数の標準化 f1 文系能力 f2 理系能力 a11 a21 a31 a42 a52 「標準化」: 平均 = 0、標準偏差 = 1 になるように置換a11 a41 a51 a12 a22 a 32 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学

e

e

e

e

e

e

1

e

2

e

3

e

4

e

5

(20)

①因子の抽出

国語 英語 社会 理科 数学 あ 10 10 20 80 9010 10 20 80 9020 40 10 100 8030 20 10 90 10030 20 10 90 10090 80 70 20 3070 90 90 10 30100 100 80 20 2020 10 10 30 2030 20 10 10 3090 90 80 90 9080 90 100 70 90

標準化 : 

u

1

= (x

1

‐ M) / SD

(21)

①因子の抽出

国語 英語 社会 理科 数学 あ 1 26 1 18 0 72 0 74 0 93-1.26 -1.18 -0.72 0.74 0.93-0.97 -0.39 -0.98 1.26 0.640 69 0 92 0 98 1 00 1 23-0.69 -0.92 -0.98 1.00 1.231.03 0.66 0.57 -0.84 -0.820.46 0.92 1.08 -1.10 -0.821.31 1.18 0.82 -0.84 -1.11-0.97 -1.18 -0.98 -0.58 -1.11-0.69 -0.92 -0.98 -1.10 -0.821.03 0.92 0.82 1.00 0.930.74 0.92 1.34 0.47 0.93

(22)

①因子の抽出

u1国語 u5数学 あ -1.26 ・・・ 0.93 ・ ・ ・ ・ ・ ・ ・ ・ せ 0.74

・・・ 0.93 u1国語 u5数学

u1国語 u5数学 あ a11fあ1 + a12 fあ2 + e1 ・・・ a51fあ1 + a52 fあ2 + e1 ・ ・ ・・ ・・ ・・ ・ ・ ・ ・ せ a11fせ1 + a12 fせ2 + e1 ・・・ a51fせ1 + a52 fせ2 + e1 この等式が成り立つはず!!

(23)

①因子の抽出

(2) 各変数の平均と標準偏差を仮定 f1 文系能力 f2 理系能力 a11 a21 a31 a12 a22 a a42 a52 平均 = 0 標準偏差 = 1 であると仮定 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 a41 a51 a12 a22 a 32 平均 = 0、標準偏差 = 1 であると仮定 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 平均 = 0、標準偏差 = d2 であると仮定

e

1

e

2

e

3

e

4

e

5

(24)

①因子の抽出

(2) 各変数の平均と標準偏差を仮定 f1 文系能力 f2 理系能力

つまり

「因子の抽出」

とは

a11 a21 a31 a12 a22 a a42 a52 平均 = 0 標準偏差 = 1 であると仮定

「因子の抽出」

とは・・・

u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 a41 a51 a12 a22 a 32 平均 = 0、標準偏差 = 1 であると仮定

①因子負荷量

a

n

d

u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 平均 = 

②独自因子の分散

0、標準偏差 = d2 であると仮定

d

n

e

1

e

2

e

3

を求めること

e

4

e

5

(25)

①因子の抽出

(3) 変数間の相関を仮定 f1 文系能力 f2 理系能力 共通因子と独自因子は相関なしと仮定 a11 a21 a31 a12 a22 a a42 a52 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 a41 a51 a12 a22 a 32 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 独自因子同士は相関なしと仮定

e

1

e

2

e

3

e

4

e

5

(26)

①因子の抽出

(3) 変数間の相関を仮定 f1 文系能力 f2 理系能力 a11 a21 a31 a12 a22 a a42 a52 共通因子同士が相関なしと仮定:直交回転モデル u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 a41 a51 a12 a22 a 32 共通因子同士が相関なしと仮定:直交回転モデル 共通因子同士が相関ありと仮定:斜交回転モデル u1 国語 u2 英語 u3 社会 u4 理科 u5 数学 ※研究者の「主観(仮説)」が重要! ※一般的には、共通因子同士が全く相関なしとは考えにくい

e

1

e

2

e

3

e

4

e

5

(27)

①因子の抽出

(4) 因子負荷量・独自因子の分散の算出 1 r12 r13 r14 r15 r21 1 r23 r24 r25

R = AA’ + D

r31 r32 1 r34 r35 r41 r42 r43 1 r45 ※R:相関行列 ※A:因子負荷行列 r51 r52 r53 r54 1 a a ※A:因子負荷行列 ※D:分散の対角行列 d21 0 0 0 0 0 d22 0 0 0 2 a11 a12 a21 a22 a11 a21 a31 a41 a51

0 0 d23 0 0 0 0 0 d24 0 0 0 0 0 d2 a31 a32 a41 a42 11 21 31 41 51 a12 a22 a32 a42 a52

0 0 0 0 d25 a51 a52

(28)

①因子の抽出

(4) 因子負荷量・独自因子の分散の算出 国語 英語 社会 理科 数学 国語 1 95 91 30 22 国語 1 .95 .91 -.30 -.22 英語 .95 1 .95 -.21 -.15 91 95 1 23 10 社会 .91 .95 1 -.23 -.10 理科 -.30 -.21 -.23 1 .93 数学 -.22 -.15 -.10 .93 1 目的変数間の相関を求める

(29)

①因子の抽出

(4) 因子負荷量・独自因子の分散の算出 1 0.95 0.91 -0.3 -0.2 0 95 1 0 95 0 2 0 2 0.95 1 0.95 -0.2 -0.2 0.91 0.95 1 -0.2 -0.1 -0.3 -0.2 -0.2 1 0.93 a a -0.2 -0.2 -0.1 0.93 1 d21 0 0 0 0 0 d22 0 0 0 2 a11 a12 a21 a22 a11 a21 a31 a41 a51

0 0 d23 0 0 0 0 0 d24 0 0 0 0 0 d2 a31 a32 a41 a42 11 21 31 41 51 a12 a22 a32 a42 a52

0 0 0 0 d25 a51 a52 計算していくと・・・

(30)

①因子の抽出

(4) 因子負荷量・独自因子の分散の算出 a11 a12 a21 a22 .932 .222 .938 .328

a31 a32 a41 a42 .898 .321 -.520 .813 a51 a52 -.440 .864

異なる抽出方法で再分析

・異なる抽出方法で再分析

・共通因子数の変更 観測変数の減少

共通因子数の変更、観測変数の減少

・異常値の削除

異常値

削除

などの方法でエラーが出なくなるまでモデルを模索

(31)

②共通因子数の推定

推定

•ガッドマン・ルール(カイザーガットマン基準) 相関行列 固有値が 固 相関行列の1より大きなものの個数固有値が を 子数とする 固 有値 を因子数とする 因子の番号

(32)

②共通因子数の推定

推定

•スクリー法(スクリープロット基準) 相関行列の固有値の 固 相関行列の固有値の 大きさの変化がなだらか になる直前の固有値番号 固 有値 になる直前の固有値番号 を因子数とする 因子の番号

(33)

③因子の回転

回転

≪回転の種類≫

≪回転の種類≫

直交回転

斜交回転

直交回転

バリマ クス法

斜交回転

プロマ クス法 • バリマックス法 • コーティマックス法 • プロマックス法 • コーティミン法 コ ティマックス法 • バイティコーティマックス法 コ ティミン法 • バイコーティミン法 • コバリミン法

(34)

③因子の回転

回転

1.000 国語 .800 .900 英語 社会 .600 .700 理科 数学 .400 .500 .200 .300 .000 .100 ‐ 600.600 ‐ 400.400 ‐ 200.200 .000000 .200200 .400400 .600600 .800800 1 0001.000 1 2001.200

(35)

③因子の回転

回転

1.000 国語 共通因子の意味を解釈しやすく .800 .900 英語 社会 するために軸を回転させる .600 .700 理科 数学 .400 .500 .200 .300 .000 .100 ‐ 600.600 ‐ 400.400 ‐ 200.200 .000000 .200200 .400400 .600600 .800800 1 0001.000 1 2001.200

(36)

③因子の回転

回転

国語

バリマックス回転で見てみると・・・

国語 英語 社会 1.000 1.200 社会 理科 数学 .800 1.000 数学 400 .600 .200 .400 200 .000 ‐.400 ‐.200 .000 .200 .400 .600 .800 1.000 1.200 ‐.400 ‐.200

(37)

③因子の回転

回転

第1共通因子 第2共通因子 国語 932 222 国語 .932 .222 英語 .938 .328 社会 898 321

回転

社会 .898 .321 理科 -.520 .813 数学

回転

数学 -.440 .864 第1共通因子 第2共通因子 第1共通因子 第2共通因子 国語 .943 -.170 英語 991 - 076 英語 .991 -.076 社会 .952 -.066 理科 150 954 理科 -.150 .954 数学 -.056 .968

(38)

④各共通因子の意味の解釈

④各

解釈

第1共通因子 第2共通因子 国語 943 170 国語 .943 -.170 英語 .991 -.076 社会 .952 -.066 理科 -.150 .954 数学 -.056 .968 f1 文系能力 f2 理系能力 .943 .991 .952 -.150 -.056 -.170 -.076 -.066 .954 .968 u1 国語 u2 英語 u3 社会 u4 理科 u5 数学

(39)

⑤分析結果の精度の確認

⑤分析結果

精度

確認

第1共通因子 第2共通因子 国語 943 170 国語 .943 -.170 英語 .991 -.076 社会 .952 -.066 理科 -.150 .954 数学 -.056 .968 第1共通因子の寄与率 = (b2 11+ b221 + b231 + b241 + b251) ×100 / 5 = 56.065 第2共通因子の寄与率 = (b2 12+ b222 + b232 + b242 + b252) ×100 / 5 = 37.723 累積寄与率 = 56.056 + 37.723 = 93.779 (%)

(40)

本日のMENU

本日のMENU

1. 探索的因子分析とは

2. 探索的因子分析の原理

3. 探索的因子分析の手続き

4. 「データ解析環境R」による探索的

因子分析の手順

(41)

「R」による探索的因子分析の手順

国語 英語 社会 理科 数学

探索

分析

10 10 20 80 9020 40 10 100 8030 20 10 90 10090 80 70 20 3090 80 70 20 3070 90 90 10 30100 100 80 20 20100 100 80 20 2020 10 10 30 2030 20 10 10 3030 20 10 10 3090 90 80 90 9080 90 100 70 9080 90 100 70 90

(42)

「R」による探索的因子分析の手順

探索

分析

データの読み込み

setwd("G:/r_toukei")

dat <- read table("exercise r toukei csv" sep=" " header=T dat < read.table( exercise_r_toukei.csv , sep , , header T, na=".") library(psych) library(psych) ①ハ ドディスク「G」の中にある ①ハードディスク「G」の中にある フォルダ「r_toukei」にアクセス ② イ 「 ②csvファイル「exercise_r_tou kei」のデータを行列datと置く ③パッケージ「psych」を呼び出す

(43)

「R」による探索的因子分析の手順

探索

分析

因子分析の実行 (2因子と仮定) factanal(x=dat,factors=2) ※何も指定しなければ、最尤法・バリマックス回転 ← 独自性 ④各目的変数の「独自性」

(44)

「R」による探索的因子分析の手順

探索

分析

因子分析の実行 (2因子と仮定) factanal(x=dat,factors=2) ⑤共通因子1と共通因子2 のそれぞれの因子負荷量 を算出 ← 因子負荷量 因子負荷量が0に近すぎる 因子負荷量 近すぎる と表示されない!

(45)

「R」による探索的因子分析の手順

探索

分析

因子分析の実行 (2因子と仮定) factanal(x=dat,factors=2) ← 因子寄与率 ← 累積因子寄与率 ⑥因子寄与率、累積因子寄与率を算出 ← 適合度検定のp値 ⑥因 寄 率、累積因 寄 率を算 ⑦適合度の検定

(46)

「R」による探索的因子分析の手順

探索

分析

因子負荷量をすべて表示 print(factanal(x=dat,factors=2),cutoff=0) 因子負荷量が0以上の値は 因子負荷量 すべて表示 ← 因子負荷量

(47)

「R」による探索的因子分析の手順

探索

分析

共通性の算出 communality <- 1-factanal(x=dat,factors=2)$uniquenesses ← 共通性 ⑧共通性を算出 (共通性が高い=共通因子で説明できる部分が大きい)

(48)

「R」による探索的因子分析の手順

探索

分析

共通因子数の推定 evres <- eigen(cor(dat)) evres$value $ ↑ 固有値の算出 plot(evres$value, type="b") スクリープロット → ⑨固有値を算出 ⑩スクリ プロ トを ⑩スクリープロットを 作図

(49)

「R」による探索的因子分析の手順

探索

分析

ちなみに・・・

factanal(x=dat,factors=2, rotation="promax")

(50)

「私の」参考文献

」参考

①マンガでわかる統計学【因子分析編】

(オーム社) →統計や因子分析に対する抵抗感を下げる →統計や因子分析に対する抵抗感を下げる →行列の計算方法や専門用語を勉強

②共分散構造分析【疑問編】

(朝倉書店)

②共分散構造分析【疑問編】

(朝倉書店) →探索的因子分析と確認的因子分析の違いを勉強 因子分析に関連した専門用語を勉強 →因子分析に関連した専門用語を勉強

SPSSで学ぶ医療系多変量データ解析

(東京図書) 因子分析 根本的な原理と基本方程式 理解 →因子分析の根本的な原理と基本方程式の理解

④心理統計学の基礎

(有斐閣アルマ) →因子分析の手順と数式の理解

SASによる統計解析【基礎統計編】

(科学技術出版) →因子抽出法と因子数の決定に関する原理の理解 http://www.sigmath.es.osaka-u.ac.jp/~kano/old/lecture/u_graduate/multivariate/factor.pdf

(51)

「私の」参考文献

」参考

Using Multivariate Statistics

(Pearson International Edition)

→良く分からない・・・作った資料と相違がないか確認 →良く分からない・・・作った資料と相違がないか確認

⑦データ解析環境「

R」

(工学者) 「R」のデ タ ハンドリングを勉強 →「R」のデータ・ハンドリングを勉強

The R Tips

-データ解析環境Rの基本技・グラフィックス活用集-(オーム社) 「 デ タ ド グを勉強 →「R」のデータ・ハンドリングを勉強

⑨「

R」によるやさしい統計学

(オーム社) →「R」による因子分析のプログラムを確認

参照

関連したドキュメント

国民の「知る自由」を保障し、

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

LLVM から Haskell への変換は、各 LLVM 命令をそれと 同等な処理を行う Haskell のプログラムに変換することに より、実現される。

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

(自分で感じられ得る[もの])という用例は注目に値する(脚注 24 ).接頭辞の sam は「正しい」と

ERROR  -00002 認証失敗または 圏外   クラウドへの接続設定及びア ンテ ナ 接続を確認して ください。. ERROR  -00044 回線未登録または

られる。デブリ粒子径に係る係数は,ベースケースでは MAAP 推奨範囲( ~ )の うちおよそ中間となる