• 検索結果がありません。

~因子分析~

N/A
N/A
Protected

Academic year: 2021

シェア "~因子分析~"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

マーケティング・リサーチ特論 2020.06.10補助資料

~因子分析~

2020年度1学期: 水曜2限 担当教員: 石垣 司

1

因子分析

• 因子分析とは? Charles Spearman (1904)

– 多変量データの要因となっている隠れた因子を探る手法 – 変数間の相関構造から潜在因子を推定

– 心理学、社会科学で多用

• マーケティング・リサーチでは?

– ポジショニング、消費者行動理論の定量分析など

観測変数 観測変数

観測変数

・・・

因子

・・・

誤差 誤差

誤差

因子

データとして観測できない

潜在的な因子 2

因子分析のイメージ

• 潜在的な因子の探索や実証

– 例:300人分の中学校のテスト

(第3回主成分分析と同じ仮想データ)

生徒 No.

国語 x1

数学 x2

理科 x3

社会 x4

英語 x5

音楽 x6

体育 x7

1 83 60 55 81 90 50 93

2 70 80 78 80 55 44 59

3 50 90 95 70 80 80 49

4 60 44 44 99 78 73 30

5 57 80 80 50 67 64 59

6 55 65 70 65 67 30 70

7 80 73 66 46 55 58 88

8 98 40 50 88 99 93 54

9 55 77 88 40 89 888 97

・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・

国語 数学

英語 理科 社会

体育 音楽

• 直接観測できない潜在的な因子(構成概念)を探る

– 因子の探索 :データから因子を発見

– 理論の実証 :データが理論に合致するかの検証

進学意識

運動・感性力 数理能力

3

因子分析による知覚マップ

• 例:ビールのイメージ調査

因子負荷量行列(プロマックス回転)

因子1 因子2

ノド越し 0.000 0.981

香り 1.048 0.000

味 0.848 0.205

幸せ 0.921 0.102

ホッとする 1.027 0.000

爽快 0.000 0.987

• 知覚マップによるポジショニング

– 因子の解釈

• 因子1: “芳醇・安らぎ”軸

• 因子2: “キレ・爽快感”軸

– ポジショニング

• 市場内でのブランドの位置づけ

• ブランドの“顔”の明確化

因子1 因子2

Aドライ

Sエビス Kラガー

芳醇・安らぎ

キレ・爽快感

K淡麗 岡田、守口「マーケティングのデータ分析」朝倉書店(2010)の

分析用データ( 529人)を使用した分析結果

ブランド名 ノド越し 香り 幸せ ホッ 爽快 Aドライ 1628 1305 1435 1335 1275 1533 Kラガー 1439 1428 1443 1339 1342 1366 Sエビス 1508 1631 1638 1534 1486 1376 K淡麗 1443 1213 1261 1226 1243 1337 金麦 1224 1207 1197 1191 1219 1181 K一番 1571 1548 1589 1460 1456 1482 S黒ラベル 1419 1418 1417 1349 1354 1356 プレモル 1562 1599 1608 1544 1512 1493 A本生 1334 1195 1219 1220 1229 1294 Kのどごし 1385 1207 1209 1216 1235 1309

5段階尺度(0~4点)529人の合計得点

K一番

プレモル S黒ラベル A本生

Kのどごし

金麦

i= 1, … , N

k = 1, …, P

j = 1, …, M

4

(2)

因子分析と主成分分析の推定対象

• 因子分析

– 目的:潜在変数の推定

– モデル化の発想は逆。本来では、使い分けが必要

• しかしながら、得られる結果は同傾向になる場合が多い

• 使い分けの許容度は研究分野により様々

5 観測

変数 観測 変数

観測 変数

・・・

潜在 変数 潜在 変数

・・・

a

11

a

21

a

・・

ε

1

ε

2

ε

観測 変数 観測 変数

観測 変数

・・・

w

11

w

21

w

・・

合成 変数 合成 変数

・・・

Z

• 主成分分析

– 目的:変数の合成

因子分析モデル

• Notation

– 標準化得点: x

ik

(i = 1,…,N, k = 1,…,P )

• 各変数毎(“香り”や“幸せ”など )に値を標準化(平均 0, 分散 1 )

– 共通因子: f

j

( j = 1,…,M ) – 因子負荷量: a

kj

– 独自因子: ε

ik

(誤差項:共通因子では説明できない量)

– 例:ビールイメージ調査

• 6変数から2因子を抽出するモデル

1 11 1 12 2 1

2 21 1 22 2 2

3 31 1 32 2 3

4 41 1 42 2 4

5 51 1 52 2 5

6 61 1 62 2 6

i i

i i

i i

i i

i i

i i

x a f a f x a f a f x a f a f x a f a f x a f a f x a f a f

  

    

    

    

    

   



xi1: ノド越し xi2: 香り xi3: 味 xi4: 幸せ xi5: ホッとする xi6: 爽快

多くの書籍では、添え字iは記されてい ない。本講義では知覚マップを意識し、

添え字iを明示。どちらも本質は同じ。

6

因子分析モデル(行列表記)

• Notation

– 標準化した観測変数ベクトル: x

i

={x

i1

,…, x

iP

}

T

– 共通因子ベクトル: f ={f

1

,…, f

M

}

T

– 因子負荷量行列:

11 1𝑀

𝑃1 𝑃𝑀

– 誤差ベクトル: ε

i

={ε

i1

,…, ε

iP

}

T

• 観測データから A f を推定

因子分析モデル: i

7

因子分析モデルの仮定

• モデルの仮定

E[ f

j

] = 0, V [ f

j

] = 1

ε

ik

~ N(0, σ

k2

)

③ Cov[ f

j

, f

k

] = 0 ( j ≠ k )

④ Cov[ f

j

, ε

ik

] = 0

⑤ Cov[ ε

ij

, ε

ik

] = 0 ( j ≠ k )

ε

i1

ε

i2

ε

iP

観測変数xi2 観測変数xi1

観測変数xiP

・・・

因子 f

11

・・・

因子 f

MM

×

×

①標準化

×

εi1 εi2

εiP

観測変数xi2

観測変数xi1

観測変数xiP

・・・

因子f1

・・・

因子fM

8

(3)

因子負荷量 {a kj } の推定

• 基本的方針:母相関と標本相関のズレの最小化

– 主因子法、最小2乗法、最尤法など – 母相関係数行列 R

• 因子分析モデルに X の分散共分散行列

• 𝑹

1 𝑟

21

⋯ 𝑟

𝑃1

𝑟

21

1 ⋮

⋮ ⋱

𝑟

𝑃1

⋯ 1

𝑨𝜱𝑨

𝑇

𝜳

– 標本相関係数行列 S

• 観測データの X の分散共分散行列

• 𝑺

1 𝑠

21

⋯ 𝑠

𝑃1

𝑠

21

1 ⋮

⋮ ⋱

𝑠

𝑃1

⋯ 1

𝜱 𝐸 𝒇𝒇

𝑇

𝑰

𝑃

1 ⋱

1 , 𝜳 𝐸 𝜺

𝑖

𝜺

𝑖𝑇

𝜎

⋱ 𝜎

ノド越し 香り 幸せ ホッ 爽快 ノド越し1.000 0.621 0.772 0.718 0.626 0.978

香り 1.000 0.972 0.979 0.987 0.589

1.000 0.981 0.956 0.740

幸せ 1.000 0.983 0.691

ホッ 1.000 0.691

爽快 1.000

check!

仮定③よりE[ffT]は単位行列であり、

記号Φの導入は本講義では不必要。

しかし、次回で必要となるため導入。

9

最尤法による因子負荷量の推定

• 最尤法

– 対数尤度関数を最大化する ({

𝑘𝑗

})と ({

𝑘

})を推定

• 𝑨 と𝜳を交互に反復計算(Newton法や準Newton法が利用可)

– Rのfactanal関数のデフォルト設定は最尤法

– 推定結果の例:

• 因子数 2 と設定

多変量正規変数xi xi~ Np(0, R=AA+Ψ) xiの同時密度関数 f(xi) =

𝟐𝝅𝑵 |R|exp 𝒙i𝑇R 𝒙i

{xi}の対数尤度関数L(R|{xi}) = log∏ f(xi)= -𝟐 𝑃log 2𝜋 log |R| 𝑡𝑟 R 𝑺

因子負荷量行列(プロマックス回転)

因子1 因子2

ノド越し 0.000 0.981

香り 1.048 0.000

味 0.848 0.205

幸せ 0.921 0.102

ホッとする 1.027 0.000

爽快 0.000 0.987

因子の解釈

10

因子の回転

• 回転の不定性

– 因子負荷量行列は一意に決まらない (non-uniqueness)

– 行列 B の選択次第で、解の組み合わせは無数に存在

• 結果をより解釈しやすいように軸を回転

– 直交回転(直交軸による回転)

• 代表例:プロマックス回転

– 斜交回転(斜交軸による回転)

• 代表例:バリマックス回転

fg へ変換する正則行列 B を考える ( g = Bf )

C = AB

-1

となる行列 C を考える

Af = AB

-1

Bf Af = Cg

AC へ、fg へ置き換えても、因子分析モデルは成立

11

直交回転と斜交回転の例

• 推定された因子負荷量

– 初期解

• 因子間の違いがわかりにくい

– 直交解

(バリマックス回転)

• 因子間の違いが分かりやすい

– 斜交解

(プロマックス回転)

• 直交解よりも違いが鮮明

※因子間の相関を認めているため

(仮定③を緩和している)

因子負荷量行列(最尤法:初期解)

因子1 因子2

ノド越し 0.848 0.525

香り 0.940 -0.335

0.987 -0.125

幸せ 0.971 -0.201

ホッとする 0.936 -0.318

爽快 0.820 0.538

因子負荷量行列(プロマックス回転)

因子1 因子2 ノド越し 0.000 0.981

香り 1.048 0.000

0.848 0.205

幸せ 0.921 0.102

ホッとする 1.027 0.000

爽快 0.000 0.987

因子負荷量行列(バリマックス回転)

因子1 因子2 ノド越し 0.371 0.926

香り 0.956 0.288

0.869 0.485

幸せ 0.901 0.414

ホッとする 0.943 0.299

爽快 0.341 0.920

因子2

ノド越し

因子1

【因子負荷量のプロット】

爽快

ホッとする 幸せ 香り

初期解 バリマックス解 プロマックス解

12

(4)

因子得点の推定

• 因子得点 {f ij }

– 各 i 毎の共通因子の値

• 例:知覚マップの各ブランドの座標点

• Notation:

𝑨, 𝑹, 𝒇: 推定された因子負荷行列、相関係数行列、因子得点

– 推定法の例1: 回帰法

Thurstone, L. L. (1935)

• 平均2乗誤差MSE 𝒇, 𝒇 ≡ E[(𝒇 - 𝒇)

T

(𝒇 - 𝒇)]の最小化

• 推定量 𝒇

𝑖

A

𝑇

𝑹 x

i

– 推定法の例 2 : Bartlett 法

Bartlett, M. S. (1937)

• 尤度関数の最大化(独自因子の最小化)

• 推定量 𝒇

𝑖

A

𝑇

𝑹 A A

𝑇

𝑹 x

i

check!

check!

13

推定法・回転法による結果の違い

-2 -1 0 1 2 3

-2-10123

Factor1

Factor2

ドライ

Kラガー Sエビス K淡麗

金麦 K一番

S黒ラベル プレモル A本生

Kのどごし

-0.5 0.0 0.5 1.0

-0.50.00.51.0

ノド越し

香り 幸せ

ホッ 爽快

[斜交回転(プロマックス)、回帰法]

-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

-2.0-1.5-1.0-0.50.00.51.01.5

Factor1

Factor2

Aドライ

Kラガー Sエビス K淡麗

金麦

K一番

S黒ラベル プレモル

A本生 Kのどごし

-1.0 -0.5 0.0 0.5 1.0

-1.0-0.50.00.51.0

ノド越し

香り 幸せ

ホッ 爽快

[斜交回転(プロマックス)、Bartlett法]

-1 0 1 2

-1012

Factor1

Factor2

Aドライ

Kラガー Sエビス K淡麗

金麦 K一番

S黒ラベル プレモル

A本生 Kのどごし

-0.5 0.0 0.5 1.0

-0.50.00.51.0

ノド越し

香り 幸せ ホッ 爽快

[直交回転(バリマックス)、回帰法]

-1 0 1 2

-1012

Factor1

Factor2

Aドライ

Kラガー Sエビス K淡麗

金麦 K一番

S黒ラベル プレモル

A本生 Kのどごし

-0.5 0.0 0.5 1.0

-0.50.00.51.0

ノド越し

香り 幸せ

ホッ 爽快

-0.4 -0.2 0.0 0.2 0.4 0.6

-0.4-0.20.00.20.40.6

PC1

PC2

Aドライ

Kラガー

Sエビス

K淡麗

金麦 K一番

S黒ラベル

レモル A本生

Kのどごし

-500 0 500

-5000500

ノド越し

香り味幸せホッ 爽快

[主成分分析]

←: 因子負荷量 黒字: 因子得点 [直交回転(バリマックス)、Bartlett法]

14

Rでの実行例

• 4 ページ目のデータを利用

#データの入力

Data = read.csv("beer.csv",header=T) Beer = Data[,2:ncol(Data)]

rownames(Beer) = Data[,1]

#バリマックス回転+回帰法 FAvarimax = factanal(Beer, factors=2,  rotation="varimax", scores = "regression") biplot(FAvarimax$scores,FAvarimax$loadings)

#プロマックス回転+回帰法、

FApromax = factanal(Beer, factors=2,  rotation="promax", scores = "regression") biplot(FApromax$scores,FApromax$loadings)

#バリマックス回転+Bartlett法 FAvarimax2 = factanal(Beer, factors=2,  rotation="varimax", scores = "Bartlett") biplot(FAvarimax2$scores,FAvarimax2$loadings)

#プロマックス回転+Bartlett法、

FApromax2 = factanal(Beer, factors=2,  rotation="promax", scores = "Bartlett") biplot(FApromax2$scores,FApromax2$loadings)

15

因子分析の流儀

• 探索的因子分析

– あらかじめ因子数を決定しない分析 – 合理的基準で因子数を決定

• 固有値基準、プロット法、累積寄与率

– 帰納的データ分析

• 検証的因子分析

– あらかじめ因子数が分かっている場合の分析 – なんらかの理論に基づき因子数が既知

• 心理学的知見など

– 理論の検証アプローチ

16

(5)

演習問題

• あなたはビール業界のマーケティング担当者である。以下の問に 答えなさい

1. ビールのアンケートデータを用いて因子分析を行い、Rのbiplot 関数を用いて、知覚マップを作成しなさい。ここでは、

1.バリマックス回転+回帰法、2.バリマックス回転+Bartlet法、3.

プロマックス回転+回帰法、4.プロマックス回転+Bartlet法の4 つの知覚マップを作製しなさい。

2. その 4 つの知覚マップの中から一つを選び、全体のブランドのポ ジショニングを議論しなさい。また、なぜその知覚マップを選んだ のか理由を説明しなさい。

17

参照

関連したドキュメント

喫煙者のなかには,喫煙の有害性を熟知してい

現行選挙制に内在する最大の欠陥は,最も深 刻な障害として,コミュニティ内の一分子だけ

わからない その他 がん検診を受けても見落としがあると思っているから がん検診そのものを知らないから

この項目の内容と「4環境の把 握」、「6コミュニケーション」等 の区分に示されている項目の

3いこーよ協力! 非認知能力を育む「3~6歳児のあそび図鑑」発売 https://iko-yo.net/articles/5848

それから 3

① Google Chromeを開き,画面右上の「Google Chromeの設定」ボタンから,「その他のツール」→ 「閲覧履歴を消去」の順に選択してください。.

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google