～因子分析～

(1)

マーケティング・リサーチ特論 2020.06.10補助資料

～因子分析～

2020年度1学期：水曜２限担当教員：石垣司

1

因子分析

• 因子分析とは？ Charles Spearman (1904)

– 多変量データの要因となっている隠れた因子を探る手法 – 変数間の相関構造から潜在因子を推定

– 心理学、社会科学で多用

• マーケティング・リサーチでは？

– ポジショニング、消費者行動理論の定量分析など

観測変数観測変数

観測変数

・・・

因子

・・・

誤差誤差

誤差

因子

データとして観測できない

潜在的な因子 ²

因子分析のイメージ

• 潜在的な因子の探索や実証

– 例：300人分の中学校のテスト

（第3回主成分分析と同じ仮想データ）

生徒 No.

国語 x1

数学 x2

理科 x3

社会 x4

英語 x5

音楽 x6

体育 x7

1 83 60 55 81 90 50 93

2 70 80 78 80 55 44 59

3 50 90 95 70 80 80 49

4 60 44 44 99 78 73 30

5 57 80 80 50 67 64 59

6 55 65 70 65 67 30 70

7 80 73 66 46 55 58 88

8 98 40 50 88 99 93 54

9 55 77 88 40 89 888 97

・・・・・・・・・・・・・・・・・・・・・・・・

国語数学

英語理科社会

体育音楽

• 直接観測できない潜在的な因子（構成概念）を探る

– 因子の探索：データから因子を発見

– 理論の実証：データが理論に合致するかの検証

進学意識

運動・感性力数理能力

3

因子分析による知覚マップ

• 例：ビールのイメージ調査

因子負荷量行列（プロマックス回転）

因子１因子２

ノド越し 0.000 0.981

香り 1.048 0.000

味 0.848 0.205

幸せ 0.921 0.102

ホッとする 1.027 0.000

爽快 0.000 0.987

• 知覚マップによるポジショニング

– 因子の解釈

• 因子1： “芳醇・安らぎ”軸

• 因子2： “キレ・爽快感”軸

– ポジショニング

• 市場内でのブランドの位置づけ

• ブランドの“顔”の明確化

因子１因子２

Aドライ

Sエビス Kラガー

芳醇・安らぎ

キレ・爽快感

K淡麗岡田、守口「マーケティングのデータ分析」朝倉書店(2010)の

分析用データ( 529人)を使用した分析結果

ブランド名ノド越し香り味幸せホッ爽快 Aドライ 1628 1305 1435 1335 1275 1533 Kラガー 1439 1428 1443 1339 1342 1366 Sエビス 1508 1631 1638 1534 1486 1376 K淡麗 1443 1213 1261 1226 1243 1337 金麦 1224 1207 1197 1191 1219 1181 K一番 1571 1548 1589 1460 1456 1482 S黒ラベル 1419 1418 1417 1349 1354 1356 プレモル 1562 1599 1608 1544 1512 1493 A本生 1334 1195 1219 1220 1229 1294 Kのどごし 1385 1207 1209 1216 1235 1309

5段階尺度（0~4点）529人の合計得点

K一番

プレモル S黒ラベル A本生

Kのどごし

金麦

i= 1, … , N

k = 1, …, P

j = 1, …, M

4

(2)

因子分析と主成分分析の推定対象

• 因子分析

– 目的：潜在変数の推定

– モデル化の発想は逆。本来では、使い分けが必要

• しかしながら、得られる結果は同傾向になる場合が多い

• 使い分けの許容度は研究分野により様々

5 観測

変数観測変数

観測変数

・・・

潜在変数潜在変数

・・・

a

₁₁

a

₂₁

a

_・・

ε

₁

ε

₂

ε

_・

観測変数観測変数

観測変数

・・・

w

₁₁

w

₂₁

w

_・・

合成変数合成変数

・・・

Z

• 主成分分析

– 目的：変数の合成

因子分析モデル

• Notation

– 標準化得点： x

_ik

(i = 1,…,N, k = 1,…,P )

• 各変数毎（“香り”や“幸せ”など）に値を標準化（平均 0, 分散 1 ）

– 共通因子： f

_j

( j = 1,…,M ) – 因子負荷量： a

_kj

– 独自因子： ε

_ik

（誤差項：共通因子では説明できない量）

– 例：ビールイメージ調査

• 6変数から2因子を抽出するモデル

1 11 1 12 2 1

2 21 1 22 2 2

3 31 1 32 2 3

4 41 1 42 2 4

5 51 1 52 2 5

6 61 1 62 2 6

i i

x a f a f x a f a f x a f a f x a f a f x a f a f x a f a f

  

    

    

    

    

   





xi1：ノド越し x_i2：香り x_i3：味 x_i4：幸せ x_i5：ホッとする x_i6：爽快

多くの書籍では、添え字iは記されていない。本講義では知覚マップを意識し、

添え字iを明示。どちらも本質は同じ。

6

因子分析モデル（行列表記）

• Notation

– 標準化した観測変数ベクトル： x

_i

={x

_i1

,…, x

_iP

}

^T

– 共通因子ベクトル： f ={f

₁

,…, f

_M

}

^T

– 因子負荷量行列：

¹¹ ^1𝑀

𝑃1 𝑃𝑀

– 誤差ベクトル： ε

_i

={ε

_i1

,…, ε

_iP

}

^T

• 観測データから A と f を推定

因子分析モデル： _i

7

因子分析モデルの仮定

• モデルの仮定

① E[ f

_j

] = 0, V [ f

_j

] = 1

② ε

_ik

~ N(0, σ

_k²

)

③ Cov[ f

_j

, f

_k

] = 0 ( j ≠ k )

④ Cov[ f

_j

, ε

_ik

] = 0

⑤ Cov[ ε

_ij

, ε

_ik

] = 0 ( j ≠ k )

ε

_i1

ε

_i2

ε

_iP

観測変数x_i2 観測変数x_i1

観測変数x_iP

・・・

因子 f

1₁

・・・

因子 f

M_M

②

× ^③

×

⑤

①標準化

× ^④

ε_i1 ε_i2

ε_iP

観測変数xi2

観測変数xi1

観測変数xiP

・・・

因子f₁

・・・

因子f_M

8

(3)

因子負荷量 {a _kj } の推定

• 基本的方針：母相関と標本相関のズレの最小化

– 主因子法、最小2乗法、最尤法など – 母相関係数行列 R

• 因子分析モデルに X の分散共分散行列

• 𝑹

1 𝑟

₂₁

⋯ 𝑟

_𝑃1

𝑟

₂₁

1 ⋮

⋮ ⋱

𝑟

_𝑃1

⋯ 1

𝑨𝜱𝑨

^𝑇

𝜳

– 標本相関係数行列 S

• 観測データの X の分散共分散行列

• 𝑺

1 𝑠

₂₁

⋯ 𝑠

_𝑃1

𝑠

₂₁

1 ⋮

⋮ ⋱

𝑠

_𝑃1

⋯ 1

𝜱 𝐸 𝒇𝒇

^𝑇

𝑰

_𝑃

1 ⋱

1 , 𝜳 𝐸 𝜺

_𝑖

𝜺

_𝑖^𝑇

𝜎

⋱ 𝜎

ノド越し香り味幸せホッ爽快ノド越し1.000 0.621 0.772 0.718 0.626 0.978

香り 1.000 0.972 0.979 0.987 0.589

味 1.000 0.981 0.956 0.740

幸せ 1.000 0.983 0.691

ホッ 1.000 0.691

爽快 1.000

check!

仮定③よりE[ff^T]は単位行列であり、

記号Φの導入は本講義では不必要。

しかし、次回で必要となるため導入。

9

最尤法による因子負荷量の推定

• 最尤法

– 対数尤度関数を最大化する ({

_𝑘𝑗

})と ({

_𝑘

})を推定

• 𝑨 と𝜳を交互に反復計算（Newton法や準Newton法が利用可）

– Rのfactanal関数のデフォルト設定は最尤法

– 推定結果の例：

• 因子数 2 と設定

多変量正規変数x_i x_i~ N_p(0, R=AA+Ψ) x_iの同時密度関数 f(x_i) =

𝟐𝝅^𝑵 |R|exp 𝒙i𝑇R 𝒙i

{xi}の対数尤度関数L(R|{xi}) = log∏ f(xi)= -_𝟐 𝑃log 2𝜋 log |R| 𝑡𝑟 R 𝑺

因子１因子２

ノド越し 0.000 0.981

香り 1.048 0.000

味 0.848 0.205

幸せ 0.921 0.102

ホッとする 1.027 0.000

爽快 0.000 0.987

因子の解釈

10

因子の回転

• 回転の不定性

– 因子負荷量行列は一意に決まらない（non-uniqueness）

– 行列 B の選択次第で、解の組み合わせは無数に存在

• 結果をより解釈しやすいように軸を回転

– 直交回転（直交軸による回転）

• 代表例：プロマックス回転

– 斜交回転（斜交軸による回転）

• 代表例：バリマックス回転

• f を g へ変換する正則行列 B を考える ( g = Bf )

• C = AB

^-1

となる行列 C を考える

• Af = AB

^-1

Bf ⇒ Af = Cg

• A を C へ、f を g へ置き換えても、因子分析モデルは成立

11

直交回転と斜交回転の例

• 推定された因子負荷量

– 初期解

• 因子間の違いがわかりにくい

– 直交解

（バリマックス回転）

• 因子間の違いが分かりやすい

– 斜交解

（プロマックス回転）

• 直交解よりも違いが鮮明

※因子間の相関を認めているため

（仮定③を緩和している）

因子負荷量行列（最尤法：初期解）

因子１因子２

ノド越し 0.848 0.525

香り 0.940 -0.335

味 0.987 -0.125

幸せ 0.971 -0.201

ホッとする 0.936 -0.318

爽快 0.820 0.538

因子１因子２ノド越し 0.000 0.981

香り 1.048 0.000

味 0.848 0.205

幸せ 0.921 0.102

ホッとする 1.027 0.000

爽快 0.000 0.987

因子負荷量行列（バリマックス回転）

因子１因子２ノド越し 0.371 0.926

香り 0.956 0.288

味 0.869 0.485

幸せ 0.901 0.414

ホッとする 0.943 0.299

爽快 0.341 0.920

因子２

ノド越し

因子１

【因子負荷量のプロット】

爽快

ホッとする幸せ味香り

初期解バリマックス解プロマックス解

12

(4)

因子得点の推定

• 因子得点 {f _ij }

– 各 i 毎の共通因子の値

• 例：知覚マップの各ブランドの座標点

• Notation:

𝑨, 𝑹, 𝒇: 推定された因子負荷行列、相関係数行列、因子得点

– 推定法の例1：回帰法

Thurstone, L. L. (1935)

• 平均2乗誤差MSE 𝒇, 𝒇 ≡ E[(𝒇 - 𝒇)

^T

(𝒇 - 𝒇)]の最小化

• 推定量 𝒇

_𝑖

A

^𝑇

𝑹 x

_i

– 推定法の例 2 ： Bartlett 法

Bartlett, M. S. (1937)

• 尤度関数の最大化(独自因子の最小化)

• 推定量 𝒇

_𝑖

A

^𝑇

𝑹 A A

^𝑇

𝑹 x

_i

^check!

check!

13

推定法・回転法による結果の違い

-2 -1 0 1 2 3

-2-10123

Factor1

Factor2

ドライ

Kラガー Sエビス K淡麗

金麦 K一番

S黒ラベルプレモル A本生

Kのどごし

-0.5 0.0 0.5 1.0

-0.50.00.51.0

ノド越し

香り味幸せ

ホッ爽快

[斜交回転（プロマックス）、回帰法]

-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

-2.0-1.5-1.0-0.50.00.51.01.5

Factor1

Factor2

Aドライ

金麦

K一番

S黒ラベルプレモル

A本生 Kのどごし

-1.0 -0.5 0.0 0.5 1.0

-1.0-0.50.00.51.0

ノド越し

香り味幸せ

ホッ爽快

[斜交回転（プロマックス）、Bartlett法]

-1 0 1 2

-1012

Factor1

Factor2

Aドライ

金麦 K一番

-0.5 0.0 0.5 1.0

-0.50.00.51.0

ノド越し

香り幸せ味ホッ爽快

[直交回転（バリマックス）、回帰法]

-1 0 1 2

-1012

Factor1

Factor2

Aドライ

金麦 K一番

-0.5 0.0 0.5 1.0

-0.50.00.51.0

ノド越し

香り幸せ味

ホッ爽快

-0.4 -0.2 0.0 0.2 0.4 0.6

-0.4-0.20.00.20.40.6

PC1

PC2

Aドライ

Kラガー

Sエビス

K淡麗

金麦 K一番

S黒ラベル

レモル A本生

Kのどごし

-500 0 500

-5000500

ノド越し

香り味幸せホッ爽快

[主成分分析]

←：因子負荷量黒字：因子得点 [直交回転（バリマックス）、Bartlett法]

14

Rでの実行例

• 4 ページ目のデータを利用

#データの入力

Data = read.csv("beer.csv",header=T) Beer = Data[,2:ncol(Data)]

rownames(Beer) = Data[,1]

#バリマックス回転＋回帰法 FAvarimax = factanal(Beer, factors=2, rotation="varimax", scores = "regression") biplot(FAvarimax$scores,FAvarimax$loadings)

#プロマックス回転＋回帰法、

FApromax = factanal(Beer, factors=2, rotation="promax", scores = "regression") biplot(FApromax$scores,FApromax$loadings)

#バリマックス回転＋Bartlett法 FAvarimax2 = factanal(Beer, factors=2, rotation="varimax", scores = "Bartlett") biplot(FAvarimax2$scores,FAvarimax2$loadings)

#プロマックス回転＋Bartlett法、

FApromax2 = factanal(Beer, factors=2, rotation="promax", scores = "Bartlett") biplot(FApromax2$scores,FApromax2$loadings)

15

因子分析の流儀

• 探索的因子分析

– あらかじめ因子数を決定しない分析 – 合理的基準で因子数を決定

• 固有値基準、プロット法、累積寄与率

– 帰納的データ分析

• 検証的因子分析

– あらかじめ因子数が分かっている場合の分析 – なんらかの理論に基づき因子数が既知

• 心理学的知見など

– 理論の検証アプローチ

16

(5)

演習問題

• あなたはビール業界のマーケティング担当者である。以下の問に答えなさい

1. ビールのアンケートデータを用いて因子分析を行い、Rのbiplot 関数を用いて、知覚マップを作成しなさい。ここでは、

1.バリマックス回転＋回帰法、2.バリマックス回転＋Bartlet法、3.

プロマックス回転＋回帰法、4.プロマックス回転＋Bartlet法の4 つの知覚マップを作製しなさい。

2. その 4 つの知覚マップの中から一つを選び、全体のブランドのポジショニングを議論しなさい。また、なぜその知覚マップを選んだのか理由を説明しなさい。

17

～因子分析～

マーケティング・リサーチ特論 2020.06.10補助資料

～因子分析～

2020年度1学期： 水曜２限 担当教員： 石垣 司

因子分析

• 因子分析とは？ Charles Spearman (1904)

– 多変量データの要因となっている隠れた因子を探る手法 – 変数間の相関構造から潜在因子を推定

– 心理学、社会科学で多用

• マーケティング・リサーチでは？

– ポジショニング、消費者行動理論の定量分析など

因子

因子

因子分析のイメージ

• 潜在的な因子の探索や実証

– 例：300人分の中学校のテスト

• 直接観測できない潜在的な因子（構成概念）を探る

– 因子の探索 ：データから因子を発見

– 理論の実証 ：データが理論に合致するかの検証

進学意識

運動・感性力 数理能力

因子分析による知覚マップ

• 例：ビールのイメージ調査

• 知覚マップによるポジショニング

– 因子の解釈

– ポジショニング

キレ・爽快感

i= 1, … , N

k = 1, …, P

j = 1, …, M

因子分析と主成分分析の推定対象

• 因子分析

– 目的：潜在変数の推定

– モデル化の発想は逆。本来では、使い分けが必要

• しかしながら、得られる結果は同傾向になる場合が多い

• 使い分けの許容度は研究分野により様々

a

a

a

ε

ε

ε

w

w

w

Z

• 主成分分析

– 目的：変数の合成

因子分析モデル

• Notation

– 標準化得点： x

(i = 1,…,N, k = 1,…,P )

• 各変数毎（“香り”や“幸せ”など ）に値を標準化（平均 0, 分散 1 ）

– 共通因子： f

( j = 1,…,M ) – 因子負荷量： a

– 独自因子： ε

（誤差項：共通因子では説明できない量）

– 例：ビールイメージ調査

• 6変数から2因子を抽出するモデル

x a f a f x a f a f x a f a f x a f a f x a f a f x a f a f

  

    

    

    

    

   















因子分析モデル（行列表記）

• Notation

– 標準化した観測変数ベクトル： x

={x

,…, x

}

– 共通因子ベクトル： f ={f

,…, f

2020年度1学期：水曜２限担当教員：石垣司

– 因子の探索：データから因子を発見

– 理論の実証：データが理論に合致するかの検証

運動・感性力数理能力

• 各変数毎（“香り”や“幸せ”など）に値を標準化（平均 0, 分散 1 ）

因子分析モデル： _i

× ^③

× ^④

因子負荷量 {a _kj } の推定