• 検索結果がありません。

相関関係

ドキュメント内 ビッグデータ利活用入門 (ページ 35-41)

4. 比較して判断する分析手法

4.2. 相関関係

正の相関(右上がり) 負の相関(右下がり) 無相関

 相関関係とは・・・

一方の値が変化すれば、他方の値も変化するという、2つの値の関連性

 正の相関

2つのデータのうち一方が 増加 すると、もう一方も 増加

 負の相関

2つのデータのうち一方が 増加 すると、もう一方が 減少

y y

x x

y

x

 相関係数とは

相関係数は-1から1までの値を取り、0に近いほど相関が弱く、1に近 いほど相関が強くなります。共分散を一方の標準偏差と他方の標準 偏差をかけあわせた値で割った値のことです。

4.2.1. 相関係数

0 1.0

-1.0

相関がない 完全な

正の相関がある 完全な

負の相関がある

y

x y

x

y

x y

x

y

x

4.2.2. 相関関係の利用イメージ(1/2)

顧客満足度アンケートの結果

(全体と項目別の5段階評価)

「総合満足度と相関が強い、かつ満足度が低い」項目

=「効果が出そうな」項目を見つけることができる

総合

満足度 アクセス 案内図 開催曜日 開始時間 終了時間 設備

(電源等)

設備

(スクリーン)

回答者1 4 4 3 4 3 3 4 3

回答者2 3 3 2 3 4 3 4 3

回答者3 5 4 4 4 3 3 5 3

回答者4 3 4 2 3 4 3 2 3

回答者5 4 4 3 4 5 5 2 2

回答者6 2 2 3 3 3 3 1 1

回答者7 2 3 2 2 2 3 2 2

回答者8 4 5 4 3 3 3 4 4

回答者9 4 4 3 3 4 4 3 4

回答者10 5 4 4 4 4 4 5 5

平均値 3.6 3.7 3 3.3 3.5 3.4 3.2 3

総合

満足度 アクセス 案内図 開催曜日 開始時間 終了時間 設備

(電源等)

設備

(スクリーン)

回答者1 4 4 3 4 3 3 4 3

回答者2 3 3 2 3 4 3 4 3

回答者3 5 4 4 4 3 3 5 3

回答者4 3 4 2 3 4 3 2 3

回答者5 4 4 3 4 5 5 2 2

回答者6 2 2 3 3 3 3 1 1

回答者7 2 3 2 2 2 3 2 2

回答者8 4 5 4 3 3 3 4 4

回答者9 4 4 3 3 4 4 3 4

回答者10 5 4 4 4 4 4 5 5

平均値 3.6 3.7 3 3.3 3.5 3.4 3.2 3

総合

満足度 アクセス 案内図 開催曜日 開始時間 終了時間 設備

(電源等)

設備

(スクリーン)

回答者1 4 4 3 4 3 3 4 3

回答者2 3 3 2 3 4 3 4 3

回答者3 5 4 4 4 3 3 5 3

回答者4 3 4 2 3 4 3 2 3

回答者5 4 4 3 4 5 5 2 2

回答者6 2 2 3 3 3 3 1 1

回答者7 2 3 2 2 2 3 2 2

回答者8 4 5 4 3 3 3 4 4

回答者9 4 4 3 3 4 4 3 4

回答者10 5 4 4 4 4 4 5 5

平均値 3.6 3.7 3 3.3 3.5 3.4 3.2 3

相関係数 満足度 0.73 3.7 0.76 3.0 0.80 3.3 0.36 3.5 0.38 3.4 0.80 3.2 0.72 3.0 0.65 3.30 g. 会場設備(スクリーン、椅子等)

平均

a. 会場へのアクセス b. 会場内案内

c. セミナーの開催曜日 d. セミナーの開始時間 e. セミナーの終了時間

f. 会場設備(電源・ネットワーク等)

相関係数 満足度 0.73 3.7 0.76 3.0 0.80 3.3 0.36 3.5 0.38 3.4 0.80 3.2 0.72 3.0 0.65 3.30 g. 会場設備(スクリーン、椅子等)

平均

a. 会場へのアクセス b. 会場内案内

c. セミナーの開催曜日 d. セミナーの開始時間 e. セミナーの終了時間

f. 会場設備(電源・ネットワーク等)

相関係数 満足度 0.73 3.7 0.76 3.0 0.80 3.3 0.36 3.5 0.38 3.4 0.80 3.2 0.72 3.0 0.65 3.30 g. 会場設備(スクリーン、椅子等)

平均

a. 会場へのアクセス b. 会場内案内

c. セミナーの開催曜日 d. セミナーの開始時間 e. セミナーの終了時間

f. 会場設備(電源・ネットワーク等)

使用するデータ 利用イメージ

複数のデータの関係性から、隠れた特徴を抽出する

相関係数の絶対値 相関係数の解釈 1.0 完全に相関がある 0.7~1.0 強い相関がある 0.4~0.7 相関がある

0.2~0.4 低い相関がある 0~0.2 ほとんど相関がない

0 相関がない

複数のデータの関係性から、隠れた特徴を抽出する

4.2.2. 相関関係の利用イメージ(2/2)

店舗改善の項目について、4つの領域に分けて整理することで、

対応すべき事項の優先度や実行判断の検討がしやすくなった

相関係数

◆アクセス

◆開始時間

◆設備

領域①:重点的に維持

領域②:早急に改善 領域④:現状の維持

領域③:改善

相関係数 満足度 0.73 3.7 0.76 3.0 0.80 3.3 0.36 3.5 0.38 3.4 0.80 3.2 0.72 3.0 0.65 3.30 g. 会場設備(スクリーン、椅子等)

平均

a. 会場へのアクセス b. 会場内案内

c. セミナーの開催曜日 d. セミナーの開始時間 e. セミナーの終了時間

f. 会場設備(電源・ネットワーク等)

相関係数 満足度 0.73 3.7 0.76 3.0 0.80 3.3 0.36 3.5 0.38 3.4 0.80 3.2 0.72 3.0 0.65 3.30 g. 会場設備(スクリーン、椅子等)

平均

a. 会場へのアクセス b. 会場内案内

c. セミナーの開催曜日 d. セミナーの開始時間 e. セミナーの終了時間

f. 会場設備(電源・ネットワーク等)

相関係数 満足度 0.73 3.7 0.76 3.0 0.80 3.3 0.36 3.5 0.38 3.4 0.80 3.2 0.72 3.0 0.65 3.30 g. 会場設備(スクリーン、椅子等)

平均

a. 会場へのアクセス b. 会場内案内

c. セミナーの開催曜日 d. セミナーの開始時間 e. セミナーの終了時間

f. 会場設備(電源・ネットワーク等)

総合満足度と各項目の相関、

各項目の満足度の平均

使用するデータ 利用イメージ

4.3. 相関関係と因果関係

 相関関係とは

一方の値が変化すれば、他方の値も変化するという、2つの値の関連性

 因果関係とは

2つ以上の事柄の間に原因と結果の関係があると言い切れる関係

 相関があっても因果があるとは限らない

「相関関係」=「因果関係」ではない

相関関係 因果関係

原因 結果

変化 変化

時間的先行性

変数間の結びつきの強さ 関連の普遍性

関連の整合性

連動

4.3.1. 考えてみましょう

 相関関係があると思われる事例を1つ挙げてく

ださい

目標

ドキュメント内 ビッグデータ利活用入門 (ページ 35-41)

関連したドキュメント