• 検索結果がありません。

相関係数と偏差ベクトル

N/A
N/A
Protected

Academic year: 2021

シェア "相関係数と偏差ベクトル"

Copied!
34
0
0

読み込み中.... (全文を見る)

全文

(1)

相関係数と偏差ベクトル

経営統計演習の補足資料

2017年11月29日

金沢学院大学経営情報学部

藤本祥二

(2)

相関係数の復習

𝑟 =

𝑠

𝑥𝑦

𝑠

𝑥

𝑠

𝑦

=

1

𝑛 σ

𝑖=1𝑛

𝑥

𝑖

− ҧ𝑥 𝑦

𝑖

− ത𝑦

1

𝑛 σ

𝑖=1𝑛

𝑥

𝑖

− ҧ𝑥

2

1

𝑛 σ

𝑖=1𝑛

𝑦

𝑖

− ത𝑦

2

=

σ

𝑖=1 𝑛

𝑥

𝑖

− ҧ𝑥 𝑦

𝑖

− ത𝑦

σ

𝑖=1𝑛

𝑥

𝑖

− ҧ𝑥

2

σ

𝑖=1 𝑛

𝑦

𝑖

− ത𝑦

2

前回は散布図と相関係数の関係を見た

今回は偏差ベクトルと相関係数の関係を見る

𝑥

𝑖

− ҧ𝑥 = 𝑢

𝑖

𝑥の偏差)

𝑦

𝑖

− ത𝑦 = 𝑣

𝑖

𝑦の偏差)

𝑟 =

σ

𝑖=1 𝑛

𝑢

𝑖

𝑣

𝑖

σ

𝑖=1𝑛

𝑢

𝑖2

σ

𝑖=1𝑛

𝑣

𝑖2 式が長くなるので 𝑢, 𝑣の文字で 偏差を表すことにする

(3)
(4)

ベクトルとは

• スカラー (scalar)

大きさのみを持った量

• ベクトル (vector)

大きさ(長さ)と向き(方向)を持った量

Ԧ𝑎

Ԧ𝑎

絶対値記号はベクトルの 大きさを表す(正のスカラー量).

始点

終点

始点と終点を繋いだ 矢印でイメージを描ける ベクトル量を表す記号は 上に矢印をつける 厳密に言うと整数や実数のようなスカラー量は+-の2方向を持つ スカラー量はベクトル量のように様々な方向を自由に取ることができない

(5)

ベクトルの平行移動

• 平行移動してぴったり重なるベクトルは同じ

ベクトルとみなす.

(平行移動は大きさと向きを変えない移動,

大きさと向きが同じベクトルは同じ量を表している.)

この2つの矢印は大きさと向きが同じ

なので同じベクトル量を表している

(6)

ベクトルの足し算

Ԧ𝑎と𝑏を足して Ԧ𝑐を求めるには

• 平行移動して始点と終点を繋ぐ

Ԧ𝑎

𝑏

Ԧ𝑎

𝑏

Ԧ𝑐 = Ԧ𝑎 + 𝑏

Ԧ𝑎

𝑏

Ԧ𝑐 = 𝑏 + Ԧ𝑎

足し算には交換則が成り立つ

(7)

ベクトルのスカラー倍

• ベクトルのスカラー倍

向きを変えずに大きさのみを変える

• ベクトルのマイナス倍は向きを反転させる

Ԧ𝑎

2 Ԧ𝑎

−2 Ԧ𝑎

(8)

ベクトルの引き算

• 始点を合わせて終点を繋ぐ

• 反転と足し算

Ԧ𝑎 − 𝑏 = Ԧ𝑎 + −𝑏 で考える

Ԧ𝑎

𝑏

Ԧ𝑐 = Ԧ𝑎 − 𝑏

Ԧ𝑎

−𝑏

Ԧ𝑐 = Ԧ𝑎 + −𝑏

𝑏 + Ԧ𝑐 = Ԧ𝑎 の逆演算

𝑏の頭から Ԧ𝑎の頭に向かった矢印

(9)

位置ベクトル

• 位置ベクトル

原点を始点とした時の

終点の座標でベクトル

を表現したもの.

2次元空間の場合

Ԧ𝑎 = 𝑎

1

, 𝑎

2

3次元空間の場合

Ԧ𝑎 = 𝑎

1

, 𝑎

2

, 𝑎

3

𝑂

原点

0,0

𝑎

1

= 2

𝑎

2

= 3

Ԧ𝑎 = 2,3

軸1

軸2

(10)

ベクトルの足し算(位置ベクトル表記)

• 足し算は位置ベクトルを

成分別に足し算すればよ

Ԧ𝑎 + 𝑏

= 𝑎

1

, 𝑎

2

+ 𝑏

1

, 𝑏

2

= 𝑎

1

+ 𝑏

1

, 𝑎

2

+ 𝑏

2

𝑂

2

3

Ԧ𝑎 = 2,3

𝑏 = 2,1

1

4

4

Ԧ𝑎 + 𝑏 = 2 + 2,3 + 1

= 4,4

(11)

ベクトルのスカラー倍と引き算

• スカラー倍は位置ベクトル

の全成分を等倍すればよ

𝑠 Ԧ𝑎 = 𝑠 𝑎

1

, 𝑎

2

= 𝑠𝑎

1

, 𝑠𝑎

2

• 引き算は位置ベクトルを成

分別に引き算すればよい

Ԧ𝑎 − 𝑏 = 𝑎

1

, 𝑎

2

− 𝑏

1

, 𝑏

2

= 𝑎

1

, 𝑎

2

+ −𝑏

1

, −𝑏

2

= 𝑎

1

− 𝑏

1

, 𝑎

2

− 𝑏

2

𝑂

2

Ԧ𝑎 = 1,2

2

4

1

2 Ԧ𝑎 = 2,4

−4

−2

−2 Ԧ𝑎 = −2, −4

(12)
(13)

偏差ベクトル

データ数

𝑛 = 3の例

個体名(番号𝒊) 体長𝒙𝒊[cm] A(1) 4 B(2) 8 C(3) 9 平均 ҧ𝑥 = 1 𝑛෍ 𝑖=1 𝑛 𝑥𝑖 = 7

(𝐴, 𝐵, 𝐶)軸の3次元空間で見る

データベクトル:

Ԧ𝑥 = 𝑥

1

, 𝑥

2

, 𝑥

3

= (4,8,9)

平均ベクトル: Ԧ

ҧ𝑥 =

ҧ𝑥, ҧ𝑥, ҧ𝑥 = (7,7,7)

偏差ベクトル:

𝑢 = Ԧ𝑥 − Ԧҧ𝑥 = −3,1,2

(データ全体の平均からのズレを方向と大きさを持ったベクトル量で表したもの)

データ数

𝑛 = 10の時は10次元空間になる

2次元や3次元と違って絵には描けないがベクトルの演算はほとんど同じ

𝐴

𝐵

𝐶

4

8

9

𝑢 Ԧ𝑥 Ԧҧ𝑥

𝑂

(14)

相関係数の意味

𝑛 = 6の例

個体 体長 𝒙𝒊[cm] 体重 𝒚𝒊[g] 𝒙偏差 𝒖𝒊 = 𝒙𝒊 − ഥ𝒙 𝑦偏差 𝒗𝒊 = 𝒚𝒊 − ഥ𝒚 A 4 2 -7 -6 B 8 7 -3 -1 C 9 6 -2 -2 D 12 10 1 2 E 16 8 5 0 F 17 15 6 7 平均 ҧ𝑥 = 11 ത𝑦 = 8 0 0

𝑟 =

σ

𝑖=1 𝑛

𝑢

𝑖

𝑣

𝑖

σ

𝑖=1𝑛

𝑢

𝑖2

σ

𝑖=1𝑛

𝑣

𝑖2

= cos 𝜃

6次元空間内の

2つの偏差ベクトル

𝑢=(-7,-3,-2,1,5,6)

Ԧ𝑣=(-6,-1,-2,2,0,7)

𝜃

相関係数は偏差ベクトルの

間の角度

𝜃のコサイン(余弦)の値.

以下の補足スライドで証明

「ベクトルの間の角度と余弦定理」

𝑟 = cos 𝜃 =0.8175

体長偏差ベクトル

体重偏差ベクトル

間の角度

𝜃 = 35.2°

(15)
(16)

三角比の復習

• 正弦(sine)

sin 𝜃 =

𝑎

𝑐

• 余弦(cosine)

cos 𝜃 =

𝑏

𝑐

• 正接(tangent)

tan 𝜃 =

𝑎

𝑏

=

sin 𝜃

cos 𝜃

• 三平方の定理

sin 𝜃

2

+ cos 𝜃

2

=

𝑎

𝑐

2

+

𝑏

𝑐

2

=

𝑎

2

+ 𝑏

2

𝑐

2

= 1

𝑎

𝑏

𝑐

𝐴

𝐵

𝐶

𝜃

直角三角形ABCの

各辺の長さの比が三角比

• 𝜃が90°以上になると上図の直角三角形が描けなくなる • どんな角度でも使えるように三角比を拡張したものが三角関数 • 拡張前の様々な定理(公式)をなるべく壊さないように拡張することが重要

(17)

1

2

+ 1

2

=

2

2

1 + 1 = 2

1

2

+

3

2

= 2

2

1 + 3 = 4

正方形の半分

正三角形の半分

三角定規の三角比

三平方の定理の確認

三平方の定理の確認

(18)
(19)

三角関数の復習

• 原点を中心に半径1の円

を描く

• 中心角が𝜃の時の円上の

𝑃の座標

cos 𝜃 , sin 𝜃

で三角関数を定義

−1 ≤ cos 𝜃 ≤ 1

90° < 𝜃 < 270°の時cos 𝜃

は負になる

• 次の公式も成り立つ

sin 180° − 𝜃 = sin 𝜃

cos 180° − 𝜃 = − cos 𝜃

• 他にもさまざまな公式

𝑂

−1

−1

1

1

𝜃

sin 𝜃

cos 𝜃

𝑃

どんな角度でも使えるように三角比を拡張したものが三角関数

(20)

+, + −, + −, − +, −

cos 𝜃 , sin 𝜃

3 2 2 2 1 2 3 2 2 2 1 2 1 1 0 0 0° 90° 1 , 0 0 , 1

(21)

0° ≤ 𝜃 ≤ 180°とcos 𝜃の対応表

𝜽 𝟏𝟖𝟎° 𝟏𝟓𝟎° 𝟏𝟑𝟓° 𝟏𝟐𝟎° 𝟗𝟎° 𝟔𝟎° 𝟒𝟓° 𝟑𝟎° 𝟎° cos 𝜃 −1 3 2 − 2 2 − 1 2 0 1 2 2 2 3 2 1 cos 𝜃 −1.000 −0.866 −0.707 −0.500 0.000 0.500 0.707 0.866 1.000 𝜃 = 90° cos 𝜃 = 0 𝜃 = 60° cos 𝜃 = 0.5 cos 𝜃 = 0.707𝜃 = 45° 𝜃 = 30° cos 𝜃 = 0.866 𝜃 = 0° cos 𝜃 = 1 𝜃 = 120° cos 𝜃 = −0.5 𝜃 = 135° cos 𝜃 = −0.707 𝜃 = 150° cos 𝜃 = −0.866 𝜃 = 180° cos 𝜃 = −1

強い負の相関

弱い負の相関

無相関

弱い正の相関

強い正の相関

強い正の相関 無相関 弱い正の相関 弱い負の相関 強い負の相関 45°や135°の相関±0.7 が 強い弱いの中間

(22)

相関の強さの3段階評価

𝜃

cos 𝜃

cos 𝜃(小数)

1

1.000

30°

3

2

0.866

60°

1

2

0.500

90°

0

0.000

強い相関がある

相関がある

殆ど相関はない

(23)

90

°

1

,0

0

,1

𝜃

cos 𝜃

, sin 𝜃

(24)

相関の強さの4段階評価

𝜃

cos 𝜃

cos 𝜃(小数)

1

1.000

22.5°

2 + 2

2

0.924

45°

2

2

0.707

67.5°

2 − 2

2

0.383

90°

0

0.000

強い相関がある

かなり相関がある

やや相関がある

殆ど相関はない

(25)

90

°

1

,0

0

,1

𝜃

cos 𝜃

, sin 𝜃

(26)
(27)

データの一次変換と相関係数

• データ𝑥を次の式で𝑢に一次変換 𝑢𝑖 = 𝑎𝑥𝑖 + 𝑏, ത𝑢 = 𝑎 ҧ𝑥 + 𝑏, 𝑠𝑢2 = 𝑎2𝑠𝑥2, 𝑠𝑢 = 𝑎 𝑠𝑥 • データ𝑦を次の式で𝑣に一次変換 𝑣𝑖 = 𝑐𝑦𝑖 + 𝑑, ҧ𝑣 = 𝑐 ത𝑦 + 𝑑, 𝑠𝑣2 = 𝑐2𝑠𝑦2, 𝑠𝑣 = 𝑐 𝑠𝑦 • 𝑢と𝑣の共分散 𝑠𝑢𝑣 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑢𝑖 − ത𝑢 𝑣𝑖 − ҧ𝑣 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑎𝑥𝑖 + 𝑏 − 𝑎 ҧ𝑥 − 𝑏 𝑐𝑦𝑖 + 𝑑 − 𝑐 ത𝑦 − 𝑑 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑎𝑥𝑖 − 𝑎 ҧ𝑥 𝑐𝑦𝑖 − 𝑐 ത𝑦 = 𝑎𝑐 1 𝑛 ෍ 𝑖=1 𝑛 𝑥𝑖 − ҧ𝑥 𝑦𝑖 − ത𝑦 = 𝑎𝑐𝑠𝑥𝑦 • 𝑢と𝑣の相関係数 𝑟𝑢𝑣 = 𝑠𝑢𝑣 𝑠𝑢𝑠𝑣 = 𝑎 𝑎 𝑐 𝑐 𝑠𝑥𝑦 𝑠𝑥𝑠𝑦 = 𝑎の符号 𝑐の符号 𝑟𝑥𝑦 = ±𝑟𝑥𝑦 • 一次変換しても相関係数の大きさは変換前と変わらない • 𝑎, 𝑐 同符号なら符号は変換前の符号と変わらない • 𝑎, 𝑐 逆符号なら符号は変換前の符号の逆になる 𝑎 𝑎は𝑎の符号を表す 𝑎 = 2の時, 𝑎𝑎 = 22 = 22 = +1 𝑎 = −3の時, 𝑎𝑎 = −3−3 = −33 = −1

(28)

データの標準化と相関係数

• データ

𝑥を次の式で標準化(Z値に変換)

𝑢

𝑖

=

𝑥

𝑖

− ҧ𝑥

𝑠

𝑥

,

ത𝑢 = 0,

𝑠

𝑢

2

= 1,

𝑠

𝑢

= 1

• データ

𝑦を次の式で標準化(Z値に変換)

𝑣

𝑖

=

𝑦

𝑖

− ത𝑦

𝑠

𝑦

,

ҧ𝑣 = 0,

𝑠

𝑣

2

= 1,

𝑠

𝑣

= 1

• 標準化後の相関係数

𝑟

𝑢𝑣

=

𝑠

𝑢𝑣

𝑠

𝑢

𝑠

𝑣

= 𝑠

𝑢𝑣

= 𝑟

𝑥𝑦

𝑠𝑢 = 1, 𝑠𝑣 = 1なので 共分散と相関係数の値が同じになる 𝑠𝑥, 𝑠𝑦は両方共に正符号なので 相関係数の符号も変わらない

(29)
(30)

合計,平均,データ数のExcel関数

• SUM

合計を返すExcel関数

𝑖=1 𝑛

𝑥

𝑖

• AVERAGE

算術平均を返すExcel関数

1

𝑛

𝑖=1 𝑛

𝑥

𝑖

• COUNT

数値が入っているセル数(データ数)を返すExcel関数

(31)

分散のExcel関数

• 分散は英語でvariance

• VAR.P

(VARP Excel2007以前は関数名が違う)

母集団(全数調査)の分散を返す関数

1

𝑛

𝑖=1

𝑛

𝑥

𝑖

− ҧ𝑥

2

• VAR.S

(VAR Excel2007以前)

標本(標本調査)不偏分散を返す関数

1

𝑛 − 1

𝑖=1

𝑛

𝑥

𝑖

− ҧ𝑥

2

標本調査の時は𝑛ではなく,𝑛 − 1で割らなければ 標本から母集団の分散を正しく推定ができない. 母集団の分散を偏りなく推定した量を不偏分散という.(統計検定2級以降) Pは母集団の英語 Populationを意味する Sは標本の英語 Sampleを意味する

(32)

標準偏差のExcel関数

• 標準偏差は英語で standard deviation

• STDEV.P

(STDEVP Excel2007以前)

母集団(全数調査)の標準偏差を返す関数

1

𝑛

𝑖=1 𝑛

𝑥

𝑖

− ҧ𝑥

2

• STDEV.S

(STDEV Excel2007以前)

標本(標本調査)の不偏標準偏差を返す関数

1

𝑛 − 1

𝑖=1 𝑛

𝑥

𝑖

− ҧ𝑥

2

(33)

共分散のExcel関数

• 共分散は英語で covariance

• COVARIANCE.P

(COVAR Excel2007以前)

母集団(全数調査)共分散を返す関数

1

𝑛

𝑖=1 𝑛

𝑥

𝑖

− ҧ𝑥 𝑦

𝑖

− ത𝑦

• COVARIANCE.S

(Excel2007以前はこれに対応する関数

はない)

標本(標本調査)共分散を返す関数

1

𝑛 − 1

𝑖=1 𝑛

𝑥

𝑖

− ҧ𝑥 𝑦

𝑖

− ത𝑦

(34)

相関係数のExcel関数

• CORREL

相関係数は英語で correlation coefficient

𝑟 =

1

𝑛 σ

𝑖=1

𝑛

𝑥

𝑖

− ҧ𝑥 𝑦

𝑖

− ത𝑦

1

𝑛 σ

𝑖=1

𝑛

𝑥

𝑖

− ҧ𝑥

2

𝑛 σ

1

𝑖=1

𝑛

𝑦

𝑖

− ത𝑦

2

標本調査の場合

1

𝑛

ではなく

1

𝑛−1

を使わなければならな

いが,分母分子で相殺する部分なので,標本調査

の場合でも同じ関数を使えば良い.

参照

関連したドキュメント

この矢印のように, 大きさと方向の両方のある量を ベクトル という.. 大きさだけのある量を, ベクトルに対して

この矢印のように, 大きさと方向の両方のある量を ベクトル という.. 大きさだけのある量を, ベクトルに対して

この矢印のように, 大きさと方向の両方のある量を ベクトル という.. 大きさだけのある量を, ベクトルに対して

  著者は、リーダーシップがフォロワーの意欲や仕事に対する満足を引き出し、組織や集団の

(さっき作った Excel のデータは,保存しなくてよ い).

(さっき作った Excel のデータは,保存しなくて よい).

会に浸透しており」,議会は「非常に穏健な」大統領に奴隷解放を迫るからである

61 調理・買い物 ・判別的中点は 71.1%であった.