ぜ散布図
直線
近
くと相関係数→±1
る
?
相関係数 定義
量的変数X Y 間 相関係数r 定義式 以 う . ,Cov(X,Y)
変数X Y 共 散,σX σY X Y 標準偏差 .
r =��� ,σ �
, 式 意味 わ ?もう 見や く う
式変型 行い .
変数 標準化と ?
,量的変数 X Y 標準化 う.標準化 ,以 う 変数変換
. ,μx X 平均値 .
Z X = − ��
変数変換 ,Z(X) 平均値 ゼロ . ,Z(X) 標準偏差 1
.逆 言う ,量的変数X 平均値 必 もゼロ い ,標準偏差
も 1 い , 無理や 平均値ゼロ,標準偏差 1 変換 も Z(X)
. 変換 標準化standardization 呼び,Z(X) Zスコア 呼
び .今 変数 X い 説明 変数 Y い も同 う 標準化
.
もう1 相関係数 定義式
(1)式 ,Z(X) Z(Y) 用い ,以 う 表 も .
r = E[ × ]
う 説明 う.(2)式 Z(X),Z(Y) 変数X,Y 使 表 ,
r = E [ − �� � − � ] =�[ − �� � − � ]= ��� ,� �
確 (1)式 . , ��� , = �[ − � − � ] 共 散 定義 .
例え 成 数 3個 場合
(2)式 以 う .
r = + +
式 子 ベク ル� X = ( , , ) � Y = ( , , )
内積 .内積 定義 , 2 ベク ル 角度 θ ,
い ,ベク ル 長 定義 ,
‖ ‖ = − � + − �� + − �
,標準偏差2 = 散 定義 思い出 ,
σ = − � + − � + − �
(4)式 (5)式 ,
‖ ‖ = × �� =
Z(Y) い も同 .以 (3)式 代入 ,
左辺= � X ∙ � Y = r
右辺= ‖� ‖‖� ‖���� = √ × √ ���� ,
r = cosθ
,相関係数r 変数Z(X) Z(Y) ベク ル間 角度 コサイン .
散布図とコサイン 関係
ベク ルZ(X) Z(Y) 間 角度 0度 180度 ,a 定数 ,
� Y = a × � X
,Z(Y) Z(X) 定義式 代入 整理 ,
Y = a × X + 定数
,散布図 一直線 .
ベク ルZ(X) Z(Y) 間 角度 0度 も180度 も け ,
� Y = a × � X + � �
け . 成 書く ,
Z Y = a × Z X + b Z Y = a × Z X + b
う . 変数X Y 使 表 ,
Y = a × X + 片
Y = a × X + 片
く ,1 番目 ータ 当 直線 ,2 番目 ータ 当 直線
異 わ . う , ータ 当 直線 異 ⇒散布
図 一直線 い . ,ベク ル Z(X) Z(Y) 間 角度 大
く ほ ,(6)式 定数ベク ルb 長く , 結果, 式 片1 , 片