第 12 回
相関 回帰
日 内容
• 値 タ
• 値 タ 整理
– 散布図
– 数分布表
• 相関
– 相関係数
– 共分散
– 相関係数 検定
– 相関係数
前回 復習
• 金沢 均 分散
– 最高気温: 均30.9、分散5.5 – 最 気温: 均24.2、分散3
• 東京 均 分散
– 最高気温: 均30.6、分散23.4 – 最 気温: 均24.2、分散6.8
• 、最 気温 変わ 、最高気温 金沢
方 均 0.3 高い 分
– 、金沢 方 暑い?
– 、0.3 く い 偶然差 出 あ ?
– 偶然起 程 差 う 確認 検定
前回 復習
• 検定 用い
= 均 − 均
分散
数 − +
分散 数 −
• 、最高気温 い
� = . − .
. + . ≈ . < .
• 最 気温 い
� = . − . + .
= < .
前回 復習
• い 、 90 % 棄却域 入 い → 帰無仮説 均
等 い 10 %水準 棄却 い
– 、 0.3 いう差 偶然起 確率 10%以 あ – 10% 起 =起 確率 あ =起
、 考え あ ば10%水準 棄却 い
– 最 気温 、 手元 タ 均 完全 一致 い 、等 く い いう仮説 検証 い
• 社会科学 、 10 % 十分 確率 い 考え 境
界 多く、 10 % 超え 場合 仮説 棄却
い ほ
前回 復習
• 分散 比 検定
� = 大 いほう 分散 小 いほう 分散
• 最高気温 い
� = . ≈ . > ..
• 最 気温 い
� = . ≈ . > .
• 、 分散 等 い いう帰無仮説 有意水準
5 % 棄却 → 分散 差 あ 東京 方 分
散 大 い 考え
前回 復習
• 結局差 あ ?
– 最高気温 最 気温 → 有意水準 10 % 差
い
– 分散 ば 有意水準 5% 差 あ 東京
方 大 い → 東京 方 、 均
暑い日や 涼 い日 多い
– 、暑 あ 差 い 、東京
方 日々 気温 変動 大 い 考え
値 タ
• 前回 講義 1 値 注目 、 タ 整
理や推定 検定 い 学
– 例えば、 気温 業所数
– 均や分散 い 複数 統計量 あ 、扱 い 値 あく 1
• 一般的 、複数 値 関係 注目 分析 行わ
– 例えば、 所得 消費 関係
– 目数 2 あ タ いう
– 値 タ 、個々 特性 関 1個 タ 構
成 く、 主体 い 2 値
タ 構成 い
値 タ 整理
• 一 一 値 整理 方 、 講義 同
– 例 均 命 GDP 関係 い 考え
– 世界全体 均 命 均や分散、GDP 均や分散 今 同様 計算
– 、 均 命やGDP 地域間 格差 い 今 同 様 計算
• 、 値 セッ い 意識 、
保 う 整理 必要 あ
– 例 日 均 命 GDP、ア カ 均 命 GDP 日 セッ ア カ セッ い
– 値 入 替え 、 日 均 命 ア カ GDP セッ ア カ 均 命 日 GDP セッ 作 意味
い
例 経済数学 中間試験 期 試験
• 経済数学 中間試験 期 試験 関係 考
え
– 両方 験 い ば 人 い
中間試験 得点 期 試験 得点 値
あ 値 タ
– 得点 い 、基 統計量やヒ
グ 書く
均 標準偏差 歪 尖
中間試験 78.0 14.8 -0.5 2.3 期 試験 76.1 19.7 -0.9 3.2
散布図
• 値 タ 図示 く用い 散布
図
– 値 組 合わ 面 標
– 各点 1 観測値 組 合わ 表
– 縦 標 横 標 数値 、 点 観測値 組 合わ わ
• 場合 、同 場所 複数 点 打 必要
あ
– く同 観測値 組 合わ あ 場合 – 場合 、
A) 無視 う点 打 い 、打 い B) 点 膨 個数 合わ 点 大 く
0 10 20 30 40 50 60 70 80 90 100
0 20 40 60 80 100
期試験
中間試験
散布図
値 数分布表
• 値 タ 一 数分布表 表わ
– 値 い 区間 設け、区間 入 数 数え
– う 表 値 分布表 分割表 いう
• 、行和 各行 和 列和 各列 和 計算 ば、 1 値 い 数分布表 使う
– 1 値 数分布表 同時 数分布表 作 い点 注 意
• 同時 数分布表 、1 値 数分布 いう
– 周辺 数分布 使う 、 値 均や分散 計 算
同時 数分布表
中間試験 期
~9 ~19 ~29 ~39 ~49 ~59 ~69 ~79 ~89 90~ 行和
期 試 験
~9 0 0 0 0 0 0 0 0 0 0 0
~19 0 0 0 0 0 1 0 0 0 0 1
~29 0 0 0 0 0 0 0 1 0 0 1
~39 0 0 0 0 0 1 1 0 0 1 3
~49 0 0 0 0 0 2 1 2 1 0 6
~59 0 0 0 1 1 3 0 2 1 0 8
~69 0 0 0 0 0 1 0 2 3 2 8
~79 0 0 0 0 1 2 4 6 5 2 20
~89 0 0 0 0 0 0 3 2 3 4 12
90~ 0 0 0 0 0 0 6 2 8 17 33
中間 列和 0 0 0 1 2 10 15 17 21 26 92 中間80点台
期 70点台 人数 ?
相関
• 値 タ 値 結び 考え
– 例 中間試験 得点 期 試験 得点 結び
– 中間 得点 高い人 、期 得点 高い ?
• 散布図 見 、右 い う 見え
– 中間 得点 高い学生 、期 得点 高い
– 1 値 高け ば、 値 高く 場合 相 関 あ いう
– 1 値 高い 、 値 く 場合 相
関 あ いう
– 中間試験 期 試験 間 相関 あ 考え
共分散
• 2 値 関係 表 統計量 あ
• � 個 観測数 � 番目 観測値 1 目 値
�
、 2 目 値
�、 均 、
、共分散 以 式 計算
� −
�=�
�
−
�−
• 共分散
– 正 相関 あ プ
– 負 相関 あ マイ
– 関係 い 0
共分散
• イ 共分散 、2 値 同時 均 う 離 計算 い
• 正 相関 あ 場合、 プ プ 、マイ
マイ
– 、 � − � − プ ×プ =プ 、あ い マイ ×マイ =プ
– 足 いけば、プ 数字
• 負 相関 あ 場合、 一方 プ う一方 マイ 、
一方 マイ う一方 プ
– 、 � − � − プ ×マイ =マイ 、あ い マイ ×プ =マイ – 足 いけば、マイ 数字
• 関係 い場合、一方 プ 、 う一方 プ あ ばマイ
あ
– 、 � − � − プ ×プ =プ あ ば、プ ×マイ =マ
イ あ
– 足 いく 、 互い 打 消 あ 数字 大 く い→0 近く
例 経済数学 中間試験 期 試験
• 中間試験 均点 72.5 点、期 試験 均
点 68.7 点、 験者数 75 人
• 共分散
−
�=�
中間 − . 期 − .
= − . × − . + − .
× − . + ⋯ + − . × − .
相関係数
• 共分散 計算 ば、 2 値 関係 わ
– プ ば正 相関、マイ ば負 相関 – 関係 強いほ 、絶 値 大 く
• 、単 違う 共分散 直接比べ 、
関係 強い わ い
– 試験 得点 あ ば、 い い50点く い – 株価 、1000や2000 通常発生
– 、共分散 計算 株価 方 数値 大 く
、 2国間 株価 関係 試験 得点 関係 強いわけ く、単 単 大 い け
• 、基準化 共分散 考え
相関係数
• 基準化 計算 共分散 いう
– 1 目 値 標準偏差 、2 目 値 標準偏差 、
� − �=
� � − � −
– 基準化 ば、元 数字 単 う 均0、分散1
、数字 大 比べ 結び 強 比較
– 相関係数 、必 -1~1 間
– 相関係数 絶 値 大 いほ 関係 強く、0 近いほ 関係 弱 い
– 、標準偏差 全 観測値 同 、次 式 計
算
相関係数 =
共分散
×
散布図 相関
70 75 80 85 90 95 100 105 110
170 175 180 185 190 195
身長 体
重
6 7 8 9 10 11 12
0 5 10 15 20
築 数 家
賃
2 4 6 8 10 12
共分散=29.33 相関係数=0.66
共分散=-4.36 相関係数=-0.58
共分散=1.91 相関係数=0.21
例 経済数学 中間試験 期 試験
• 中間試験 期 試験 共分散 119 前
イ
• 中間試験 標準偏差 14.8 、期 試験 標
準偏差 19.7
• 、相関係数
. × . ≈ .
相関係数 検定
• 相関係数 0 い う 関係 あ う 検定 – 仮説 2 値 相関係数 0 あ
– 仮説 2 値 相関係数 0 い
– 検定
• 検定 方 通常 同様
– 相関係数 、標準誤差 以 計算
標準誤差 =
−
� − – 、 � 以 う 計算
� = −
標準誤差
= � − ×
– あ 、検定 大 決 棄却域 計算− 、 入 う 検定 行えば い
例 経済数学 中間試験 期 試験
• 計算 相関係数 0.51
• 検定 仮説
– � : =
– �
�: ≠
• 公式 当 計算
� = − × .
− . = . ×
.
. ≈ .
– 両側検定 有意水準 1 % 棄却域 2.58
– 、帰無仮説
– 、相関係数 0 い → 正 関係 あ
相関係数
• 数値 直接用い く、各 目 け 、
計算 相関係数 相関係数 いう
– 用い ほ 通常 相関係数 全く同 (計算方法 検定方 法)
– イ 、 均 分 点
• 極端 値 引 張 くく
• 使う情報量 落 う
• 例) 100、100 、 300、900 、 900、300 いう3 値 あ – 通常 相関係数 -0.04
– け 、 3、3 、 2、1 、 1、2 いう3 値 相関係数
、相関係数 0.5
– 900 いう大 数値 引 張 、全体 関係 薄く見え い
– 、 当 薄い い