付録.2011 年 M5 社会医学実習 1: 重回帰 析
量的変数Y 量的変数X 明 回帰 あ 量的変数Y 量的変数X あ
い 関連 表 相関 あ 両者 く異 .
く 回帰:Y←X, 相関:Y↔X あ 回帰 向 あ 相関 向
い いう わ 思い .
回帰 Y ← X vs. 相関 Y ↔ X
タ 込
demodata.csvフ イ 変数data 込 . 込 あ 本当
変数data タ 格納さ 見 関数head( ) 使 最初 6行
表示 う.
data = read.csv(“demodata.csv”) head(data)
変数ID 被験者 sex 性別 age 年齢 ht 身長 wt 体重 grmax 握力 左右 握力 う 強い方 BMI (BMI) Body Mass Index grclass 握力
変数化 握力 強い人 1, 弱い人 0 い .
変数grclass 1/0 イン さ い 数字 便宜的 数字
意味 例え 握力 強い人 弱い人 差 1-0 = 1 いう計算
無意味 . 数字 あ いう ソフ あ R
わ い 人間 教え あ 必要 あ .
data$grclass = factor (data$grclass)
式 右辺 変数grclass 取 出 関数factor( ) 使う
数字 因子 変換 い . 変換 grclass 旧
grclass 書 い わ .
タ ュ
関数summary( ) 使 質的変数 変数 表 量的変数 要
約統計量 求 う.
summary(data)
質的変数 sex grclass 内訳 わ 量的変数age, ht, wt, grmax, BMI
い イ くい . ボッ プ ッ 描い
う. 描く 関数hist( ) 使い .
hist(data$age) hist(data$ht) hist(data$wt) hist(data$grmax) hist(data$BMI)
う ボッ プ ッ 関数boxplot( ) 使 描 .
boxplot(data$age) boxplot(data$ht) boxplot(data$wt) boxplot(data$grmax) boxplot(data$BMI)
変数age grmax 山型 い わ . く 今回 変数grmax
正規 布 あ 仮定 統計解析 行い grmax 山型 い
心配 . 正規 布 い QQプ ッ 描い 変数grmax く
い正規 布 一致 い ハ い 調 う.
qqnorm(data$grmax)
変数grmax 正規 布 う QQプ ッ 直線 .真
中あ 微妙 直線 い 今回 変数grmax 正規 布
う 話 進 .
回帰直線:身長 使う
握力 身長 予測 考え う.例え 握力 身
長 ×2 あ 身長 握力 予測 . う 何
関数f 使 握力 f 身長 いう式 回帰式 呼 う 解析 回帰 析
言い .
特 関数f 線形式 例え 握力 身長×2 5 場合 線型回帰 析 言い .
握力 身長 ×2 体重 ×0.5 4 う 握力 明 変数 複数あ
場合 重回帰 析 呼 1 場合 単回帰 析 呼 細 い 称 忘
-3 -2 -1 0 1 2 3
102030405060
Normal Q-Q Plot
Theoretical Quantiles
Sample Quantiles
く差 支えあ . う 回帰式 見 明変数
一 複数 関数 線形 非線形 一目 わ .
変数grmax 目的変数, 身長ht 明変数 線型単 回帰 析 行い う.
res = lm(grmax~ht, data)
回帰 析 行 う 関数lm( ) 使い 目的変数Y 明変数X 使 lm(Y~X, タ ) . 解析結果 変数res (result 前3文字) 代入 い
.
結果 関数summary( ) 使い .
summary(res)
くさ 表示さ さ あ 赤い箱印 見 い
う.Intercept 片 . grmax = 片 β ×ht 誤差 いう回帰 式 片 β 推定値 Estimate 標準 誤差 Std.Error 表示さ い .
grmax = -106.9868 0.8893×ht 誤差 いう タ 一番当
う 推定 詳 く . t value いう
あ 出 く P値 P( > |t|) 求 必要 t統計量 あ いう
知 い 良い う. P値 片 0 β =0 う 表 一般
P値 0.05 小さ 片≠0, β ≠0 いう .
次 変数grmax ht 関係 散布 プ ッ う.
plot(data$ht, data$grmax)
身長ht 高い 握力grmax 高い いう右肩 関係 見 取 .
さ 散布 先 求 回帰直線 重 う.
abline(res, col=”red”)
130 140 150 160 170 180
102030405060
ht
grmax
関数abline( ) 回帰 析 結果res 使え 回帰直線 引 . 見や い う 回帰直線 色 赤色 col=”red” いう プ ョン 数
使 い フ 黒色 .
回帰 析:男女別
男女別 回帰 析 う準備 タ 男女別 う.
mdata = data[ data$sex==”M”, ] fdata = data[ data$sex==”F”, ]
タ 変数sex M F 行 抜 出 変数mdata, fdata
代入 い わ . や mdata, fdata い
タ ュ う .
男女別 回帰 析 う
mres=lm(grmax~ht, mdata)
130 140 150 160 170 180
102030405060
ht
grmax
fres=lm(grmax~ht, fdata)
. 結果 summary(mres), summary(fres) 表示
.解 男性 grmax -54.07011 0.58255×ht 誤差 女 性 grmax -49.36122 0.49728×ht 誤差 わ .男女
い 際 傾 β =0.8893 大 く異 い わ .
回帰 析:身長 性別 使う
以 男女い 回帰 析 場合 男女別 回帰 析
場合 回帰直線 傾 大 く わ . 握力grmax
明 式 く 際 身長ht 不十 あ 性別sex 式 加え 必要
あ 意味 . 以 う 回帰式 計算 う.
res2=lm(grmax ~ ht + sex, data) summary(res2)
今 く解析結果 表示 以 う 回帰式 grmax
-54.19531 0.52926×ht 8.81692×sex 誤差 わ .
次 散布 以 回帰 析 結果 表示 う. 男女別 散布
描 .
plot(data$ht, data$grmax, col=sex)
前 や 式 加え プ ョン col=sex 加え 男女別 違う色 プ
ッ い .変数sex 文字列”M”, “F” う 使い 自動
的 数字 変換さ 数字 わ 例え M 2, F=1
う . 数col 1 黒色 2 赤色 男性 赤色 女
性 黒色 プ ッ .
散布 身長ht く性別sex 明変数 加え 回帰式 描
う.回帰式grmax -54.19531 0.52926×ht 8.81692×sex 誤差 男性 場合sex=1, 女性 場合sex=0 い 男性 grmax -45.3136 0.52926×ht 誤差, 女性 grmax -54.19531 0.52926×ht 誤差 片
異 わ .
直線 追加 関数abline( ) 使い Y=a+b×X 直線 描く場合
abline(a,b) .今 場合 男性 回帰直線 abline(-45.3136, 0.52926), 女性 回帰直線 abline(-54.19531, 0.52926) 手 打 込 良い.
abline(-45.3136, 0.52926, col=”red”) # 男性 回帰直線 abline(-54.19531, 0.52926) #女性 回帰直線
手 打 込 面倒 方 回帰 析結果res2 使う方法 試 い.
res2 何 入 い 見 names(res2)
130 140 150 160 170 180
102030405060
ht
grmax
表示さ . 変数res2 1番目 coefficients 係数 2番目
residuals 残渣 入 い 以 様 示 例え
res2[[1]]
変数res2 入 い 回帰 析 係数 推定値 表示さ . (Intercept) ht sexM
-54.1953084 0.5292596 8.8169195
片 1番目 身長ht 係数β 2番目 性別 男 係数 3番目 入 い 取 出 res2[[1]][1], res2[[1]][2], res2[[1]][3] .
女性 回帰直線 片 res2[[1]][1], 傾 res2[[1]][2], 男性 回帰直線 片 res2[[1]][1]+res2[[1]][3], 傾 res2[[1]][2] わ . 以
う 回帰直線 式 書い い.
abline (res2[[1]][1], res2[[1]][2]) # 女性 回帰直線
abline(res2[[1]][1]+res2[[1]][3], res2[[1]][2], col=”red”) #男性 回帰直線
回帰 析:身長 性別 体重 使う
さ 体重wt 明変数 加え う.
res3=lm(grmax ~ ht + sex + wt, data) summary(res3)
130 140 150 160 170 180
102030405060
ht
grmax
身長ht 係数 先 回帰 析 推定値 異 わ .
回帰 析:身長 性別 BMI 使う
様 身長ht 性別sex BMI 追加 う.
res4=lm(grmax ~ ht + sex + BMI, data) summary(res4)
身長ht 係数 異 わ .
う 変数 明変数 加え 回帰係数 値 異 .
変数 明変数 加え う 一般的 言う 明変
数 多 多い 回帰式 明力 高く 誤差 小さく .
例え 握力 明 100個 明変数 入 式 作
約 立 い う. 言い 明変数 数 多 多い 回帰
式 タ 当 良く 逆 他 タ 例え 他
集団 測定 タ 当 悪く . 明変数
明力 高い く 他 タ 当 良く
明変数 数 必要 わ . 明変数 うや 選
い 詳細 例え 情報量基準AIC (Akaike’s Information Criteria) 最小 あ いう基準 く使わ .