質的変数を右辺に使った場合は,基準(この場 合は女)に対する増加分で質的変数の効果を表 します.
女女 男男
基準の女の体重 α からの増分 β
β1β1
中卒の体重 α 中卒の体重 α
β2β2 高卒の体重
高卒の体重
大卒の体重 大卒の体重
(中卒)体重 Y =α +誤差 ε
(高卒)体重 Y =α + β1 + 誤差 ε
(大卒)体重 Y =α + β2 + 誤差 ε 誤差 ε は正規分布
(中卒)体重 Y =α +誤差 ε
(高卒)体重 Y =α + β1 + 誤差 ε
(大卒)体重 Y =α + β2 + 誤差 ε 誤差 ε は正規分布
(続)
面倒くさいので
を以下のように書くことにします.
この(性別)変数は女の体重に対する男の増加 分を表すものとします
体重 Y =α +(性別)+誤差 ε 誤差 ε は正規分布
体重 Y =α +(性別)+誤差 ε 誤差 ε は正規分布
(女性)体重 Y =α +誤差 ε
(男性)体重 Y =α + β + 誤差 ε 誤差 ε は正規分布
(女性)体重 Y =α +誤差 ε
(男性)体重 Y =α + β + 誤差 ε 誤差 ε は正規分布
(続)
同じように
を以下のように書くことにします.
この(学歴)変数は中卒の体重に対する高卒また は大卒の増加分を表すものとします
体重の測定値 Y =α +(学歴)+誤差 ε 誤差 ε は正規分布
体重の測定値 Y =α +(学歴)+誤差 ε 誤差 ε は正規分布
(中卒)体重の測定値 Y =α +誤差 ε
(高卒)体重の測定値 Y =α + β1 + 誤差 ε
(大卒)体重の測定値 Y =α + β2 + 誤差 ε
誤差 ε は正規分布
(中卒)体重の測定値 Y =α +誤差 ε
(高卒)体重の測定値 Y =α + β1 + 誤差 ε
(大卒)体重の測定値 Y =α + β2 + 誤差 ε 誤差 ε は正規分布
(続)
例えば学歴の統計モデルの場合は,
この例では,
仮説はデフォルトで H0:α=0 vs. H1:α≠0
H0:β1=0 vs. H1:β1≠0, H0:β2=0 vs. H1:β2≠0
α の推定値= 56.8, P 値 <0.05 より H0 を棄却→ H1
β1 の推定値= 0.56, P 値≧ 0.05 より H0 を棄却でき ず
β2 の推定値= 1.88, P 値 <0.05 より H0 を棄却→ H1
体重 Y =α +(学歴)+誤差 ε 誤差 ε は正規分布
体重 Y =α +(学歴)+誤差 ε 誤差 ε は正規分布
右辺が量的変数と質的変数の場合
この例では,
仮説はデフォルトで H0:α=0 vs. H1:α≠0
H0:β=0 vs. H1:β≠0, H0: 性差 γ=0 vs. H1: 性差 γ≠0
体重 Y =α + β× 身長+(性別)+誤差 ε 誤差 ε は正規分布
体重 Y =α + β× 身長+(性別)+誤差 ε 誤差 ε は正規分布
演習②
demo.csv を読み込み以下の統計モデルについて 答えなさい.
① H0: 男女差あり vs H1 :男女差なしの検定を行 いなさい.ただし,有意水準は 0.05 とする.
② β を推定しなさい.
ふつうは独立変数 X が Y に及ぼす影響を調べた いので切片 α の推定や検定は行わない
体重 Y =α + β× 身長+(性別)+誤差 ε 誤差 ε は正規分布
体重 Y =α + β× 身長+(性別)+誤差 ε 誤差 ε は正規分布
この場合の結果の読み方
身長の係数 β=0.63 は何を表すのか?
男女差は γ=5.71 で吸収される
β=0.63 は性別の影響を除外した上での,身長が体重に 及ぼす影響力を表す
影響を除外した変数を右辺に入れれば良い 体重 = -46.7 + 0.63× 身長+(男 5.71/ 女 0 )+誤差
体重 = -46.7 + 0.63× 身長+(男 5.71/ 女 0 )+誤差
まとめ・線型モデル
量的変数= α + β× 量的変数+誤差
回帰分析
量的変数はいくつあっても OK
量的変数= α +(質的変数)+誤差
分散分析 ANOVA
質的変数が男女のように 2 水準なら t 検定となる
量的変数= α + β× 量的変数+(質的変数)+誤差
共分散分析 ANCOVA
以上すべての統計モデルをまとめて線型モデル Linear model と呼ぶ
??? Questions ???
課題
自分の番号のデータ”番号 .csv” を読み込み以 下の統計モデルについて答えなさい.
① Sleep に Depression が影響するか検定しなさ い.
② Sleep に Sex が影響するか検定しなさい.
③ β を推定しなさい.
④ 女性に対する男性の睡眠時間増加分を推定しな さい.
Sleep =α + β×Depression +
( Sex )+誤差
・・・誤差 ε は正規分布
Sleep =α + β×Depression +
( Sex )+誤差
・・・誤差 ε は正規分布