特に何も指定しなかった場合、regressは最小2乗法(OLS: ordinary least squares)による回帰を実行しま す。しかしOLSの場合には分散の均一性(homoskedasticity) が一つの前提となっている点に注意する必要 があります。例えばExampleデータセットauto.dtaに対して次のようなフィットを行ってみます。
. sysuse auto, clear (1978 Automobile Data)
. replace weight = weight/1000*14
*13i.演算子についてはmwp-028を参照。
*14メニュー操作:Data◃Create or change data◃Change contents of variable 適正な係数値を得るため、車重の単位をポンドからKポンドに変更します。
. regress mpg weight
_cons 39.44028 1.614003 24.44 0.000 36.22283 42.65774 weight -6.008687 .5178782 -11.60 0.000 -7.041058 -4.976316 mpg Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 2443.45946 73 33.4720474 Root MSE = 3.4389 Adj R-squared = 0.6467 Residual 851.469221 72 11.8259614 R-squared = 0.6515 Model 1591.99024 1 1591.99024 Prob > F = 0.0000 F( 1, 72) = 134.62 Source SS df MS Number of obs = 74 . regress mpg weight
このモデルは単回帰であるため、フィットの様子を直接視覚化することが可能です。
. twoway (scatter mpg weight) (lfit mpg weight), ytitle(mpg)*15
フィットされた直線周囲のデータ点のバラツキは余り均等とは言えないように見えます。この点は診断プロッ トの1つであるrvpplot(residual-versus-predictor plot) を使うとより鮮明なものにできます。
. rvpplot weight, yline(0)*16
*15メニュー操作:Graphics◃Twoway graph (scatter, line, etc.) 詳細については補足1を参照。
*16メニュー操作:Statistics◃Linear models and related◃Regression diagnostics◃Residual-versus-predictor plot
rvpplotは残差を特定の説明変数(今の場合、weight)と対向させた形でプロットする機能を提供します。
この分散不均一性(heteroskedasticity)はフォーマルな検定によっても確かめることができます。
• Statistics◃ Postestimation◃Reports and statisticsと操作
• estatダイアログ: Reports and statistics: Tests for heteroskedasticity (hettest)
図5 estatダイアログ
Prob > chi2 = 0.0009 chi2(1) = 11.05
Variables: fitted values of mpg Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . estat hettest
estat hettestの出力に示されているように、均一な分散を仮定した帰無仮説H0に対するp値が0.0009で すから、H0は棄却せざるを得ないわけです。
このように今回設定したモデルについては分散の均一性が主張できないため、OLSの結果を疑ってかかる必 要がありそうです。OLSに代る推定法を選択するにはregressダイアログのSE/Robustタブを利用します
(SEは標準誤差(standard error)の略です)。
• Statistics◃ Linear models and related◃Linear regressionと操作
• Modelタブ: Dependent variable: mpg Independent variables: weight
• SE/Robustタブ: Robust
図6 regressダイアログ-SE/Robustタブ
_cons 39.44028 1.98832 19.84 0.000 35.47664 43.40393 weight -6.008687 .5840839 -10.29 0.000 -7.173037 -4.844337 mpg Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust
Root MSE = 3.4389 R-squared = 0.6515 Prob > F = 0.0000 F( 1, 72) = 105.83 Linear regression Number of obs = 74 . regress mpg weight, vce(robust)
vce(robust)オプションを指定した場合には分散不均一性を許容する推定法が用いられます。OLSの場合と 比べ点推定値に変化は生じませんが、標準誤差や信頼区間の推定値が変わってきます。たまたま今回の例では 次の表に見られるように95% CIに大きな違いは見られませんでした。
OLS Robust
weight [−7.04,−4.98] [−7.17, −4.84]
cons [36.22,42.66] [35.48, 43.40]
SE/Robustタブ上でClustered robustを選択した場合には、グループ(クラスタ)内での相関を許
容した推定法が実行されます。
補足1 – グラフ作成コマンド操作
セクション5では散布図にフィット直線を重ね合わせる形でグラフを作成しましたが、その操作の詳細を記し ておきます。
• Graphics◃Twoway graph (scatter, line, etc.) と操作
• Plotsタブ上でCreateボタンをクリック、表示されるPlot 1ダイアログ上で次の設定を行う。
◦ Choose a plot category and type: Basic plots(デフォルト)
◦ Basic plots: Scatter
◦ Y variable: mpg
◦ X variable: weight
• Plotsタブ上で再度Createボタンをクリック、表示されるPlot 2ダイアログ上で次の設定を行う。
◦ Choose a plot category and type: Fit plots
◦ Fit plots: Linear prediction(デフォルト)
◦ Y variable: mpg
◦ X variable: weight
• Y axisタブ: Title: mpg
. twoway (scatter mpg weight) (lfit mpg weight), ytitle(mpg)
¥
mwp-042
anova/oneway - 機能概要と用例
anovaは分散分析の機能を提供する汎用的なコマンドです。これに対しonewayは一元配置ANOVAに特化 し、多重比較機能も包含するなど、より使いやすさを追求したコマンドです。