第
1
章 補論
2015 年 4 月 6 日
1. ECCSリモートシステムの使い方.
ECCSのウェブサイトに接続し,ページ左下のリモートアクセス環境から接続をする. (https://ras.ecc.u-tokyo.ac.jp/guacamole/)
2. MacにおけるDo-file Editorの使い方.
babababababababababababababababababababab
MacにおけるDo-file Editorの使い方
Windowsメニュー Do-file Editor
▶ Top Do-file editor
ファイルにコマンドを書き入れた後, 右上のDoアイコンを押すか、Viewメニュー ▶ Do-file Editor▶ Execute(do)を選ぶ.
3. Macにおける画面サイズの変更
画面左上の メニュー ▶ System Preferences...
出てきた画面でDisplayを選択してクリックし, さらにResolutionのScaledをクリックして選 んで800x600などを選ぶ.
2015 年 4 月 9 日
babababababababababababababababababababab
csvファイルの読み込み
Fileメニュー Import
▶ Tex data (delimited, *.csv,...)
画面でBrowse...をクリックし, csvファイルを選択する. babababababababababababababababababababab xls, xlsxファイルの読み込み Fileメニュー Import ▶ Excel spreadsheet (*.xls, *.xlsx)
画面でExcel file:のBrowse...をクリックし, xls(またはxlsx)ファイルを選択する. 第1行目が変数の名前の場合には, Import first row as variable namesに✓(チェッ ク)を入れる.
2. データの入力のしかた (Commandウィンドウを使ってcsvファイルを読み込む)
(2) 現在のディレクトリを作業したいディレクトリに変更する. 具体的にはcd "作業ディレクトリ" と入力するか (cd:change directory), FileメニューからChange Working Directory... を選んで, ディレクトリを指定する. (3) insheet using ファイル名とすると, データが入力される. ※ 作業ディレクトリがわかっていれば, 直接 insheet using "ファイルへのパス"とすることも できる. 2015 年 4 月 20 日 1. 比率の区間推定. 比率の区間推定は以下のように行うこともできる. babababababababababababababababababababab 比率の区間推定 Statisticsメニュー
Summaries, tables, amd tests
▶ Summary and descriptive statistics ▶ Binomial calculator
画面でSample sizeに観測値の個数 n = 865 , Successesに試行の成功回数 x = 268aを いれる.
a
nˆp = 865× 0.31 = 268.15 より, x = 268 とわかる. デフォルトの計算方法はExactだが, Waldを選べ
表1.1: 比率の信頼区間
. display 865*0.31 268.15
. cii 865 268
Binomial Exact --Variable | Obs Mean Std. Err. [95% Conf. Interval]
---+---| 865 .3098266 .0157228 .2791244 .3418306
. cii 865 268, wald (Waldを指定した場合)
-- Binomial Wald ---Variable | Obs Mean Std. Err. [95% Conf. Interval]
---+---| 865 .3098266 .0157228 .2790104 .3406427
. prtesti 865 268 0.4, count (仮説検定を標本比率0.31でなく, 計数(count)268を使っ た場合)
One-sample test of proportion x: Number of obs = 865
---Variable | Mean Std. Err. [95% Conf. Interval]
---+---x | .3098266 .0157228 .2790104 .3406427
---p = ---pro---portion(x) z = -5.4135
Ho: p = 0.4
Ha: p < 0.4 Ha: p != 0.4 Ha: p > 0.4
Pr(Z < z) = 0.0000 Pr(|Z| > |z|) = 0.0000 Pr(Z > z) = 1.0000 ※ 仮 説検 定 で計 数 (count) を使うには, 画面の下部に ある Use integer counts instead of proportionsに✓(チェック)をいれて, 標本比率の代わりに計数を入れればよい.
2. Video examples. ヘルプで現れる画面に, Video examplesという項目がある場合には, ク リックすると解説のビデオをYoutubeで見ることができる (ただし, バージョンは12).
3. 分布の裾の面積を求める
• t 分布の右裾の面積が 0.05 (5%)であるような点を求める. Commandウィンドウでdisplay invttail(自由度, 0.05)といれる. display invttail(自由度, 0.05)といれる.
• t 分布において, t 値より右側の面積を求める. Commandウィンドウでdisplay ttail(自 由度, t値)といれる.
• 正規分布の左裾の面積が 0.95 (95%)であるような点を求める. Commandウィンドウでdisplay invnormal(0.95)といれる.
• STATAで利用可能な関数を見るには, Commandウィンドウでhelp functionsといれる. あ るいはDataメニューで, Other utilities▶ Hand calculatorを選び, Create...を押す と, Category:に関数のリストがある.
4. その他
• Macでは, オプション・キー + Y=キー → \
2015 年 4 月 23 日
• 25ページ. 脚注4を下記に修正.
対数リターン (連続複利の収益率) (log pt − log pt−1) × 100 (たとえば, (log(topix)
-log(L.topix))*100 )を用いても良い.
• 25ページ. 2期前, 3期前のラグはL2.sony, L3.sonyなどと表す.
• 28ページ. 脚注5. 図1.24は平均値の信頼区間で, Xi = xi が与えられた時の Yi の期
待値 E(Yi|Xi = xi) = β0 + β1xi の95%信頼区間について, xi の値を様々に変えて曲線を
つなげたものとなっている。一方、脚注5にあるConfidence interval for an individual forecast は各予測の信頼区間で, 新しく Xi = x∗i が与えられた時の Yi∗ = β0+ β1x∗i + ϵ∗i の95%信頼区間であり, 前者と区別するために95%予測区間とも呼ばれる. 平均だけにフォー カスする前者と異なり、誤差項 ϵ∗i まで考慮するので区間の幅が広くなる。 図1.1: 散布図と推定された回帰直線, 95%信頼区間(左)と95%予測区間(右) (1) −6 0 6 −4 −2 0 2 4 x 95% CI Fitted values y 95% Confidence Interval −6 0 6 −4 −2 0 2 4 x 95% PI Fitted values y 95% Prediction Interval
図1.2: 散布図と推定された回帰直線, 95%信頼区間と95%予測区間(2) −6 0 6 −4 −2 0 2 4 x 95% PI Fitted values 95% CI y
95% Confidence Interval & 95% Prediction Interval
STATA14での変更点
1.1.
babababababababababababababababababababab
正規乱数を発生させる データ(Data)メニュー
データの作成または変更(Create or change data)
▶ その他の変数作成コマンド(Other variable creation commands) ▶ 正規分布から標本を抽出(Draw sample from normal distribution)
図1.1: 乱数を発生する
babababababababababababababababababababab
データを閲覧または編集する データ(Data)メニュー
データエディタ(Data Editor)
▶ データエディタ(ブラウズ) (Data Editor (Browse))
(または ▶ データエディタ(編集)(Data Editor (Edit))
babababababababababababababababababababab
散布図を描く
グラフィックス(Graphics)メニュー
二元グラフ(散布図/折れ線など)(Twoway graph (scatter, line, etc))
図1.4: 散布図 (2) babababababababababababababababababababab 基本統計量を求める データ(Data)メニュー データの内容表示(Describe data) ▶ 記述統計量(Summary Statistics) または 統計(Statistics)メニュー
要約/表/検定(Summaries, tables, and tests)
▶ 記述統計量(Summary and descriptive statistics) ▶ 記述統計量(Summary Statistics)
図1.6: 基本統計量(1)
babababababababababababababababababababab
分散, 共分散, 相関係数を求める 統計(Statistics)メニュー
要約/表/検定(Summaries, tables, and tests)
▶ 記述統計量(Summary and descriptive statistics) ▶ 相関と共分散(Correlations and covariances)
図1.8: Do-file Editorの画面
1.2.
図1.11: 詳細な要約統計量を出力する.
babababababababababababababababababababab
csvファイルの読み込み
ファイル(File)メニュー インポート(Import)
▶ テキストデータ (デリミタ, .csv等)(Tex data (delimited, *.csv,...))
画面で参照(Browse...)をクリックし, csvファイルを選択する.
babababababababababababababababababababab
xls, xlsxファイルの読み込み
ファイル(File)メニュー インポート(Import)
▶ Excelシート形式(.xls, xlsx)(Excel spreadsheet (*.xls, *.xlsx))
画面でExcelファイル(Excel file:) の参照(Browse...) をクリックし, xls(または xlsx)ファイルを選択する. 第1行目が変数の名前の場合には, 第1行を変数名として
1.3.
babababababababababababababababababababab
母平均の信頼区間を求める 統計(Statistics)メニュー
要約/表/検定(Summaries, tables, and tests)
▶ 記述統計量(Summary and descriptive statistics) ▶ 信頼区間(Confidence intervals)
図1.14: 母平均の95%信頼区間
babababababababababababababababababababab
母平均 (母平均の差) の仮説検定
統計(Statistics)メニュー
要約/表/検定(Summaries, tables, and tests) ▶ 古典的仮説検定(Classical tests of hypotheses) ▶ t検定(平均比較検定)(t test (mean-comparison test))
図1.15: 仮説検定:有意水準5%
babababababababababababababababababababab
比率の区間推定
統計(Statistics)メニュー
要約/表/検定(Summaries, tables, and tests)
▶ 記述統計量(Summary and descriptive statistics) ▶ 二値信頼区間(集計値)(Binomial calculator)
画面で標本の大きさ(Sample size)に観測値の個数 n = 865 , 成功回数(Successes)に 試行の成功回数 x = 268aをいれる. anˆp = 865× 0.31 = 268.15 より, x = 268 とわかる. デフォルトの計算方法は正確(Exact)だが, ワル ド(Wald)を選べば正規分布に基づく近似的な信頼区間が出力される. babababababababababababababababababababab 母比率(母比率の差)の仮説検定 統計(Statistics)メニュー
要約/表/検定(Summaries, tables, and tests) ▶ 古典的仮説検定(Classical tests of hypotheses) ▶ 比率検定(集計値)(Proportion test calculator)
図 1.17: 比率の仮説検定:有意水準5%
1.4.
babababababababababababababababababababab
新しい変数を作成する データ(Data)メニュー
データの作成または変更(Create or change data) ▶ 新規変数の作成(Create new variable)
図1.19: 変数の定義
babababababababababababababababababababab
時間変数を指定する
統計(Statistics)メニュー 時系列(Time series)
▶ 設定とユーティリティ(Setup and utilities)
図1.20: 時間変数の指定
babababababababababababababababababababab
単純回帰分析
統計(Statistics)メニュー
線形モデル他(Linear models and related) ▶ 線形回帰(Linear regression)
図1.21: 単純回帰分析