経済分析のための Stata 入門
経済産業研究所計 析 室 松浦 幸
早稲田大学大学院経済学研究科 佐々木明果
慶應義塾大学大学院経済学研究科 渡辺善
†
†
暷新 http://park1.wakwak.com/~mt_tosiyuki/stata-manual.htm ウン 可能
目
第1 章 Stバtバ め 一歩...3
Stバtバ 起動...3
タヴタ 読 込 ...4
タヴタを保 る...5
読 込ん タヴタを確認 よう...6
変数 加工 条件式...8
コマ ネァ゜ャ め...10
LOG を る...12
第 章補論...15
補論 タヴタ読 込 ダメノャクュヴゾ゛ンエ...15
補論 ハュエメプンエ よる繰り返 作業...19
第 章 作成...20
タヴタ 縦方向 結合 ...21
タヴタ 横方向 結合 ...22
少数 タヴタセッダ ら大規模タヴタ 値を割り当 る...24
不完全一致 タヴタセッダ 接続...25
第 章 記述統計 よる 析 表 作成 ...27
ィゾガモヴ区 され 変数 質的タヴタ ...27
連続変数 記述統計量を る...30
階級別ィゾガモヴ変数 作成 度数 布表 作成 ...39
タヴタ エェセャへ 移行...41
第 章 回帰 析ン離散選択ペタャ 推定...43
回帰 析...43
離散選択ペタャ...48
回帰 析結果 整理 outregカブンチ ...51
第 章 ドネャタヴタ よる 析...53
ドネャタヴタ ...53
ドネャタヴタ よる回帰 析...58
第 章 補論 重複タヴタ 対処法...60
第 章 キト゜トャ 析...63
キト゜トャ 析 ...63
キト゜トャタヴタ 認証...63
キト゜トャ 析...64
索 引...67
第 1 章 Stバtバ め 一歩
Stバtバ 起動
Stata 起動 う ン Stata 起動 以 ウ ン ウ
現 以 簡単 ウ ン ウ 役割 い 明
(4) Results ウ ン ウ
(2) Review ウ ン ウ ュ
(3) Variableウ ン ウ
(1) Commandウ ン ウ
Stata Command: ン 入力 ウ ン ウ
Review:過去 実行 ン 表示 い 表示 い ン
ッ Stata Commandウ ン ウ 表示 Variable:使用 変数 一覧 表示 Stata Results: 処理 結果 表示
実際 処理 あ ュ 処理方法 指定 Stata Command ウ ン
ウ ン 直接入力 作業 進 初心者 ュ 処
理方法 指定 ほう 簡単 Command ウ ン ウ ン 入力 作業
進 方法 中心 明 方法 Stata 操作 慣 利
用 際 移行 や い
タヴタ 読 込
Stata 拡張子 .dta い Stata形式 処理 用い
Stata 形式 用意 必要 あ 通常 処理 前段階
EXCEL形式や 区 ン 区 CSV 保 い 場合 ほ
形式 Stata 込 方法 検討 う
以 う 場企業 財務 込 場合 検討
表
証券 漢 略称 売 高 経常利益 賃金俸給 試験研究 従業員数
F y Y
準備 変数 変更 Stata 日曓語 応 い 変数
日曓語 場合 文 化 い 変数 半角英数 用い い 表
う ッ あ 行目 日曓語変数 削除 込 い
※変数 や ン 使え ”R-and-D” ”RandD” い う
使い い場合 ン ”R_and_D” 用い う
P W _ _D
F y Y
タノ区 りンィンブ区 り CSV ネァ゜ャ 読 込
insheet ン 用い 表 CSV え D ¥Data
内 profit-loss.csv いう 保 い
以 う ン Commandウ ン ウ 書 込
insheet using d:¥Data¥profit-loss.csv
表頭 変数 入力 Variableウ ン ウ 変数 表示 入力
い い場合 変数 v1 v2 v3… 場合 rename ン 変数 変更
rename 使い方
rename [旧変数 ] [新変数 ]
複数 込 行う際 作業用 指定 え
D ¥Data 作業用 以 ン 記 込
ン 意味
cd d:¥Data
insheet using profit-loss.csv
現在指定 い 作業用 確認 際 pwd ン 用い
. pwd D:¥Data
エェセャネァ゜ャ 読 込
込 方法 い 方法 あ
(1) 区 ン 区 CSV形式 保 insheet ン 入力
(2) 付
ュ Data ッ Data Editor 開 あ EXCEL 入力 い
範 指定 Data Editor 開い い 状態 ュ Edit
Paste 簡単 込
※ Do い 述 (1) 方法 勧 (1) 方法 場合
Do 作業 化 暷初 EXCEL
作成 補正 変数 追加 場合 込 遡 作業 や 直
タヴタを保 る
込 Stata 形式 保 う 保 方 通 あ
ュ file Save or Save as 保 Commandウ ン ウ save ン 入力
い 新規 作成 場合 以 う
save D:¥Data¥profit-loss.dta
既 書 場合 , replace ョン 付 わ
save D:¥Data¥profit-loss.dta ,replace
一度 保 開 use ン 用い
use D:¥Data¥profit-loss.dta
読 込ん タヴタを確認 よう
保 込 確認 う ュ ワ 形
ン あ わ う ?右側 Data Browser ッ
ワ 現 入力 い 確認 う Data
Browser う 直接 加
Data Browser
変数 あ 場合 Data Browser 一度 表示 い
必要 あ 面倒 場合 必要 変数 表示 あ 条件 満
表示 具体的 Commandウ ン ウ
browse sale profit
入力 sale profit 表示
sale 100,000以 企業 表示 い
browse if sale<=100000
条件式 ”if” 使い方 い 述
ほ Resultsウ ン ウ 確認 方法 い あ (1) list variable1 variable2 …:変数(variable) 内容 表示
list sales profit wage
を---を ル モバleモ ミメマフit wバブe ル ル---ル 1. ル 32イ①2ィ② イ3②ィ1 ィ9③③29 ル 2. ル 239ィ0③イ 300イ9 ィイ9219 ル 3. ル イ③22①② イイイ0 99ィ0イ ル ィ. ル 3②①ィ3 -1ィ1② 9ィ①3 ル イ. ル 12ィ③①3 123 2②③22 ル ル---ル ①. ル ③③0ィ② -③9イ 20009 ル ②. ル 1③イ③②ィ 33ィ② ィ3393 ル を---を
(2) describe:標曓数 変数 属性 表示 ”des” 省略可
. deモ
Cマntバinモ dバtバ
マパモ: ② vバメモ: ② モiラe: 2イ2 (99.9れ マフ memマメy フメee)
--- モtマメバブe diモミlバy vバlue
vバメiバパle nバme tyミe フマメmバt lバパel vバメiバパle lバパel
--- cマde int れ③.0ブ
nバme モtメ10 れ10モ モバleモ lマnブ れ12.0ブ ミメマフit lマnブ れ12.0ブ wバブe lマnブ れ12.0ブ
メ_バnd_d lマnブ れ12.0ブ R_バnd_コ lバパマメ lマnブ れ12.0ブ Lバパマメ
--- Sマメted パy:
Nマte: dバtバモet プバモ cプバnブed モince lバモt モバved
※ ”storage type” 変数 形式 ”int” 整数 ”str10” 10bite以 文 列 long long
形式 あ 示
(3) sum variable1 variable2 …:変数 variable 基曓統計 表示 . モum nバme モバleモ ミメマフit
Vバメiバパle ル Oパモ Meバn Std. コev. Min Mバx ---を--- nバme ル 0
モバleモ ル ② 9イ2②1③ 131イ2イ9 3②①ィ3 32イ①2ィ② ミメマフit ル ② 12929.②1 210③0.1 -1ィ1② イ3②ィ1
※ ”name 文 列 基曓統計 計算
変数 加工 条件式
変数 加
表 作成 際 変数 足 引い 掛 割 いう作業 必要 場合 出
使え ン 整理 う
ブeneメバte:新 変数を作 り 変数を加工 る場合 使用 ブen 省略可
gen newvar1 = variable1 + variable2 gen newvar2 = variable1 - variable2 gen newvar3 = variable1 * variable2 gen newvar4 = variable1 / variable2
例 generate hosdc2=hosd1 + hosd2 generate age2 = age*age
eブen:ブenカブンチ 使え いいく 関数を使うこ るカブンチ
egen newvar = function(variable1)
function 関数 書 込 利用 多数あ 主 以
mean: 均値 sum:合計 max:暷大値 min:暷 値
例 egen avg = mean(chol)
例 chol 均値 計算 値 avg 代入
※ 注意点
generate sum( ) 変数 番 合計 値 表示 い
egen sum( ) 変数 合計 値 常 表示
gen sum1 = sum(A) egen sum2 = sum(A)
A Sum1 Sum2
1 1 15
2 3 15
3 6 15
4 10 15
5 15 15
作成 際 group関数 便利 え 以 う
都道府県 group関数 使 新 い変数 作成 う
Prefecture Year Hokkaido 1990 Hokkaido 1991 Aomori 1990 Aomori 1991 Iwate 1990 egen newvar = group(year)
newvar prefecture year
1 Hokkaido 1990
2 Hokkaido 1991
1 Aomori 1990
2 Aomori 1991
1 Iwate 1990
year 特定 い 数値 割 当 ッ 内
変数 例 prefecture 指定 ッ 内 複数 変数 並
メeミlバce: 在 る変数 値 を書 換える時 用いる
replace oldvar = value1 if variable==2
variable 2 場合 oldvar 値 value1 置 換え 例 : 変数 値 書 換え
replace odd = 5 if odd == 8
Odd Even
1 2
3 4
-8 6
7 8
9 10
Odd Even
1 2
3 4
条件式 書 方
度々 場 い 条件式 書 方 い う
等 い (==)
replace newvar=1 if var1==0
等 い(!= ~=)
replace newvar=1 if var1!=0 replace newvar=1 if var1~=0 大 関係(>,<,<=,>=)
replace newvar=1 if var2=>0 (&)
replace newvar=1 if var2=>0&var1==0 (|)
replace newvar=1 if var2=>0|var1==0
A B C D
replace newvar=1 if (var3==”A”&var4==”B”)| (var3==”C”&var4==”D”)
※変数 文 列 あ 条件式 加え
コマ ネァ゜ャ め
5 6
7 8
9 10
Do い う Do Stata ン 作業 程 書
並 い ン 実行 際 い 便利 作業 程
DO 記述 習慣 作業 う一度初 や 直
人間 いう 動物 作業 繰 返 い う
う 場合 一連 作業 Do 記述
元 戻 ッ 修正 わ
Do 作成方法 秀丸 キ Stata ン 書 込
作成 保 拡張子 .do Stata 専用 Do
あ 使い勝手 あ あ 以 例 一連 作業
DO
“ do file 例
insheet using c:\Data\profit-loss.csv des
list sales labor sum sales labor
Do 中 ン 加え 場合 行頭 “ 変数 数
あ 改行 い場合 行曒 /“ 行 行頭 “/ 入
“ Do 改行 い
insheet using c:\Data\profit-loss.csv des
list sales labor wage /“
“/ name profit
Do 実行 file → do 所在 指定 参照
Commandウ ン ウ 利用 際 do c:¥Data¥yomikomi.do
入力
LOG を る
正 Stata 込 確認 い い 析 前
作業記録 方 い う
Stata 作業結果 Results ウ ン ウ 表示 結果 長 見
Results ウ ン ウ 表示 結果 記録 必要
出 わ
作成 ュ LOG ン ッ 既
開 出 来 際 結 果 既 付 足 Append 選
択 書 Overwrite 選択
Commandウ ン ウやDo 実行 い場合
log using D:¥Data¥logwotoru.log
既 logwotoru.log ン 以 結果 付 足 い 場合
log using D:¥Data¥logwotoru.log, append
書 際 ”append” 代わ ”overwrite” 記入 拡張子 ”.log” い
必 ”.log” あ 必要 あ 拡張子 キ 保
い 秀丸等 開 出来
Log
第 章補論
補論 タヴタ読 込 ダメノャクュヴゾ゛ンエ
込 際 処法 い い 解
ベペモヴ 足り い!
大容 込 以 う ッ Results ウ ン ウ 表示
込 い あ
. uモe らコ:\コバtバ\dバiペiパマ-dバtバ.cモvらん cleバメ nマ メママm tマ バdd mマメe マパモeメvバtiマnモ
グn バttemミt wバモ mバde tマ incメeバモe tプe numパeメ マフ マパモeメvバtiマnモ パeyマnd wプバt iモ cuメメently
ミマモモiパle. トマu プバve tプe フマllマwinブ バlteメnバtiveモ:
1. Stマメe yマuメ vバメiバパleモ mマメe eフフicientlyオ モee プelミ cマmミメeモモ. (Tプinペ マフ Stバtバ'モ
dバtバ バメeバ バモ tプe バメeバ マフ バ メectバnブleオ Stバtバ cバn tメバde マフフ widtプ バnd lenブtプ.) 2. コメマミ モマme vバメiバパleモ マメ マパモeメvバtiマnモオ モee プelミ dメマミ.
3. ジncメeバモe tプe バmマunt マフ memマメy バllマcバted tマ tプe dバtバ バメeバ uモinブ tプe モet memマメy
cマmmバndオ モee プelミ memマメy. メ(901)オ
ッ Stata 割 当 い ほう 大 い
う 場合 込 前 Stata 割 当 領域 確保
必要 あ え 50m割 振 い場合
set memory 50m
一度 込 失敗 ッ 出 割当 変更 い
場合 ッ い 具体的 Commandウ ン ウ 以 う 入
力 clear
パメマwモeや liモt タヴタ 確認 る モum 記述統計量 出 い!
数値列 文 列 混 い 込 際 変数 文 列 認識
い え う 損値 ”N.A.” 入力 い 場合 変数 文
列
A
A
A
ッ 込 descript ン 変 数 属 性 調 込 変 数
storage type str 文 列 い . deモ
Cマntバinモ dバtバ
マパモ: イ vバメモ: 3 モiラe: イ2 (99.9れ マフ memマメy フメee)
--- モtマメバブe diモミlバy vバlue
vバメiバパle nバme tyミe フマメmバt lバパel vバメiバパle lバパel
--- vバlue1 モtメィ れ③.0ブ
vバlue2 モtメィ れ10モ vバlue3 モtメィ れ12.0ブ
--- Sマメted パy:
込 変数 い sumarize 記述統計 出力 う 以 う
結果 出
. モum nバme モバleモ ミメマフit
Vバメiバパle ル Oパモ Meバn Std. コev. Min Mバx ---を--- vバlue1 ル 0
vバlue2 ル 0 vバlue3 ル 0
う 場合 込 前 戻 “N.A.” . 置換 空白
い う 再度 込 実行 い
Stata 変換 出来 置 換え ン あ replace 用い
replace value2=”.” if value2==”N.A.”
ン value2 要素 ”N.A.” い . 置 換え
いう意味 作業 変数 文 列 変数 要素
数値 .
destring value2,replace
入力
空白 え 誤 空白 ”^” ”;” 入 い 場合 文 列
い う 場合 入 い 探 出 大
変 当 変数 sort variable variable 内 大 い
ッ 並び暶え 変数 browse い 数値 異物 混入 い
一番暷 並 い
数値 文 列 組 合わさ 変数を 解 い
変数 数値 文 列 組 合わ い 場合 解 利用 い 考
え う
え 以 う 数値 文 組 合わ 変数 あ 変数
桁 業種 ッ 法人属性 個人企業 A 法人企業 B 一桁 曓店
(1) 支店 (2) 示 い code 1 5③A1 2 5③A2 3 5③B1 4 59B2
基曓的 generate ン ョン 付 処理
ッ 出 い
gen str1 corp=substr(code,3,1)
新 い変数 属性 変数 code 3 文 目 1 文 出
場合 1 byte 文 列
桁 数値 出 い
gen byte industry=real(substr(code,1,2))
新 い変数 属性 出 数値 実数 認識
場合 数値 real 無い場合 文 列扱い
結果 以 う
code corp industry
1 5③A1 A 5③
2 5③A2 A 5③
3 5③B1 B 5③
4 59B2 B 59
方法 応用 複数 結合 長い桁数 ID 番号 解
え 以 う ID 番号 あ
id 1 01201001 2 01201002 3 01301001 4 01304001
ID 桁 都道府県番号 桁 区 村 暷 桁 業所
解 方法 考え う
変数 id 文 列 認識
gen str10 code_str=string(id)
桁 出 prefecture 都道府県 gen byte prefecture=real(substr(code_str,1,2))
様 手 区 村 業所 出
補論 ハュエメプンエ よる繰り返 作業
う 作業 何度 繰 返 必要 あ DO 使 い い
ン 並 面倒 ン 初歩的 知識 あ 効率的 作業
複数 変数 処理 適用 い場合 for 使い え 以 ッ
う P.15 表 う 損値 N.A. 表示 い ッ あ い
N.A. 損値 変え 前述 う
replace value1=”.” if value1==”N.A.” replace value2=”.” if value2==”N.A.” replace value3=”.” if value3==”N.A.”
いう作業 繰 返 必要 あ 一連 作業 繰 返 ン 処理
う
for num 1/3: replace valueX=”.” if valueX==”N.A.”
for num ン 使う Stata X 番 数値 代入 ン 処
理 3 回繰 返
value1, value2, value3, value4 いう 変数 比率 計算
gen ratio12=value1/value2 gen ratio13=value1/value3 gen ratio14=value1/value4 gen ratio23=value2/value3 gen ratio24=value2/value4 gen ratio34=value3/value4
for num ン 使う 以 う ¥ 繰 返 数値 複数定義
for num 1/3 ¥ num 2/4: gen ratioXY=valueX/valueY
ン 弱点 数値 番 代入 使え い点 全 異 称 複数
変数 繰 返 処理 行う場合 foreach ン 使い
foreach v of varlist income consumption investment [改行] { [改行]
replace `v'=”.” if `v'==”N.A.” [改行] }
線部 処理 施 い変数 並 線部 繰 返 処理 施 い
ン 書 ン 実行 線部 `v’ 変数 番 代入
い
第 章 タヴタパヴケ 作成
第 2 章 複数 ッ 一 ッ 方法 い 検討
接続方法 A B C D E 異 ッ 入
以 う ン 考え
縦 接続 場合 ⇒
A
B
横 接続 場合:完全一致 ⇒
A C
方 ッ 一部 複数 応 場合 ⇒
A D
横 接続 場合: 完全一致 ⇒
A E
以 ~ 例 あ 検討 う
タヴタ 縦方向 結合
複数 個体 結合 方法 考え 例 都道府
県 一 方法 い 考え う
Hokkaido.dta
Prefecture Year Production
1 19③0 1200
1 19③1 1310
1 19③2 1450
省略
1 2000 25①0
Aomori.dta
Prefecture Year Production
2 19③0 ③00
2 19③1 ②10
2 19③2 1050
省略
2 2000 1420
結合 場合 append
ン 用 い 使 用 方 法 一 方 開 い 状 態 う 一 方
append 呼び出
具体的 以 う D:\Data あ
cd D:¥Data
use Hokkaido.dta
append Aomori.dta
save Production80-00.dta
完成 以 う
Prefecture Year Production
1 19③0 1200
1 19③1 1310
省略
1 2000 25①0
2 19③0 ③00
2 19③1 ②10
省略
2 2000 1420
append 使う際 注意点 必 共通 変数 変数 付 い い
タヴタ 横方向 結合
複数 個体 変数 各々 録 い 場合 結合
例 考え う 例 都道府県 生産 都道府県 賃金
接続 方法 考え
Wage.dta Production.dta
省略
省略
接続 キ 変数 sort 必要 あ Wage.dta
う D Data あ
モtマメバブe diモミlバy vバlue
vバメiバパle nバme tyミe フマメmバt lバパel vバメiバパle lバパel
--- ミメeフectuメe パyte れ③.0ブ
wバブe フlマバt れ9.0ブ
--- Sマメted パy:
. cd コ:\コバtバ D Data 移動
. deモ
Cマntバinモ dバtバ フメマm コ:\コバtバ\テバブe.dtバ
マパモ: ィ②
vバメモ: 2 21 グミメ 200ィ 21:イ③ モiラe: ィ23 (99.9れ マフ memマメy フメee)
---
場合 Sorted by 何 示 い い sort い い わ
sort prefecture
Command ウ ン ウ 入力 ソ う一度 des 確認 以 う
. des
Contains data from D:\Data\Wage.dta
obs: 4②
vars: 2 21 Apr 2004 21:5③ size: 423 (99.9% of memory free)
--- storage display value
variable name type format label variable label
--- prefecture byte %③.0g
wage float %9.0g
--- Sorted by: prefecture
状態 save
save Wage.dta,replace
書 replace 忘
save 準備完了
use Production.dta
接続 merge ン 使い merge ン
merge [キ 変数] using [接続 ]
場合 接続 キ 変数 prefecture 接続 Wage.dta
merge prefecture using Wage.dta
い ッ 以 う
様 Production.dta prefecture sort
う 先 呼び出 構い Production.dta 先 呼び出
う
以 う
う
1 3.616281 18954421 3
2 2.64389 4634405 3
3 3.52162 4678288 3
4 3.630811 8429719 3
5 3.347991 3901386 3
6 3.517322 4095372 3
7 3.928278 7692465 3
8 5.337247 11374471 3
9 4.912243 7739373 3
省略
47 2.687243 3268545 3
prefecture wage production _merge
_merge いう新 い変数 生成 い い 述 続
ッ merge 場合 _merge drop い い
少数 タヴタセッダ ら大規模タヴタ 値を割り当 る
接続 長 等 い 現実
作成 都道府県× × 目 全国一
え 物価指数 接続 い 作業 必要 あ う 場合
う いい う ?
例 以 う 全国 均 物価指数 作成 ッ 接続
方法 い 考え う
Price.dta Year Price 19③0 100.0 19③1 101.2 省略 2000 132.2
接続方法 基曓的 接続 際 キ 変数 接続
sort い う 確認 場合 示 Year キ 変数
問 一方 開い 状態 merge 行い
use Production80-00.dta merge year using Price.dta
結果 う い 以 表 う Year 一 必 Price
値 入 い 確認
Prefecture Year Production Price
1 19③0 1200 100.0
2 19③0 ③00 100.0
3 19③0 1921 100.0
省略
1 19③1 1310 101.2
2 19③1 1050 101.2
省略
1 2000 25①0 132.3
2 2000 1420 132.3
不完全一致 タヴタセッダ 接続
~ ッ ッ 含 キ 変数 完全 応関
係 あ 実際 以 う キ 変数 部 的 応 い い
あ 以 う 例 考え う
even.dta odd.dta
number Odd 1 1 2 3 3 5 4 7 5 9 number Even
5 10 6 12 7 14 8 16
キ 変 数 number 複 変 数
”5” number キ merge 以 う
use even.dta
merge number using odd.dta
number Even Odd _merge 5 10 9 3 6 12 1 7 14 1 8 16 1 1 1 2 2 3 2 3 5 2 4 7 2
場合 even.dta odd.dta number変数 共通 キ 指定 変
数 共通 場合 行 odd.dta 接続 異 場合 異 行 odd.dta 接続
merge ン 実行 _merge いう変数 副産物 生成 _merge
結合状態 表
_merge=3 : キ 指定 変数 結合前 方 在 い 場合
_merge=1 : キ 変数 merge 実行前 開い い 在 い 場
合
_merge=2 : キ 変数 merge実行時 呼び出 在 い 場合
even.dta odd.dta 接続 例
even.dta odd.dta 両方 含 い :_merge=3
even.dta 含 い :_merge=1
odd.dta 含 い :_merge=2
第 章 記述統計 よる 析 表 作成
ィゾガモヴ区 され 変数 質的タヴタ
区 主 質的 離散 指 一般的 区 数
値 文 問わ 大 位尺度 義尺度 種類 尺度
区 位尺度 例え 銀行 預金格付 う 信用度 高い AAA
~C 区 う 位 表わ 質的 義尺度 性 男 女 や結
婚 有無 既婚 曑婚 既婚暦有独身 う 特性 表わ 質的
以 ッ 例 STATA 記述統計 方 う 特 記載 い限
~ 通 以 一 ッ 例 使 ン 例 紹
扱う共通タヴタセッダ例
id time yeモnマ バブe フバmily y x1 x2
10001 1 0 3① 3 ③01.2 2イ0.1 22.③
10001 2 0 3② 3 ③ィ0.0 200.イ 2①.②
10001 3 1 3③ ィ ③ィイ.3 2③②.イ 19.ィ
10002 1 1 2ィ 2 イ23.0 1③ィ.1 3イ.③
10002 2 1 2イ 2 イ3ィ.1 19②.③ 1イ.2
10002 3 1 2① 2 イ91.イ 20イ.イ ィ0.9
10003 1 0 31 3 ②イ0.0 2②①.イ イイ.ィ
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
111①③ 2 1 ィ0 ィ 920.1 321.② 2③.9
111①③ 3 1 ィ1 ィ 900.ィ 312.③ イ2.②
id time 構成 表わ 変数
yesno 区 変数 連続変数
表 作成
tab ン 使 変数 見 う 一変数 着目 場合 度数
相 度数 積相 度数 確認
. tバパ yeモnマ
yeモnマ ル サメeム. Peメcent Cum. ---を--- 0 ル 1んィ10 ィ0.2ィ ィ0.2ィ 1 ル 2ん09ィ イ9.②① 100.00 ---を--- Tマtバl ル 3んイ0ィ 100.00
条件式 if 加え 範 指定 可能 plot ョン 加え 相
度数 視覚的 確認
変数 指定 確認 特 指定 い場合 度数
表示 相 度数 確認 行 相 度数 col 列 相 度数 row
表示 ョン 指定 必要 あ 度数表示 省略 相 度数 確認 い
時 nofreq ョン 指定
変数 指定 時 all ョン 情報 得
. tバパ yeモnマ time んメマw nマフメeム ル time
yeモnマ ル 1 2 3 ル Tマtバl ---を---を--- 0 ル 3ィ.0ィ 33.③3 32.13 ル 100.00 1 ル 32.③① 33.00 3ィ.1イ ル 100.00 ---を---を--- Tマtバl ル 33.33 33.33 33.33 ル 100.00 yeモnマ ル サメeム.
---を---を--- 0 ル ィ③0 ル*************************************
1 ル ①③③ ル***************************************************** ---を---を--- Tマtバl ル 1ん1①③
. tバパ yeモnマ time んバll メマw nマフメeム ル time
yeモnマ ル 1 2 3 ル Tマtバl ---を---を--- 0 ル 3ィ.0ィ 33.③3 32.13 ル 100.00 1 ル 32.③① 33.00 3ィ.1イ ル 100.00 ---を---を--- Tマtバl ル 33.33 33.33 33.33 ル 100.00 Peバメモマn cプi2(2) = 1.イイ9ィ Pメ = 0.ィイ9
liペeliプママd-メバtiマ cプi2(2) = 1.イ①2① Pメ = 0.ィイ③ Cメバm>'モ V = 0.0211
ブバmmバ = 0.0320 グSゴ = 0.02③ Kendバll'モ tバu-パ = 0.01③1 グSゴ = 0.01① . tバパ yeモnマ iフ time==1 んミlマt
メパャ 設定
区 変数 設定
銀行 格付 う 複数 AAA~C 在 時 推定 便宜 各
数値 え あ え AAA 1 AA 2 … 時
示 記述統 計 数値 変換 示 区 多
多いほ 数値 え方 い 混乱 い 設定 混乱 回
避 以 . yesno変数 い 例示 う
例 線部 適当 設定 続い 目 " " 内 目
指定 ッ 必要 目 ッ 数 記述 必
全 目 作 必要 あ
label define yesnolabel 0 "no" 1 "yes" label value yesno yesnolabel
指定 置 換え 変数 指定
設定 . 表 以 う 表示
yeモnマ ル サメeム. Peメcent Cum. ---を--- nマ ル 1んィ10 ィ0.2ィ ィ0.2ィ yeモ ル 2ん09ィ イ9.②① 100.00 ---を--- Tマtバl ル 3んイ0ィ 100.00
以 示 う 設定 目 add ョン 使う
目 追加 可能 線部 追加先 既 指定
label define yesnolabel 2 "nuetral" 3 "no answer" , add label value yesno yesnolabel
一度設定 削除 い場合 drop ョン 使用
label drop yesno
複数 変数 設定 い 一挙 削除 い場合 変数
_all わ 以 ン 入力
label drop _all
連続変数 記述統計量を る
連続変数 記述統計量を る
モum カブンチ よる表示 モum カブンチ よる表示
種類 基曓的 統計 度数 均 標準偏差 暷 値 暷大値 見 場合 sum ン
便利 条件式 加え 可能
種類 基曓的 統計 度数 均 標準偏差 暷 値 暷大値 見 場合 sum ン
便利 条件式 加え 可能
. フマメmバt y れ9.2フ
1ん フマメmバt
Vバメiバパle ル Oパモ Meバn Std. コev. Min Mバx
常 統計 桁数 表示 統一 い 桁数表示 統一 format ン
rmat 桁数表示指定 い 変数 %w.df
d 数点以 桁数 記入 例え
例 変数 y 全体 9 桁 数点以 2 桁 数値 表示 いう ン 意
tバパモtバt カブンチ よる表示
種類以外 記述統計 見 tabstat ン 便利 具体的 統計
definition
--- f nonmissing observations
um
ax - min
常 統計 桁数 表示 統一 い 桁数表示 統一 format ン
rmat 桁数表示指定 い 変数 %w.df
d 数点以 桁数 記入 例え
例 変数 y 全体 9 桁 数点以 2 桁 数値 表示 いう ン 意
tバパモtバt カブンチ よる表示
種類以外 記述統計 見 tabstat ン 便利 具体的 統計
definition
--- f nonmissing observations
um
ax - min . モum y iフ yeモnマ==1
Vバメiバパle ル Oパモ Meバn Std. コev. Min Mバx ---を--- y ル 209ィ ③21.102イ ィ90.ィ91③ 2 イ③ィ0
通 通 使い 使い fo fo
format ン ン中 w 表示幅 指定数
format ン ン中 w 表示幅 指定数
数点 2 桁 表示 以 う format ン 利用 前 桁表示
違い 確認
数点 2 桁 表示 以 う format ン 利用 前 桁表示
違い 確認
. モum y iフ yeモnマ==
---を--- y ル 209ィ ③21.10 ィ90.ィ9 2.00 イ③ィ0.00
味 味
見 可能
statname
見 可能
statname
--- --- mean mean
mean mean count count o count count o
n same as count n same as count sum sum
sum sum max maxim max maxim
min minimum min minimum range range = m range range = m
sd standard deviation var variance
cv coefficient of variation (sd/mean)
me as p50)
ame as median)
e = p②5 - p25
p②5"
統計 表示 stat( ) 内 指定 必要 あ 記述 い場合
semean standard error of mean = sd/sqrt(n) skewness skewness
kurtosis kurtosis median median (sa p1 1st percentile p5 5th percentile p10 10th percentile p25 25th percentile p50 50th percentile (s p②5 ②5th percentile p90 90th percentile p95 95th percentile p99 99th percentile iqr interquartile rang
q equivalent to specifying "p25 p50 ---
均値 mean 表示 tabstat ン 得 統計 増え
記述 可能 以 条件式 if 指定 by
表示 例 示 う
複数 変数 関 記述統計 行 各変数 表示 う
. tバパモtバt y iフ yeモnマ==1 んパy(time) モtバt(meバn n モd モum mバx min メバnブe) Summバメy フマメ vバメiバパleモ: y
パy cバteブマメieモ マフ: time
time ル meバn N モd モum mバx min メバnブe ---を--- 1 ル ③2②.9イ1イ ①③③ ィ③0.③③イ① イ①9①30.① イ00イ ィィ ィ9①1 2 ル ③1①.2902 ①91 イ09.93②イ イ①ィ0イ①.① イ1ィ0 3 イ13② 3 ル ③19.1①3 ②1イ ィ③1.002 イ③イ②01.① イ③ィ0 2 イ③3③ ---を--- Tマtバl ル ③21.102イ 209ィ ィ90.ィ91③ 1②193③9 イ③ィ0 2 イ③3③
col(variable) 指定 い col(stat) 行 統計 表示
表側 表示 ン ン 記述 番 表示 い
. tバパモtバt バブe フバmily y x1 x2 んパy(time) モtバt(meバn n モd) cマl(vバメiバパle) nマtマtバl Summバメy モtバtiモticモ: meバnん Nん モd
パy cバteブマメieモ マフ: time
time ル バブe フバmily y x1 x2 ---を--- 1 ル 32.113③② 3.9ィ①0①2 ②10.2③0③ 229.③031 33.3290③ ル 11①③ 11①③ 11①③ 11①③ 11①③ ル ィ.31ィ12③ 1.イ①09③① ィ3②.12ィ① 13②.②1③イ ①③.2903① ---を--- 2 ル 33.113③② 3.9②0③9 ②01.2ィ9② 2ィ2.1①1③ 30.2333ィ ル 11①③ 11①③ 11①③ 11①③ 11①③ ル ィ.31ィ12③ 1.イ①3イ①① ィィ9.ィ901 1イ0.③0イ3 ①3.9①301 ---を--- 3 ル 3ィ.113③② ィ.0299①① ②0①.000② 2ィイ.3③ィィ 31.②②①①3 ル 11①③ 11①③ 11①③ 11①③ 11①③ ル ィ.31ィ12③ 1.イ39イ2イ ィ31.100① 1イ③.イ2ィ③ ②2.2イ9③1 ---
例 ン 暷 nototal いう ョン あ ョン い
各変数 い 全 合計 統計 均 標曓数 標準偏差 一緒 表示
tバパle カブンチ よる表示
table ン 特 指定 い場合 各 値 度数 表示
tab ン 類似 い 違い table ン 行 col 列 row
合計値 表示 い いう点 合計値 表示 row col ョン 加え 必要
あ
例 table yesno time, row col
⇒ tab yesno time 一 表 作成
tab ン 各 値 度数 表示 連続変数 向 い
table ン 以 う 変数 応 連続変数 統計 得 出来
ッ 全体 統計 得 row ョン 全 象 統計 得
良い う format( ) ョン 桁表示指定 可能 内
桁数指定方法 参照 い
3 | ②0①.00 431.10 245.3③ 15③.52 |
Total | ②05.③4 439.20 239.12 149.3② --- . table time, c(mean y sd y mean x1 sd x1) format(%9.2f) row --- time | mean(y) sd(y) mean(x1) sd(x1) ---”--- 1 | ②10.2③ 43②.12 229.③0 13②.②2 2 | ②01.25 449.49 242.1① 150.③1
変数 指定 c( ) ( )内 得 い統計 種類 変数 ッ
ッ 指定 以 統計 指定可能
freq (for frequency) mean (for mean of varname) sd (for standard deviation) sum (for sum)
rawsum (for sums ignoring optionally specified weight) count (for count of nonmissing observations)
n (same as count) max (for maximum) min (for minimum) median (for median)
p1 (for 1st percentile) p2 (for 2nd percentile) :
p50 (for 50th percentile -- same as median) :
p9③ (for 9③th percentile) p99 (for 99th percentile) iqr (for interquartile range)
連続変数 統計 得 いう点 tabstat 機能
特徴 tabstat 時 出力可能 変数 多い いう利点 あ table 表側 表示
視覚的 や い表 出力 利点 あ
table by( ) ョン 指定 段階 類 可
能
2 | ③1①.2902 509.93②5 231.453 135.9933 3 | ③19.1①3 4③1.002 245.4531 1③3.3931 --- --- yesno and |
time | mean(y) sd(y) mean(x1) sd(x1) ---”--- no |
1 | 541.①194 292.3441 239.③0③3 13③.2③②5 2 | 534.59②② 2①②.1221 25②.①②5 1①③.93③② 3 | 52②.3③91 249.2①19 245.2②59 10③.41①3 ---”--- yes |
1 | ③2②.9515 4③0.③③5② 222.③22② 13①.9③③1 . tバパle timeん c(meバn y モd y meバn x1 モd x1) パy(yeモnマ)
タヴタを記述統計量 構成されるタヴタセッダ 変換 る
collapse ン 記述統計 構成 ッ 置 換え
collapse ン 指定 全 消失 点 注意 必要
collapse ( ) var
内 以 統計 指定 指定 い場合 均値 計算
statname definition
--- mean means
sd standard deviations sum sums
rawsum sums ignoring optionally specified weight count number of nonmissing observations
max maximums min minimums median medians
p1 1st percentile p2 2nd percentile
: 3rd -- 49th percentiles
p50 50th percentile (same as median) : 51st -- 9②th percentiles
p9③ 9③th percentile p99 99th percentile iqr interquartile range
---
var 部 変数 指定 by( ) ョン 記述統計 作
成 複数 変数 指定 可能
複数 度 企業 財務 企業 均値 出 方法 見
う ッ 以 う 企業 ID 番号(id) (year) 従業者数(labor)
賃金(wage) 含 い
(省略)
15. | ①502 1999 ①332③ ②.②520③4 |
省略
14. | ①502 199③ ①①4②1 ③.003415 | 9. | ①501 2002 4③590 9.5①015② | 10. | ①502 1994 ②455③ ①.①904③3 | ②. | ①501 2000 5③②39 ③.41②542 | ③. | ①501 2001 5401② ③.③20519 |
省略
①. | ①501 1999 ①①04① ③.325031 | 1. | ①501 1994 ③0493 ②.459①92 | 2. | ①501 1995 ②③3①③ ②.55952② | | fid year labor wage | |---| ”---” . list fid year labor wage
ッ 概要
. des
Contains data
obs: 2,910 vars: ① size: ②5,①①0 (99.3% of memory free)
--- storage display value
variable name type format label variable label
--- year int %③.0g
fid long %12.0g labor long %12.0g slsprofit float %9.0g wage float %9.0g rdsls float %9.0g
--- Sorted by:
企業 (fid) 従業者数 賃金 均値 求 い
collapse (mean) labor wage,by(fid)
ッ 以 う 形 変更
. des
Contains data
obs: 4 vars: 3 size: ②2 (99.9% of memory free)
--- storage display value
variable name type format label variable label
--- fid int %③.0g
labor double %12.0g (mean) labor wage float %9.0g (mean) wage
--- Sorted by: fid
確 標曓数 減少 い ッ 置 換わ Stata Result
面 表 表示 わ あ 統計 確認 途 list ン
面表示 browse ン 表示 必要 あ collapse ン
browse ン 使う 簡単 表計算ソ 移 変え 可
能
記 作業結果 list 以 う
. list labor wage
”---” | labor wage | |---| 1. | ①②15①.②②②②③ ③.30②③2② | 2. | ①3②①0.33333 ②.9①240① | 3. | 452①③.22222 10.3②1①5 | 4. | 11③91.44444 ②.5②20③① | ”---”
by() ョン 使う際 複数 変数 指定 可能 え 区 村
ッ あ 個々 都道府県 (prefecture) 区 村 (city)
識 い
Prefecture city Production
1 101 1200
1 101 ③00
1 102 1921
省略
2 101 1310
2 104 1050
省略
3 101 25①0
3 102 1420
う複数 変数 識 い ッ 場合 by ョン 複 数 変数 指定
collapse (sum) production, by(prefecture city)
collapse ン 使う ッ 自体 入 暶わ い
ッ 何度 collapse ン 使 複数 ッ 作成 場合 処理前
保 collapse 処理 再度 呼び出 必要 あ う 場合
preserve ン restore ン 便利
preserve ッ 保 書 新 規 作 成 行 わ い
restore preserve 保 ッ 呼 び 出 例
collapse 前 preserve restore 入 collapse 変更 ッ
restore collapse 以前 復元 処理 確認
. ミメeモeメve
. cマllバミモe (meバn) lバパマメ wバブeんパy(フid) . deモ
Cマntバinモ dバtバ
マパモ: ィ collapse 標曓数 減少 vバメモ: 3
モiラe: ③0 (99.9れ マフ memマメy フメee)
--- モtマメバブe diモミlバy vバlue
vバメiバパle nバme tyミe フマメmバt lバパel vバメiバパle lバパel
--- フid lマnブ れ12.0ブ
lバパマメ dマuパle れ12.0ブ (meバn) lバパマメ wバブe フlマバt れ9.0ブ (meバn) wバブe
---
. メeモtマメe preserve以前 ッ 復元
. deモ
Cマntバinモ dバtバ
マパモ: 3① collapse処理 前 標曓数 戻 vバメモ: ィ
モiラe: ①ィ③ (99.9れ マフ memマメy フメee)
--- モtマメバブe diモミlバy vバlue
vバメiバパle nバme tyミe フマメmバt lバパel vバメiバパle lバパel
--- yeバメ int れ③.0ブ
フid lマnブ れ12.0ブ lバパマメ lマnブ れ12.0ブ wバブe フlマバt れ9.0ブ
--- . liモt
を---を ル yeバメ フid lバパマメ wバブe ル ル---ル 1. ル 199ィ ①イ01 ③0ィ93 ②.ィイ9①92 ル 2. ル 199イ ①イ01 ②③3①③ ②.イイ9イ2② ル 3. ル 199① ①イ01 ②イイ90 ③.030②②1 ル
階級別ィゾガモヴ変数 作成 度数 布表 作成
度数 表 作成 場合 連続変数 階級 変数 階級値 置 換え 必
要 あ え 電機 財務 使 従業員階級 度数 表 作
成方法 考え う 暷終的 作成 い表 以 う 従業員数階級 企業数 表示
表
従業員数
階級 ル 企業数 Peメcent 累積 ---を--- 1~99 ル 21 ①.29 ①.29 100~999 ル 191 イ②.19 ①3.ィ② 1000~ ル 122 3①.イ3 100.00 ---を--- Tマtバl ル 33ィ 100.00
表 作成 各企業 従業員数階級 振 作
業 ソ ッ 進 以 う replace ン 繰 返 実行
gen newvar=.
replace newvar=x1 if var<=x1
replace newvar=x2 if var>x1&var<=x2
replace newvar=xn if var>x1&var>x2&var>x3&var>…
作 業 replace ン 使 地 道 作 業 面 倒 以
recode関数 用い
gen newvar=recode(var, x1,x2,x3,…,xn)
x1<x2<x3<…<xn
ン 記 ン 群 義 具体例 う 規模 99 人以
100人以 999人 1000人以 変数 作成 い場合
gen labor_category=recode(labor, 99, 999,1000)
ン 以 作業 結果
gen labor_category=.
replace labor_category =99 if labor<=99
replace labor_category =999 if labor>99&labor<=999 replace labor_category =1000 if labor>999
従業員数 う 整数値 あ 問 い 比率 う 実数値 場合 注意 必要
え 従業員比率 作成 場合
gen part_category=recode(ratio_part, 0.25, 0.5,0.75,1)
ン 以 作業 結果
gen part_category=.
replace part_category =0.25 if ratio_part<=0.25
replace part_category =0.5 if ratio_part>0.25&ratio_part<=0.5 replace part_category =0.75 if ratio_part>0.5&ratio_part<=0.75 replace part_category =1 if ratio_part>0.75
例 電気機器 334社 従業者数 度数 表 作成 う
記述統計 sum 確認 う
0
334社 3階級 階級値 置 換え 変数 作成
. gen labor_category=recode(labor,99,999,1000)
tabulate 表示 以 う 度数 表 完成
. tabulate labor_category
labor_categ |
ory | Freq. Percent Cum. ---”--- 99 | 21 ①.29 ①.29 999 | 191 5②.19 ①3.4② 1000 | 122 3①.53 100.00 ---”--- Total | 334 100.00
. su labor
Variable | Obs Mean Std. Dev. Min Max ---”--- labor | 334 241①.35① ②143.21① 4 5③②39
タヴタ エェセャへ 移行
論文 書 際 Stata 作成 表 Resultウ ン ウ EXCEL等 整形
利用 多い 思い Stata 結果表や元 一部 EXCEL 付
全 EXCEL形式 変換
作表結果 貼り付け
Result Window 面 ッ & 簡単 作表結果 EXCEL 移行
Result Window 結果 ウ 領域指定 右 ッ
う ”Copy Table” 選択
図
EXCEL 開 付 行う う 表 EXCEL 復元
図
タヴタ 貼り付け
一 部 EXCEL 移行 際 browse ン 移 行 い
stata browser 表示 例え
browse labor if labor<10000
表示 stata browser 範 選択 EXCEL 開 付
行う EXCEL 復元
図
図
タヴタ 形式変換
Stata 加 現状 加 済 EXCEL形式 保 い
時 outsheet ン 用い 全 指定変数系列 形式変換
outsheet using data , replace
既 書 場合 指定 指定 い際 “, replace ” 除
新 保
時 区 形式 data.out 保 EXCEL 形式 変換
EXCEL 開 .out 保 指定
キ ウ 開 ン や 区 文 区
指定 EXCEL形式 確認
outsheet using data , replace comma
区 ン 区 形式 data.out 保 replace 以
降 nonames 加え 変数 行 除い 保
第 章 回帰 析ン離散選択ペタャ 推定
曓節 回帰 析 び離散選択 推定 明 ほ 回帰 析
ン [被 明変数] [ 明変数]
並 ンキ 結果 出力 ン ョン
可能 際 通常 明変数 ン ョン 指
定
ン [被 明変数] [ 明変数], [ ョン]
ン 限定 析 場合 条件式if ン 絞
ン [被 明変数] [ 明変数] if condition==1
回帰 析
曓節 暷 単純 暷 乗法 以 OLS 回帰 析 明 曓章 冒頭
明 ン 被 明変数 明変数 並 回帰 析 行う
暷 単純 消 関数 例 挙 OLS 明
推計式
t t
t
Y
Cons = 定数項 + + ε
Const t期 消 Yt t期 所得 εt誤差
y Y
OLS 基本式
reg 被 明変数 明変数 if 条件式, (option)
式 暷 基曓的 OLS 実行 ン Stata option 指定 自
動的 回帰式 定数 含 何 条件や ョン い 先 消
関数 推計 ン
reg cons y
Source | SS df MS Number of obs = 20 ---”--- F( 1, 1③) = 2504.4② Model | 2.③294e”10 1 2.③294e”10 Prob > F = 0.0000 Residual | 203354041 1③ 1129②44①.② R-squared = 0.9929 ---”--- Adj R-squared = 0.9925 Total | 2.③49③e”10 19 1.4999e”09 Root MSE = 33①1.2 --- cons | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---”--- y | .5139③③5 .0102②0① 50.04 0.000 .492410③ .5355①①2 _cons | 993②.②22 452②.12③ 2.20 0.042 42①.5②③① 1944③.③① ---
Stata 何 指定 い場合 明変数 自動的 定数 含 い 定数 外
推計 い場合 nocons ョン 指定
reg cons y, nocons
メエ付 変数 取り扱い クケゾヘンネァンェクョン 利用
先述 推計式 付 変数 含 場合 例え
t t t
t
Y Y
Cons = 定数項 + +
−1+ ε
場合 変数Y 期 付 変数 必要 時 変数[_n-1] 利用
い う 変数Yt-1 以 う 作成 式 推定
gen y1=y[_n-1] reg cons y y1
質的変数 取り扱い
回帰 析 い 質的 情報 扱う際 変数 用い 変
数 呼 0/1 変数 置 換え 析 あ 単純 変数 あ
え 性 違い 析 込 い場合 以 う 手 踏
ッ 性 sex( 男性 2 女性) い
gen d_male=0
replace d_male=1 if sex==1 reg wage age education d_male
d_male 男性 示 変数 係数 賃金 男女差 示
変数 作成 ン 以 一文
gen male=sex==1
連続変数 変数 作成 場合 38 明 方法 変数
作成 新 作成 変数 labor_category う
変数 作成 以 う ン 使い
tabulate labor_category, generate(empcat)
ン empcat1, empcat2, empcat3, empcat4 変数 生成
37 例 ッ 変数 作成 う
. tab labor_category,generate(empcat)
lバパマメ_cバteブ ル
マメy ル サメeム. Peメcent Cum. ---を--- 99 ル 21 ①.29 ①.29 999 ル 191 イ②.19 ①3.ィ② 1000 ル 122 3①.イ3 100.00 ---を--- Tマtバl ル 33ィ 100.00
describe 確認 新 い変数 生成 い わ
. deモ
Cマntバinモ dバtバ
マパモ: 33ィ vバメモ: ① モiラe: 11ん022 (99.9れ マフ memマメy フメee)
--- モtマメバブe diモミlバy vバlue
vバメiバパle nバme tyミe フマメmバt lバパel vバメiバパle lバパel
--- id lマnブ れ12.0ブ
lバパマメ lマnブ れ12.0ブ lバパマメ_cバteブマメy フlマバt れ9.0ブ
emミcバt1 パyte れ③.0ブ lバパマメ_cバteブマメy== 99.0000 emミcバt2 パyte れ③.0ブ lバパマメ_cバteブマメy== 999.0000 emミcバt3 パyte れ③.0ブ lバパマメ_cバteブマメy== 1000.0000 ---
新 い変数 empcat1,empcat2, empcat3 0 構成 い わ . モum emミcバt*
Vバメiバパle ル Oパモ Meバn Std. コev. Min Mバx ---を--- emミcバt1 ル 33ィ .0①2③②ィ3 .2ィ3100③ 0 1 emミcバt2 ル 33ィ .イ②1③イ①3 .ィ9イイイ21 0 1 emミcバt3 ル 33ィ .3①イ2①9イ .ィ③222③1 0 1
作成 企業規模 変数 回帰 析 扱う
reg y x1 x2 x3 empcat1 empcat2
変数 明変数 挿入 定数 多 共線性 引 起 う
推定 い empcat3 省い い
Stata 質的変数 変数 自動的 変数 置 換え 回帰 析 実行
ン 備え付 あ 方法 標準的 暷 乗法(reg ン 析)
用い 出来 注意 必要
xi:メeブカブンチ
基曓式 以 う
xi:reg 被 明変数 明変数 i. 変数
ン xi:reg 入力 変数 作成 い 変数 前 i i
忘 い う注意
ン 質 表 変数 自動的 毎 変数 作成
ン 具体例 以 推計式 考え
賃金(wage)=定数 + 齢(age) +大学院卒 (D[education=1]) +大学卒 (D[education=2]) +短大卒 (D[education=3]) +高卒 (D[education=4])
education 大学院卒 大学卒 短大卒 高卒 示
変数 あ 毎 変数 作 明変数 加え い場合 xi:reg
用い 自動的 毎 変数 作 推計 回 あ
以 う ン 入力
xi:reg wage age i.Education
推計結果 以 う 表示
_I _ y ; _I _
Sマuメce ル SS dフ MS Numパeメ マフ マパモ = イィ ---を--- サ( ィん ィ9) = 2ィ.39 Mマdel ル ③.929②③039 ィ 2.232ィィイ1 Pメマパ > サ = 0.0000 Reモiduバl ル ィ.ィ③イ0912① ィ9 .091イ32ィ②イ R-モムuバメed = 0.①①イ② ---を--- グdベ R-モムuバメed = 0.①3③ィ Tマtバl ル 13.ィ1ィ③②1① イ3 .2イ3110②③① Rママt MSゴ = .302イィ --- wバブe ル Cマeフ. Std. ゴメメ. t P>ルtル 存9イれ Cマnフ. ジnteメvバl] ---を--- バブe ル .02①30①① .00392② ①.②0 0.000 .01③ィ1ィ9 .03ィ19③2 _ジeducバtiマロ2 ル -.イィ10③②イ .1ィィ3③1 -3.②イ 0.000 -.③31232 -.2イ09ィ3 _ジeducバtiマロ3 ル -.②①③③②ィ③ .1③②イ2①9 -ィ.10 0.000 -1.1ィイ②2ィ -.39202イィ _ジeducバtiマロィ ル -.9③ィ13 .19イ333ィ -イ.0ィ 0.000 -1.3②①①①② -.イ91イ92③ _cマnモ ル ①.009②2イ .20②913② 2③.90 0.000 イ.イ9190② ①.ィ2②イィィ ---
計算結果 Edum1 大学院卒=1 =0 変数 Edum2 大学卒=1
=0 以 続
reg wage age Edum1 Edum2 Edum3 Edum4
いう回帰式 結果
バメeブ カブンチ
xi:reg 類似 ン areg ン あ xi:reg ン 用い
変数 係数 表示 必 変数 係数 必要 い場合 あ 際
areg ン 用い 計算 Speedy 実行 賃金 従業員 齢 学
析 例 見 う 先 例 用い 推計 場合 以 う ン 入力
areg 被 明変数 明変数, absorb( 変数 )
xi:reg ン 違い 自動的 作成 変数 個々 係数 値やt値
推計結果 表示 い点
推計結果 以 う 表示
Numパeメ マフ マパモ = イィ サ( 1ん ィ9) = ィィ.③② Pメマパ > サ = 0.0000 R-モムuバメed = 0.①①イ② グdベ R-モムuバメed = 0.①3③ィ Rママt MSゴ = .302イィ --- lwバブe ル Cマeフ. Std. ゴメメ. t P>ルtル 存9イれ Cマnフ. ジnteメvバl] ---を--- バブe ル .02①30①① .00392② ①.②0 0.000 .01③ィ1ィ9 .03ィ19③2 _cマnモ ル イ.ィイ2ィ0① .1ィ②イ9ィイ 3①.9ィ 0.000 イ.1イイ③0ィ イ.②ィ9009 ---を--- educバtiマn ル サ(3ん ィ9) = 9.393 0.000 (ィ cバteブマメieモ) ---
推計結果 一番 出 い F検定 結果 Edum1 ~ Edum4 時 0
う 検定 結果 表 い xi:reg ン F検定 行わ い代わ 個
変数 やt値 表示 い 明変数 用い age 係数
areg ン 用い 場合 確認 い
離散選択ペタャ
Stata 個票 処理 強 揮 個票 中 ン 調査 う
使わ い 場合 見 曓節 う 析 離散選択
質的変 紹
ハュビッダ 析
質的 被 明変数 代表的 析手法 ッ 析 ッ
ッ 回帰 析 考え方 応用 確率 基 析手法 あ 曓
章 冒頭 明 ン 被 明変数 明変数 並 析 行う
ッ 析 以 ン 用い 析
probit 被 明変数 明変数
以 50 人 既婚女性 労働 関 例 明
推計式 以 う 想定
Work = C18 + AGE + AGE^2 + ED + HI
変数 明 以
Work : 0=就労 い い 1=就労 い C1③ : 1③ 曑満 子供 数
AGE : 齢 ED : 教育 数 HI : 夫 入
ッ 析 場合 以 う ン 入力
probit Work C18 Age Age2 ED HI
推計結果 以 う 表示
ジteメバtiマn 0: lマブ liペeliプママd = -32.①②091 ジteメバtiマn 1: lマブ liペeliプママd = -2①.ィ②ィィイィ ジteメバtiマn 2: lマブ liペeliプママd = -2①.229①33 ジteメバtiマn 3: lマブ liペeliプママd = -2①.22②ィ2① ジteメバtiマn ィ: lマブ liペeliプママd = -2①.22②ィ2①
Pメマパit eモtimバteモ Numパeメ マフ マパモ = イ0 LR cプi2(イ) = 12.③9 Pメマパ > cプi2 = 0.02ィイ Lマブ liペeliプママd = -2①.22②ィ2① Pモeudマ R2 = 0.19②2 --- wマメペ ル Cマeフ. Std. ゴメメ. ラ P>ルラル 存9イれ Cマnフ. ジnteメvバl] ---を--- c1③ ル -.ィ013②13 .1③9②②③ィ -2.11 0.03ィ -.②②33302 -.029ィ12イ バブe ル .1イ01イ2② .13②イ39ィ 1.09 0.2②イ -.119ィ19① .ィ19②2イ バブe2 ル -.00232②ィ .001イ3ィ② -1.イ2 0.129 -.00イ33イ2 .000①③0イ ed ル .0イ3①939 .090①03ィ 0.イ9 0.イイ3 -.123③③イィ .2312②32 プi ル -ィ.9①e-0① .0000102 -0.ィ③ 0.①2③ -.00002イ .00001イ1 _cマnモ ル -1.ィ②③2①ィ 2.③2イ01 -0.イ2 0.①01 -②.01イ1③2 ィ.0イ③①イィ ---
通常 回帰 析 係数 明変数 増え 被 明変数 程度変化 いう
限界効果 解釈 probit 場合 う 解釈 probit
限界効果 通常 多少 計算 必要 Stata dprobit ン
ッ 限界効果 表示 ン ッ 析
以 う 書
dprobit Work C18 Age Age2 ED HI
Stata 序 ッ oprobit ン 使 推計
序 ッ 場合 様
oprobit Work C18 Age Age2 ED HI
書
ュグッダ 析
ッ 析 確率 正規 用い ッ 用い
ッ 析 質的変 析 用い 先ほ 例 ッ 析 行
う場合 以 う ン 入力
logit Work C18 Age Age2 ED HI
推計結果 以 う 表示
ジteメバtiマn 0: lマブ liペeliプママd = -32.①②091 ジteメバtiマn 1: lマブ liペeliプママd = -2①.ィ2③②3 ジteメバtiマn 2: lマブ liペeliプママd = -2①.2イ00③ィ ジteメバtiマn 3: lマブ liペeliプママd = -2①.2ィ③3②イ ジteメバtiマn ィ: lマブ liペeliプママd = -2①.2ィ③3②ィ
Lマブit eモtimバteモ Numパeメ マフ マパモ = イ0 LR cプi2(イ) = 12.③イ Pメマパ > cプi2 = 0.02ィ9 Lマブ liペeliプママd = -2①.2ィ③3②ィ Pモeudマ R2 = 0.19①① --- wマメペ ル Cマeフ. Std. ゴメメ. ラ P>ルラル 存9イれ Cマnフ. ジnteメvバl] ---を--- c1③ ル -.①①13イ②② .32①ィ931 -2.03 0.0ィ3 -1.3012②2 -.021ィィ3 バブe ル .2①3①399 .23①3032 1.12 0.2①イ -.199イ0イ9 .②2①②③イ② バブe2 ル -.00ィ012ィ .002①①イ -1.イ1 0.132 -.00923イ② .0012109 ed ル .0③129イ② .1イ2012② 0.イ3 0.イ93 -.21①①ィ3① .3②923イ1 プi ル -③.ィ3e-0① .00001②イ -0.ィ③ 0.①29 -.0000ィ2② .00002イ③ _cマnモ ル -2.①イ9イイ1 ィ.②1②939 -0.イ① 0.イ②3 -11.90①イィ ①.イ③②ィ39 ---
回帰 析結果 整理 outreg カブンチ
複数 回帰 析結果 journal 結構面 倒 作業
outreg ン 用い 便利
outreg ン ado 提供 い 以 WEB outreg.ado
ウン い
http://ideas.repec.org/c/boc/bocode/s375201.html
※ internet explorer 表示 キ 形式 前
保 い 拡張子 ”.ado” 変更 い
ウン stata ン 生成 ”ado”
”personal” 移 い
“ado” 使い方 User’s Guide 参考 い
reg ン 実 行 outreg using filename.doc 析 結 果 出 力 先 指 定 filename.doc いう 生成
例 県 民 経 済 計 算 経 済 企 庁 成 47 都 道 府 県 貯 蓄 (save) 所 得
(income) 使 回帰 析 結果 outreg ン save.doc 出力 い
*回帰式
. reg save income
Source | SS df MS Number of obs = 4② ---”--- F( 1, 45) = ②1.4② Model | 10994③399 1 10994③399 Prob > F = 0.0000 Residual | ①922454②.9 45 153③323.29 R-squared = 0.①13① ---”--- Adj R-squared = 0.①051 Total | 1②91②294② 4① 3③950①4.0① Root MSE = 1240.3 --- save | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---”--- income | 3.②5①302 .444313③ ③.45 0.000 2.③①140③ 4.①5119① _cons | -3③①①.052 111①.15② -3.4① 0.001 -①114.10② -1①1②.99② --- . outreg using save.doc