Stataの統計解析機能を有効に活用して行くには、それに先立ってデータセットの入力、構成変更といった操 作が欠かせません。本解説書では • データセットのインポート機能 • データセットの併合機能 • データセットの構成変更機能(long/wide形式変換) • データ変換、コード変換機能 • 支援関数群の用例 等、代表的なデータ管理機能をカバーしました。
目 次
コマンド whitepaperタイトル ページ mwp番号 − マニュアルコード一覧 − mcodeimport excel Excelのインポート/エクスポート 4 mwp-092 import delimited テキストデータのインポート 10 mwp-195 infix インポート機能(固定形式) 17 mwp-031 infile インポート機能(自由形式) 23 mwp-080 append データセットの付加 29 mwp-034 merge データセットの併合 33 mwp-035 reshape wide/long形式変換 40 mwp-036 encode データ変換(文字列→数値) 51 mwp-032 recode コードの変換 59 mwp-033 mvencode 欠損値のコード変換 65 mwp-081 functions 関数群の用例 71 mwp-076 egen 変数の生成(拡張機能) 89 mwp-077
マニュアルコード
Stataの英文マニュアル中ではマニュアル参照に際し次のようなコードが用いられています。本解説書の中で もこの慣行が踏襲されています。
コード マニュアル
[GSM] Getting Started with Stata for Mac [GSU] Getting Started with Stata for Unix [GSW] Getting Started with Stata for Windows [U] Stata User’s Guide
[R] Stata Base Reference Manual
[D] Stata Data Management Reference Manual [G] Stata Graphics Reference Manual
[XT] Stata Longitudinal-Data/Panel-Data Reference Manual [ME] Stata Multilevel Mixed-Effects Reference Manual [MI] Stata Multiple-Imputation Reference Manual [MV] Stata Multivariate Statistics Reference Manual [PSS] Stata Power and Sample-Size Reference Manual [P] Stata Programming Reference Manual
[SEM] Stata Structural Equation Modeling Reference Manual [SVY] Stata Survey Data Reference Manual
[ST] Stata Survival Analysis and Epidemiological Tables Reference Manual [TS] Stata Time-Series Reference Manual
[TE] Stata Treatment-Effects Reference Manual: Potential Outcomes/Counterfactual Outcomes [I] Stata Glossary and Index
[M] Mata Reference Manual
本解説書はStataCorp社の許諾のもとに作成したものです。 c
⃝ 2013 Math工房 一部 ⃝ 2013 StataCorp LPc
Math工房 web: www.math-koubou.jp email: [email protected]
import/export excel - Excelのインポート/エクスポート
import excel, export excelコマンドを使用するとExcelファイルのインポート/エクスポートが行えま す。対象ファイル形式としては.xls (Excel 1997/2003)と.xlsx (Excel 2007/2010) の双方に対応してい ます。
1. Excelのインポート 2. Excelのエクスポート
c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
Stata13 whitepapers mwp-195
import/export delimited -テキストデータのインポート/エクスポート
import delimited, export delimitedコマンドを使用すると、カンマやタブで仕切られたテキストファ
イルのインポート/エクスポートが行えます。これらは従来のinsheet, outsheetコマンドを置き換えるも のです。 1. CSVファイルからのインポート 用例1 用例2 2. CSVファイルへのエクスポート 用例3 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
infix - 固定形式データのインポート infixはデータが固定形式のテキストファイルとして与えられたときに、それをStataにインポートする機能 を提供します。本whitepaperではその用例を紹介します。 1. 固定形式データ 2. 固定形式データのインポート 用例1 用例2 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
Stata13 whitepapers mwp-080
infile - 自由形式データのインポート
infileはデータが自由形式のASCII(テキスト)ファイルとして与えられたときに、それをStataにイン
ポートする機能を提供します。本whitepaperではその用例を紹介します。 1. 自由形式データ 2. 自由形式データのインポート 用例1 用例2 3. byvariable()オプション c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
append - データセットの付加 appendは外部ファイル上の観測データ(observations)を読み込み、それをメモリ上のデータセットに対して 付加します。データセットの併合を行うコマンドの中では最も単純な機能を提供するものですが、それでも注 意すべき点はいくつかあります。 1. 整合性のあるappend 用例1 2. 整合性のないappend 用例2 3. カテゴリ変数 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
Stata13 whitepapers mwp-035 merge - データセットの併合 mergeは特定の変数値をキーとする形で2つのデータセットの併合を行います。 1. 1:1 merge 用例1 用例2 2. m:1 merge 用例3 3. 1:m merge 用例4 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
reshape - wide/long形式変換
reshapeはwide形式のデータをlong形式に、long形式のデータをwide形式に変換する機能を提供します。
1. データ形式 2. wideからlongへの変換 用例1 3. longからwideへの変換 用例2 4. 変則的な用例 用例3 用例4 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
Stata13 whitepapers mwp-032 encode/decode - 文字列コード、数値コード間の変換 あるカテゴリ変数が例えば"male"、"female"といった文字列の形でコード化されていた場合、その情報を回 帰推定等のコマンドで利用するためには最初に数値コードへの変換が必要になります。それは文字列変数が統 計処理の対象としては扱われないことによるものです。encodeコマンドを使用するとこの変換操作が容易に 行えます。 1. 数値コードへの変換 用例1 2. コードの変換 3. 文字列コードへの変換 用例2 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
recode -コードの変換 あるカテゴリ変数が与えられたときに、そのコードの値を変更したいといったことは良く起ります。recode コマンドを使用するとコードの変換が容易に行えます。 1. コードの変換–値ラベルなし 用例1 2. コードの変換–値ラベルあり 用例2 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
Stata13 whitepapers mwp-081
mvencode/mvdecode - 欠損値のコード変換
Stataでは“.”及び“.a”から“.z”の27個のコードを欠損値(missing values)として扱います。mvencode/ mvdecodeコマンドを使用すると欠損値コードの変換が行えます。
1. mvdecode 用例1 2. mvencode 用例2
c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
functions - 関数群 Stataには数多くの関数が用意されており、generateコマンドや数式記述の中で利用されます。詳細は [D] functionsを参照いただくとして、ここでは代表的な関数に限定した形でその用法を紹介します。なお、 [D] egen (mwp-077 )についても併せてご参照ください。 1. 乱数の発生 用例1 用例2 2. 数学関数 2.1整数値への変換 2.2 Running sum 3. 統計分布関数 3.1 t検定の実行 3.2分布関数の用例 用例3 用例4 用例5 4. プログラミング関数 4.1コード化関数 用例6 用例7 用例8 5. 文字列関数 用例9 6. 日付/時間関数 7. 行列操作関数 用例10 補足1 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)
Stata13 whitepapers mwp-077 egen - 変数の生成 通常、新変数の生成にはgenerateコマンドが使用されます。またその際、[D] functions (mwp-076 )に示 されるような多様な関数が利用できるようになっています。これに対しegenコマンドはgenerateコマンド の機能を補完するもので、egen固有の関数を一式備えています。詳細は[D] egen を参照いただくとして、 ここでは代表的な関数に限定した形でその用法を紹介します。 1. 要約統計量の計算 用例1 2. 行方向の要約統計量 用例2 3. グルーピング 用例3 4. パターンによるデータ生成 用例4 c
⃝ Copyright Math 工房; 一部 c⃝ Copyright StataCorp LP (used with permission)