イントロダクション計量経済学鹿野研究室 note01

(1)

担当：鹿野（大阪府立大学）

2013 年度後期

はじめに

今回学ぶこと

計量経済学の概要。

基本概念の復習。

テキスト該当箇所：₁章。

1 計量経済学とは何か？

1.1 計量経済学と実証分析

科学としての経済学：データによるの必要性。

⊲ 理論仮説をテスト。例：恒常所得仮説は成立するか？

⊲ 新たな法則の発見。例：治安悪化は不動産価格に影響を与えるか？

⊲ 政策評価。例：公的職業訓練で労働者の生産性が上がるか？

⊲ 予測。例：企業財務データから、次年度の企業株価を予測するには？

分析上の関心＝変数間の相関関係や因果関係。特に後者。

⊲ ^ある変数Y^とX^{の関係を次式で表す。}

Y = f (X). ⁽¹⁾

⊲ ^例：_{Y =}労働者の賃金（生産性）、_{X =}職業訓練時間。^dY

dX ^{> 0}^{かどうか知りたい。}

⊲ X^{は複数の変数}X1, X2, . . . , X_k^{でも良い。}

計量経済学＝経済学の実証分析のための統計手法。統計的推測がベース。

⊲ 統計的推測：母集団モデルの設定_→標本抽出、母数の推定と仮説検定。

_Remark：なぜ計量経済学が必要？（なぜ通常の統計学ではダメ？）

⊲ ^{通常の統計学：} （物理・臨床実験）が前提_⇒因果性の立証は容易。

⊲ 経済学の分析対象：実験に莫大なコスト_or倫理的・物理的に不可能。

⊲ ^{計量経済学の目的：} ^{から因果性を立証。}^∴経済学以外で、実験が難しい分野（疫学・公衆衛生学、環境学、_etc）でも利用される。

1

(2)

⊲ u =^変数X^の一次式α + βX^{で説明できない誤差。}

_Remark：変数間の関係を簡単なモデルに定式化_⇒目的が明確に。

⊲ 分析者の知りたいこと＝変数_Xが_Yに与える影響。

⊲ ^{係数パラメータ}_{β (=} ^dY_dX)^{の値が分かれば、}X^のY^{への影響が判明。}

⊲ (2)^式を、 ^と呼ぶ。

推定：変数_{X, Y}のデータを集め、データから未知のパラメータ_{α, β}の値を推測する作業

を、と呼ぶ。

⊲ 用意したデータから上手にパラメータを推定するには？_⇒統計的推測の基準を応用。

2 実験データ vs. 非実験データ

2.1 実験データによる実証分析

例：ある製薬会社が新しい抗高血圧剤を開発。この新薬の効果はあるか？

⊲ ^{実験開始。}200人の被験者（高血圧）のうち、ランダムに選んだ₁₀₀人に新薬を投与。残りは放置。_⇒1ヶ月後、投与グループの血圧平均と放置グループの血圧平均の差を見れば良い。

∴実験データのもとでは、分析が比較的簡単。

⊲ 入門レベルの統計学（平均値の差の検定、単回帰分析）などで対応可能。

2.2 非実験データの問題点

例：ある市が、小学校高学年向けの補習授業を₄週間実施。参加は生徒の任意。補習の効果はあるか？注：実験データではない。

⊲ 上の新薬の例に倣い、補習を受けた生徒₁₀₀人の学力テストスコアと、受けなかった₁₀₀人のスコアの差を比較したところ、前者のスコアが_20%ほど高かった。統計的な検定もパスしている。

⊲ ^{これで「補習}→成績」の因果関係が立証できたか？

答えは。因果関係の立証になっていない。

⊲ 学習意欲のある子どもほど補習参加_→もともと勉強のできる子が補習グループに集まっていた可能性。∴単純比較は、補習の効果を。図₁参照。

(3)

図_1:「補習」_→「成績」の因果関係？

⊲ 進学塾通いで忙しい子どもほど、補習参加しない_→もともと勉強のできない子が補習グループに集まっていた可能性。∴単純比較は、補習の効果を。

⊲ ∴補習を「抜き」にしても、両グループに差があった可能性。

_Remark：実験データと非実験データの決定的な違いは？

⊲ 新薬効果の実証分析：薬剤投与（_X）が本人の意思とは無関係に、ランダムに与えられる。∴投与・放置グループに偏りが生まれない。

⊲ 補習効果の実証分析：参加・不参加（_X）が本人の意思・能力に基づいて決まる。∴ 補習の効果か、サンプルの偏りか、区別がつかない。

解決策：計量経済学によるアイディア（一例）。

1. 事前の学力が同等の子どもで比較。例：前回の学力テスト偏差値が_50∼55点の子ども。 2. 複数の子どもを長期間追跡調査し、補習を受けたタイミングで成績の上昇があった

か検証。

3. 受講機会が偶然によって決まってしまったケースを探す。例：大型台風により、特定地域だけ補習が中止された。

4. 受講機会を、子どもにランダムに与える。∴新薬と同じ、実験。

計量経済学の専門言葉で言えば_...

1. 他の条件を一定として比較_⇒ 。 2. ^{複数の個体を追跡調査}⇒ ^。

3. 災害・法制度などによる偶然に着目_⇒ と。

4. 社会・人間組織を対象にした制御実験_⇒ 。

この講義では、主に重回帰分析と操作変数法を扱う。

3 基本概念の復習

3.1 和記号

のルール

和記号

（サム_orシグマ）：_n個の数_X₁_{, X}₂, . . . , X_n^の和は

n i=1

Xi = X¹+ X²+ · · · + Xn^. ⁽³⁾

(4)

n i=1

c = c + c + · · · + c

n 個の c

= ^. ⁽⁵⁾

⊲ ^ルール3^：{X1, X2, . . . , X_n}^と{Y1, Y2, . . . , Y_n}^について

n i=1

(Xi+ Yi) = (X¹+ Y¹) + (X²+ Y²) + · · · + (Xn+ Yn⁾

= (X1+ X2+ · · · + Xn) + (Y1+ Y2+ · · · + Yn) = ^. ⁽⁶⁾

_Remark：₍ⁿ

i=1^Xⁱ⁾ 2n

i=1^X 2

i。間違いやすいので要注意。

⊲ ^{左辺を展開すると} (

n i=1

X_i)² _{= (}

n i=1

X_i)(

n i=1

X_i_{) = (X}1_{+ X}2+ · · · + Xn^)(X¹+ X²+ · · · + Xn⁾

= (X₁²+ X₂²+ · · · + X_n²⁾

=右辺ⁿ_i=1X²_i

+ (X1X2+ · · · + Xn−1Xn⁾

余計な交差項

n i=1

X_i².

(7)

3.2 データのタイプと表記法

クロスセクションデータ：ある時点において、複数の観測個体を観測することで得られる

データを、と呼ぶ。

⊲ ある時点における、観測個体のバラつきの記録。

⊲ ^例：2000^年度の47^{都道府県のデータ。}

県名人口 _GDP 出生数

北海道 ₅₆₈₃ ₂₀₂₇₃ ₄₆

青森 ₁₄₇₆ ₄₅₆₆ ₁₂ 岩手 ₁₄₁₆ ₄₉₄₅ ₁₂ ... ^... ^... ^... 沖縄 ₁₃₁₈ ₃₅₃₉ ₁₆

_Remark：第_i番目の観測個体（i = 1, 2, . . . , n^{）の観測値を、}^Xi^、Yi^{などと表記。}

(5)

⊲ ^{観測の個数}nを、サンプル数と呼ぶ。

⊲ 都道府県クロスセクションデータは_{n = 47}。_X₁_{, X}₂, . . . , X47^。

時系列データ：単一観測個体を、複数時点継続して観測することで得られるデータを、と呼ぶ。

⊲ 特定観測対象の、時間を通じた変化の記録。

⊲ ^例：1987∼2000年の日本のマクロ経済データ。

年貨幣需要利子率 _GDP

1987 113.12 4.8 367.56

1988 124.18 4.8 390.33

1989 137.01 5.6 409.18

... ^... ^... ^...

2000 186.4 1.2 485.97

3.3 記述統計：データの整理

記述統計（基本統計）：データの持つ特徴を、数値でまとめる。

⊲ ^{生のデータ}X1, X2, . . . , X_n^{は、単なる数字の羅列}→記述統計で整理、特徴をつかむ。

⊲ よく使う記述統計：標本平均、標本分散（と標準偏差）。

標本平均：サンプル数_nのデータ_X₁_{, X}₂, . . . , X_n^{の標本平均}X^¯ ^は X =¯ ¹

n^(X¹^{+ X}²+ · · · + Xn) = ¹ n

n i=1

Xi^. ⁽⁸⁾

⊲ ^{標本平均は} ^：データX1, X2, . . . , X_nの重心、代表的な値を表す。

標本分散：同様に、標本分散_s²

X^は

s²_X ₌ ¹ n − 1

(X1^{− ¯}X)²_{+ (X}2^{− ¯}X)²+ · · · + (Xn^{− ¯}^X)²

= ¹

n − 1

n i=1

(X_i− ¯X)². (9)

⊲ ^{標本分散は} ：データのバラつき具合を数値化したもの。

⊲ ^各X_i^の、重心X^¯ ^{からのズレ}(X_i− ¯X)^が大きい→^{分散が大きい。}^{（ズレは正にも負に} もなるので、₂乗して評価。）

⊲ ^{標本分散の正の平方根}sX =

s²_X^を、 ^と呼ぶ。

3.4 多次元データと標本共分散

多次元データ：各観測個体_iに関し、複数の変数が記録されたデータ。

⊲ 3.1節のクロスセクションデータ、時系列データの例は、多次元データ。

⊲ 変数間の関係を分析するには、多次元データが必要。

(6)

⊲ ^平均値X^¯^、Y^¯ ^を軸に、Xi^とYi^{が同じ方向に動く}^⇒(Xi^{− ¯}X)(Yi^{− ¯}Y) > 0^。

⊲ X_i^とY_i^{が逆方向に動く}⇒(X_i− ¯X)(Y_i− ¯Y) < 0^。

⊲ ∴^平均的に(X_i− ¯X)(Y_i− ¯Y) > 0^{が強ければ}s_XY> 0^、(X_i− ¯X)(Y_i− ¯Y) < 0^{が強ければ} s_XY < 0^{。打ち消し合えば}s_XY ≈0^。

_Remark：標本共分散は、二つの変数（事柄）のを計る。

⊲ s_XY > 0 ⇔ X^{が大きいほど}Yが小さい傾向。正の相関。

⊲ s_XY < 0 ⇔ X^{が大きいほど}Yが大きい傾向。負の相関。

⊲ あくまで相関関係。因果関係ではない。

まとめと復習問題

今回のまとめ

計量経済学：非実験データのための実証分析の手法。幅広い適用範囲。

非実験データから因果関係を立証する難しさ。

基本概念の復習。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. 次のデータ（サンプル数_{n = 4}）の標本平均は_{X = 7.5}¯ 、標本分散は _s² ₌＿＿＿である。

（下表の空欄を埋めてゆくと計算しやすい。）

i Xi Xi^{− ¯}X (X_i− ¯X)²

1 5

2 10 3 10

4 5

2. ( X_i)² X_i²^を、^数値例_{n = 2}^、X1= 1^、^X2= 2^{で確認する。左辺}^{( X}i⁾² = (X1+X2⁾² = 9^、右辺_X²

i ^{= X} 2 1^{+ X}

2

2 ⁼^{＿＿＿。よって左辺}^{右辺である。}

3. 大学教育が賃金に与える影響を実証するため、学歴が大卒以上の労働者₁₀₀人の平均賃金と大卒以下₁₀₀人の平均賃金を比較したところ、_10%ほど前者の平均が大きかった。しかしこれは必ずしも「大学教育_→賃金」の因果関係を意味しない。その理由を簡潔に述べよ。

イントロダクション 計量経済学 鹿野研究室 note01

担当：鹿野（大阪府立大学）

2013 年度後期

はじめに

今回学ぶこと

1 計量経済学とは何か？

1.1 計量経済学と実証分析

2 実験データ vs. 非実験データ

2.1 実験データによる実証分析

2.2 非実験データの問題点

3 基本概念の復習

3.1 和記号

のルール

3.2 データのタイプと表記法

3.3 記述統計：データの整理

3.4 多次元データと標本共分散

まとめと復習問題

今回のまとめ

復習問題

イントロダクション計量経済学鹿野研究室 note01