担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
今回学ぶこと
計量経済学の概要。
基本概念の復習。
テキスト該当箇所 :1章。
1 計量経済学とは何か?
1.1 計量経済学と実証分析
科学としての経済学 :データによる の必要性。
⊲ 理論仮説をテスト。 例:恒常所得仮説は成立するか ?
⊲ 新たな法則の発見。 例:治安悪化は不動産価格に影響を与えるか ?
⊲ 政策評価。例:公的職業訓練で労働者の生産性が上がるか ?
⊲ 予測。例:企業財務データから、 次年度の企業株価を予測するには ?
分析上の関心=変数間の相関関係や因果関係。 特に後者。
⊲ ある変数YとXの関係を次式で表す。
Y = f (X). (1)
⊲ 例:Y =労働者の賃金(生産性)、X =職業訓練時間。dY
dX > 0かどうか知りたい。
⊲ Xは複数の変数X1, X2, . . . , Xkでも良い。
計量経済学=経済学の実証分析のための統計手法。 統計的推測がベース。
⊲ 統計的推測:母集団モデルの設定→標本抽出、母数の推定と仮説検定。
Remark:なぜ計量経済学が必要 ?(なぜ通常の統計学ではダメ ?)
⊲ 通常の統計学: (物理・臨床実験)が前提⇒因果性の立証は容易。
⊲ 経済学の分析対象 :実験に莫大なコストor倫理的・物理的に不可能。
⊲ 計量経済学の目的: から因果性を立証。∴経済学以外で、実験が難 しい分野(疫学・公衆衛生学、環境学、etc)でも利用される。
1
⊲ u =変数Xの一次式α + βXで説明できない誤差。
Remark:変数間の関係を簡単なモデルに定式化⇒目的が明確に。
⊲ 分析者の知りたいこと=変数XがYに与える影響。
⊲ 係数パラメータβ (= dYdX)の値が分かれば、XのYへの影響が判明。
⊲ (2)式を、 と呼ぶ。
推定:変数X, Yのデータを集め、 データから未知のパラメータα, βの値を推測する作業
を、 と呼ぶ。
⊲ 用意したデータから上手にパラメータを推定するには?⇒統計的推測の基準を応用。
2 実験データ vs. 非実験データ
2.1 実験データによる実証分析
例:ある製薬会社が新しい抗高血圧剤を開発。 この新薬の効果はあるか ?
⊲ 実験開始。200人の被験者(高血圧)のうち、ランダムに選んだ100人に新薬を投 与。残りは放置。⇒1ヶ月後、投与グループの血圧平均と放置グループの血圧平均の 差を見れば良い。
∴実験データのもとでは、 分析が比較的簡単。
⊲ 入門レベルの統計学 (平均値の差の検定、 単回帰分析)などで対応可能。
2.2 非実験データの問題点
例:ある市が、小学校高学年向けの補習授業を4週間実施。参加は生徒の任意。補習の効 果はあるか?注:実験データではない。
⊲ 上の新薬の例に倣い、補習を受けた生徒100人の学力テストスコアと、受けなかっ た100人のスコアの差を比較したところ、 前者のスコアが20%ほど高かった。統計 的な検定もパスしている。
⊲ これで「補習→成績」の因果関係が立証できたか ?
答えは 。因果関係の立証になっていない。
⊲ 学習意欲のある子どもほど補習参加→もともと勉強のできる子が補習グループに集 まっていた可能性。∴単純比較は、補習の効果を 。図1参照。
図1:「補習」→「成績」の因果関係?
⊲ 進学塾通いで忙しい子どもほど、補習参加しない→もともと勉強のできない子が補 習グループに集まっていた可能性。∴単純比較は、補習の効果を 。
⊲ ∴補習を「抜き」にしても、両グループに差があった可能性。
Remark:実験データと非実験データの決定的な違いは ?
⊲ 新薬効果の実証分析:薬剤投与(X)が本人の意思とは無関係に、ランダムに与えら れる。∴投与・放置グループに偏りが生まれない。
⊲ 補習効果の実証分析:参加・不参加(X)が本人の意思・能力に基づいて決まる。∴ 補習の効果か、 サンプルの偏りか、 区別がつかない。
解決策:計量経済学によるアイディア (一例)。
1. 事前の学力が同等の子どもで比較。例:前回の学力テスト偏差値が50∼55点の子ども。 2. 複数の子どもを長期間追跡調査し、 補習を受けたタイミングで成績の上昇があった
か検証。
3. 受講機会が偶然によって決まってしまったケースを探す。例:大型台風により、特定 地域だけ補習が中止された。
4. 受講機会を、子どもにランダムに与える。∴新薬と同じ、実験。
計量経済学の専門言葉で言えば...
1. 他の条件を一定として比較⇒ 。 2. 複数の個体を追跡調査⇒ 。
3. 災害・法制度などによる偶然に着目⇒ と 。
4. 社会・人間組織を対象にした制御実験⇒ 。
この講義では、 主に重回帰分析と操作変数法を扱う。
3 基本概念の復習
3.1 和記号
のルール
和記号
(サムorシグマ):n個の数X1, X2, . . . , Xnの和は
n i=1
Xi = X1+ X2+ · · · + Xn. (3)
n i=1
c = c + c + · · · + c
n 個の c
= . (5)
⊲ ルール3:{X1, X2, . . . , Xn}と{Y1, Y2, . . . , Yn}について
n i=1
(Xi+ Yi) = (X1+ Y1) + (X2+ Y2) + · · · + (Xn+ Yn)
= (X1+ X2+ · · · + Xn) + (Y1+ Y2+ · · · + Yn) = . (6)
Remark:(n
i=1Xi) 2n
i=1X 2
i。間違いやすいので要注意。
⊲ 左辺を展開すると (
n i=1
Xi)2 = (
n i=1
Xi)(
n i=1
Xi) = (X1+ X2+ · · · + Xn)(X1+ X2+ · · · + Xn)
= (X12+ X22+ · · · + Xn2)
=右辺ni=1X2i
+ (X1X2+ · · · + Xn−1Xn)
余計な交差項
n i=1
Xi2.
(7)
3.2 データのタイプと表記法
クロスセクションデータ:ある時点において、複数の観測個体を観測することで得られる
データを、 と呼ぶ。
⊲ ある時点における、 観測個体のバラつきの記録。
⊲ 例:2000年度の47都道府県のデータ。
県名 人口 GDP 出生数
北海道 5683 20273 46
青森 1476 4566 12 岩手 1416 4945 12 ... ... ... ... 沖縄 1318 3539 16
Remark:第i番目の観測個体(i = 1, 2, . . . , n)の観測値を、Xi、Yiなどと表記。
⊲ 観測の個数nを、サンプル数と呼ぶ。
⊲ 都道府県クロスセクションデータはn = 47。X1, X2, . . . , X47。
時系列データ :単一観測個体を、 複数時点継続して観測することで得られるデータを、 と呼ぶ。
⊲ 特定観測対象の、 時間を通じた変化の記録。
⊲ 例:1987∼2000年の日本のマクロ経済データ。
年 貨幣需要 利子率 GDP
1987 113.12 4.8 367.56
1988 124.18 4.8 390.33
1989 137.01 5.6 409.18
... ... ... ...
2000 186.4 1.2 485.97
3.3 記述統計:データの整理
記述統計(基本統計):データの持つ特徴を、 数値でまとめる。
⊲ 生のデータX1, X2, . . . , Xnは、単なる数字の羅列→記述統計で整理、特徴をつかむ。
⊲ よく使う記述統計 :標本平均、標本分散(と標準偏差)。
標本平均:サンプル数nのデータX1, X2, . . . , Xnの標本平均X¯ は X =¯ 1
n(X1+ X2+ · · · + Xn) = 1 n
n i=1
Xi. (8)
⊲ 標本平均は :データX1, X2, . . . , Xnの重心、代表的な値を表す。
標本分散:同様に、標本分散s2
Xは
s2X = 1 n − 1
(X1− ¯X)2+ (X2− ¯X)2+ · · · + (Xn− ¯X)2
= 1
n − 1
n i=1
(Xi− ¯X)2. (9)
⊲ 標本分散は :データのバラつき具合を数値化したもの。
⊲ 各Xiの、重心X¯ からのズレ(Xi− ¯X)が大きい→分散が大きい。(ズレは正にも負に もなるので、2乗して評価。)
⊲ 標本分散の正の平方根sX =
s2Xを、 と呼ぶ。
3.4 多次元データと標本共分散
多次元データ:各観測個体iに関し、複数の変数が記録されたデータ。
⊲ 3.1節のクロスセクションデータ、 時系列データの例は、 多次元データ。
⊲ 変数間の関係を分析するには、 多次元データが必要。
⊲ 平均値X¯、Y¯ を軸に、XiとYiが同じ方向に動く⇒(Xi− ¯X)(Yi− ¯Y) > 0。
⊲ XiとYiが逆方向に動く⇒(Xi− ¯X)(Yi− ¯Y) < 0。
⊲ ∴平均的に(Xi− ¯X)(Yi− ¯Y) > 0が強ければsXY> 0、(Xi− ¯X)(Yi− ¯Y) < 0が強ければ sXY < 0。打ち消し合えばsXY ≈0。
Remark:標本共分散は、二つの変数(事柄)の を計る。
⊲ sXY > 0 ⇔ Xが大きいほどYが小さい傾向。正の相関。
⊲ sXY < 0 ⇔ Xが大きいほどYが大きい傾向。負の相関。
⊲ あくまで相関関係。 因果関係ではない。
まとめと復習問題
今回のまとめ
計量経済学:非実験データのための実証分析の手法。 幅広い適用範囲。
非実験データから因果関係を立証する難しさ。
基本概念の復習。
復習問題
出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。
1. 次のデータ(サンプル数n = 4)の標本平均はX = 7.5¯ 、標本分散は s2 =___である。
(下表の空欄を埋めてゆくと計算しやすい。)
i Xi Xi− ¯X (Xi− ¯X)2
1 5
2 10 3 10
4 5
2. ( Xi)2 Xi2を、数値例n = 2、X1= 1、X2= 2で確認する。左辺( Xi)2 = (X1+X2)2 = 9、 右辺 X2
i = X 2 1+ X
2
2 =___。よって左辺右辺である。
3. 大学教育が賃金に与える影響を実証するため、 学歴が大卒以上の労働者100人の平均賃 金と大卒以下100人の平均賃金を比較したところ、10%ほど前者の平均が大きかった。し かしこれは必ずしも「大学教育→賃金」の因果関係を意味しない。 その理由を簡潔に述 べよ。