計量経済学#01
イントロダクション:計量経済学とは?
鹿野繁樹
大阪府立大学
2017 年 10 月更新
Outline
1 計量経済学の役割
2 基本概念の復習
テキスト・参考書。
テキスト:鹿野繁樹 [2015]、第 1 章。 参考書:松原望 et al. [1991]。
前回の復習
. . . なし。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 2 / 35
Section 1
計量経済学の役割
実証分析のための計量経済学
データを収集・分析し、何かを明らかにすることを実証分性と 呼ぶ。
計量経済学の役割:経済データを使った実証分析の手法を開 発・実用。エコノミスト必須の道具。
Evidence-based medicine/education/policy ...。現在、あらゆる 分野で求められる統計的エビデンス。
∴ 欧米の(まともな)大学の経済学部では通常、計量経済学 は必修科目。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 4 / 35
例(需要曲線):みかんの需要量をY 、価格を X と置く。理論上、 みかんの需要関数Y = f (X) は右下がり。
Y = f (X), dY
dX <0. (1) 経済学で最初に習う、「需要の法則」。
消費者は本当に、「需要の法則」通りの消費行動をしてい るか?
価格X の1 パーセント上昇で、需要 Y は何パーセント減る? このような問いに答えるのが、計量経済学の役目。
例(職業訓練の政策評価):公的職業訓練X1(訓練時間)が、労働 者の賃金Y に与える影響を評価。⇒ 両者の関係を次式で表す。
Y = f (X1, X2, . . . , XK). (2)
ただしX2, X3, . . . , XKは、賃金に影響するその他の個人属性(年 齢や性別など)。
訓練による職能スキルの取得は、賃金増をもたらすはず。
∂Y
∂X1
>0. (3)
⇒ 本当にそのような効果があるか?あるとして、どれだけ賃 金(生産性)が増えるのか?
これも、計量経済学の分析対象。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 6 / 35
∴ 計量経済学の目標を一言で言えば、変数間の数量的な因果関 係の実証。⇒ 統計的エビデンスの確立。
Remark 1
計量経済学の目標=変数間の因果関係を数量的に測る。 例:価格X が上昇⇒ 需要量 Y がどれだけ変化する? 例:職業訓練X を受ける⇒ 所得 Y がどれだけ変化する?
回帰分析:計量経済学の基礎
計量経済学では通常、変数X と Y の関係を回帰式(回帰モデル) Y = a + bX (4) でモデル化。a と b は定数で、回帰係数と呼ぶ。
∴ 回帰式は、Y の違いを、X の違いによって説明する式。
⇒ X を説明変数、Y を被説明変数と呼ぶ。 上式をX で微分すれば、
dY
dX = b. (5)
係数b は、X 一単位の変化に対する Y の変化分。∴ 計量経済 学の目的は、b の値を突き止めることに帰着。
データからa と b を求めるには?⇒回帰分析(テキスト第4 章以降)。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 8 / 35
イメージをつかむための分析例。
Example 1
2010 年における 19 政令指定都市について、各都市の生活保護受給 率welfare の違いを、その失業率 unemp の違いで説明する回帰式。
welfare
被説明変数
= −1.07
a
+ 0.46
b
unemp
説明変数
. (6)
係数はb= 0.46 > 0 で、unemp が高いほど welfare が高い。 回帰分析は、基本的に上のような「答え」を出す。
「失業率が1 ポイント悪化すると、受給率が 0.46 ポイント増 える」という、定量的な議論や予測が可能に。
因果関係の実証:実験データ vs. 非実験データ
データに基づく因果関係の実証は、意外と難しい。⇒ 因果関係 と相関関係の違い。
Example 2
ある市の教育委員会が、小学生向けの補習授業を希望者に無料提 供。補習の効果を評価するためn= 2000 人のサンプルで回帰分 析。⇒ 児童の補習参加日数supp と翌学期の学力テストの成績 score の関係は
score = 40.0 + 1.5 supp. (7)
∴ 補習に10 日間参加した児童は、不参加の児童と比べ 15 点も得点 が高くなる!
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 10 / 35
この分析結果は、「補習→ 成績」という因果関係の、統計的な証 拠・エビデンスになるか?⇒ 答えはNO!
問題点:児童(家族)の意思決定で、補習に参加。
もし勉強好きな児童・教育熱心な家庭ほど補習を受けていた ら?⇒ 補習参加グループは、補習を「抜き」にしても、元々 高い学力・モティベーション。∴ 上の回帰係数
b= 1.5 (8)
は、補習の効果を過大評価している恐れ。
... 補習を受けなかった児童に補習を強制したら、彼らはこの ような効果を得られるか?
逆に、学業に不安のある児童ほど補習を受けた可能性。⇒ 補 習グループは元々学力の低い児童の集まり。∴ 補習効果を過 小評価。
Remark 2
相関関係と因果関係の違いに注意。
相関関係X ↔ Y :X が大きい(小さい)ほど、Y が大きい
(小さい)。
因果関係X → Y :X の変化・差異で、Y の変化・差異が生 じた。
... いかなるデータ・設定で回帰分析を行えば、正しい因果関 係の推計を得られるか?
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 12 / 35
次の例も、やはり回帰分析。
Example 3
ある製薬会社の臨床実験。新開発の抗血圧剤を、被験者にランダ ムに投与。投与量dose(グラム)と血圧 bp の関係を表す、次の回 帰式を得た。
bp = 135.0 − 3.0 dose. (9) 投与量が1 グラム増えると血圧が 3 下がる傾向。
Example 2 との決定的な違いは?⇒ 説明変数(dose)の値が、 本人の意思とは無関係に、ランダムに与えられている点。
「1 グラム当たり 3」の低下は、介入がなければ存在し得な い。⇒「薬が血圧を下げる」因果関係の統計的証拠!
ここで採用されている分析デザインを、無作為化実験と呼ぶ。
一方、経済学(社会科学)で実験は困難⇒ 主に非実験データを 使う。
非実験データ= 個人・企業のありのままの行動や、市場取引 の結果を観察・記録したデータ。
従来の統計手法は、実験データが前提。⇒ 非実験データにそ のまま適用すると、推定すべき効果が過大評価・過小評価さ れてしまう。
∴ 計量経済学の必要性!
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 14 / 35
データから因果関係に迫るための分析方法は?⇒ 計量経済学が提 案するのは. . .
1 重回帰分析(コントロール変数アプローチ)⇒ テキスト第6 章。このコース前半のメインテーマ。
2 操作変数法(自然実験)⇒ テキスト第12 章、第 13 章。この コース後半のメインテーマ。
3 パネルデータ分析⇒ テキスト第16 章。このコースでは省略。
Section 2
基本概念の復習
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 16 / 35
データ分析の基本用語
表1:2010 年第 1 四半期(1 月 ∼3 月)に、東京の世田谷区で取引 された中古マンション194 軒のデータ。
データを集めたら、Excel などでこのようにレイアウト! 一つ一つのマンションを個体(あるいは観測)と呼ぶ。⇒ 任 意の個体をi で表す。
データ中の個体(観測)総数を、サンプル数(またはサンプ ルサイズ、標本数、個体数、観測数など)と呼ぶ。⇒ サンプ ル数をn で表す。この例では n= 194。
このデータは、ある時点(2010 年第 1 四半期)におけるマン ションの個体差を記録したクロスセクションデータ。
id 価格 最寄駅所要時間 築年数 面積 ワンルーム
1 620 5 26 15 1
2 3700 3 11 50 0
3 3700 12 12 55 0
...
194 3400 8 24 60 0
表1 : 中古マンションのクロスセクションデータ(n= 194)
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 18 / 35
データ中の変数:表1 のデータは、一つの個体につき「価格」、
「最寄駅までの所要時間」、「築年数」、「面積」、「ワンルーム」の5 つの情報(=変数)を持つ。
変数の総数(ここでは5)を、データの次元と呼ぶ。
「価格」や「面積」のように、測定単位を理論上どこまでも 細かくすることが可能な変数を、連続変数と呼ぶ。
「ワンルーム」は、そのマンションがワンルームなら1、そう でなければ0 となる変数。分類のために機械的に 0/1 が割り 振られた変数を、ダミー変数と呼ぶ。. . . より一般的に、取り 得る値が数えるほどしかない変数を、離散変数と呼ぶ。
表2:2006 年 1 月から 2011 年 12 月までの、日本の物価上昇率と失 業率のデータ。
特定の個体を複数時点に渡って観測し、その変化・変動を記 録したデータを、時系列データと呼ぶ。
このコースでは、時系列データを扱わない。 id 年 月 物価上昇率 失業率
1 2006 1 -0.1 4.5 2 2006 2 -0.1 4.2 3 2006 3 -0.2 4.4
...
72 2011 12 -0.2 4.2
表 2 : 物価上昇率と失業率の時系列データ(n= 72)
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 20 / 35
和記号
の演算ルール
データの任意の変数(例えば表1 の価格)は、
X1, X2, . . . , Xn (10)
と横並びに表記。(表では縦に並んでいるが、式では横並び。) 第i 番目の観測を、代表して Xiと表す。
X1, X2, . . . , Xnの和は、和記号
(サム、シグマ)を使えば
n
i=1
Xi = X1+ X2+ · · · + Xn. (11)
和記号
の便利な公式。よく使うので、覚えておくこと。
公式 1
添え字i が付かない定数を c と置けば、次式が成立。
cXi = c
Xi, (12)
c= nc, (13)
Xi
2
=Xi2. (14)
(14) 式に注意。「Xiの和の2 乗」(左辺)は、「Xiの2 乗の和」
(右辺)と等しくない。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 22 / 35
証明:(12) 式の証明は、テキスト p11 参照。(13) 式は、
n
i=1
c= c + c + · · · + c
n×c
= nc. (15)
(14) 式については、左辺を展開すると
Xi
2
= (X1+ X2+ · · · + Xn)(X1+ X2+ · · · + Xn)
= (X12+ X22+ · · · + Xn2)
=X2 i
+ (X1X2+ · · · + Xn−1Xn) 余計な交差項
=Xi2. (16)
∴「余計な交差項」の分、(i=1Xi) 2
と
i=1X 2
i に差が出る。
二つの変数X1, X2, . . . , XnとY1, Y2, . . . , Ynの、対応する観測同士 の和についても、同様の公式。
公式 2
添え字i が付かない定数を a、b と置けば、
(aXi+ bYi) = aXi+ b
Yi. (17)
証明:簡単なので省略。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 24 / 35
記述統計:データの整理
表1 や表 2 のデータは、単なる数字の羅列。⇒記述統計にまとめ、 特徴・傾向をつかむ。変数Xiの標本平均は、
X¯ = 1
n(X1+ X2+ · · · + Xn) = 1 n
Xi. (18)
標本平均は変数Xiの位置の尺度。さまざまな値が観測される Xiの、代表的・典型的な値。
わざわざ「標本」平均と呼ぶ理由:今後、標本以外の平均も 登場するため。
各観測Xiの平均値X からのズレ¯ (Xi− ¯X) を 2 乗し、その後平均 をとることで、標本分散を得る。
s2X = 1
n−1(X1− ¯X)
2+ (X2− ¯X)2+ · · · + (Xn− ¯X)2
= 1 n−1
(Xi− ¯X)2. (19)
標本分散は散らばりの尺度。Xiのバラつきを測る。
標本分散のアイディア:各観測X1, X2, . . . , Xnが「平均的に」 どれだけ典型的な値X からズレているかを数値化。¯
なぜ2 乗?⇒ 正のズレも負のズレも、等しく正の値で評価。 なぜサンプル数n ではなく n−1 で割る?⇒ テキスト第 4 章。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 26 / 35
標本分散s2X の問題点:計算の際に2 乗を伴うため,その単位が変 数Xiの単位の2 乗になってしまう!
例:「万円」単位で測られたXiの分散s
2
Xは、単位が「万円 2
」。
∴ 分散を正の平方根
sX =
s2X (20) に直し、元の測定単位に戻す。このsXを、Xiの標本標準偏 差と呼ぶ。
Example 4
表1の中古マンション取引データについて、標本平均、標準偏差お よび最小値・最大値をまとめると、表3の通り。
平均 標準偏差 最小値 最大値 価格 3762.60 2151.00 500 19000 駅所要時間 8.98 5.41 0 29 築年数 14.99 11.49 0 43 面積 53.53 29.12 10 280 ワンルーム 0.19 0.39 0 1 サンプル数n 194
表3 : 中古マンションデータ(表1)の記述統計
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 28 / 35
記述統計を表にまとめ、各変数の様子を眺めてみるのも大切。
Remark 3
まずは記述統計でデータの要約。
標本平均X:変数 X¯ iの代表的な値。
標本分散s2X・標準偏差sX:変数Xiのバラつきの程度を数 値化。
標本共分散と相関係数
変数間の関係性を測るには?⇒ 二つの変数 Xi、Yi(例えば表2の 物価上昇率と失業率)について、標本共分散
sX Y =
1
n−1(X1− ¯X)(Y1− ¯Y) + · · · + (Xn− ¯X)(Yn− ¯Y)
= 1 n−1
n
i=1
(Xi− ¯X)(Yi− ¯Y). (21)
標本共分散のアイディア:変数ペア(Xi, Yi) が、平均値
( ¯X, ¯Y) を軸に
1 同方向に変動(+ + or − −)⇒(Xi− ¯X)(Yi− ¯Y) > 0。
2 逆方向に変動(+ − or − +)⇒(Xi− ¯X)(Yi− ¯Y) < 0。
sX Y は(Xi− ¯X)(Yi− ¯Y) の平均。
1 sX Y >0 ⇒ (Xi, Yi)に正の相関。
2 sX Y <0 ⇒ (Xi, Yi)に負の相関。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 30 / 35
標本共分散sX Y の問題点:sX Y の値は、(Xi, Yi) の測定単位に依
存。⇒ 理論上の上限・下限が不明。∴ 相関の「正負」は判断でき るが、相関の「強弱」を議論できない。
そこで、sX Y を標本相関係数 rX Y =
sX Y
sXsY
. (22)
に変換。ただしsY はYiの標本標準偏差。 相関係数rX Y は
−1 ≤ rX Y ≤1 (23) という上限・下限を持つ。∴ 次の判断が可能!
rX Y が−1に近い⇒強い負の相関。 rX Y が+1に近い⇒強い正の相関。 証明は松原 望 et al. [1991, 第 3.3 章]。
Remark 4
標本共分散と相関係数の違いは?
共分散sX Y:理論上の上限・下限がない。⇒ 相関の「正負」 は決まるが、「強弱」は不明。
標本相関係数rX Y:−1 ≤ rX Y ≤1 ⇒ 相関の方向性に加え、
「強弱」まで判断できる。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 32 / 35
Example 5
表2の失業率 Xiと物価上昇率Yiの標本共分散と相関係数は、 sX Y = −0.74, rX Y = −0.41. (24)
両者には中程度の強さの負の相関がある。
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 テキスト第1 章復習問題 1.2。
2 テキスト第1 章復習問題 1.3。
3 大学教育が賃金に与える影響を実証するため、大卒以上労働 者100 人の平均賃金と大卒以下 100 人平均賃金を比較したと ころ、10%ほど前者の平均が大きかった。しかしこれは必ず しも「大学教育→ 賃金」の因果関係を意味しない。その理由 を簡潔に述べよ。
鹿野繁樹 (大阪府立大学) 計量経済学#01 2017 年 10 月更新 34 / 35
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.
松原望, 縄田 和満, and 中井 検裕. 統計学入門. 東京大学出版会, 1991.