『新しい計量経済学』鹿野研究室 slide01

(1)

計量経済学_#01

イントロダクション：計量経済学とは？

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 計量経済学の役割

2 基本概念の復習

テキスト・参考書。

テキスト：鹿野繁樹 [2015]、第 1 章。参考書：松原望 et al. [1991]。

前回の復習

. . . なし。

鹿野繁樹 _{(大阪府立大学)} 計量経済学_#01 2017 年 10 月更新 2 / 35

(3)

Section 1 計量経済学の役割

(4)

実証分析のための計量経済学

データを収集・分析し、何かを明らかにすることを実証分性と呼ぶ。

計量経済学の役割：経済データを使った実証分析の手法を開発・実用。エコノミスト必須の道具。

Evidence-based medicine/education/policy ...。現在、あらゆる分野で求められる統計的エビデンス。

∴ 欧米の（まともな）大学の経済学部では通常、計量経済学は必修科目。

(5)

例（需要曲線）：みかんの需要量をY 、価格を X と置く。理論上、みかんの需要関数_Y = f (X) は右下がり。

Y = f (X), ^dY

dX ^<^0. ⁽¹⁾ 経済学で最初に習う、「需要の法則」。

消費者は本当に、「需要の法則」通りの消費行動をしているか？

価格_{X の}1 パーセント上昇で、需要 Y は何パーセント減る？このような問いに答えるのが、計量経済学の役目。

(6)

例（職業訓練の政策評価）：公的職業訓練X1（訓練時間）が、労働者の賃金Y に与える影響を評価。⇒ 両者の関係を次式で表す。

Y = f (X¹, X2, . . . , XK_). ₍₂₎

ただし_X₂_{, X}₃, . . . , XKは、賃金に影響するその他の個人属性（年齢や性別など）。

訓練による職能スキルの取得は、賃金増をもたらすはず。

∂Y

∂X1

>0. (3)

⇒ 本当にそのような効果があるか？あるとして、どれだけ賃金（生産性）が増えるのか？

これも、計量経済学の分析対象。

(7)

∴ 計量経済学の目標を一言で言えば、変数間の数量的な因果関係の実証。⇒ 統計的エビデンスの確立。

Remark 1

計量経済学の目標＝変数間の因果関係を数量的に測る。例：価格_{X が上昇}⇒ 需要量 Y がどれだけ変化する？例：職業訓練_{X を受ける}⇒ 所得 Y がどれだけ変化する？

(8)

回帰分析：計量経済学の基礎

計量経済学では通常、変数_{X と Y の関係を}回帰式（回帰モデル） Y = a + bX (4) でモデル化。a と b は定数で、回帰係数と呼ぶ。

∴ 回帰式は、Y の違いを、X の違いによって説明する式。

⇒ X を^{説明変数、}Y を^{被説明変数と呼ぶ。} 上式をX で微分すれば、

dY

dX ^{= b.} ⁽⁵⁾

係数b は、X 一単位の変化に対する Y の変化分。∴ 計量経済学の目的は、b の値を突き止めることに帰着。

データからa と b を求めるには？⇒^{回帰分析（テキスト第}4 章以降）。

(9)

イメージをつかむための分析例。

Example 1

2010 年における 19 政令指定都市について、各都市の生活保護受給率welfare の違いを、その失業率 unemp の違いで説明する回帰式。

welfare

被説明変数

= −1.07

a

+ 0.46

b

unemp

説明変数

. ₍₆₎

係数は_b= 0.46 > 0 で、unemp が高いほど welfare が高い。回帰分析は、基本的に上のような「答え」を出す。

「失業率が1 ポイント悪化すると、受給率が 0.46 ポイント増える」という、定量的な議論や予測が可能に。

(10)

因果関係の実証：実験データ vs. 非実験データ

データに基づく因果関係の実証は、意外と難しい。_{⇒ 因果関係} と相関関係の違い。

Example 2

ある市の教育委員会が、小学生向けの補習授業を希望者に無料提供。補習の効果を評価するため_n= 2000 人のサンプルで回帰分析。⇒ 児童の補習参加日数supp と翌学期の学力テストの成績 score の関係は

score = 40.0 + 1.5 supp. (7)

∴ 補習に10 日間参加した児童は、不参加の児童と比べ 15 点も得点が高くなる！

(11)

この分析結果は、「補習→ 成績」という因果関係の、統計的な証拠・エビデンスになるか？_{⇒ 答えは}_NO!

問題点：児童（家族）の意思決定で、補習に参加。

もし勉強好きな児童・教育熱心な家庭ほど補習を受けていたら？⇒ 補習参加グループは、補習を「抜き」にしても、元々高い学力・モティベーション。∴ 上の回帰係数

b_{= 1.5} ₍₈₎

は、補習の効果を過大評価している恐れ。

... 補習を受けなかった児童に補習を強制したら、彼らはこのような効果を得られるか？

逆に、学業に不安のある児童ほど補習を受けた可能性。_{⇒ 補} 習グループは元々学力の低い児童の集まり。∴ 補習効果を過小評価。

(12)

Remark 2

相関関係と因果関係の違いに注意。

相関関係_X ↔ Y ：X が大きい（小さい）ほど、Y が大きい

（小さい）。

因果関係_X → Y ：X の変化・差異で、Y の変化・差異が生じた。

... いかなるデータ・設定で回帰分析を行えば、正しい因果関係の推計を得られるか？

(13)

次の例も、やはり回帰分析。

Example 3

ある製薬会社の臨床実験。新開発の抗血圧剤を、被験者にランダムに投与。投与量dose（グラム）と血圧 bp の関係を表す、次の回帰式を得た。

bp = 135.0 − 3.0 dose. (9) 投与量が1 グラム増えると血圧が 3 下がる傾向。

Example 2 との決定的な違いは？⇒ 説明変数（dose）の値が、本人の意思とは無関係に、ランダムに与えられている点。

「1 グラム当たり 3」の低下は、介入がなければ存在し得ない。⇒「薬が血圧を下げる」因果関係の統計的証拠！

ここで採用されている分析デザインを、無作為化実験と呼ぶ。

(14)

一方、経済学（社会科学）で実験は困難_{⇒ 主に}非実験データを使う。

非実験データ= 個人・企業のありのままの行動や、市場取引の結果を観察・記録したデータ。

従来の統計手法は、実験データが前提。_{⇒ 非実験データにそ} のまま適用すると、推定すべき効果が過大評価・過小評価されてしまう。

∴ 計量経済学の必要性！

(15)

データから因果関係に迫るための分析方法は？_{⇒ 計量経済学が提} 案するのは_{. . .}

1 重回帰分析（コントロール変数アプローチ）_{⇒ テキスト第}₆ 章。このコース前半のメインテーマ。

2 操作変数法（自然実験）_{⇒ テキスト第}12 章、第 13 章。このコース後半のメインテーマ。

3 _{パネルデータ分析}_{⇒ テキスト第}16 章。このコースでは省略。

(16)

Section 2 基本概念の復習

(17)

データ分析の基本用語

表1：2010 年第 1 四半期（1 月 ∼3 月）に、東京の世田谷区で取引された中古マンション_{194 軒のデータ。}

データを集めたら、Excel などでこのようにレイアウト！一つ一つのマンションを個体（あるいは観測）と呼ぶ。_{⇒ 任} 意の個体をi で表す。

データ中の個体（観測）総数を、サンプル数（またはサンプルサイズ、標本数、個体数、観測数など）と呼ぶ。_{⇒ サンプ} ル数をn で表す。この例では n= 194。

このデータは、ある時点（2010 年第 1 四半期）におけるマンションの個体差を記録したクロスセクションデータ。

(18)

id ^価格 ^{最寄駅所要時間} ^築年数 ^面積 ^{ワンルーム}

1 620 5 26 15 1

2 3700 3 11 50 0

3 3700 12 12 55 0

...

194 3400 8 24 60 0

表1 : 中古マンションのクロスセクションデータ（_n_{= 194}）

(19)

データ中の変数：表1 のデータは、一つの個体につき「価格」、

「最寄駅までの所要時間」、「築年数」、「面積」、「ワンルーム」の₅ つの情報（₌変数）を持つ。

変数の総数（ここでは_{5）を、データの}次元と呼ぶ。

「価格」や「面積」のように、測定単位を理論上どこまでも細かくすることが可能な変数を、連続変数と呼ぶ。

「ワンルーム」は、そのマンションがワンルームなら_1、そうでなければ0 となる変数。分類のために機械的に 0/1 が割り振られた変数を、ダミー変数と呼ぶ。. . . より一般的に、取り得る値が数えるほどしかない変数を、離散変数と呼ぶ。

(20)

表2：2006 年 1 月から 2011 年 12 月までの、日本の物価上昇率と失業率のデータ。

特定の個体を複数時点に渡って観測し、その変化・変動を記録したデータを、時系列データと呼ぶ。

このコースでは、時系列データを扱わない。 id ^年 ^月 ^{物価上昇率} ^失業率

1 2006 1 -0.1 4.5 2 2006 2 -0.1 4.2 3 2006 3 -0.2 4.4

...

72 2011 12 -0.2 4.2

表 2 : 物価上昇率と失業率の時系列データ（_n_{= 72}）

(21)

和記号

の演算ルール

データの任意の変数（例えば表_{1 の価格）は、}

X1, X2, . . . , Xn ₍₁₀₎

と横並びに表記。（表では縦に並んでいるが、式では横並び。）第i 番目の観測を、代表して Xiと表す。

X1, X2, . . . , Xnの和は、和記号

（サム、シグマ）を使えば

n

i=1

Xi _{= X}1_{+ X}2+ · · · + Xⁿ. (11)

(22)

和記号

の便利な公式。よく使うので、覚えておくこと。

公式 ₁

添え字i が付かない定数を c と置けば、次式が成立。

cXi _{= c}

Xi, ₍₁₂₎

c= nc, (13)

Xi

²

=^Xi². ₍₁₄₎

(14) 式に注意。「Xⁱ^の和の2 乗」（左辺）は、「Xⁱ^の2 乗の和」

（右辺）と等しくない。

(23)

証明：(12) 式の証明は、テキスト p11 参照。(13) 式は、

n

i=1

c= c + c + · · · + c

n×c

= nc. (15)

(14) 式については、左辺を展開すると

Xi

²

= (X¹+ X²+ · · · + Xⁿ)(X¹+ X²+ · · · + Xⁿ)

= (X1²+ X2²+ · · · + Xn²)

=X2 i

+ (X¹^X²+ · · · + Xn−1Xn₎ 余計な交差項

=^Xi². ₍₁₆₎

∴「余計な交差項」の分、₍_i=1_Xi₎ 2

と

i=1^X 2

i ^{に差が出る。}

(24)

二つの変数X1, X2, . . . , XnとY1, Y2, . . . , Ynの、対応する観測同士の和についても、同様の公式。

公式 ₂

添え字i が付かない定数を a、b と置けば、

(aXⁱ+ bYⁱ) = aXi_{+ b}

Yi. (17)

証明：簡単なので省略。

(25)

記述統計：データの整理

表1 や表 2 のデータは、単なる数字の羅列。⇒^{記述統計にまとめ、} 特徴・傾向をつかむ。変数Xiの標本平均は、

X¯ ₌ ¹

n^(X¹^{+ X}²+ · · · + Xⁿ) = ¹ n

Xi. ₍₁₈₎

標本平均は変数_Xiの位置の尺度。さまざまな値が観測される Xiの、代表的・典型的な値。

わざわざ「標本」平均と呼ぶ理由：今後、標本以外の平均も登場するため。

(26)

各観測Xiの平均値X からのズレ^¯ _(Xi− ¯X) を 2 乗し、その後平均をとることで、標本分散を得る。

s²X = ¹

n−1^(X¹^{− ¯}^X)

2+ (X²− ¯X)²+ · · · + (Xⁿ− ¯X)²

= ¹ n−1

(Xⁱ− ¯X₎². ₍₁₉₎

標本分散は散らばりの尺度。_Xiのバラつきを測る。

標本分散のアイディア：各観測_X₁_{, X}₂, . . . , Xnが「平均的に」どれだけ典型的な値X からズレているかを数値化。¯

なぜ2 乗？⇒ 正のズレも負のズレも、等しく正の値で評価。なぜサンプル数_{n ではなく n}₋1 で割る？⇒ テキスト第 4 章。

(27)

標本分散s²X ^{の問題点：計算の際に}2 乗を伴うため，その単位が変数_Xiの単位の2 乗になってしまう！

例：「万円」単位で測られた_Xiの分散_s

2

X^{は、単位が「万円} 2

」。

∴ 分散を正の平方根

sX ₌

s²_X ₍₂₀₎ に直し、元の測定単位に戻す。この_sXを、_Xiの標本標準偏差と呼ぶ。

(28)

Example 4

表1の中古マンション取引データについて、標本平均、標準偏差および最小値・最大値をまとめると、表_{3の通り。}

平均標準偏差最小値最大値価格 _3762.60 _2151.00 ₅₀₀ ₁₉₀₀₀ 駅所要時間 _8.98 _5.41 ₀ ₂₉ 築年数 _14.99 _11.49 ₀ ₄₃ 面積 _53.53 _29.12 ₁₀ ₂₈₀ ワンルーム _0.19 _0.39 ₀ ₁ サンプル数n ₁₉₄

表3 : 中古マンションデータ（表1）の記述統計

(29)

記述統計を表にまとめ、各変数の様子を眺めてみるのも大切。

Remark 3

まずは記述統計でデータの要約。

標本平均X：変数 X^¯ iの代表的な値。

標本分散s²_X・標準偏差sX：変数Xiのバラつきの程度を数値化。

(30)

標本共分散と相関係数

変数間の関係性を測るには？_{⇒ 二つの変数 X}i、_Yi（例えば表_2の物価上昇率と失業率）について、標本共分散

sX Y ₌

1

n−1^(X¹^{− ¯}^X)(Y¹^{− ¯}^Y) + · · · + (Xⁿ− ¯X)(Yⁿ− ¯Y)

= ¹ n−1

n

i=1

(Xⁱ− ¯X)(Yⁱ− ¯Y). (21)

標本共分散のアイディア：変数ペア_(Xi, Yi_{) が、平均値}

( ¯^{X, ¯}^Y) を軸に

1 同方向に変動（_{+ + or − −}）_⇒_(X_i_{− ¯}_X)(Y_i_{− ¯}_Y_{) > 0}。

2 _{逆方向に変動（}_{+ − or − +}_）_⇒_(X_i_{− ¯}_X)(Y_i_{− ¯}_Y_{) < 0}_。

sX Y は_(Xi_{− ¯}_X)(Yi_{− ¯}Y) の平均。

1 _s_{X Y} _>_{0 ⇒ (X}_i_{, Y}_i₎に正の相関。

2 _s_{X Y} _<_{0 ⇒ (X}_i_{, Y}_i₎に負の相関。

(31)

標本共分散sX Y の問題点：sX Y の値は、_(Xi, Yi_{) の測定単位に依}

存。⇒ 理論上の上限・下限が不明。∴ 相関の「正負」は判断できるが、相関の「強弱」を議論できない。

そこで、_sX Y を標本相関係数 rX Y ₌

sX Y

sXsY

. (22)

に変換。ただし_sY は_Yiの標本標準偏差。相関係数rX Y は

−1 ≤ r^{X Y} ≤1 (23) という上限・下限を持つ。∴ 次の判断が可能！

rX Y が₋₁に近い_⇒強い負の相関。 rX Y ^が+1^に近い⇒^{強い正の相関。} 証明は松原望 et al. [1991, 第 3.3 章]。

(32)

Remark 4

標本共分散と相関係数の違いは？

共分散_sX Y：理論上の上限・下限がない。_{⇒ 相関の「正負」} は決まるが、「強弱」は不明。

標本相関係数_rX Y：_{−1 ≤ r}X Y _≤1 ⇒ 相関の方向性に加え、

「強弱」まで判断できる。

(33)

Example 5

表_{2の失業率 X}iと物価上昇率_Yiの標本共分散と相関係数は、 sX Y _{= −0.74,} rX Y _{= −0.41.} ₍₂₄₎

両者には中程度の強さの負の相関がある。

(34)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。講義名、日付、学籍番号、氏名を明記すること。

1 _{テキスト第}1 章復習問題 1.2。

2 _{テキスト第}1 章復習問題 1.3。

3 大学教育が賃金に与える影響を実証するため、大卒以上労働者100 人の平均賃金と大卒以下 100 人平均賃金を比較したところ、10%ほど前者の平均が大きかった。しかしこれは必ずしも「大学教育→ 賃金」の因果関係を意味しない。その理由を簡潔に述べよ。

(35)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

松原望, 縄田和満, and 中井検裕. 統計学入門. 東京大学出版会, 1991.

『新しい計量経済学』 鹿野研究室 slide01