様々なミクロ計量モデル
†担当: 長倉 大輔
(ながくらだいすけ)
様々なミクロ計量モデル
◼ カウントデータモデル 労働経済学などで扱うデータには連続変数ではなく離散 変数、特に非負の整数の値を取るデータが多い。例えば 、ある個人による通院の回数などは非負の整数のデータ である。このようなデータはカウントデータと呼ばれる。 そのような変数をその性質を考慮しないで、たとえば線 形回帰分析などを行うと、いろいろと不都合なことが起き る。以下ではこのようなデータを扱うのに適したミクロ計 量モデルを紹介する。様々なミクロ計量モデル
◼ ポアソン分布 カウントデータのような非負の整数の値を取る離散型の 分布の代表的なものにポアソン分布がある。確率変数Y がポアソン分布に従うとは、Yの確率関数が以下のよう に与えられる時である。 Pr(Y = y) = , y = 0, 1, 2, … ここで λ は正の実数である (整数ではないことに注意)。 この分布の期待値は λ で与えられ、分散も λ で与えられ る。以下では確率変数 Y が パラメーター λ のポアソン分 exp( ) ! y y
−様々なミクロ計量モデル
◼ ポアソン回帰モデル 前述のポアソン分布においては期待値は λ で一定であ る。より柔軟性のあるモデルにしたい場合、特に説明変 数による影響を考えたい場合、この仮定は制約的である 。 例えば線形回帰分析などは、被説明変数 Yi の期待値を 説明変数の線形の関数でモデル化していると考えること ができるが、同じような拡張をポアソン分布に対して行っ たものがポアソン回帰モデルと呼ばれるモデルである。様々なミクロ計量モデル
線形回帰分析の時と同様に、ポアソン分布の期待値 λ を説明変数の関数として表すことを考える。ただし λ は常に正の値をとらないといけないので、ポアソン回帰 モデルでは、それを考慮して λi = exp(β0 + β1X1i + … + βKXKi), のように定式化する。このように定式化すると λi は各説 明変数 Xki の値に依存して変わり、また Xkiの値によらず 正の実数をとる。λi の定式化としては、分析の目的に応 じて他の定式化を使用することも可能であるが、上記の 定期化が非常によく用いられる。様々なミクロ計量モデル
よって非負の整数の値をとる被説明変数 Yi に対するポア ソン回帰モデルは以下で与えられる。 Pr(Yi = y) = , y = 0, 1, 2, …. λi = exp(β0 + β1X1i + … + βKXKi) λi の部分は log λi = β0 + β1X1i + … + βKXKi と書き直すこともできる。 exp( ) ! y i i y
−様々なミクロ計量モデル
◼ 最尤法によるポアソン回帰モデルの推定 ポアソン回帰モデルは最尤法で簡単に推定できる。β = [β0, β1, .. , βK]T とすると、実現値 y1, y2, …., yn が与えられた 下での、対数尤度関数は log L(β) λi = exp(β0 + β1X1i + … + βKXKi) によって与えられる。 1 1 1 1 log Pr( ) log ! n i i i n n n i i i i i i i Y y y y
= = = = = = = − + −
様々なミクロ計量モデル
最大化の1階の条件は である。ここで X0i = 1 とする。この連立方程式は β につい て明示的には解けないので、ポアソン回帰モデルの最尤 推定値は数値的に求めることになる。 1 1 log ( ) 0, 0,..., n n ki i i ki i i k L X
y X k K
= = = − + = =
β様々なミクロ計量モデル
例題1 ポアソン回帰モデル Yi ~ Po(λi), λi = exp(β0 + β1 Xi) を考える。ここで Xi は i 番目の観測値に対する説明変数 である。 Yi, i =1,…,n は λiが与えられたもとで互いに独 立であるとする。今、n = 3であり、Xi と Yi の観測値として X1= –1, X2 = 1, X3 = 1, y1 = 5, y2 = 4, y3 = 3 が与えられた とする。この時、 β0 と β1の最尤推定値を求めなさい。様々なミクロ計量モデル
◼ デュレーションモデル デュレーションモデルとは何らかのイベントが起こる(また は終わる)までの時間を分析したい場合によく用いられる。 例えば、病気が治癒するまでの時間、製品が故障するま での時間、失業が続く期間、などの分析である。 デュレーション分析は生存時間分析などとも呼ばれる。様々なミクロ計量モデル
◼ 生存関数 確率変数 T は非負の実数とする。ここで T はあるイベン トが続いた時間を表すと解釈しよう。T の分布関数 F(t) = Pr(T ≤ t) はこのイベントが続く時間が t 以下になる確率、言い換 えると(時点 0 から始まった) このイベントが時点 t まで に終わる確率を表している。 この時 S(t) = 1 – F(t) と定義される関数 S(t) は生存関数と呼ばれる。S(t)はこ のイベントが続く時間が t より大きくなる確率、つまりこ様々なミクロ計量モデル
◼ ハザード関数 Δt を任意の小さな値を表すとする。このイベントが続く 時間が t 以上 t + Δt 以下となる確率は Pr(t < T ≤ t + Δt ) = F(t + Δt) – F(t) である。これは無条件確率であることに注意しよう。今、 興味のある確率として、このイベントが時点 t まで続い たという条件付きでさらに非常に小さな時間 Δt 続く確率 を考えたいとする。これは Pr(t < T ≤ t + Δt | T ≥ t ) = ( ) ( ) ( ) F t t F t S t + −様々なミクロ計量モデル
ここでこの条件付き確率とΔt の比 を考え、この比が Δt → 0 の時にどのように表せるか考 える。これは条件付き分布関数の点 t における(右から 極限を取った)傾きと解釈できる。T の確率密度関数を f(t) とすると、この極限は と表すことができる。これをハザード関数と呼ぶ。デュレ Pr( | ) ( ) ( ) 1 ( ) t T t t T t F t t F t t t S t + + − = 0 ( ) ( ) 1 ( ) ( ) lim ( ) ( ) t F t t F t f t h t t S t S t → + − = = 様々なミクロ計量モデル
◼ ウェイブル分布 T の分布として、ウェイブル分布を考える。ウェイブル分 布の分布関数は以下で与えられる。 F(t ; β, α) = 1 – exp(– (βt)α) ここで β > 0 である。よってその密度関数、生存関数、ハ ザード関数はそれぞれ f (t ; β, α) = αβαtα–1 exp( – (βt)α ) S(t) = exp(– (βt)α) h(t) = αβα tα–1様々なミクロ計量モデル
◼ ウェイブル分布のハザード関数の性質 t が増加した時、ハザード関数が減少していく場合、負 のデュレーション依存があるといい、増加していく場合、 正のデュレーション依存があるという。またハザード関数 が t に依存しないときは デュレーション独立と呼ぶ。 ウェイブル分布場合は α < 1 ⇒ 負のデュレーション依存 α > 1 ⇒ 正のデュレーション依存 α = 1 ⇒ デュレーション独立 となる。様々なミクロ計量モデル
◼ 対数正規分布 確率変数 Y の分布が対数正規分布であるとは log Y ~ N(μ, σ2) となる分布のことである。 ウェイブル分布のハザード関数は t についての単調関 数であり、やや制約的である。実際の分析では、ハザー ド関数が t が大きくなるにつれて、当初は増加するが、 次第に減少に転じるような場合がよく観測される。その ようなハザード関数はウェイブル分布のハザード関数で は表現できないため、他の分布を用いる必要がある。そ のような分布としてよく用いられるのが対数正規分布で ある。様々なミクロ計量モデル
対数正規分布の分布関数、密度関数、生存関数、ハザ ード関数は で与えられる。ここでΦ(.)および はそれぞれ標準正 1 ( ) (log ) F t t = − 1 1 ( ) 1 (log ) (log ) S t t t = − − = − − 1 1 ( ) (log ) f t t t = − (
)
(
)
(log ) / 1 ( ) (log ) / t h t t t − = − − (.) 様々なミクロ計量モデル
◼ デュレーションモデルの最尤推定 Ti を i 番目のデュレーションで確率変数とする。また tiを i 番目のデュレーションの観測値とする。Ti は Xi という 説明変数ベクトルで条件付けした場合、条件付きで独立 であるとし、その条件付き密度関数は f (ti; Xi, θ) で与え られるとする。ここで θ は未知パラメーターベクトルであ る。この時、一般的に尤度関数は と書け、これを最大化する未知パラメーター θ の値を求 めれば最尤推定値が得られる。 1log ( )
log ( ;
, )
n i i iL
f t
==
θ
X θ
様々なミクロ計量モデル
例えばウェイブル分布において i 番目の分布の β を β = βi = exp(β0 + β1X1i + … + βKXKi) とすると、先ほどのウェイブル分布の密度関数より f (ti; Xi, θ) = f(ti; α, β0, …, βK) = αβiα tiα–1 exp(–(βiα tiα)) である。ここで βiα= exp(αβ 0 + αβ1X1i + … + αβKXKi) であるので γk = αβk とすれば f (ti; Xi, θ) = f(ti; α, γ0, …, γK) = αβi tiα–1 exp(– (βi tiα)) βi= exp(γ0 + γ1X1i + … + γKXKi)様々なミクロ計量モデル
よってその対数尤度関数は βi= exp(γ0 + γ1X1i + … + γKXKi) で与えられる。 0 1 1 1log ( , ,..., ) log log ( 1) log
n n n K i i i i i i i L n t t = = = = + + − −