多項選択モデル教育 OKUI, Ryo

(1)

平成²⁵年度ミクロ計量経済学講義ノート^3: 多項選択モデル

被説明変数が、3つ以上の値をとるが、それぞれの値について、特に序数的な意味付けのない場合のモデル化とその推定方法を紹介する。とくに、各個人が3つ以上の選択肢から一つだけを選択している経済モデルの計量分析法について紹介する。

3.1 多項選択確率効用モデル

まず、分析の対象となるデータについて議論する。各個人がJ個の選択肢の中から、一つだけを選ぶとする。データは、

({dⁱ_j, xⁱ_j}^J_j=1), i = 1, . . . , n (1) というようになっている。各dⁱ_j は2項変数であり、

dⁱ_j =







1 iがjを選ぶ場合,

0 それ以外 ⁽²⁾

となっている。なお、dⁱ_k= 1であれば、dⁱ_j = 0 (j ̸= k)である場合のみを考える。従って、

∑J

j=1^dⁱj ^{= 1}^である。^xⁱjは説明変数である。個人の属性の変数、選択肢の属性の変数、あるいは個人ごとにことなる選択肢の属性を表す変数などである。Xⁱ= ((xⁱ₁)^′, . . . , (xⁱ_J)^′)^′と定義する。選択肢jを選ぶ確率Pr(dⁱ_j|Xⁱ)をモデル化し、そのモデルを推定することが目的である。

個人の選択のモデル化に次の確率効用モデルを使用する。jという選択肢からの効用を、 y^∗i_j = x^i′_jβ_j+ ϵⁱ_j, (3) と定義する。ϵⁱ_jは効用に影響を与える要素のうち観測できない部分である。なお、以下では、β_j = βの場合のみを考える。

• β_j = βというのは、一般性を失わずに仮定できる。もし係数が異なるなら、(1(j = 1)xⁱ_j, . . . , 1(j = J)xⁱ_j)という新しい変数の組を用意することで、β = (β₁^′, . . . , β_J^′)というjに依存する係数を使用したモデルと、もとのモデルは同値になる。

• 係数が同じモデルを条件付きモデル、変数が同じで係数が異なるモデルを多項モデル、それらが混じったモデルを混合モデルと呼ぶようであるが、上でみたように、常に条件付きモデルで書くことができるため、ここでは、そのような用語の区別はしない。なお、このノートで考えるモデルは、厳密な定義では条件付きモデルと呼ばれるわけであるが、多項選択モデルと呼ぶことにする。また、多項選択モデルと呼ことでさしたる誤解は生じないであろう。

個人iはy_j^∗iが最大となる選択肢を選ぶこととする。つまり、

dⁱ_j =







1 すべてのk ̸= jにつて、y^∗_jⁱ≥ y^∗_kⁱの場合,

0 あるkがあって、y^∗_kⁱ> y_j^∗ⁱの場合 ⁽⁴⁾

(2)

となる。各個人iごとに式をまとめて、 y^∗ⁱ

|{z}

J×1

= Xⁱβ + ϵⁱ, (5)

と書く。

効用の観測できない部分であるϵⁱの分布を指定することで、Pr(dⁱ_j|Xⁱ)のモデル化が完了する。例えば、ϵⁱ∼ N (0, Ω)とすると、多項プロビットモデルになる。各ϵⁱ_jが独立にType

I extreme分布に従うならば、多項ロジットモデルになる。

対数尤度関数は、θを母数として、 1

n

∑n i=1

∑J j=1

dⁱ_jlog Pr{dⁱ_j = 1|Xⁱ; θ}. (6)

となる。

識別確率効用モデルのすべての母数が識別できるわけではなく、推定には母数になんらかの制約が必要となる。この問題を考えるために、次の潜在変数からなる多項プロビットモデルを考える。

y^∗ⁱ = Xⁱβ + ϵⁱ, ϵⁱ ∼ N (0, Ω). (7) 1. cをある定数としてy^∗_jⁱ (j = 1, . . . , J)をy^∗_jⁱ+ c (j = 1, . . . , J)に置き換えても観測さ

れる選択は変わらない。

2. またy^∗ⁱ× cと置き換えても変化はない。

基本的に離散選択モデルの場合、効用の母数は識別されず、選択肢間での効用の差の大きさを標準化したものにある母数のみが識別される。ここでは、選択肢の中から一つ、例えば、J番目のものを、比較の基準と置く。

次の選択肢ごとに定数項の異なるモデルを考える。

y_j^∗ⁱ = αj + βxⁱ_j + ϵⁱ_j (8) あるいは、y^∗ⁱ

|{z}

J×1

= α

|{z}

J×1

+Xⁱβ + ϵⁱ. (9)

次の行列、

∆_J

|{z}

J×(J−1)

=







1 0 . . . 0 −1 0 1 . . . 0 −1 . . . . 0 0 . . . 1 −1







(10)

と、α_J = ∆_JδとΩ_J = ∆_JΩ∆_Jを定義すると、

∆_Jy^∗i = ∆_Jα + ∆_JXⁱβ + ∆_Jϵⁱ (11)

⇐⇒ ˜y^∗ⁱ = αJ + ˜Xⁱβ + ˜ϵⁱ (12)

(3)

となる。y˜^∗iは、J番目の選択肢と比較したときの、それぞれの効用の差をまとめたベクトルである。

y^∗ⁱを効用として考えたモデルと、y˜^∗ⁱを効用としたモデルは、同じ選択をもたらす。さらに、y˜^∗ⁱを正の数で定数倍しても同じ選択をもたらす。

こうすること、母数(α, β, Ω)の中で、最大限で(c × α_J, c × β, c²× Ω_J)(ただし、cはある一つの母数を定数にするようにきめる)までが識別できることがわかる。なお、cは、係数の一つから取る場合と(その場合はその係数の絶対値は決まっており、符号のみがデータから推定できる)、分散の一つから取る場合(その場合は、対応するϵ^∗_jⁱの分散が固定される) の２通りのどちらかを使う場合が多い。

上のような状況を表して、(αJ, β, ΩJ)は、(αJ· c, β · c, ΩJ · c²)と観測同値であるという。ちなみに識別の定義は通常、真値と観測同値な母数が存在しないこと、である。以上の議論に関しては、Keane (1992)を参照せよ。

尤度関数の計算尤度関数は確率を評価すれば計算できる。確率は、

Pr(dⁱ_j = 1|Xⁱ, θ) = Pr(˜y_j^∗ⁱ ≥ ˜y_k^∗ⁱ, ∀k|Xⁱ, θ)なおy˜^∗_jⁱ= y^∗_jⁱ− y^∗_Jⁱ (13)

= Pr((˜xⁱ_j− ˜xⁱ_k

| {z }

˜ xⁱ_jk

)^′β ≥ ˜ϵⁱ_k− ˜ϵⁱ_j

| {z }

˜ ϵⁱ_kj

, ∀k|Xⁱ, θ) (14)

=

∫ . . .

∫ ∫ 1_{˜_xⁱ

jk ^{≥ ˜}^ϵⁱkj^{, ∀k}dF (˜}^ϵⁱij, . . . , ˜ϵⁱ_Jj) (15) と表現できるが、J − 1重の積分であり、その計算には、何らかの工夫が必要となる。

いくつかの解決策が提示されている。

• 多項ロジットモデルを使う。

• J = 3の時には、Moffit and Butler (1982)を参照せよ。

• J が大きいとき、例えばJ = 5、ならシミュレーションによって、積分計算をする必要がある。

3.2 _{多項ロジットモデル}

多項ロジットモデルは、各選択確率を

Pr(dⁱ_j = 1|Xⁱ) = ^exp(βx

ij⁾

∑J

k=1^exp(βxⁱk⁾

. (16)

としてモデル化する。これは、確率的効用モデルのϵをType I extreme分布とすることで導出できる。なお、識別のため、どれか一つの選択肢についてβxⁱ_j = 0、つまり、exp(βxⁱ_j) = 1 と標準化するのが通常である。このモデルの最尤推定は数値計算的に非常に簡単である。

IIA問題しかし、多項ロジットモデルは「無関係な選択肢からの独立(Independence of Ir- relevant Alternatives, IIA)」という問題があることが知られている。これはオッズ比(Pr(dⁱ_j = 1|Xⁱ)/ Pr(dⁱ_k= 1|Xⁱ))が他の選択肢の存在の影響を受けないという問題である。

(4)

図1: 青バス赤バス

train bus

blue ^red

次の例を考える。市内の移動に３つの選択肢があるとする。

j =











1 =電車 2 =青バス 3 =赤バス

(J = 3) (17)

x^i′_jβ = µⁱ_jとおくと、

Pr(dⁱ_j = 1|Xⁱ) = ^exp(µ

ij⁾

exp(µⁱ₁) + exp(µⁱ₂) + exp(µⁱ₃)^. ⁽¹⁸⁾ となる。仮に、µⁱ_j = 1, ∀jとし、各選択肢を確率1/3で選択するとする。この時、電車と青バスのオッズ比(Pr(dⁱ₁ = 1)/ Pr(dⁱ₂ = 1))は１である。

重要な問題は、この電車と青バスのオッズ比が赤バスの情報から影響を受けないことである。例えば、何らかの政策変化などがあり、µⁱ₃ → −∞となるとする。つまり、赤バスがもはや運行されないとする。しかし、その場合でも、電車と青バスのオッズ比は１で変化はない。一方で、赤バスがなくなれば、青バスの需要が高まると予想するのが自然であろう。つまり、ロジットモデルは代替効果を全く考慮に入れていなず、ロジットモデルではとらえることのできない、現実的で結果に影響を与えるような問題が存在する。

解決策この問題を解決するためには他のモデルを使用するしかない。例えば、多項プロビットモデルではIIAの問題はなく、また誤差項の選択肢間の相関構造を考慮することもモデル上では容易い。しかし多項プロビットモデルの推定は、それほど容易ではなくシミュレーションを使用する必要がある。一方で、計算の簡便なロジットモデルを拡張することで、 IIA問題を解決するアプローチもある。

IIA問題を回避できるロジットモデルの拡張としては、入れ子型ロジットモデルがある。

0 ≤ ρ ≤ 1というパラメーターを導入して、

Pr(電車|Xⁱ) = ^exp(βx

i1⁾

exp(βxⁱ₁) + (exp(βxⁱ₂/ρ) + exp(βxⁱ₃/ρ))^ρ^, ⁽¹⁹⁾ Pr(青バス|バス, Xⁱ) = ^exp(βx

i2^/ρ)

exp(βxⁱ₂/ρ) + exp(βxⁱ₃/ρ) ⁽²⁰⁾

(5)

図2: 一般的な逐次的選択

Branch 1 ² ^B³ ^B^S

と仮定するモデルである。

• ρ = 1なら、通常の多項ロジットモデルになる。

• ρ → 0なら、Pr(電車|Xⁱ)) = ^exp(βxⁱ¹⁾

exp(βxⁱ1)+1^かつ^Pr(^バス^|X

i_{)) =} 1

exp(βxⁱ1)+1^かつ^Pr(^青バス^|X i_{) =} 1

exp(βxⁱ1)+1^lim^ρ→0

exp(βxⁱ2/ρ)

exp(βxⁱ2/ρ)+exp(βxⁱ3/ρ) ^となる。

一般的な場合のモデルは、

Pr(s組を選ぶ|Xⁱ) =

(∑

j∈Bs^exp(βX

ji^/ρ^s⁾

)ρs

∑S s^′=1

(∑

j∈B_s′^exp(βXjⁱ^/ρ^s^′⁾

)ρ_s′ ⁽²¹⁾

Pr(j|s組, Xⁱ) = ^exp(βX

ji^/ρ^s⁾

∑

j^′^∈Bs^exp(βX

ji^′^/ρ^s⁾

(22) である。

なお、IIAの検定は、帰無仮説を

H₀ : ρ_s = 1, ∀s ∈ {1, . . . , S} (23) とおいてできる。帰無仮説が正しいなら、IIAの問題は存在しない、あるいは実際にも成り立っているので、その点を考慮したモデルを使う必要はない。検定法についてはHausman and McFadden (1984)を参照のこと。

入れ子型ロジットモデルの欠点は、入れ子構造をあらかじめ決めてしまう必要があることである。また、選択肢の分類にいくつかの候補があるとき、分類の仕方を変えると結果がかわる。他にも、多重に入れ子になっている場合には、入れ子にする順番を変更すると結果がかわる。そのため、入れ子構造を決める際には慎重に行う必要がある。

参考文献

[1] J. Hausman and D. McFadden. Specification tests for the multinomial logit model. Economet- rica, 52(5):1219–1240, 1984.

(6)

[2] M. P. Keane. A note on identification in the multinomial probit model. Journal of Business & Economic Statistics, 10(2):193–200, 1992.

[3] R. Moffit and J. S. Butler. A computationally efficient quadrature procedure for the one-factor multinomial probit model. Econometrica, 50(3):761–764, 1982.

多項選択モデル 教育 OKUI, Ryo

参考文献

多項選択モデル教育 OKUI, Ryo