二値選択モデル
報告日:2009年11月4日 報告者:寺脇 拓
1. 確率分布
1. 確率分布
2 1. 確率分布
二値選択モデル 2009年度演習II(10)
1 1 標準正規分布
1.1 標準正規分布
•
密度関数 数
•
分布関数
•
平均
0分散
1•
平均
0、分散
1。
• 0について対称。
が標準正規分布に従うとき
+は平均 分散
z z
が標準正規分布に従うとき、
μ+σzは平均
μ、分散
σ2の正規分布に従う。
3 1. 確率分布
二値選択モデル 2009年度演習II(10)
1 0 8 1
0.6 0.8
0.4 0 6
0.2
0
-6 -4 -2 0 2 4 6
密度関数 分布関数
4 1. 確率分布
図1 標準正規分布
1 2 標準ロジスティック分布
1.2 標準ロジスティック分布
•
密度関数 数
•
分布関数
•
平均
0分散
: π2 /3•
平均
0、分散
: π /3。
• 0について対称。
が標準ロジスティ ク分布に従うとき
+は平
z z
が標準ロジスティック分布に従うとき、μ+φz は平 均
μ、分散
π2φ2 /3のロジスティック分布に従う。
5 1. 確率分布
0 8 1
0 6 0.8
0.4 0.6
0.2
0
-6 -4 -2 0 2 4 6
密度関数 分布関数
6 1. 確率分布
図2 標準ロジスティック分布
二値選択モデル 2009年度演習II(10)
共に0について対称
0.4共に0について対称 で単峰形だが、ロジ スティック分布の方 が両裾が分厚い(分
0.3が両裾が分厚い(分 散が大きい)。
0.2
0.1
0
-6 -4 -2 0 2 4 6
標準正規分布 標準ロジスティック分布
7 1. 確率分布
図3 標準正規分布と標準ロジスティック分布の比較
二値選択モデル 2009年度演習II(10)
2. 最尤法 2. 最尤法
8 2. 最尤法
2 1 例:政策支持者は何%か?
2.1 例:政策支持者は何%か?
•
いま、母集団全体の
pp (100*p( p%)がある政策に賛成)しており、残りの1-pが反対している。
•
このpを推定するため、母集団からn人の人をランダム に抽出する。
•
抽出される人が賛成者なら1、反対者なら0をとる変 数を
Xで表す
数を
Xで表す。
•
このとき、
Xは次の確率分布を持つ確率変数となる。
X 1 0
Prob(X) p 1-p
z i番目に抽出された人の結果をXi
で表わし、n個の
Xi
で構成されるベクトルを
Xで表わす。
9
X=(X1, X2, X3, …, Xn)
2. 最尤法
母集団 母集団 賛成者 標本
X 1 0
p
X1 1 0
Prob(X1) p 1-p 1
X2 1 0
X1=1
X2 1 0
Prob(X2) p 1-p 2
無作為抽出 ・ ・
X2=0
反対者
・ ・・ ・
・ ・・
・ ・・ ・
・ ・・
1-p Xn 1 0
Prob(Xn) p 1-p
n Xn=0
観測値
10
図4 無作為抽出
2. 最尤法
二値選択モデル 2009年度演習II(10)
2 2 最尤推定量
2.2 最尤推定量
• Xの観測値をxで表すとき、X=xとなる確率は次式で
表わされる。
y
は観察された賛成者の数を表す。
を変数とみなすとき この確率は尤度(likelihood)
• pを変数とみなすとき、この確率は尤度(likelihood)
あるいは尤度関数(likelihood function)と呼ばれる。
•
この尤度関数を最大にするような を
ppの最尤推定量
(maximum likelihood estimator: MLE)といい、
この推定法を最尤法と
(maximum likelihood approach)いう11
approach)いう。
2. 最尤法
二値選択モデル 2009年度演習II(10)
より高い確率 観測値 観測値から得 より高い確率
X1 1 0
Prob(X1) p 1-p
1 X1=1
観測値
p>1-p 観測値から得
られる情報
p
X2 1 0
Prob(X2) p 1-p
2 X2=0 p<1-p 1-p 積
X3 1 0
Prob(X3) p 1-p
3 X3=1 p<1-p p 尤度関数
・ ・・ ・
・ ・・
・ ・・ ・
・ ・・
・ ・ 最大化
・ ・・ ・
・
・ ・・ ・
・ ・・
・ ・・ ・
・ ・・
Xn 1 0
・・
・・
X =0 p<1-p 1-p
MLE
・・ ・・ ・・
Prob(Xn) p 1-p
n Xn=0 p<1-p 1-p
12
図5 最尤法の考え方
2. 最尤法
■最尤推定量を計算する
■最尤推定量を計算する
•
実際には、最尤推定量は次の対数尤度関数
(log- likelihood function)を最大化することによって導か likelihood function)を最大化することによって導かれる。
尤度関数を最大化することと対数尤度関数を最大化するこ とは同じ。
•
を解けば、
pの最尤推定量は となり、
「標本における賛成者の割合」で
pが推定されること になる
になる。
直観的な予測と整合的であろう。
13 2. 最尤法
3. 二値選択モデル 3. 二値選択モデル
14 3. 二値選択モデル
二値選択モデル 2009年度演習II(10)
3 1 ロジット / プロビットモデル
3.1 ロジット / プロビットモデル
•
二値選択モデル(binary choice models) 択
( y ) yi
は
i番目の人について観測される被説明変数、
yi*は
yiの 潜在変数
(latent variable)。
x
はi 番目の人の説明変数のベクトル
βはその係数パラ
xi
はi 番目の人の説明変数のベクトル、β はその係数パラ メータベクトル。
εi
は全ての人について独立で同一、そして
0について対称な 分布に従う誤差項
分布に従う誤差項。
εi
が標準正規分布に従うと仮定されるとき、このモデルは プロビットモデル
(probit model)と、標準ロジスティック
15
(p )
分布のとき、ロジットモデル(logit model)と呼ばれる。
3. 二値選択モデル
二値選択モデル 2009年度演習II(10)
3 2 二値選択モデルの推定
3.2 二値選択モデルの推定
•
各y
yii (=0、1)をとる確率(尤度)( ) ( ) F はεi
の分布関数を表す。
•
対数尤度関数
β
の推定値はコンピュータの反復計算により導かれる。
16
β
推定値 反復 算 り導 。
3. 二値選択モデル
3 3 モデルの当てはまりの良さ
3.3 モデルの当てはまりの良さ
•
マクファーデンの疑似 疑
R2(McFadden’s pseudo R( p 2)) lnLUR
は
βに関して最大化したときの対数尤度を、
lnLRは
β=0という制約のもとで計算される対数尤度を意味する。
線形回帰モデルの
R2とは基本的に対応しないが この種のモ
線形回帰モデルの
R2とは基本的に対応しないが、この種のモ デルではおよそ
0.3以上あれば大体良しとされる。
•
赤池の情報量基準(Akaike’s information criterion: 赤池の情報量基準(Akaike s information criterion:
AIC) kは推定されるパラ
メータの数。
この値が小さいほどモデルの当てはまりが良いとされる。
最尤法で推定可能なあらゆるモデルに適用できるため、ロ ジット
/プロビットモデルの選択に利用可能
17
ジット
/プロビットモデルの選択に利用可能。
3. 二値選択モデル
3 4 係数の有意性検定
3.4 係数の有意性検定
•
次のt統計量(t statistic)は、すべてのβ
( ) βkkについて、
βk=0の帰無仮説のもとで標準正規分布することが知
られている。
線形回帰モデルと同様の検定が可能。
t
統計量が
1.96(1.65)より大きい、あるいは-
1.96(-
1 65)より小さければ その係数は
5 (10 )水準で有意
1.65)より小さければ、その係数は
5%
(10%
)水準で有意。
もちろん
p値が
0.05(0.1)より小さければ、
5%
(10%
)水準 で有意。 有意。
18 3. 二値選択モデル
二値選択モデル 2009年度演習II(10)
3 5 限界効果
3.5 限界効果
•
ロジット/プロビットモデルの係数推定値の符号は意
/数 味があるが、大きさはそれ自体意味がない。
•
個人
iの
k番目の説明変数
xikが
yiの期待値
E[yi]に与える
効 換 れば 与 効
限界効果、言い換えれば
Prob(yi=1)に与える限界効 果は次式で表される。
この限界効果はx
iの水準によって変わるため、通常はx
iにそ
19
i i
の平均値を代入して計算されたものを結果として提示する。
3. 二値選択モデル
二値選択モデル 2009年度演習II(10)
4. 二値選択モデルの応用 4. 二値選択モデルの応用
20 4. 二値選択モデルの応用
4 1 二肢選択 CVM への応用
4.1 二肢選択 CVM への応用
•
二肢選択型の質問形式 択
質問:現在の里山生態系を保全するためにあなたは毎年
1000円を支払っても良いと思いますか?
答 ① 支払 も良 ② 支払 くな
回答:① 支払っても良い ② 支払いたくない
提示される金額は被験者によって異なる。
確率効用モデル(
d tilit d l RUM)•
確率効用モデル(random utility model:RUM)
U
は効用関数
U
は効用関数。
q
は環境質を表す変数であり、現状なら
0、より高いレベル に達すれば
1をとる。
m
は所得水準
. α
と
βはそれぞれ
qと
mの係数パラメータ。
21
ε
は誤差項。
4. 二値選択モデルの応用
•
提示額
Bを支払って
q=1を得るときの効用を
U Bを
•
提示額
Biを支払って
q=1を得るときの効用を
U1、
Biを 支払わず
q=0を受け入れるときの効用を
U0とする と、それらは次式で表わされる。
•
、 と定義すると、効用の大
小関係と回答
(WTP(に関する情報
))の関係は次式で表 される。
•
が標準正規分布に従うと仮定すれば、このモデル はプロビットモデルとなり、標準ロジスティック分
22
布と仮定すればロジットモデルとなる。
4. 二値選択モデルの応用
二値選択モデル 2009年度演習II(10)
•
支払う確率と支払わない確率
(尤度
)•
支払う確率と支払わない確率
(尤度
)• WTPの分布
プロビットモデルでは、
WTPは平均
α/β、分散
1/β2の正規 分布に従う。
ロジットモデルでは、
WTPは平均
α/β、分散
π2/3β2のロジ スティック分布に従う。
スティック分布に従う。
23 4. 二値選択モデルの応用
二値選択モデル 2009年度演習II(10)
4 2 選択型コンジョイント分析への応用
4.2 選択型コンジョイント分析への応用
•
確率効用モデル
U
は効用関数。
zk
は商品
kの属性ベクトル、
pkはその価格。
β
はz
kの係数パラメータベクトル、β
pはp
kの係数パラメータ。
ε
は誤差項。
•
商品aとbを購入することから得られる効用U
a、U
bはそ れぞれ次式で表される
れぞれ次式で表される。
24 4. 二値選択モデルの応用
質問:どちらの自動車を買いたいですか?買いたいと思う方に○をつ
自動車A 属性
質問:どちらの自動車を買いたいですか?買いたいと思う方に○をつ けてください。
自動車 B 二酸化炭素排出量 ガソリン車の半分 ガソリン車レベル
燃料代 走 能 離
ガソリン車の1/4 ガ 車 半分
ガソリン車の3/4 ガ 車 / 走行可能距離
価格
ガソリン車の半分 320万円
ガソリン車の1/4 240万円
価格 万円
1
万円
2
25 4. 二値選択モデルの応用
図6 選択型コンジョイント分析の質問例
•
効用の大小関係と回答
(aと
bのどちらを購入するか
)•
効用の大小関係と回答
(aと
bのどちらを購入するか
)の関係は次式で表される。
•
ただし 、 、 、
である である。
•
が標準正規分布に従うと仮定すれば、このモデル はプロビットモデルとなり、標準ロジスティック分 はプロビットモデルとなり、標準ロジスティック分 布と仮定すればロジットモデルとなる。
26 4. 二値選択モデルの応用