• 検索結果がありません。

U U U car Vcar car bus Vbus bus rail Vrail bus 多項ロジットモデル ε~iidガンベル 2 独立で (Independently) 同一 (Identically) の分散を持つ 0 分布 (Distributed) 0 Cov(U)

N/A
N/A
Protected

Academic year: 2021

シェア "U U U car Vcar car bus Vbus bus rail Vrail bus 多項ロジットモデル ε~iidガンベル 2 独立で (Independently) 同一 (Identically) の分散を持つ 0 分布 (Distributed) 0 Cov(U)"

Copied!
11
0
0

読み込み中.... (全文を見る)

全文

(1)

愛媛大学

倉内慎也

[email protected]‐u.ac.jp

多項ロジットモデル

ε~IIDガンベル

独立で(Independently)

同一(Identically)の分散を持つ

分布(Distributed)

図2.1 正規分布とガンベル分布の確率密度関数 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 -3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 ε f( ε )

 

 

 

rail

bus

bus

bus

car

car

V

rail

U

V

bus

U

V

car

U

 

exp

exp

exp

f

 

η

ε

μ

exp

exp

ε

F

Cov(U)

2

2

2

2

2

2

6

0

0

0

0

0

0

多項ロジットモデル

closed-formであるため計算が容易

便益計算が簡便

 

 

 

C

j

j

i

V

V

i

P

exp

exp

3

ロジットモデルとIIA特性

無関係な選択肢からの選択確率の独立 (

I

ndependence 

from 

I

rrelevant 

A

lternatives)

rail

C

P

C

car

P

bike

walk

rail

bus

car

,

,

,

,

C

A

 

 

 

 

 

 

 

 

 

bike

walk

rail

bus

car

car

rail

bus

car

car

V

V

V

V

V

V

A

car

P

V

V

V

V

C

car

P

exp

exp

exp

exp

exp

exp

exp

exp

exp

exp

 

 

V

rail

car

V

exp

exp

rail

A

P

A

car

P

選択確率の比は無関係な選択肢(walk,bike)に影響を受けない

IIA特性の問題点(1)

Before

 

 

RB

car

T

RB

U

T

car

U

赤バス(RB)

車(car)

1/2       

1/2

After

赤バス(RB) 青バス(BB)

車(car)

1/4      

1/4

1/2

 

 

 

BB

RB

car

T

BB

U

T

RB

U

T

car

U

ロジットモデル 1/3       

1/3

1/3

(2)

IIA特性の問題点(2)

Before

バス(bus)

車(car)

40%      60%

After

鉄道(rail) バス(bus)

車(car)

‐20%

‐20%

交差弾性値が等しい

20%

32% 

48%

誤差項間に相関が生じないようにする

調査等で影響要因を観測

確定項の関数型等の工夫

誤差相関を明示的に考慮したモデルの適用

IIA特性の問題を避けるには

誤差項には

確定項で説明で

きない要因

が含まれる

 

 

 

rail

bus

bus

bus

car

car

V

rail

U

V

bus

U

V

car

U

個人間の異質性を考慮

個人属性をたくさん入れる/セグメンテーションを行う

7

効用関数の特定化の工夫(1)

n

car

n

car

n

n

car

male

T

U

,

0

1

1

,

,

女性の定数項:α

0     

男性の定数項:α

0

+ α

1

女性のパラメータ:β

2     

男性のパラメータ:β

1

Group1のパラメータベクトル:

Group2のパラメータベクトル:

n

car

n

car

n

n

car

n

n

car

male

T

male

T

U

,

0

1

*

*

,

2

*

1

*

,

,

2

,

,

2

1

2

0

2

,

1

,

,

1

1

1

0

1

,

Group

n

car

n

car

Group

Group

Group

n

car

Group

n

car

n

car

Group

Group

Group

n

car

T

U

T

U

2

1

2

0

1

1

1

0

,

,

Group

Group

Group

Group

8

Before

バス(bus)

車(car)

40%      60%

After

鉄道(rail) バス(bus)

車(car)

20%

32% 

48%

人数

バス

男性

500人

20%

80%

女性

500人

60%

40%

合計

1,000人

40%

60%

人数

鉄道

バス

男性

500人

10%

18%

72%

女性

500人

30%

42%

28%

合計

1,000人

20%

30%

50%

‐20%

‐20%

‐25%

‐17%

マーケットシェアの変化率は異なる

18%

72%

42%

28%

30%

50%

効用関数の特定化の工夫(2)

(3)

多項プロビットモデル

 

 

 

rail

bus

bus

bus

car

car

X

rail

U

X

bus

U

X

car

U

ε~多変量正規分布

多項プロビットモデル

中心極限定理より誤差項の仮定は尤もらしい

open-formであるため計算負荷が大きい(J-1重積分)

 

 

 

 







1

2

1

1

1

2

1

exp

2

1

1 1

J

V

V

J

i i i J i i J

d

d

i

P

2

,

,

,

2

,

,

,

2

car

bus

car

rail

car

bus

car

bus

rail

bus

rail

car

rail

bus

rail

10

ネスティッドロジット(NL)モデル(1)

 

 

 

bus

BB

BB

RB

RB

bus

car

car

car

t

T

BB

U

t

T

RB

U

t

T

car

U

cos

cos

cos

多項ロジットモデルの仮定:ε~IIDガンベル分布

ε

RB

とε

BB

共通の非観測属性

を含んでいる

・ 料金

・ 快適性

・ 利便性など

 

 

 

BB

RB

car

T

BB

U

T

RB

U

T

car

U

共通要因

相関

Cov(U)

2

2

2

2

2

2

6

0

0

0

0

0

0

11

ネスティッドロジット(NL)モデル(2)

NLモデルの誤差構造

公共交通

自動車

鉄道

バス

Cov(U)

2

2

2

2

2

0

0

0

0

transit

transit

鉄道

バス

自動車

等分散

無相関

2

,

,

,

2

,

,

,

2

car

car

bus

car

rail

car

bus

bus

bus

rail

car

rail

bus

rail

rail

一般的な誤差構造(MNPモデル)

鉄道

バス

自動車

ミックストロジット(MMNL)モデル(1)

rail

rail

rail

rail

bus

bus

bus

bus

car

car

car

car

X

U

X

U

X

U

2

2

2

2

,

,

,

2

,

,

,

2

0

0

0

0

0

0

rail

rail

bus

rail

car

rail

bus

bus

bus

car

rail

car

bus

car

car

IIDガンベル分布

プロビットタイプのフレキシブルな

誤差項

ロジットモ

デルの操

作性

プロビットモ

デルの柔

軟な誤差

構造

η

ν

(4)

ミックストロジット(MMNL)モデル(2)

rail

rail

rail

rail

bus

bus

bus

bus

car

car

car

car

X

U

X

U

X

U

 



 

f

d

car

car

P

IIDガンベル分布

rail

rail

bus

bus

car

car

car

car

X

X

X

X

e

e

e

e

car

ηはunknown

ロジットモ

デルの操

作性

ミックストロジット(MMNL)モデル(3)

 



 

f

d

car

car

P

 

D

d

X

X

X

X

d

rail

rail

d

bus

bus

d

car

car

d

car

car

e

e

e

e

D

car

P

1

1

ˆ

open‐form→どうやって推定?

シミュレーション法

Step1: 分布f(η)に従う乱数ηを発生

Step2: それを用いて選択確率を計算

Step3: これをD回繰り返し選択確率の平均値を計算

Step4: それを尤度として最尤推定法により未知パラメータを推定

ミックストロジット(MMNL)モデル(4)

2

2

2

2

2

2

2

2

2

2

2

2

2

2

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

transit

transit

transit

transit

transit

transit

transit

transit

rail

transit

transit

rail

rail

bus

transit

transit

bus

bus

car

car

car

X

U

X

U

X

U

 

0

,

1

~ N

transit

Nested

自動車

バス

鉄道

NLモデルとは違う!!

ミックストロジット(MMNL)モデル(5)

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

0

0

0

0

0

0

0

0

0

0

transit

transit

transit

road

transit

road

road

road

transit

transit

transit

road

transit

road

road

road

rail

transit

transit

rail

rail

bus

road

road

transit

transit

bus

bus

car

road

road

car

car

X

U

X

U

X

U

 

0

,

1

~

,

road

N

transit

Cross-Nested

自動車

バス

鉄道

CNLモデルとは違う!!

(5)

ミックストロジット(MMNL)モデル(6)

2

2

2

2

2

2

2

2

2

2

2

2

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

rail

bus

car

rail

bus

car

rail

rail

rail

rail

rail

bus

bus

bus

bus

bus

car

car

car

car

car

X

U

X

U

X

U

 

0

,

1

~

,

,

bus

rail

N

car

異分散

Identificationの問

題で,一つのσは0に

固定する必要あり

嗜好の異質性:

ランダム係数モデル(1)

2

,

,

2

1

2

0

2

,

1

,

,

1

1

1

0

1

,

,

,

2

,

1

0

,

,

,

1

1

0

,

*

1

*

*

*

Group

n

car

n

car

Group

Group

Group

n

car

Group

n

car

n

car

Group

Group

Group

n

car

n

car

n

car

n

n

car

n

n

car

n

car

n

car

n

n

car

T

U

T

U

T

male

T

male

U

T

male

U

2

1

2

0

1

1

1

0

,

,

Group

Group

Group

Group

βは母集団で同一⇔

嗜好は母集団で同質と仮定

嗜好には

異質性(個人差)

が存在

観測異質性

非観測異質性

女性の定数項:α

0     

男性の定数項:α

0

+ α

1

女性のパラメータ:β

2     

男性のパラメータ:β

1

Group1のパラメータベクトル:

Group2のパラメータベクトル:

n

car

n

car

n

n

car

T

U

,

,

,

n

car

n

car

n

car

T

U

,

,

,

アプリオリ・マーケット

セグメンテーション

嗜好の異質性:

ランダム係数モデル(2)

n

rail

n

rail

n

n

rail

n

rail

n

bus

n

bus

n

n

bus

n

bus

n

car

n

car

n

n

car

n

car

T

T

U

T

T

U

T

T

U

,

,

,

,

,

,

,

,

,

,

,

,







n

car

n

car

n

n

car

T

U

,

,

,

 

0

,

1

~ N

n

,

2

~

n

N

β

parameter

unknown

:

,

IIDガンベル分布を仮定すればMXLモデル

でも,結局のところ...

MMNLモデルもopen-formのモデル

プロビットモデルやGEVモデルでよいのでは?

誤差相関を部分的かつ発見探索的に考える場

合は有効

対MNP:計算負荷が少ない(特に選択肢数が多い

場合)

対GEV:推定プログラムの変更が容易

ランダム係数モデルとしての意義

個人パラメータの算定,再現性の向上

(6)

行動モデルの推定

~シミュレーションによる推定と

identificationの問題~

山梨大学 佐々木邦明

愛媛大学

倉内慎也

BEhavior Study for Transportation Graduate school, Univ. of Yamanashi

モデル推定の意義

• 行動モデルにはパラメータが含まれることが多い

– どのような要因が,どのような影響を及ぼすのか不明

• 現実のデータにもっとも良く適合するようにパラメータ値

を決める

• これを通じて,「

どのような要因が,どのような影響を

及ぼすのか」等についての仮説検定

 

 

C

j

jn

in

n

V

V

i

P

exp

exp

in

in

in

in

c

in

t

in

time

t

V

U

0

cos

モデル推定の手順

1. モデルの選定

 ネスティッドロジットモデル

2. 効用関数の特定化

 (誤差分布のパラメータ)

 説明変数の選定

所要時間,費用,性別,年齢,...

 効用関数の関数型

3. パラメータ推定

4. 結果の考察

in

c

in

t

in

in

c

in

t

in

t

time

V

t

time

V

cos

ln

cos

0

0

最尤推定法

• 点推定量を求める最もポ

ピュラーな方法

• 右上の式をθの関数とみな

したものが尤度関数

• 尤度関数を最大化するθの

値を最尤推定量とするのが

最尤推定法

x

L

n

|

4

選択モデルの場合,f が選択確率

個人の選択確率を全員で掛け合わせる

n

i

i

x

f

1

|

i

i

i

x

P

ood

MaxLikelih

|

max

データ(a,b)が得られたとき,全体の平均がいくつとするのがよいか

⇔平均がいくつだったら(a,b)が得られやすいか?

(7)

最大化アルゴリズムの考え方

対数尤度関数の段階的な最

大化

1. 初期値を与える

2. 初期値周りで勾配(1次微分)等

を用いて次の推定値の方向を

決める

3. 初期値付近のステップサイズを

1次微分,2次微分を用いて適

切に決めて次の推定値を決め

4. 収束基準(尤度関数の一時微分

ベクトル)を判定し,収束してい

ない場合は,現在の値を初期値

として2に進む

x

L

n

|

5

ST

ML

ˆ

1

2

代表的な繰り返し計算法

Newton‐Raphson法

– テイラー展開の1次近似を利用して進める

– 解の収束が早い(ステップ数が少ない)

• 準Newton法(BFGS法)

– ヘッセ行列を逐次近似する.

1

1

1

n

H

g

n

6

H:尤度関数の二階微分

ヘッセ行列

g: 尤度関数の一階微分

g()

  

尤度関数を最大化:尤度関数の一階微分=0を解く

シミュレーションによる推定

ミックストロジットモデル

8

2

2

2

2

2

2

2

2

2

2

2

2

2

2

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

transit

transit

transit

transit

transit

transit

transit

transit

rail

transit

rail

rail

bus

transit

bus

bus

car

car

car

X

U

X

U

X

U

Nested

自動車

バス

鉄道

 

car

bus

transit

car

rail

transit

X

X

X

X

transit

transit

transit

transit

e

e

e

e

car

d

f

car

car

P

(8)

シミュレーションによる尤度計算

9

 

D

d

X

X

X

X

d

rail

rail

d

bus

bus

d

car

car

d

car

car

e

e

e

e

D

car

P

1

1

ˆ

Step1: 分布f(η)に従う(準)乱数ηを発生

Step2: それを用いて選択確率を計算

Step3: これをD回繰り返し選択確率の平均値を計算

Step4: それを尤度として最尤推定法により未知パラメータを推定

 

car

bus

transit

car

rail

transit

X

X

X

X

transit

transit

transit

transit

e

e

e

e

car

d

f

car

car

P

モデルの特定化とIDENTIFICATION

の問題

パラメータ推定がうまくいかない

• 収束するとは

θ

n+1

とθ

n

が同じになる

g

1

が0になる

• 収束しない

– 無限に繰り返す

θ

2

が計算不能

• 局所最適解

– 見かけ上の最大化

11

H

‐1

が存在しない(計算できない)

変数が完全相関

変数が効用関数に影響して

いない

関数の近似状況

2次関数近似

初期値の問題

そもそも推定不可能

推定プログラムに誤り

g()

  

g()

 

変数が完全相関

n

car

t

n

n

n

car

male

female

T

V

,

0

1

2

,

n

n

male

female

 1

 

n

t

car

n

n

car

t

n

n

n

car

T

male

T

male

male

V

,

2

1

2

0

,

2

1

0

,

1

• 推定可能なパラメータは3つ⇔未知パラメータは4つ

• 極めて相関が高い場合には推定できない場合も

(9)

そもそも推定不能

• 最大値において唯一解が求まらない可能性がある

(最大値となるパラメータベクトルが無数にある)

13

定数項

car

car

car

rail

rail

rail

c

t

V

c

t

V

4

3

2

4

3

1

β

β

β

 

β

β

β

 

1つは「0」に固定する

 

 

 

 

 

   

V

R

V

C

C

V

R

V

C

U

R

U

R

P

C

R

R

C

C

C

R

R

Pr

Pr

Pr

これを満たす組み合

わせは無限に存在

• 同様に個人属性も1つは0に固定

そもそも推定不能

1人も選択していない

例)誰も鉄道を選択していない

14

car

car

car

rail

rail

rail

c

t

V

c

t

V

4

3

4

3

1

β

β

 

β

β

β

 

β1→‐∞とすれば完璧なモデル(‐ ∞ とは?)

• 同様に,ある代替案を選択した人が極めて少ない

場合も危険

ベイズ推定

 

  

D

P

P

D

P

D

P

|

|

尤度

事前確率

事後分布

乱数による最大値計算

• ある変数に対して乱

数を発生させ,その時

の関数の値を調べる

– 単純な乱数だと効率

が悪い

– 尤度関数の値の大き

さで,次のパラメータ

にあたりをつける

– 尤度分布に基づく乱

数 を 発 生 で き れ ば ,

その頻度がパラメー

タの分布になる

θ

(10)

MCMC法による推定

Gibbs Sampling

– 一つを除いて残りのパラメータを固定して条件付き分

布を考える

– あるパラメータの事後分布を求め,その分布から次の

パラメータをサンプリングする

– 同様に事後分布から順々にサンプリングする

Metropolis‐Hastings Sampling

– あるパラメータに対する尤度を計算する

– パラメータをある方向(ランダムに)に変える

• 基本的には

– 尤度が大きくなるようならその方向を採択

– 尤度が小さくなるようなら、逆方向にパラメータを変える

• 実際は一様乱数との大小で採択を決定

前の状態に基づいて(Markov Chain)新しいパラメー

タをランダムにサンプリング(Monte Carlo)する

データ拡大法による

プロビットモデル

ベイズロジットモデル

平均値も計算可能

• この時μとσの平均値は単純に平均で計算可能で5.01と2.17

(※1000まで廃棄)

0

1

2

3

4

5

6

7

1

45

89

13

3

17

7

22

1

26

5

30

9

35

3

39

7

44

1

48

5

52

9

57

3

61

7

66

1

70

5

74

9

79

3

83

7

88

1

92

5

96

9

10

13

10

57

11

01

11

45

11

89

12

33

12

77

13

21

13

65

14

09

14

53

14

97

15

41

15

85

16

29

16

73

17

17

17

61

18

05

18

49

18

93

19

37

19

81

μ

σ

• 例

– 平日一日の平均トリップ数が右の表のように与えられる

– 分散の事前分布を逆ガンマ,平均値の事前分布を正規分布

とする

メトロポリス法のMCMCで平均値と分散の分布を計算してみる

6.0 

8.1

7.2 

3.9 

4.5

2.5 

6.6 

4.1 

2.0 

5.5 

続く

ロジット・プロビットモデルの

MCMC推定プログラム(兵藤2009)

• library(MCMCpack)  • ###データファイルの読み込み • Dat<‐read.csv("H:/2014/data.csv",header=TRUE)  • hh<‐nrow(Dat) ##データ数:Data の行数を数える • rtime <‐ Dat[, 6]/100; btime <‐ Dat[, 9]/100; ctime <‐ Dat[,12]/100  • rcost <‐ Dat[, 7]/100; bcost <‐ Dat[,10]/100; ccost <‐ Dat[,13]/100  • raged <‐ matrix(0,nrow=hh,ncol=1); baged <‐ 1*(Dat[,3]>=6); caged <‐ raged  • rcar <‐ matrix(0,nrow=hh,ncol=1); bcar <‐ rcar; ccar <‐ 1*(Dat[,4]>=2)  • ##選択結果 • ch <‐ matrix(0,nrow=hh,ncol=3)  • colnames(ch) <‐ c("1", "2", "3")  • for (i in 1:hh){  • if (Dat[i, 5]==0) ch[i,1] <‐ ‐999  • if (Dat[i, 2]==1) ch[i,1] <‐ 1  • if (Dat[i, 8]==0) ch[i,2] <‐ ‐999  • if (Dat[i, 2]==2) ch[i,2] <‐ 1  • if (Dat[i,11]==0) ch[i,3] <‐ ‐999  • if (Dat[i, 2]==3) ch[i,3] <‐ 1  • }  • post <‐ MCMCmnl(ch ~  • choicevar(rtime, "time", "1") +  • choicevar(btime, "time", "2") +  • choicevar(ctime, "time", "3") +  • choicevar(rcost, "cost", "1") +  • choicevar(bcost, "cost", "2") +  • choicevar(ccost, "cost", "3") +  • choicevar(raged, "aged", "1") +  • choicevar(baged, "aged", "2") +  • choicevar(caged, "aged", "3") +  • choicevar(rcar , "car" , "1") +  • choicevar(bcar , "car" , "2") +  • choicevar(ccar , "car" , "3") ,  • baseline="3", burnin=1000,  • mcmc.method="RWM",  • b0=0, B0=0, seed=2348,  • verbose=1000, mcmc=10000, B=0.001)  • plot(post)  • summary(post)  library(bayesm)  ###データファイルの読み込み Dat<‐read.csv("h:/2014/data.csv",header=TRUE)  hh<‐nrow(Dat) ##データ数:Data の行数を数える alt <‐ 3 

rtime <‐ Dat[, 6]/100; btime <‐ Dat[, 9]/100; ctime <‐ Dat[,12]/100  rcost <‐ Dat[, 7]/100; bcost <‐ Dat[,10]/100; ccost <‐ Dat[,13]/100  raged <‐ matrix(0,nrow=hh,ncol=1); baged <‐ 1*(Dat[,3]>=6); caged <‐ raged  rcar <‐ matrix(0,nrow=hh,ncol=1); bcar <‐ rcar; ccar <‐ 1*(Dat[,4]>=2)  cres <‐ Dat[,2]  na <‐ 4  Xa <‐ cbind(rtime,btime,ctime,rcost,bcost,ccost,raged,baged,caged,rcar,bcar,ccar)  nd <‐ 0  X <‐ createX(alt, na=na, nd=nd, Xa=Xa, Xd=NULL, DIFF=TRUE, base=3)  dat1 <‐ list(p=alt, y=cres, X=X)  mcmc1 <‐ list(R=5000,k=1)  res1 <‐ rmnpGibbs(Data=dat1, Mcmc=mcmc1)  plot(res1$betadraw)  plot(res1$sigmadraw) 

ロジット

プロビット

推定例(MHアルゴリズムでロジット)

兵藤 2009を用いた

(11)

ベイズ推定のメリットデメリット

• メリット

– 解析的にはパラメータが求まらない複雑なモデルも

パラメータ分布が求まる

• 例:パネルデータの個人モデルを考慮した階層モデル

– パラメータの分布がわかる

• 多峰性の分布になったならばモデル構造を考え直す

• デメリット

– 時間がかかる

MNLの推定 MCMC:15秒 最尤推定:7秒

– パラメータの分布が収束しない場合もある

参考文献等

• 入門ベイズ統計学 松原望

• ベイズモデリングによるマーケティング分析 照井伸彦

R による離散選択モデルの推定方法メモ 兵藤哲朗

参照

関連したドキュメント

Theorem 3 implies strong asymptotic stability results: the energy of strong solutions decays to zero, with an explicit decay rate

We aim at developing a general framework to study multi-dimensional con- servation laws in a bounded domain, encompassing all of the fundamental issues of existence,

The CR singular points, where the complex lines are tangent to the image, are an example of this, but the geometric invariants of these intersections under the action of P GL(n + 1,

Actually a similar property shall be first de- rived for a general class of first order systems including the transport equation and Schr¨odinger equations.. Then we shall consider

This concludes the proof that the Riemann problem (1.6) admits a weak solution satisfying the boundary condition in the relaxed sense (1.6c).... The two manifolds are transverse and

The pa- pers [FS] and [FO] investigated the regularity of local minimizers for vecto- rial problems without side conditions and integrands G having nonstandard growth and proved

We obtain some conditions under which the positive solution for semidiscretizations of the semilinear equation u t u xx − ax, tfu, 0 &lt; x &lt; 1, t ∈ 0, T, with boundary conditions

To define the category of sets of which this type of sets is the type of objects requires choosing a second universe of types U 0 and an element u of U 0 such that U = El(u) where El