• 検索結果がありません。

RP/SPモデル推定のための SP調査の最適設計

N/A
N/A
Protected

Academic year: 2021

シェア "RP/SPモデル推定のための SP調査の最適設計"

Copied!
18
0
0

読み込み中.... (全文を見る)

全文

(1)

行動モデルの応用:

サンプル数が小さい時

名古屋大学 山本俊行

(2)

ビッグデータの時代にサンプル数が

小さい??

• 個人間の異質性を突き詰めていくと

個人毎のモデル推定

• 現時点で需要の小さい選択肢こそ

需要予測が求められる

2016/09/24 第15回行動モデル夏の学校 2

(3)

離散選択モデルにおける

個人間異質性の表現

• 定数項を社会経済特性の関数にする

– 社会経済特性ダミー(免許保有ダミー等)

• 交通サービス水準のパラメータを個別化

– 社会経済特性の関数

– 確率分布を仮定(連続/離散分布)

• モデル全体を個別化

– 社会経済特性によるセグメント別モデル

– 意思決定者毎のモデル

2016/09/24 第15回行動モデル夏の学校 3

(4)

個人別モデル

これまで

• 主にマーケティング分野等で用いられてきた

• 交通行動分析ではあまり用いられてこなかった

PT調査では同一個人のトリップ数は数回

近年

• プローブパーソン調査では長期観測により

同一個人の繰り返し選択行動が観測可能

• SP調査ではコンピュータ画面で繰り返し選択

2016/09/24 第15回行動モデル夏の学校 4

(5)

648トリップ

388トリップ

A

B

データ:函館で

2名2012~2013年

5 16回以上/月 8回以上/月 4回以上/月 2回以上/月 1回以上/月

no less than 16 times/month no less than 8 times/month no less than 4 times/month no less than 2 times/month

no less than 1 times/month supermarket home

work place

no less than 16 times/month no less than 8 times/month no less than 4 times/month no less than 2 times/month no less than 1 times/month

home work place supermarket 16回以上/月 8回以上/月 4回以上/月 2回以上/月 1回以上/月

no less than 16 times/month no less than 8 times/month no less than 4 times/month no less than 2 times/month no less than 1 times/month

home fitness club work place 1 work place 3 work place 4 work place 2 残り18名分の取得済みデータを整備中

(6)

0 2 4 6 8 10 12 14 16 18 20 22 24 Time of day Stay home Other Working

Streetcar

Shopping Exercise Foot Auto

凡例

Other

Other Snow(0.5) Other

Snow(11.0) Other

Snow(1.0)

Snow(2.5)

Note: snow fall in cm/24hrs. Data from Subject ID 8

Meal Snow(2.5) Bus Recreation Other Date 2013/2/4 Mon. 2013/2/9 Sat. 2013/2/11 Mon. 2013/2/12 Tue. 2013/2/18 Mon.

荒天時の行動変化(冬季大雪:被験者

A)

• スポーツジムに行くのを取り止め?

6

(7)

需要の小さい選択肢

• タクシーやカーシェアリング,相乗り等の選択

肢は鉄道や自動車(自分で運転)等の選択肢

に比べて観測数が少ない

• 通常の対応

– 選択肢別抽出によりサンプル数を増やす

– 選択肢から除く

2016/09/24 第15回行動モデル夏の学校 7

(8)

名古屋でのカーシェアリングへの加入

による影響の調査結果

(2005年)

• 非会員の保有台数は名古

屋市平均(

1.1台)と一致

• 入会する人は元々保有台

数が少ない

• 入会によって保有台数は減

少する

• 入会して変化のない会員の

うち

7世帯は購入を見送っ

ている

会員

非会員

1台増車

0

6

変化なし

19

170

1台減車

8

5

27

181

会員

非会員

1年前

0.6

1.0

0.5**

現在

0.3

1.1

0.8**

変化

−0.3**

+0.0

平均保有台数

1年間の更新行動

2016/09/24 第15回行動モデル夏の学校 8

(9)

名古屋市名東区内の交通手段選択

行動のモデリング

選択肢 サンプル数 鉄道

120

バス

97

タクシー

11

自家用車

1622

自転車

684

徒歩

1954

合計

4488

2016/09/24 第15回行動モデル夏の学校 9 変数名 推定結果 t値 鉄道 定数項 0.466 2.50 バス 定数項 -0.258 -1.01 タクシー 定数項 0.170 0.45 自家用車 定数項 0.533 5.93 自転車 定数項 -0.255 -2.95 所要時間 -0.064 -16.85 費用 -0.003 -4.86 待ち時間 -0.236 -11.56 女性ダミー -0.089 -1.05 年少者ダミー -1.086 -12.88 老年者ダミー -0.472 -1.85 主婦無職ダミー 0.331 3.99 補正済み尤度比 0.397

多項ロジットモデル推定結果

2011年中京PTデータ

(10)

最尤推定法の特徴

• 一致性(

consistency):

サンプル数を大きくしてい

けば

推定値が真値に近づく

• 漸近的有効性(

asymptotic efficiency):

サンプル

数が十分大きければ

推定値の分散は他のどの

推定法より小さくなる

• 漸近的正規性(

asymptotic normality):

サンプル

数が大きくなれば

推定値の分散は正規分布に

従う

2016/09/24 第15回行動モデル夏の学校 10

(11)

小サンプル時の問題

• 最尤推定法の望ましい性質はサンプル数が大き

い時しか保証されない

• 特定の選択肢を選択するサンプルが少ない時,

説明変数の組み合わせによってパラメータが発

散し推定できないことも多い(

separation)

• 二項ロジットモデルでは小サンプル時にパラメー

タ推定値がバイアスを持つことが示されてきた

2016/09/24 第15回行動モデル夏の学校 11

(12)

パラメータが発散する時の解釈

Frischknecht et al., 2014)

1. 確率的選択行動の仮定は正しいが,サンプ

ル数が少ないために上手く推定できない

2. 辞書編纂型意思決定等の確定的な選択行

動の証拠であり,確率的選択行動の仮定が

間違っている

2016/09/24 第15回行動モデル夏の学校 12

(13)

小サンプル時のパラメータのバイアス

• 医学分野等,小サンプルで二項ロジットモデ

ルを推定し,オッズ比を算出したい場合に問

題視されてきた

• 選択肢数が多かったり説明変数が多かったり

するとパラメータ数に対するサンプル数が相

対的に小さくなりバイアスが大きくなる(

Bull et

al., 2002)

– 交通行動分野ではありがち?

2016/09/24 第15回行動モデル夏の学校 13

(14)

バイアスの原因(

Firth, 1993)

• スコア関数(対数尤度の一次微分

𝑈𝑈 𝜃𝜃 =

𝐿𝐿𝐿𝐿𝐿 𝜃𝜃 )にバイアスがない: 𝐸𝐸 𝑈𝑈 𝜃𝜃 = 0

• スコア関数がパラメータに対して非線形:

𝑈𝑈

′′

𝜃𝜃 ≠ 0

最尤推定ではスコア関数が

0

となる

𝜃𝜃

を探索

するが,スコア関数が非線形の時,サンプル

平均が母集団平均と一致しない

2016/09/24 第15回行動モデル夏の学校 14 先ほどの講義「行動モデルの推定法」の資料4頁:代表的な繰り返し計算法を参照

(15)

Penalized maximum likelihood

estimation (Firth, 1993)

(16)

Penalized maximum likelihood

estimation (Firth, 1993)

2016/09/24 第15回行動モデル夏の学校 16

I(

β

): 情報行列

上式では

β

を使って補正する必要があるので,実際の推定は

以下の繰り返し計算となる

Rパッケージ(二項ロジット:

logistf,多項ロジット:pmlr)

ペナルティ付きスコア関数

ペナルティ付き尤度

(17)

Firth (1993)以降

• 多項ロジットモデルへの拡張(

Bull et al., 2002)

• ベイズ推定との類似性の指摘(

Gilbride et al., 2008;

Evgeniou et al., 2007)

• 通常の情報行列を用いる(正規性の仮定)より,尤度

比を用いてパラメータ信頼区間を推定した方が良い

Heinze and Schemper, 2002; Bull et al., 2007)

• 交通行動分析の分野でよく用いられる,より複雑なモ

デルでも有効なのか?

(18)

参考文献

• Bull, S.B., Mak, C., Greenwood, C.M.T. (2002): A modified score function estimator for multinomial logistic regression in small samples. Computational Statistics & Data Analysis 39, 57-74.

• Bull, S.B., Lewinger, J.P., Lee, S.S.F. (2007): Confidence intervals for multinomial logistic regression in sparse data. Statistcs in Medicine 26, 903–918.

• Evgeniou, T., Pontil, M., Toubia, O. (2007): A convex optimization approach to modeling consumer heterogeneity in conjoint estimation. Marketing Science 26, 805–818.

• Firth, D. (1993): Bias reduction of maximum likelihood estimates. Biometrika 80, 27-38.

• Frischknecht, B.D., Eckert, C., Geweke, J., Louviere, J.J. (2014): A simple method for estimating preference parameters for individuals. International Journal of Research in Marketing 31, 35-48.

• Gilbride, T. J., Lenk, P. J., Brazell, J.D. (2008): Market share constraints and the loss function in choice-based conjoint analysis. Marketing Science 27, 995–1011.

• Heinze, G., Schemper, M. (2002): A solution to the problem of separation in logistic regression. Statistics in Medicine 21, 2409-2419.

参照

関連したドキュメント

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計

出来形の測定が,必要な測 定項目について所定の測 定基準に基づき行われて おり,測定値が規格値を満 足し,そのばらつきが規格 値の概ね

サンプル 入力列 A、B、C、D のいずれかに指定した値「東京」が含まれている場合、「含む判定」フラグに True を

■鉛等の含有率基準値について は、JIS C 0950(電気・電子機器 の特定の化学物質の含有表示方

領海に PSSA を設定する場合︑このニ︱条一項が︑ PSSA

るものとし︑出版法三一条および新聞紙法四五条は被告人にこの法律上の推定をくつがえすための反證を許すもので

・発電設備の連続運転可能周波数は, 48.5Hz を超え 50.5Hz 以下としていただく。なお,周波数低下リレーの整 定値は,原則として,FRT

・発電設備の連続運転可能周波数は, 48.5Hz を超え 50.5Hz 以下としていただく。なお,周波数低下リレーの整 定値は,原則として,FRT