第3章　離散選択分析

(1)

『ブロードバンド・ビッグバンの経済学』京都大学大学院経済学研究科依田高典 V.1.1 10/25/2005

第 3 章離散選択分析

本章では本書で用いられる離散選択分析の必要最低限の基本を初心者にも判りやすく紹介する。ここでは離散選択分析を次の項目に分けて解説する。 z ランダム効用理論 z 条件付ロジット・モデル z 入れ子ロジット・モデル z ミックスド・ロジット・モデル z 顕示選好データと表明選好データ z コンジョイント分析こうしたトピックの研究は 1920 年代に始まり、1970 年代に大きく花開き、2000 年にはマクファデン(D.McFadden)教授とヘックマン(J.Heckman)教授がノーベル経済学賞を受賞した。コンピューターとシミュレーションの発達により今なお技術革新が進行中で、一昔前では不可能だった分析も可能になっている経済学のフロンティアの一つである。従ってそのような研究の最先端を初心者にも判りやすく紹介することは困難であるが、幸いなことに近年優れた三冊の教科書

z J.J. Louviere, D.A. Hensher, and J. Swait (2000) Stated Choice Methods, Cambridge University Press.

z K. Train (2003) Discrete Choice Methods with Simulation, Cambridge University Press.

z D.A. Hensher, J.M. Rose, and W.H. Greene (2005) Applied Choice Analysis, Cambridge University Press.

が相次いで出版され、離散選択分析の基本から発展まで網羅している。しかしながら三著とも大変な力作であり、初学者にとっては一冊を読み通すだけでも大変であろう。そこで本章は離散選択分析のエッセンスを判りやすくまとめる形で、必要最低限の内容が判るように工夫している。計量経済分析の推定結果を解釈するだけなら、必ずしも高度な数学的知識は必要なく、数式にはその都度言葉による説明も付けているので、そこを拾い読みするだけでも良い。また初学者は星印(＊)の付いている項は省略して差し支えない1_。 1 ＊の数は難易度を表す。＊は詳細は除いて一読することを勧める。＊＊は省略しても差し支えない。

(2)

3.1 ランダム効用理論(RUT)

本節では離散選択分析の基礎になるランダム効用理論を解説する(Louviere et al. 2000 Ch.3; Train 2003 Ch.2; Hensher et al. 2005 Ch.3 参照)。そもそも離散的選択とは何かから説明を始めよう。 z 離散的選択(discrete choice)：選択集合の中から一つの選択肢を選ぶこと。 z 選択集合(choice set)：選択者が選択をする選択肢の集合のこと。従って離散選択モデルとは、選択肢の様々な属性に応じて選択者が選択集合の中からどの選択肢を選ぶかという行動に関する分析である。選択集合は次のような特徴を持たなければならない。 z 選択肢は互いに排他的(mutually exclusive)である。 z 選択集合は網羅的(exhaustive)である。 z 選択肢の数は有限(definite)である。例えばブロードバンド・インターネット接続サービスを考えよう。第 1 章でも見たとおり、日本の代表的なブロードバンド・サービスは、ADSL、CATVインターネット、そして FTTHである。ここで選択肢集合をADSL、CATVインターネット、FTTHと定義し、選択者はその中からただ一つの選択肢を選ぶ。実際にはあるユーザーは自宅でADSLと CATVインターネットを併用しているかもしれないが、ここではそのような可能性は考えない2_{。またあるユーザーはここで想定された選択集合に含まれていない選択肢、例え} ば無線LANを用いているかもしれないが、そのような可能性も考えない。選択者が選択肢から得る満足のことを効用 (utility)と呼ぶ。ランダム効用理論 (random utility theory RUT)では、効用を二つの項に分ける3。

z 分析者が観察可能な代表的効用(representative utility)。 z 分析者が観察不可能な誤差項(random component)。 RUT では選択者 n が選択肢 i を選ぶ確率を、選択集合の全ての選択肢に対して選 択肢 j と i の誤差項の差が選択肢 i と j の代表的効用の差よりも小さい確率と考える。 選択者 n が J 選択肢の中から一つ選ぶ。選択者 n が選択肢 j から得る効用を と書く。選択者 n が選択肢 i を選ぶ必要十分条件は、選択肢 i から得る効 用が選択肢 j から得る効用よりも大きいこと( )である。研究者が観察でき , 1... nj U j= J , ni nj U >U i≠ j 2 そのような可能性を考える場合、ADSLとCATVインターネットを併用することを一つの独立した選択肢として扱う。 3 RUTは心理学の文脈ではThurstone (1927)、経済学の文脈ではMarshack (1960)によって展開された。

(3)

る代表的効用は選択肢固有の属性x_njと個人特有の属性に依存すると考え、代表的効用をと書く。また誤差項を n s ( , ) nj nj n V =V x s ε とし、選択者の効用をnj Unj =Vnj+εnjと書く。誤差項ベクトル εn =<εn1,...,εnJ >の結合分布関数を f(εn)と置けば、選択者 n が 選択肢 i を選ぶ選択確率は Pr( ) Pr( ) Pr( ) ( ) ( ) ni ni nj ni ni nj nj nj ni ni nj nj ni ni nj n n P U U V V V V , I V V f d j ε ε ε ε ε ε ε ε = > = + > + = − < − =

_∫

− < − ≠i (3.1) と書ける(Train 2003 pp.18-19 参照)。ここでI( )は括弧の式が真であれば 1 それ以外は 0 となる指示関数である。以上が RUT の主要内容である。代表的効用は、しばしばパラメータに関して線形 1 K nj j _k kj knj V =α +

∑

₌ β x (3.2) と仮定される。ここでx_knjは選択肢 j 固有の属性、α は選択肢固有の定数項、j β は選kj 択肢固有の係数パラメータである。もしも定数項と係数パラメータが選択肢共通である と仮定するならば、添え字 j を省略して、α 、β_kと書けばよい。 3.1.1 RUT の例示 本項では RUT を例示する。選択肢を ADSL と FTTH の二つ、説明変数を価格 (PRICE)と通信速度(SPEED)の二つとする。この時 ADSL と FTTH の線形代表的効用 は 1 2 1 2

ADSL ADSL ADSL ADSL ADSL ADSL

FTTH FTTH FTTH FTTH FTTH FTTH V PRICE SPEED V PRICE SPEED α β β α β β = + + = + + (3.3) と書ける。 FTTH を選ぶ確率はV_FTTH +ε_FTTH >V_ADSL+ε_ADSLとなる確率であるから、 Pr( ) FTTH FTTH FTTH ADSL ADSL P = V +ε >V +ε (3.4) と書ける。ADSL を選ぶ確率P_ADSLについても同様である。

(4)

3.2 条件付ロジット(CL)・モデル

本節では最も基本的な離散的選択モデルである条件付きロジット(conditional logit CL)・モデルを解説する(Louviere et al. 2000 Ch.3; Train 2003 Ch.3; Hensher et al. 2005 Ch.10,11 参照)4。

CLモデルの条件とは、誤差項が独立かつ同一に分布すること(independently and identically distributed IID)である。換言するとIID条件は、全ての選択肢の効用の誤差項がそれぞれの選択肢の誤差項から独立であり、誤差項がそれぞれ同じ分布を持つことを意味する。この IID 条件から後で説明する無関係な選択肢からの独立性 (independence of irrelevant alternative IIA)という仮定が派生する5。

CL モデルでは、誤差項ε が IID 条件に従うこと、つまり極値(extreme value EV)分_nj 布に従うことを仮定する。この時ε の密度関数と分布関数はそれぞれ _nj ( ) nj e nj nj f ε e ε e ε − − − = , F(ε_nj) e eεnj (3.5) − − = と書ける。EV 分布の差ε ε= _nj −ε_niはロジスティック分布 ( ) /(1 ) F ε =eε +eε (3.6) に従う。従って CL モデルの選択確率(以下 CL 選択確率)は ( ) ( ) ni nj V ni nj ni ni nj V j e P I V V f d j e ε ε ε ε =

∫

− < − =

∑

, ≠i (3.7) と書ける。さらに代表的効用が線形である場合、CL 選択確率は、 1 1 , K x j k kjknj K _x j k kjknj ni j e P e α β α β +∑ = +∑ = =

∑

j≠i (3.8) と書ける(Train 2003 pp.38-40 参照)。 3.2.1(＊) IIA 条件 4 CLモデルは多項ロジット(multinomial logit MNL)・モデルと呼ばれることも多い。 5 IIA仮定からロジット・モデルを導いたのはLuce (1959)である。IIA仮定をRUTに対応させたのはMarshak (1960)である。ロジット・モデルを極値分布に対応させたのはLuce and Suppes (1965)である。そしてロジット・モデルを完成させたのがMcFadden (1974)である。

(5)

本項では CL モデルにおける IIA 条件と検定方法について解説する(Hausman and McFadden 1984 参照)。IIA 条件とは、選択確率の比率が選択集合の他の選択肢の有無にかかわらず一定であることを意味する。正確に言えば IIA 条件は / / nj ni ni ni nk nj nk nk V V _V j V V ni V V V nk _j e e P e e P e e e − =

∑

= =

∑

(3.9) として表される。つまり選択肢 i と k の選択確率の比が選択肢 i と k 以外の選択肢に全 く依存しない。後に見るように IIA 条件は交叉弾力性が一定という仮定も意味する。 IIA 条件が成立しているかどうかをテストするにはハウスマン・テスト(Hausman test)を用いる。ハウスマン・テストは、IIA 条件が成立すれば、選択肢の部分集合を用いた推定値は選択肢の完全集合を用いた推定値から統計的有意に異ならないという性質を利用する。具体的にはハウスマン・テストは次のような手順で行う。 z 全ての選択肢を用いて CL モデルの推定値β_uと共分散行列V_uを求める。 z 選択肢の数を落として CL モデルの推定値β_rと共分散行列V_rを求める。 z ハウスマン統計量 1 [β_u−β_r]'[V_r−V_u] [− β_u −β を求める。 _r] このハウスマン統計量はカイ二乗(χ2 )分布に従うので、推定されるパラメータの数だけの自由度を持つ片側 5%のχ2_{臨界値を計算し大小を比較する。ハウスマン統計} 量がχ2_{臨界値よりも大きければ、部分集合 CL モデルの推定値と完全集合 CL モデル} 推定値は統計的に異なるので、IIA 条件は成立していないことになる。もしも IIA 条件が成立しないならば、IID 条件を緩和したモデルの採用を検討すべきである。このトピックは次節以降で扱う。 3.2.2(＊) CL 弾力性 本項では CL モデルの弾力性(以下 CL 弾力性)について説明する。弾力性とは、ある説明変数の 1%の変化に関する被説明変数の変化率(%)を表す。特に離散的選択モデルでは選択確率(あるいは加入需要)の弾力性を表す(Train 2003 pp.63-64 参照)。 弾力性には二つの概念がある。CL 自己弾力性(own-elasticity)は、選択肢 i の変数 の 1%の変化に関する選択肢 i の選択確率の変化率を表す。選択肢 i の第 k 属性に 関する選択者 n が選択肢 i を選ぶ確率P_niの弾力性は

(6)

/ (1 ) / ni kni P ni ni ni x kni ni

kni kni kni

P P V E x P x x x ∂ ∂ = = − ∂ ∂ (3.10) (1 ) kixkni Pni β = − ・・・代表的効用が線形( 1 K ni _k ki kni V =

∑

₌ β x )の場合と書ける。 CL 交叉弾力性(cross-elasticity)は、選択肢 j の変数の 1%の変化に関する選択肢 i の選択確率の変化率を表す。選択肢 j の第 k 属性に関する選択者 n が選択肢 i を選 ぶ確率P_niの弾力性は / / ni knj nj P ni ni x knj nj knj knj knj V P P E x P x x x ∂ ∂ = = − ∂ ∂ (3.11) kjx Pknj nj β = − ・・・代表的効用が線形( 1 K nj _k kj knj V =

∑

₌ β x )の場合 と書ける。CL 交叉弾力性は選択肢 j だけに依存し選択肢 i に依存していない。従って 選択肢 j の属性に関する CL 交叉弾力性は j を除いた選択肢 i で一定となる。この交 叉弾力性一定条件は CL モデルの IID 条件の帰結であり、IIA 条件の異なる表現でもある。 3.2.3(＊) 最尤推定法(MLE)

本項では CL モデルの最尤推定法(maximum likelihood estimation MLE)について説明する。MLE とは、データを確率的に最も良く説明する推定値を見つける方法であり、次のような考え方に基付く(Louviere et al. 2000 p.43 参照)。 z RUT では選択者 n が選択肢 j を選ぶ必要十分条件は、選択肢 j の効用 が選 択肢 i の効用U よりも大きいことである。 U_nj ni z CL 選択確率を利用して、選択肢 j の効用U が選択肢 i の効用U よりも大きい確率を全ての選択者に関して計算する。 nj ni 簡単に MLE を解説しよう。選択者 n が選択肢 j を選択する確率は と書ける。ここで は選択者 n が選択肢 j を選ぶ時に 1、そうでない時に 0 となる指示関数で ある。N 人の選択者が選択肢 j を選ぶ確率を尤度関数(likelihood function)と呼び、 ( )Inj j Pnj Π 1 nj I =

(7)

( ) ( ) ,Inj 1... , 1... n j nj L β = Π Π P n= N j= J (3.12) と書く。ここでβ はパラメータ・ベクトルである。尤度関数の対数を対数尤度関数 (log-likelihood function)と呼び、 ( ) n j njln nj, 1... , 1... LL β = Σ Σ I P n= N j= J (3.13) と書く。対数尤度関数をパラメータで微分し、最大化の一次条件 ( ) / 0 dLL β dβ = (3.14) を満たすようなパラメータを見つければよい(Train 2003 pp.64-65 参照)。 3.2.4(＊) 適合度(ρ ) 本項では離散選択モデルの適合度であるマクファデンのρ について解説する。 ρ (擬似R2_{とも呼ばれる)とは、離散選択モデルがどの程度データの変動をうまく説明} するかを表す指標である。離散選択モデルは MLE を用いて推定されるので、対数尤度関数がモデル適合度の指標になる。LL( )β を推定されたパラメータにおける対数尤度関数の値、LL(0)を全てのパラメータをゼロとおいた対数尤度関数の値とし、 ( ) 1 (0) LL LL β ρ= − (3.15) と書く。ρ は 0-1 区間内の値をとり、 ρ が大きいほど適合度が高い。従って ρ の大小を通じて同じデータ、同じ選択集合を持つ複数のモデルの適合度を比較することもできる。しかしρ は最小二乗法の決定係数とは直接比較できず、数値がかなり低めにでることに注意しよう。離散選択モデルでは 0.2 のρ でも十分に高い適合度を表す6_。 3.2.5 CL モデルの例示 本項では CL モデルの推定結果のイメージを例示しよう。数字はすべて説明のための「便宜的」なものである。選択肢を ADSL、CATV インターネットと FTTH の三つ、説明変数を価格と通信速度の二つとする。記述統計を表 3.1(a)のように表す。そこには選択肢毎に選択者数、選択比率、価格平均値、通信速度平均値が記載されている。IIA 条件を確認しよう。現在 ADSL、 6 MLEのρと最小二乗法の 2 R の間ではおおよそ ρ[ 0.1, 0.2, 0.3, 0.4, 0.5]= 2 R [0.3, 0.5, 0.6, 0.8, 0.9]

(8)

CATV インターネット、FTTH の選択比率は 3：1：1 である。CATV インターネットが利用できない場合、ADSL、FTTH の選択比率は 3：1 で保存され、選択比率は 75%、25% になる。＜表 3.1 挿入＞推定結果を表 3.1(b)のように表す。そこには観察数、LL( )β 、LL(0)、ρ が記載されている。離散選択モデルにおいてρ =0.33 というのは、最小二乗法の 2 R でいうと 0.6 以 上にあたるので、モデルの適合度はかなり高い。次に変数、推定値、標準誤差、t 値が記載されている。変数は(基準化のために)CATV インターネットを除いた ADSL、 FTTH の選択肢固有の定数項、価格と通信速度の選択肢共通のパラメータである。推定値の符号を見ると、価格の推定値の符号は負、通信速度の推定値の符号は正であると期待されるが、確かに符号条件は満たされている。MLE 推定値は漸近的に t テストの性質を満たす。推定値の標準誤差に対する比率が t 値である。t 値は変数の推定値が統計的有意にゼロから異なるかどうかを表す。絶対値で見て t 値が 1.96 よりも大きければ、変数の推定値は 5%水準で統計的に有意である。それぞれの変数の t 値を見てみると、ADSL 定数項、価格、通信速度は統計的に有意な変数であるが、FTTH 定数項は統計的に非有意な変数である。価格や速度の推定値を用いて弾力性や支払意思額(willingness to pay WTP)を計算する際には推定値の有意性が必要である。この点でこの推定結果は良好である。価格に関する需要の弾力性を表 3.1(c)のように表す。列は変化する価格の変数名を表し、行は変化する選択確率の変数名を表す。対角線上の数値は自己弾力性を表す。弾力性は通常絶対値で表示するが、自己弾力性と交叉弾力性が混同されないように、負のままにしている。ADSL 自己弾力性は-0.96 なのに対して、CATV インターネット自己弾力性は-2.56、FTTH 自己弾力性は-3.2 である。１より小さな弾力性を非弾力的、1 より大きな弾力性を弾力的と呼ぶので、ADSL 自己弾力性は非弾力的、CATV インターネット、FTTH 自己弾力性は弾力的である。一行目に注目すると、ADSL 価格に関する CATV インターネット、FTTH 選択確率の交叉弾力性はそれぞれ 1.44 である。交叉弾力性一定条件は CL モデルの IID 条件の帰結である。同様の交叉弾力性一定条件は二行目、三行目でも確認できる。最後に WTP を表 3.1(d)のように表す。ここでは代表的効用が線形であることを仮定しているので、パラメータ比率がいわゆる限界代替率を表し、通信速度パラメータを価格パラメータで除した比率の絶対値が 1Mbps あたりの金銭的価値を表す。従って 1Mbps あたりの WTP は 0.02/0.0008=25 円となる。 3.2.6 CL モデルの限界

(9)

CL モデルは誤差項に IID 条件を課し、その結果 IIA が導出される。実際の無数の選択肢候補の中からある特定の選択肢だけを抽出し選択集合を定義することはやむを得ない単純化である。この時 IID 条件が成り立てば、推定結果の統計学的な諸問題を無視して分析できる。しかし CL モデルは次のような制約を持っている。 z 嗜好多様性(taste variation)：CL モデルは個人の嗜好の多様性を取り扱えない。 z 代替性パターン(substitution pattern)：CL モデルは柔軟な選択肢間代替性パターンを表現できない。 z 系列相関(serial correlation)：CL モデルは時系列上の相関を取り扱えない。そこで CL モデルの IID 条件の部分的緩和、さらには完全緩和が研究されてきた。第二の制約を緩和したのが次節で解説される入れ子ロジット・モデルに代表される一般化極値モデルであり、全ての制約を緩和したのが次々節で解説されるミックスド・ロジット・モデルやプロビット・モデルである(Train 2003 p.46 参照)。 3.3 入れ子ロジット(NL)・モデル 本節ではCLモデルの代替性パターン制約を緩和した入れ子ロジット(nested logit NL)・モデルを解説する(Louviere et al. 2000 Ch.6; Train 2003 Ch.4; Hensher et al. 2005 Ch.13,14 参照)7。入れ子とは、階層的意思決定、互いに排他的な選択集合の部分集合という意味である8_{。NLモデルでは、異なる入れ子の選択肢に比べて、同じ入れ子内の選択肢が互} いに近似した誤差項を持つ。従ってNLモデルでは入れ子内ではIID条件が課されるが、入れ子間ではIID条件が緩和されているので、CLモデルよりも柔軟な代替性パターンを表現できる。つまりIIA条件は入れ子内では成立するが、入れ子間では成立しない。NLモデルの性質を無関係な入れ子からの独立性(independence of irrelevant nests IIN)と呼ぶことがある。NLモデルでは入れ子毎に包括値(inclusive value IV)パラメータと呼ばれる変数を加えて推定する。

インターネット接続サービスを考えると、ダイアルアップ、ISDN、ADSL、CATVインターネット、FTTHなどの選択肢がある。この中で最も通信速度に優れるFTTHと最も通

7

CLモデルのIID条件を緩和したモデルを一般化極値(generalized extreme value GEV)モデルと呼ぶ。GEVモデルでは誤差項がEV分布することを仮定しながら、選択肢間で相関することを許している。NLモデルは最もよく使われるGEVモデルである。 8 NLモデルは選択肢間の誤差項の相関にかかわる選択集合の分割を扱うので、正しくは逐次的意思決定ではなく、あくまで同時的意思決定なのであるが、理解のしやすさのために逐次的意思決定のイメージを用いている。

(10)

信速度に劣るダイアルアップの代替性パターン(交叉弾力性)と、FTTHとADSLの代替性パターン(交叉弾力性)が同じと考えることは不自然である。例えばダイアルアップ、 ISDNを一つの入れ子と考え、ナローバンド・カテゴリーとしよう。ADSL、CATVインターネット、FTTHを別の入れ子と考え、ブロードバンド・カテゴリーとする。選択者が第一段階でナローバンドかブロードバンドを選択し、第二段階で選択された入れ子の中から個別の選択肢を選択する。さらにブロードバンド・カテゴリーはADSL、CATVインターネットの低速度ブロードバンド・カテゴリーとFTTHの高速度ブロードバンド・カテゴリーとに分割されるかもしれない。以上がNLモデルの骨子である9_。それではNLモデルを解説しよう10_{。選択肢jの集合をK個の入れ子に分割し、} 1, , K B _L B で表す。NLモデルの誤差項ベクトルをεnj =<εn₁,...,εnJ > K = とすれば、その累積分布は / ( ) ( ) , 1... nj k k k j Bke nj F e k ε λ λ ε = −∑ ∑∈ − (3.16) と書ける。ここで k λ は入れ子kのスケール・パラメータと呼ばれ、ε εnj, nm∈Bkの場合εnj とε_nmの相関度の指標になる。λ_kが高ければそれらの相関度は低い。上位レベルのスケール・パラメータの下位レベルのスケール・パラメータに対する比率をIVパラメータという11_{。少なくとも一つのスケール・パラメータは 1 に基準化される必要がある。上位レ} ベルのスケール・パラメータと下位レベルのスケール・パラメータのどちらを基準化するかでNLモデルのランダム効用(RU)は 2 つのタイプに分けられる(Louviere et al. 2000 pp.165-167 参照)。

z ランダム効用モデル・タイプ 1(RU1)：下位レベルのスケール・パラメータを基準化する。

z ランダム効用モデル・タイプ 2(RU2)：上位レベルのスケール・パラメータを基準化する。

RU1 と RU2 のどちらのモデルを採用するかは分析者に委ねられるが、RU2 推定値 9 実際には入れ子構造の決定は難しい問題である(Cameron 1982 参照)。そこでNLモデルではモデルの選択が重要な問題となる。大まかな基準としては、(1)直感的な選択、 (2)IVパラメータが持つ入れ子内の選択肢の相関度、(3)モデルの対数尤度関数の比較などが提案されている(Louviere et al. 2000 参照)。 10

NLモデルの選択確率はDaly and Zachary (1978)、McFadden (1978)、Williams (1977)によってほぼ同時に証明された。

11

(11)

は高次レベルを含んだ複雑なモデルでも RUT と整合的であることから、RU2 の方が望ましいと言えよう(Hund 1998 参照)。 NL モデルの選択確率(以下 NL 選択確率)は / / 1 / 1 ( ) ( ) nj k ni k k k nj k l l V V j B ni K V l j B e e P e λ λ λ λ λ − ∈ = ∈ Σ = Σ Σ (3.17) と書ける(Train 2003 pp.83-84 参照)。 NL モデルの推定は CL モデル同様に最尤法を用いるが、最尤法は逐次的でも同時的でも実行できる。もしも入れ子のレベルが 2 から 4 程度であれば、完全情報最尤法(full information maximum likelihood FIML)と呼ばれる同時推定が一般的である。同時推定の方が逐次的に推定するよりも効率的なパラメータ推定値を得ることができる。 3.3.1(＊) NL 選択確率の分解 本項では NL 選択確率について解説する。(3.17)式で与えられた NL 選択確率を理解するには、入れ子選択確率と選択肢選択確率に分解することが便利である。選択 者 n が入れ子B 内の選択肢 j を選ぶ時、その代表的効用を入れ子内の選択肢共通_k の属性W_nkと選択肢固有の属性Y_njに分け、効用を , nj nk nj nj k U =W +Y +ε j∈B (3.18) と書く。その時 NL 選択確率は | ni ni B nB P =P P k k (3.19) ただし / | / ni k k nj k k Y ni B Y j B e P e λ λ ∈ = Σ , 1 nk k nk k nl l nl W IV nB K W IV l e P e λ λ + + = = Σ , / ln nj k k Y nk j B IV = Σ _∈ e λ と書ける(Train 2003 pp.85-87 参照)。言葉で説明すると、は二つの確率に分解できる。 は選択者 n が入れ子 ni P | _k ni B P B を選んだという条件のもとで選択肢 i を選ぶ確率であk り、選択肢選択確率に関してロジット形式が成立している。は選択者 n が入れ子 k nB P k B を選ぶ確率であり、入れ子選択確率に関してロジット形式が成立している。さらに

(12)

kIVnk λ は選択者 n が入れ子B 内の選択肢を選んだ時の期待効用を表し、_k IV は包括_nk 値、λ_kは IV パラメータである。 3.3.2(＊) NL 弾力性 本項では NL モデルの弾力性(以下 NL 弾力性)を解説する。NL 弾力性は選択肢が同じ入れ子に所属するかどうかで異なる。この意味で CL モデルの交叉弾力性一定条件は部分的に緩和される。線形効用の場合、NL 自己弾力性は | 1 [(1 ) ( 1)(1 )] , ni ni i k P x n ni B n k i k E P P βx λ = − + − − i∈B (3.20) と書ける。交叉弾力性は | 1 [ ( 1) ] , , ni nj j k P x n nj B nj k k E P P βx i j λ = − + − ∈ B (3.21) と書ける。λ_k ≠ の場合、CL弾力性とNL弾力性は[ ]内第二項の効果により異なる1 12。 1 k λ = の場合、CL弾力性とNL弾力性は形式的に一致する。 3.3.3 NL モデルの例示 本項では NL モデルの推定結果のイメージを例示しよう。数字はすべて説明のための「便宜的」なものである。選択肢を ADSL、CATV インターネットと FTTH の三つ、説明変数を価格と通信速度の二つとする。 NLモデルを適用するに先立って、IIA条件が成立しているかどうかを確認するため、 CLモデルにハウスマン・テストを行う必要がある。ADSL、CATVインターネット、FTTH の選択比率が 3：1：1 である時、CATVインターネットが削除されると、IIA条件によれば ADSL、FTTHの選択比率が 3：1 で保存される必要がある。しかし例えばCATVインターネットはADSLと完全な代替性を持つ場合、ADSL、FTTHの選択比率が 4：1 となる。このような場合ADSLとCATVインターネットを一つの入れ子と見なし、FTTHを別の入れ子と見なすことができよう。そこでCATVインターネット選択肢を落としてCLモデルの推定を行い、ハウスマン統計量を導出した。自由度 2 のχ2_{分布の片側 5%臨界値は} 5.99 であるから、ハウスマン統計量がその値以上であれば、IIA条件が成立するという 12 従って同じ入れ子に所属する選択肢と異なる入れ子に所属する選択肢の間で交叉弾力性一定条件が緩和される。

(13)

帰無仮説は棄却される13_。ハウスマン・テストで IIA 条件が棄却されれば、もはや CL モデルの採用は適当ではない。そこで第一段階で ADSL・CATV カテゴリーか FTTH を選び、第二段階で ADSL・CATV カテゴリーを選んだ場合いずれかの選好肢を選ぶという NL モデルを推定した。表 3.2(b)の NL モデル推定結果を表 3.1(b)の CL モデル推定結果と比較すると、モデル適合度を表すρ が 0.40 に向上している。変数の推定値の符号と統計的有意性の傾向は CL モデルとそれほど変わらないが、個々の t 値は良くなっている。変数には IV パラメータが追加されている。IV パラメータ推定値は 0-1 区間にあり、t 値は統計的に有意である。表 3.2(c)のNL弾力性を見ると、交叉弾力性が入れ子の内外の選択肢間で異なり、交叉弾力性一定条件がもはや成立していない。同じ入れ子内にある選択肢(ADSLと CATVインターネット)の交叉弾力性が入れ子外の選択肢(FTTH)の交叉弾力性よりも高くなっている14_{。つまり入れ子内にある選択肢間の需要代替性の方が入れ子外にあ} る選択肢間の需要代替性よりも高い。＜表 3.2 挿入＞ 3.3.4(＊＊) HEV モデル 本項では最も一般的なGEVモデルである分散不均一極値分布(heteroscedastic extreme value HEV)モデルを紹介しよう。HEVモデルは全ての誤差項が可変な極値分布に従うモデルである15_{。従ってHEVモデルでは全ての交叉弾力性が自由に決ま} る。NLモデルがIIN仮定を持っていたのに対して、HEVモデルはIIA条件を完全に緩和したモデルである。HEV選択確率は ( ) / / _/ [ ] ( VniVnj ni j ni i ni i e e ni j i ni i P e e e d ε θ ε θ _{ε θ} / ) ε θ − − + − ₋ − − ≠ = Π

∫

(3.22)

と書ける(Train 2003 p.96 参照)。積分が閉鎖形式(closed form)になっておらず、選択確率に積分記号がそのまま残っている。従って HEV モデルは解析的に解くことができず、シミュレーションを用いる必要がある。 13 ハウスマン・テストでは定数項を落として計算することがある。ここでは価格と速度を推定パラメータとしているので、自由度は 2 である。 14 FTTH価格に関するADSLとCATVインターネット選択確率の交叉弾力性は一定である。これはIIN条件を表す。 15

実例としてAllenby and Ginter (1995), Bhat (1995), Hensher (1997a, 1998a, b)など参照。

(14)

3.4 ミックスド・ロジット(ML)・モデル

本節では、CLモデルの嗜好多様性・代替性パターン・系列相関の制約を全て緩和したミックスド・ロジット(mixed logit ML)・モデルを紹介する(Louviere et al. 2000 Ch.6; Train 2003 Ch.5,6; Hensher et al. 2005 Ch.15,16 参照)。MLモデルは誤差項に共分散の多様性を考慮した一般性の高いモデルである。MLモデルはランダム・パラメータ (random parameter)・モデルと呼ばれることもある16。 MLモデルではパラメータβ が確率分布 f( )β に従うと仮定する。 f( )β は正規分布や対数正規分布がよく仮定される17_{。パラメータ}_{β を所与とすると、選択者nが選択肢i} を選ぶ選択確率は ( ) ( ) 1 ( ) ni nj V ni J V j e L e β β β = =

∑

(3.23) とロジット形式を用いて書くことができる。パラメータβ が確率的に分布する時、ML モデルの選択確率(以下 ML 選択確率)は f( )β 上のL_ni( )β の積分となる。従って ML 選択確率は ( ) ( ) ni ni P =

∫

L β f β βd (3.24) と書ける(Train 2003 p.138 参照)。入れ子内の選択肢に 1、入れ子外の選択肢に 0 となるダミー変数を付けると、ML モデルは NL モデルに似た階層的選択構造を表現できる。EV 誤差項の他に、誤差項 1 ' K n xnj _k nkdjk μ =

∑

₌ μ を加える。ここでd_jk =1は選択肢が入れ子 k 内にある時に 1、それ以外の時 0 となるようなダミー変数、μ_nkを正規分布 (0,N σ_k)とする。ダミー変数によって、分散σ_kは入れ子毎に決まるので、入れ子毎に選択肢の相関が異なる。さらにダミー変数d_jkを選択肢が交叉するように特定化すれば、より複雑な交叉した入れ子構造 16

MLモデルの初期の実例としてTrain et al. (1987a) and Ben-Akiva et al. (1993)がある。コンピューターによるシミュレーション手法の発達によって近年MLモデルは広く用いられるようになり、実例はBhat (1998a), Brownstone and Train (1999)、Erden (1996)、 Revelt and Train (1998)、Bhat (2000)など多数ある。

17

対数正規分布は価格パラメータのように係数が正負いずれかの符号を持つ場合に用いられる。

(15)

も表現できる(Ben-Akiva et al. 2001 参照)。 ML モデルの弾力性(以下 ML 弾力性)も f( )β 上の積分として表現できる。選択肢 j の第 k 属性が 1%変化した時、選択肢 i の選択確率の変化率は ( ) ( )[ ] ( ) knj ni ni x k nj ni L E L f P d β β β = −

∫

β β (3.25) と書ける(Train 2003 p.145 参照)。ML 弾力性は選択肢毎に異なり、もはや交叉弾力性一定条件は成立しない。 3.4.1(＊) シミュレーション 本項では ML モデルの推定法について解説する。ML 選択確率は閉鎖形式ではないので、推定にはシミュレーションを用いる必要がある。θをパラメータ密度関数の平均や分散を表すパラメータとし、パラメータ密度関数を f(β θ とする。ML 選択確率| ) はθの値に対するシミュレーションを通じて計算される。具体的な計算方法は次の通りである(Train 2003 p.148 参照)。 z f(β θ から β を R 回抽出する(| ) βr,r=1...R)。 z βr_毎に ( ) L_ni β を計算する。 z L_ni( )β の平均値 1 1 ˆ R ₍ _r ni _r ni P L ) R = β =

∑

を求める。シミュレーション選択確率は ML 選択確率の不偏推定量であり、抽出回数 R が増えるほど分散は減少する。シミュレーション対数尤度(simulated log likelihood SLL)関

数は である。ここで選択者 n が選択肢 j を選ぶとき 、それ以外

の時 0 とする。最大シミュレーション尤度(maximum simulated likelihood MSL)推定値は SLL を最大化するような ˆ ni P 1 1 ˆ ln N J nj ni n= j= d P

∑ ∑

d_nj =1 β である。シミュレーションで用いられる抽出方法であるが、ランダム・ドロー法とハルトン・シークエンス法が代表的である。 z ランダム・ドロー(random draw)法正規分布や一様分布から変数を抽出する方法(Train 2003 p.208 参照)。推定量の計算が簡単なため最も良く利用される。しかしランダム・ドロー法ではカバーする範囲が偏る危険性と変数が互いに独立なために多くのドロー回数が必要になるという欠点がある。5 選択肢、10 選択肢、1000 サンプル程度の標準的問題では 100 回程度の抽出回数が必要とされる(Louviere et al. 2000 参照)。 z ハルトン・シークエンス法

(16)

一連のドローが負の相関を持つような素数を用いたアルゴリズム(Train 2003 p.224 参照)。素数 3 を例にとると、先ず 0-1 区間を 1/3 と 2/3 で分割し、それらの区間を 1/9、4/9、7/9、さらに 2/9、5/9、8/9 と一定の間隔で細かく分割していく。ハルトン・シークエンス法の方がランダム・ドロー法よりも広い範囲を効率的にカバーできる。 100 回抽出ハルトン・シークエンスを用いたMSLの方が 1000 回抽出ランダム・ドロー法を用いたMSLよりも推定結果が優れることもある(Bhat 2001 参照)18_。 3.4.2 ML モデルの例示 本項では ML モデルの推定結果のイメージを例示する。数字はすべて説明のための「便宜的」なものである。選択肢を ADSL、CATV インターネットと FTTH の三つ、説明変数を価格と通信速度の二つとする。 ML モデルでは変数をランダムと見なす。重要なのはどの変数をランダムとし、どの変数を非ランダムにするかである。この問題は分析者の問題意識に依存する。ここでは二つの変数をランダムであるとみなし、MSL 法を用いる。 z ADSL と CATV インターネットが共通の定数項を持ち、それが正規分布に従うと仮定する。この結果 ADSL と CATV インターネットの間に NL モデル同様の相関が生れ、柔軟な代替性パターンが表現される。交叉弾力性も選択肢間で異なる。 z 通信速度パラメータが正規分布に従うと仮定する。この結果通信速度に関する嗜好多様性がサンプル別に表現できる。サンプル毎のWTPを計算することもできる 19_。推定結果が表 3.3(b)に掲載されている。説明変数がランダム・パラメータと非ランダム・パラメータに分かれ、ランダム・パラメータは平均値と標準偏差が報告されている。この分布が嗜好多様性を表す。ADSL・CATVインターネット定数項は平均 1、標準誤差 0.7 を持つ正規分布である。従って 8%のサンプルが負の係数を持ち、92%のサンプルが正の係数を持つと予想できる。同様に通信速度パラメータは平均 0.02、標準誤差 0.015 を持つ正規分布である。従って 5%のサンプルが負の係数を持ち、95%のサンプルが正の係数を持つと予想される20_。 18 しかしハルトン・シークエンスには二つの問題がある。一つはまれに例外(anomaly) が発生すること、もう一つは高次元を伴うシミュレーションではハルトン・ドローの変数が高度に相関することである。従ってハルトン・シークエンスにはさらなる研究が必要とされている(詳細はTrain 2003 参照)。 19 価格パラメータもランダムと仮定できるが、WTPは通信速度パラメータの価格パラメータに対する比率であるから、両方のパラメータをランダムにすると数値の解釈が難しくなる。 20 速度パラメータが負であるサンプルが存在するというのは直感に反する。速度パラ

(17)

ML 弾力性が表 3.3(c)に掲載されている。ML モデルでは柔軟な代替性パターンが表現可能であり、ここでは ADSL と CATV インターネットがランダムに分布する共通定数項を持つと仮定しているので、ADSL と CATV インターネットが入れ子になっているように交叉弾力性が選択肢間で異なる。＜表 3.3 挿入＞ 3.4.3(＊＊) プロビット・モデル 本項ではMLモデル同様にCLモデルの全ての制約を緩和する多項プロビット (multinomial probit MNP) ・モデルを紹介しよう21。効用関数の誤差項ベクトル 1, , n n nj ε =<ε _L ε >が平均ゼロ、共分散行列Ωを持つJ次元正規分布と仮定すると、密度関数は 1 1 ' 2 / 2 1/ 2 1 ( ) (2 ) | | n n J e n ε ε φ ε π − − Ω = Ω (3.26) で与えられる。この時 MNP モデルの選択確率(以下 MNP 選択確率)は ( ) ni ni ni nj nj n n P =

∫

I V +ε >V +ε φ ε( )dε (3.27) と書ける(Train 2003 pp.101-102 参照)。MNP選択確率は閉鎖形式とならず、(J-1)次元の積分が残るので、推定には計算負荷の高いシミュレーションが必要になる。MNPモデルは全ての変数がランダムかつ変数間の相関も許容するMLモデルと形式的に一致するので、分析者の目的に応じて使い分けが可能である(Louviere et al. 2000 pp.199-204 参照)22。 3.5 RP データと SP データ ここまで実際に離散選択分析で用いるデータについては説明してこなかった。本節メータは全てのサンプルで正の符号を持つと考えるならば、対数正規分布を仮定すべきであろう。 21 二項プロビット・モデルはThurstone (1927)によって提唱された。近年の選択分析におけるMNPの発展はHausman and Wise (1978)、Daganzo (1979)などに負う。重要な先行研究としてはBen-Akiva and Bolduc (1996), Revelt and Train (1998), Bhat (1997a), McFadden and Train (1996), Brownstone, Bunch and Train (1998)が挙げられる。

22

MLモデルで変数間の相関を許すには、推定時にコレツキ(Cholesky)行列を制約し ないようにする。コレツキ行列Lとは、行列AをA=LL’のように分解する行列である。

(18)

では 2 種類のデータについて解説する(Louviere et al. 2000 Ch.8,9; Train 2003 Ch.7; Hensher et al. 2005 Ch.4.6 参照)。一つは顕示選好(revealed preference RP)データと呼ばれ、実際の市場で観察される選択に基づく。もう一つは表明選好(stated preference SP)データと呼ばれ、仮想的な実験で観察される選択に基づく。先ず RP データから説明する。RP データは分析者の市場観察にせよ、選択者のアンケート回答にせよ、現実の選択に基づくデータである。従って現実の制約条件を反映し、実際に選択されたという点で高い信頼性を持つ。RUT に従えば RP データは現在の制約条件下での効用最大化行動を表すと考えられるので、RP データに基づく推定結果は短期予測に適している。他方で RP データの長所は同時に短所でもある。RP データは既存のサービスや技術に関する選好を表すので、仮想的なサービスや技術を予測するような場面では利用できない。また一般に変数の変動が乏しく、変数間の相関が観察されるので、優れた推定結果が得られない場合も多い。 RP データの特質をまとめると次のようになる(Louviere et al. 2000 pp.23-24 参照)。 z RP データは現実の市場均衡を表現する。 z RP データは技術制約を所与として扱う。 z RP データは観察可能な選択肢のみを扱う。 z RP データは実際の制度与件や制約条件を考慮に入れている。 z RP データは現実的信頼性と妥当性を持っている。 z RP データは各時点で選択者毎に一データのみ観察可能である。 RP データが利用できれば RP データを利用することが望ましい。しかし実際には RP データが存在しないか、収集に時間と費用がかかることが多い。医療経済学・環境経済学のような分野では市場の組織化が限られているし、ブロードバンド・サービスのように技術革新が著しい新興分野では RP データがすぐに陳腐化し意味を持たなくなる。このような時に分析を諦めてしまうと、分析可能な範囲は極めて限られることになる。長らく経済学は実験のできない学問と見なされてきた。近年では事情が異なる。仮想的市場における選択を通じてデータを収集し、それを離散選択モデルで分析することができる。SP データは RP データよりも広範囲で柔軟な意思決定問題を扱うことができる。例えば現実には存在しない選択肢や属性をプロファイルに付加したり、現実の技術制約に縛られず属性レベルを変化させたりすることが可能である。従って SP データは長期予測に向いている。しかし SP データは仮想的選択実験に基づくので、選択結果が現実の制約条件を反映していないのではないかと懸念される。また選択者の回答が分析者の意向に左右されるというフレーミングの問題も指摘されている。 SP データの特質をまとめると次のようになる(Louviere et al. 2000 pp.23-24 参照)。 z SP データは仮想的な意思決定問題を扱う。 z SP データは現実には存在しないようなサービスや技術に関する選好も扱うことができる。

(19)

z SP データは製品に商標(label)がある場合もない場合も処理できる。 z SP データは制度与件や制約条件を十分に考慮していない危険性がある。 z SP データの信頼性は選択者が意思選択の構造、分析者の意図をどの程度理解しているかに依存する。 z SP データは一時点で選択者毎に複数の回答を集めることができる。重要な点は RP データと SP データを比較してどちらが良いか悪いかを議論しているのではないことだ。RP データと SP データはそれぞれ互いの弱点を補う利用が可能である。ことにブロードバンド・サービスのように技術革新が早く、RP データの収集が困難な場合には、SP データを積極的に利用すべき場面も出てくる。RP データと SP データを使い分け、あるいは合わせて使い、両面から分析することが重要である。 3.5.1(＊) RP データと SP データの結合 本項ではRPデータとSPデータの結合について解説する。RPデータは現実の市場での選択を反映するという強みを持つが、変数の変動が足りず、多重共線性の影響を受けやすいという弱みを持つ。他方でSPデータは変数の変動や直交性に関して柔軟な設計が可能という強みを持つが、選択結果の比率が現実の市場シェアを意味しないという弱点を持つ。そこでRPデータとSPデータを結合してしまうというのが一つの方策である23_。もしも RP データと SP データが同じ属性を持つならば、二つのデータの結合は簡単にできる。しかし両者を結合するにあたって両者のパラメータが同一であるという仮説を検定する必要がある。この RP データと SP データの結合テストは次のような手順で行われる(Louviere et al. 2000 pp.244 参照)。 z RP データと SP データそれぞれ別々に CL モデルを推定する。対応する対数尤度 関数を LL(RP)、LL(SP)とする。 z RP データと SP データをプールしたモデルを CL モデルで推定する。対応する対 数尤度関数を LL(RP+SP)とする。 z RP データと SP データのパラメータ・ベクトルをβ とし、パラメータ共通仮説 (β_RP=β_SP)のための検定統計量を−2[(LL RP( )+LL SP( ))−LL RP( +SP)]とする。この統計量は漸近的にχ2_{分布に従う。} 例えば表 3.1 の RP データ・CL モデルの対数尤度関数は LL(RP)＝-1000 である。次 節で紹介するようなコンジョイント分析を実施し、SP データ・CL モデルの対数尤度関 数が LL(SP)=-900 であったとしよう。さらに RP データと SP データを結合したプール・ 23

このような取り組みはMorikawa (1989)、Ben-Akiva and Morikawa (1990)、 Ben-Akiva, Morikawa and Shiroishi (1991)によって発展された。

(20)

データ・CL モデルの対数尤度関数が LL(RP+SP)＝-1896 であったとしよう。この時パ ラメータ共通仮説の統計量は 8 である。自由度 4 のχ2_{分布の片側 5%臨界値は 9.49} であるから、RP データ・モデルと SP データ・モデル間でパラメータが同一であるという仮説は棄却されない。従って RP データと SP データを結合することが可能である。 3.6 コンジョイント分析 前節で SP データについて解説した。本節では SP データを得るための具体的手法としてコンジョイント(conjoint)分析を解説しよう(Louviere et al. 2000 Ch.4,5,7; Hensher et al. 2005 Ch.4,5,6 参照)。コンジョイント分析とは、選択者がプロファイルを順序づけるための仮想的市場の分析である。また実験の設計(experimental design)とは、実験で用いられる属性と属性レベルの組み合わせであるプロファイル(profile)を特定化することである。実験を設計するには次のようなステップが必要である(Hensher et al. 2005 Figure 5.1 参照)。 1. 問題の決定(problem refinements) 2. 説明変数の決定(stimuli refinements) z 選択肢の特定化(alternative identification) z 属性の特定化(attributes identification)

z 属性レベルの特定化(attributes level identification) 3. 実験の設計の決定(experimental design consideration)

z 実験設計のタイプ(types of design) z モデルの特定化(model specification)

z 実験サイズの縮減(reducing experimental size) 4. 実験のデザインの生成(generate experimental design)

5. プロファイルの属性の決定(allocate attributes to design columns) z 主効果か交叉効果か(main effects vs. interactive effects) 6. 選択集合の生成(generate choice sets)

7. 選択集合のランダマイズ(randomize choice sets) 8. 質問形式の決定(construct survey instrument)

特にステップ 3 の実験設計の決定には解説が必要である。実験設計には全てのプロファイルの組み合わせを網羅する完全要素設計(full factorial design)法がある。ブロードバンド・サービスを例にとって考えよう。ここでは価格と通信速度という 2 つの属性を考える。それぞれの属性には低(L)、中(M)、高(H)という 3 レベルがあると仮定する。これらのレベルが選択肢間で共通である必要はない。ここで完全要素設計法を考えると、 [価格,通信速度]に関して 9 つのプロファイルがある。

(21)

その他実験を設計する上で考えるべきことについて触れていこう。コード(code)とは属性レベルにそれぞれ数字を対応させることである。コードには 2 つの様式がある。設計コード(design code)とは、L=0、M=1、H=2 と数字を割り振っていくやり方である。直交コード(orthogonal code)とは、全ての数字が集計してゼロとなるように L=-1、M=0、 H=1 と数字を割り振っていくやり方である。様々な取り扱い上の理由から、足してゼロとなる直交コードを用いる方が望ましい。コードの付け方を表 3.4 に例示しておく。＜表 3.4 挿入＞選択肢にラベルを貼るかどうかを決める必要がある。無ラベル実験とは、選択肢に商品ラベルが付けられてなく、ただ選択肢 1、2 とのみ表記される。ラベル実験とは、選択肢に商品ラベルが付けられていて、例えば ADSL とか FTTH と表記される。どちらを採用するかは分析者の目的によるが、パラメータの係数値に純粋な興味がある場合には無ラベル実験が、予測や市場シェアに興味がある場合にはラベル実験が望ましい。無ラベル実験とラベル実験を表 3.5 に例示しておく。＜表 3.5 挿入＞実験をデザインするにあたってプロファイルにどのように属性を割り当てるかを決定する必要もある。大きく分けて一次項と高次項の二つの効果の取扱が焦点になる。主効果(main effects)モデルとは各属性の一次項(価格、通信速度)だけを考慮に入れるモデルである。交叉効果(interaction effects)モデルとは一次項のみならず複数の属性を交叉させた項(価格＊通信速度)も考慮に入れるモデルである。交叉効果を入れれば属性の非線形な影響も分析できるが、説明された変動部分の 70-90%が主効果だけで説明され、交差項の説明する部分は僅かに過ぎないという指摘もある(Dawes and Corrigan 1974 参照)。 3.6.1(＊) 直交性 本項ではプロファイルの数を減らし、コンパクトな実験設計を解説する。多くの実験で 32 以上のプロファイルを処理することに成功しているとされる(Carson et al. 1994 参照)。しかし属性や属性レベルの数が増えれば、完全要素設計法に基づくプロファイル数は膨大になる。 例えばLを属性レベル数、Mを選択肢数、Aを属性数とすると、完全要素設計法が要 求するプロファイル数はラベル実験の場合LMA_{、無ラベル実験の場合L}A_{になる。先ほ} どのブロードバンド・サービスの例では、選択肢数が 2、属性数が 2、属性レベル数が 3

(22)

であるから、プロファイル数はラベル実験の場合 32*2 =81、無ラベル実験の場合 32=9 になる。単純な意思決定問題でも、ラベル実験の場合かなり大がかりな設計が必要なことが判る。完全要素設計法が要求するプロファイルのサイズを縮減するためには、プロファイルの一部だけを効率的に用いる必要がある。そのための基準として直交性 (orthogonality)を利用する。直交性とは変数が互いに独立ということである。直交性が満たされないと、推定量の効率性が失われ、バイアスが発生する。直交要素設計 (orthogonal factorial design)法とは属性間の相関がゼロという性質を維持しながら、プロファイル数を節約する方法である。現在はSPSSなどのソフトを利用して直交要素設計法に基づき、直交性を保ったプロファイルを作成できる (Hensher et al. 2005 pp.112-116 参照)。 3.6.2(＊) 自由度 本項では自由度を解説する。実験設計に必要な自由度はサンプル数から推定パラメータ数を引いた数である。2 選択肢、2 属性のブロードバンド・サービスの例で言えば、 (選択肢固有)パラメータは 4 である。実際に推定するにはもう一つ自由度が必要になるから、少なくとも 5 の自由度が必要である。こうして主効果モデルに必要な自由度は、 ラベル実験の場合 MA+1、無ラベル実験の場合 A+1 となる。 3.7 要約 本章で得られた結論を要約すると次のようになる。 z 近年ミクロ計量経済学の分野ではランダム効用理論に基礎を置く離散選択分析の発展が著しく、消費者行動分析などに広く使われている。 z 最も基本的な離散選択モデルは CL モデルである。CL 選択確率は簡単なロジット形式で表されるので、簡単に計算できる。しかし CL モデルには IID 条件が課されているので、IIA 仮定が派生する。そのため交叉弾力性が一定など分析上の不便もある。 z IID 条件を部分的に緩和したのが NL モデルである。NL モデルは選択肢間の類似性に従って選択肢を入れ子でグループ化する。NL モデルでは入れ子が異なる選択肢間の交叉弾力性が一定ではなくなる。 z IID 条件を完全に緩和したのが ML モデルである。ML モデルはパラメータがランダムに分布することを許容し、柔軟な需要代替性パターンも記述できる。ML モデルの推定にはシミュレーションが用いられるので、その精度を高めることが今後の課題である。 z 離散選択モデルで利用されるデータには RP と SP がある。RP は現実の均衡を反

(23)

映するが、柔軟性に乏しい。逆に SP データは柔軟性に富むが、仮想性という弱点も持つ。RP と SP を結合するなど、両者の長所を補完する利用法が重要である。 z SP データの採集にはコンジョイント分析を用いることが可能である。コンジョイント分析は仮想市場における離散選択からデータを得るので、柔軟かつ信頼性の高いデータを集めることができる。特にデザイン設計を単純化するための直交計画法などの有用性が高い。以上説明したように、離散選択モデルは実用性の高い経済学のフロンティアの一つである。本書はそうした分析を駆使して、日本のブロードバンドを研究していく。

(24)

表3.1：CL推定結果例示

(a)記述統計選択者選択比率価格平均速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b)推定結果観察数 1000 -1000.0 -1500.0 0.3333 変数推定値標準誤差ｔ値 ADSL定数項 1.5000 0.5000 3.0000 FTTH定数項 0.2000 0.4000 0.5000 価格 -0.0008 0.0003 -2.6667 速度 0.0200 0.0100 2.0000 (c)価格弾力性 ADSL CATV FTTH ADSL -0.9600 1.4400 1.4400 CATV 0.6400 -2.5600 0.6400 FTTH 0.8000 0.8000 -3.2000 (d)通信速度WTP \25 /1Mbps 価格選択確率 (0) LL

ρ

( ) LL β

(25)

表3.2：NL推定結果例示

(a)記述統計選択者選択比率価格平均速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b)推定結果観察数 1000 -900 -1500 0.4000 変数推定値標準誤差ｔ値 ADSL定数項 1.0000 0.3000 3.3333 FTTH定数項 0.4000 0.4000 1.0000 価格 -0.0009 0.0003 -3.0000 速度 0.0250 0.0100 2.5000 IVパラメータ 0.7500 0.2500 3.0000 (c)価格弾力性選択確率 ADSL CATV FTTH 価格 ADSL -0.9113 2.2950 1.6200 CATV 1.0200 -2.2050 0.7200 FTTH 0.9000 0.9000 -3.6000 (d)通信速度WTP \28 /1Mbps ( ) LL

β

(0) LL

ρ

(26)

表3.3：NL推定結果例示

(a)記述統計選択者選択比率価格平均速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b)推定結果観察数 1000 -850 -1500 0.4333 変数推定値標準誤差ｔ値ランダム・パラメータ(平均値) 定数項 1.0000 0.3000 3.3333 速度 0.0200 0.0100 2.0000 ランダム・パラメータ(標準誤差) 定数項 0.7000 0.2500 2.8000 速度 0.0150 0.0050 3.0000 非ランダム・パラメータ価格 -0.0008 0.0003 -2.6667 (c)価格弾力性選択確率 ADSL CATV FTTH 価格 ADSL -0.9600 1.6400 1.2400 CATV 0.8400 -2.5600 0.4400 FTTH 1.0000 0.6000 -3.2000 (d)通信速度WTP \25 /1Mbps ( ) LL

β

(0) LL

ρ

(27)

表3.4：完全要素設計とコード様式価格速度価格速度価格速度 1 L L 0 0 -1 -1 2 L M 0 1 -1 0 3 L H 0 2 -1 1 4 M L 1 0 0 -1 5 M M 1 1 0 0 6 M H 1 2 0 1 7 H L 2 0 1 -1 8 H M 2 1 1 0 9 H H 2 2 1 1 プロファイル属性レベル設計コード直交コード

(28)

表3.5：無ラベル実験vs.ラベル実験価格速度価格速度プロファイル \3,000 12Mbps \5,000 100Mbps 価格速度価格速度プロファイル \3,000 12Mbps \5,000 100Mbps ADSL FTTH 無ラベル実験ラベル実験選択肢1 選択肢2

第3章 離散選択分析