『ブロードバンド・ビッグバンの経済学』 京都大学大学院経済学研究科 依田高典 V.1.1 10/25/2005
第 3 章 離散選択分析
本章では本書で用いられる離散選択分析の必要最低限の基本を初心者にも判りや すく紹介する。ここでは離散選択分析を次の項目に分けて解説する。 z ランダム効用理論 z 条件付ロジット・モデル z 入れ子ロジット・モデル z ミックスド・ロジット・モデル z 顕示選好データと表明選好データ z コンジョイント分析 こうしたトピックの研究は 1920 年代に始まり、1970 年代に大きく花開き、2000 年には マクファデン(D.McFadden)教授とヘックマン(J.Heckman)教授がノーベル経済学賞を 受賞した。コンピューターとシミュレーションの発達により今なお技術革新が進行中で、 一昔前では不可能だった分析も可能になっている経済学のフロンティアの一つである。 従ってそのような研究の最先端を初心者にも判りやすく紹介することは困難であるが、 幸いなことに近年優れた三冊の教科書z J.J. Louviere, D.A. Hensher, and J. Swait (2000) Stated Choice Methods, Cambridge University Press.
z K. Train (2003) Discrete Choice Methods with Simulation, Cambridge University Press.
z D.A. Hensher, J.M. Rose, and W.H. Greene (2005) Applied Choice Analysis, Cambridge University Press.
が相次いで出版され、離散選択分析の基本から発展まで網羅している。しかしながら 三著とも大変な力作であり、初学者にとっては一冊を読み通すだけでも大変であろう。 そこで本章は離散選択分析のエッセンスを判りやすくまとめる形で、必要最低限の内 容が判るように工夫している。 計量経済分析の推定結果を解釈するだけなら、必ずしも高度な数学的知識は必要 なく、数式にはその都度言葉による説明も付けているので、そこを拾い読みするだけ でも良い。また初学者は星印(*)の付いている項は省略して差し支えない1。 1 *の数は難易度を表す。*は詳細は除いて一読することを勧める。**は省略して も差し支えない。
3.1 ランダム効用理論(RUT)
本節では離散選択分析の基礎になるランダム効用理論を解説する(Louviere et al. 2000 Ch.3; Train 2003 Ch.2; Hensher et al. 2005 Ch.3 参照)。そもそも離散的選択とは 何かから説明を始めよう。 z 離散的選択(discrete choice):選択集合の中から一つの選択肢を選ぶこと。 z 選択集合(choice set):選択者が選択をする選択肢の集合のこと。 従って離散選択モデルとは、選択肢の様々な属性に応じて選択者が選択集合の中 からどの選択肢を選ぶかという行動に関する分析である。選択集合は次のような特徴 を持たなければならない。 z 選択肢は互いに排他的(mutually exclusive)である。 z 選択集合は網羅的(exhaustive)である。 z 選択肢の数は有限(definite)である。 例えばブロードバンド・インターネット接続サービスを考えよう。第 1 章でも見たとおり、 日本の代表的なブロードバンド・サービスは、ADSL、CATVインターネット、そして FTTHである。ここで選択肢集合をADSL、CATVインターネット、FTTHと定義し、選択 者はその中からただ一つの選択肢を選ぶ。実際にはあるユーザーは自宅でADSLと CATVインターネットを併用しているかもしれないが、ここではそのような可能性は考え ない2。またあるユーザーはここで想定された選択集合に含まれていない選択肢、例え ば無線LANを用いているかもしれないが、そのような可能性も考えない。 選 択 者 が 選 択 肢 か ら 得 る 満 足 の こ と を 効 用 (utility)と呼ぶ。ランダム効用理論 (random utility theory RUT)では、効用を二つの項に分ける3。
z 分析者が観察可能な代表的効用(representative utility)。 z 分析者が観察不可能な誤差項(random component)。 RUT では選択者 n が選択肢 i を選ぶ確率を、選択集合の全ての選択肢に対して選 択肢 j と i の誤差項の差が選択肢 i と j の代表的効用の差よりも小さい確率と考える。 選択者 n が J 選択肢の中から一つ選ぶ。 選択者 n が選択肢 j から得る効用を と書く。選択者 n が選択肢 i を選ぶ必要十分条件は、選択肢 i から得る効 用が選択肢 j から得る効用よりも大きいこと( )である。研究者が観察でき , 1... nj U j= J , ni nj U >U i≠ j 2 そのような可能性を考える場合、ADSLとCATVインターネットを併用することを一つ の独立した選択肢として扱う。 3 RUTは心理学の文脈ではThurstone (1927)、経済学の文脈ではMarshack (1960)に よって展開された。
る代表的効用は選択肢固有の属性xnjと個人特有の属性 に依存すると考え、代表 的効用を と書く。また誤差項を n s ( , ) nj nj n V =V x s ε とし、選択者の効用をnj Unj =Vnj+εnjと 書く。誤差項ベクトル εn =<εn1,...,εnJ >の結合分布関数を f(εn)と置けば、選択者 n が 選択肢 i を選ぶ選択確率は Pr( ) Pr( ) Pr( ) ( ) ( ) ni ni nj ni ni nj nj nj ni ni nj nj ni ni nj n n P U U V V V V , I V V f d j ε ε ε ε ε ε ε ε = > = + > + = − < − =
∫
− < − ≠i (3.1) と書ける(Train 2003 pp.18-19 参照)。ここでI( )は括弧の式が真であれば 1 それ以外 は 0 となる指示関数である。 以上が RUT の主要内容である。代表的効用は、しばしばパラメータに関して線形 1 K nj j k kj knj V =α +∑
= β x (3.2) と仮定される。ここでxknjは選択肢 j 固有の属性、α は選択肢固有の定数項、j β は選kj 択肢固有の係数パラメータである。もしも定数項と係数パラメータが選択肢共通である と仮定するならば、添え字 j を省略して、α 、βkと書けばよい。 3.1.1 RUT の例示 本項では RUT を例示する。選択肢を ADSL と FTTH の二つ、説明変数を価格 (PRICE)と通信速度(SPEED)の二つとする。この時 ADSL と FTTH の線形代表的効用 は 1 2 1 2ADSL ADSL ADSL ADSL ADSL ADSL
FTTH FTTH FTTH FTTH FTTH FTTH V PRICE SPEED V PRICE SPEED α β β α β β = + + = + + (3.3) と書ける。 FTTH を選ぶ確率はVFTTH +εFTTH >VADSL+εADSLとなる確率であるから、 Pr( ) FTTH FTTH FTTH ADSL ADSL P = V +ε >V +ε (3.4) と書ける。ADSL を選ぶ確率PADSLについても同様である。
3.2 条件付ロジット(CL)・モデル
本節では最も基本的な離散的選択モデルである条件付きロジット(conditional logit CL)・モデルを解説する(Louviere et al. 2000 Ch.3; Train 2003 Ch.3; Hensher et al. 2005 Ch.10,11 参照)4。
CLモデルの条件とは、誤差項が独立かつ同一に分布すること(independently and identically distributed IID)である。換言するとIID条件は、全ての選択肢の効用の誤差 項がそれぞれの選択肢の誤差項から独立であり、誤差項がそれぞれ同じ分布を持つ こ と を 意 味 す る 。 こ の IID 条 件 から 後 で 説 明 す る 無 関 係 な 選 択 肢 か らの 独 立 性 (independence of irrelevant alternative IIA)という仮定が派生する5。
CL モデルでは、誤差項ε が IID 条件に従うこと、つまり極値(extreme value EV)分nj 布に従うことを仮定する。この時ε の密度関数と分布関数はそれぞれ nj ( ) nj e nj nj f ε e ε e ε − − − = , F(εnj) e eεnj (3.5) − − = と書ける。EV 分布の差ε ε= nj −εniはロジスティック分布 ( ) /(1 ) F ε =eε +eε (3.6) に従う。従って CL モデルの選択確率(以下 CL 選択確率)は ( ) ( ) ni nj V ni nj ni ni nj V j e P I V V f d j e ε ε ε ε =
∫
− < − =∑
, ≠i (3.7) と書ける。さらに代表的効用が線形である場合、CL 選択確率は、 1 1 , K x j k kjknj K x j k kjknj ni j e P e α β α β +∑ = +∑ = =∑
j≠i (3.8) と書ける(Train 2003 pp.38-40 参照)。 3.2.1(*) IIA 条件 4 CLモデルは多項ロジット(multinomial logit MNL)・モデルと呼ばれることも多い。 5 IIA仮定からロジット・モデルを導いたのはLuce (1959)である。IIA仮定をRUTに対応 させたのはMarshak (1960)である。ロジット・モデルを極値分布に対応させたのはLuce and Suppes (1965)である。そしてロジット・モデルを完成させたのがMcFadden (1974)で ある。本項では CL モデルにおける IIA 条件と検定方法について解説する(Hausman and McFadden 1984 参照)。IIA 条件とは、選択確率の比率が選択集合の他の選択肢の有 無にかかわらず一定であることを意味する。正確に言えば IIA 条件は / / nj ni ni ni nk nj nk nk V V V j V V ni V V V nk j e e P e e P e e e − =
∑
= =∑
(3.9) として表される。つまり選択肢 i と k の選択確率の比が選択肢 i と k 以外の選択肢に全 く依存しない。後に見るように IIA 条件は交叉弾力性が一定という仮定も意味する。 IIA 条件が成立しているかどうかをテストするにはハウスマン・テスト(Hausman test)を 用いる。ハウスマン・テストは、IIA 条件が成立すれば、選択肢の部分集合を用いた推 定値は選択肢の完全集合を用いた推定値から統計的有意に異ならないという性質を 利用する。 具体的にはハウスマン・テストは次のような手順で行う。 z 全ての選択肢を用いて CL モデルの推定値βuと共分散行列Vuを求める。 z 選択肢の数を落として CL モデルの推定値βrと共分散行列Vrを求める。 z ハウスマン統計量 1 [βu−βr]'[Vr−Vu] [− βu −β を求める。 r] このハウスマン統計量はカイ二乗(χ2 )分布に従うので、推定されるパラメータの数 だけの自由度を持つ片側 5%のχ2臨界値を計算し大小を比較する。ハウスマン統計 量がχ2臨界値よりも大きければ、部分集合 CL モデルの推定値と完全集合 CL モデル 推定値は統計的に異なるので、IIA 条件は成立していないことになる。もしも IIA 条件 が成立しないならば、IID 条件を緩和したモデルの採用を検討すべきである。このトピ ックは次節以降で扱う。 3.2.2(*) CL 弾力性 本項では CL モデルの弾力性(以下 CL 弾力性)について説明する。弾力性とは、あ る説明変数の 1%の変化に関する被説明変数の変化率(%)を表す。特に離散的選択 モデルでは選択確率(あるいは加入需要)の弾力性を表す(Train 2003 pp.63-64 参 照)。 弾力性には二つの概念がある。CL 自己弾力性(own-elasticity)は、選択肢 i の変数 の 1%の変化に関する選択肢 i の選択確率の変化率を表す。選択肢 i の第 k 属性に 関する選択者 n が選択肢 i を選ぶ確率Pniの弾力性は/ (1 ) / ni kni P ni ni ni x kni ni
kni kni kni
P P V E x P x x x ∂ ∂ = = − ∂ ∂ (3.10) (1 ) kixkni Pni β = − ・・・代表的効用が線形( 1 K ni k ki kni V =
∑
= β x )の場合 と書ける。 CL 交叉弾力性(cross-elasticity)は、選択肢 j の変数の 1%の変化に関する選択肢 i の選択確率の変化率を表す。選択肢 j の第 k 属性に関する選択者 n が選択肢 i を選 ぶ確率Pniの弾力性は / / ni knj nj P ni ni x knj nj knj knj knj V P P E x P x x x ∂ ∂ = = − ∂ ∂ (3.11) kjx Pknj nj β = − ・・・代表的効用が線形( 1 K nj k kj knj V =∑
= β x )の場合 と書ける。CL 交叉弾力性は選択肢 j だけに依存し選択肢 i に依存していない。従って 選択肢 j の属性に関する CL 交叉弾力性は j を除いた選択肢 i で一定となる。この交 叉弾力性一定条件は CL モデルの IID 条件の帰結であり、IIA 条件の異なる表現でも ある。 3.2.3(*) 最尤推定法(MLE)本項では CL モデルの最尤推定法(maximum likelihood estimation MLE)について 説明する。MLE とは、データを確率的に最も良く説明する推定値を見つける方法であ り、次のような考え方に基付く(Louviere et al. 2000 p.43 参照)。 z RUT では選択者 n が選択肢 j を選ぶ必要十分条件は、選択肢 j の効用 が選 択肢 i の効用U よりも大きいことである。 Unj ni z CL 選択確率を利用して、選択肢 j の効用U が選択肢 i の効用U よりも大きい確 率を全ての選択者に関して計算する。 nj ni 簡単に MLE を解説しよう。選択者 n が選択肢 j を選択する確率は と書ける。 ここで は選択者 n が選択肢 j を選ぶ時に 1、そうでない時に 0 となる指示関数で ある。N 人の選択者が選択肢 j を選ぶ確率を尤度関数(likelihood function)と呼び、 ( )Inj j Pnj Π 1 nj I =
( ) ( ) ,Inj 1... , 1... n j nj L β = Π Π P n= N j= J (3.12) と書く。ここでβ はパラメータ・ベクトルである。尤度関数の対数を対数尤度関数 (log-likelihood function)と呼び、 ( ) n j njln nj, 1... , 1... LL β = Σ Σ I P n= N j= J (3.13) と書く。対数尤度関数をパラメータで微分し、最大化の一次条件 ( ) / 0 dLL β dβ = (3.14) を満たすようなパラメータを見つければよい(Train 2003 pp.64-65 参照)。 3.2.4(*) 適合度(ρ ) 本項では離散選択モデルの適合度であるマクファデンのρ について解説する。 ρ (擬似R2とも呼ばれる)とは、離散選択モデルがどの程度データの変動をうまく説明 するかを表す指標である。 離散選択モデルは MLE を用いて推定されるので、対数尤度関数がモデル適合度 の指標になる。LL( )β を推定されたパラメータにおける対数尤度関数の値、LL(0)を 全てのパラメータをゼロとおいた対数尤度関数の値とし、 ( ) 1 (0) LL LL β ρ= − (3.15) と書く。ρ は 0-1 区間内の値をとり、 ρ が大きいほど適合度が高い。従って ρ の大小を 通じて同じデータ、同じ選択集合を持つ複数のモデルの適合度を比較することもでき る。しかしρ は最小二乗法の決定係数とは直接比較できず、数値がかなり低めにでる ことに注意しよう。離散選択モデルでは 0.2 のρ でも十分に高い適合度を表す6。 3.2.5 CL モデルの例示 本項では CL モデルの推定結果のイメージを例示しよう。数字はすべて説明のため の「便宜的」なものである。選択肢を ADSL、CATV インターネットと FTTH の三つ、説 明変数を価格と通信速度の二つとする。 記述統計を表 3.1(a)のように表す。そこには選択肢毎に選択者数、選択比率、価格 平均値、通信速度平均値が記載されている。IIA 条件を確認しよう。現在 ADSL、 6 MLEのρと最小二乗法の 2 R の間ではおおよそ ρ[ 0.1, 0.2, 0.3, 0.4, 0.5]= 2 R [0.3, 0.5, 0.6, 0.8, 0.9]
CATV インターネット、FTTH の選択比率は 3:1:1 である。CATV インターネットが利用 できない場合、ADSL、FTTH の選択比率は 3:1 で保存され、選択比率は 75%、25% になる。 <表 3.1 挿入> 推定結果を表 3.1(b)のように表す。そこには観察数、LL( )β 、LL(0)、ρ が記載され ている。離散選択モデルにおいてρ =0.33 というのは、最小二乗法の 2 R でいうと 0.6 以 上にあたるので、モデルの適合度はかなり高い。次に変数、推定値、標準誤差、t 値が 記載されている。変数は(基準化のために)CATV インターネットを除いた ADSL、 FTTH の選択肢固有の定数項、価格と通信速度の選択肢共通のパラメータである。推 定値の符号を見ると、価格の推定値の符号は負、通信速度の推定値の符号は正であ ると期待されるが、確かに符号条件は満たされている。MLE 推定値は漸近的に t テス トの性質を満たす。推定値の標準誤差に対する比率が t 値である。t 値は変数の推定 値が統計的有意にゼロから異なるかどうかを表す。絶対値で見て t 値が 1.96 よりも大き ければ、変数の推定値は 5%水準で統計的に有意である。それぞれの変数の t 値を見 てみると、ADSL 定数項、価格、通信速度は統計的に有意な変数であるが、FTTH 定 数項は統計的に非有意な変数である。価格や速度の推定値を用いて弾力性や支払 意思額(willingness to pay WTP)を計算する際には推定値の有意性が必要である。こ の点でこの推定結果は良好である。 価格に関する需要の弾力性を表 3.1(c)のように表す。列は変化する価格の変数名 を表し、行は変化する選択確率の変数名を表す。対角線上の数値は自己弾力性を表 す。弾力性は通常絶対値で表示するが、自己弾力性と交叉弾力性が混同されないよ うに、負のままにしている。ADSL 自己弾力性は-0.96 なのに対して、CATV インターネ ット自己弾力性は-2.56、FTTH 自己弾力性は-3.2 である。1より小さな弾力性を非弾力 的、1 より大きな弾力性を弾力的と呼ぶので、ADSL 自己弾力性は非弾力的、CATV イ ンターネット、FTTH 自己弾力性は弾力的である。一行目に注目すると、ADSL 価格に 関する CATV インターネット、FTTH 選択確率の交叉弾力性はそれぞれ 1.44 である。 交叉弾力性一定条件は CL モデルの IID 条件の帰結である。同様の交叉弾力性一定 条件は二行目、三行目でも確認できる。 最後に WTP を表 3.1(d)のように表す。ここでは代表的効用が線形であることを仮定 しているので、パラメータ比率がいわゆる限界代替率を表し、通信速度パラメータを価 格パラメータで除した比率の絶対値が 1Mbps あたりの金銭的価値を表す。従って 1Mbps あたりの WTP は 0.02/0.0008=25 円となる。 3.2.6 CL モデルの限界
CL モデルは誤差項に IID 条件を課し、その結果 IIA が導出される。実際の無数の 選択肢候補の中からある特定の選択肢だけを抽出し選択集合を定義することはやむ を得ない単純化である。この時 IID 条件が成り立てば、推定結果の統計学的な諸問題 を無視して分析できる。しかし CL モデルは次のような制約を持っている。 z 嗜好多様性(taste variation):CL モデルは個人の嗜好の多様性を取り扱えない。 z 代替性パターン(substitution pattern):CL モデルは柔軟な選択肢間代替性パター ンを表現できない。 z 系列相関(serial correlation):CL モデルは時系列上の相関を取り扱えない。 そこで CL モデルの IID 条件の部分的緩和、さらには完全緩和が研究されてきた。 第二の制約を緩和したのが次節で解説される入れ子ロジット・モデルに代表される一 般化極値モデルであり、全ての制約を緩和したのが次々節で解説されるミックスド・ロ ジット・モデルやプロビット・モデルである(Train 2003 p.46 参照)。 3.3 入れ子ロジット(NL)・モデル 本節ではCLモデルの代替性パターン制約を緩和した入れ子ロジット(nested logit NL)・モデルを解説する(Louviere et al. 2000 Ch.6; Train 2003 Ch.4; Hensher et al. 2005 Ch.13,14 参照)7。 入れ子とは、階層的意思決定、互いに排他的な選択集合の部分集合という意味で ある8。NLモデルでは、異なる入れ子の選択肢に比べて、同じ入れ子内の選択肢が互 いに近似した誤差項を持つ。従ってNLモデルでは入れ子内ではIID条件が課される が、入れ子間ではIID条件が緩和されているので、CLモデルよりも柔軟な代替性パタ ーンを表現できる。つまりIIA条件は入れ子内では成立するが、入れ子間では成立し ない。NLモデルの性質を無関係な入れ子からの独立性(independence of irrelevant nests IIN)と呼ぶことがある。NLモデルでは入れ子毎に包括値(inclusive value IV)パラ メータと呼ばれる変数を加えて推定する。
インターネット接続サービスを考えると、ダイアルアップ、ISDN、ADSL、CATVインタ ーネット、FTTHなどの選択肢がある。この中で最も通信速度に優れるFTTHと最も通
7
CLモデルのIID条件を緩和したモデルを一般化極値(generalized extreme value GEV)モデルと呼ぶ。GEVモデルでは誤差項がEV分布することを仮定しながら、選択 肢間で相関することを許している。NLモデルは最もよく使われるGEVモデルである。 8 NLモデルは選択肢間の誤差項の相関にかかわる選択集合の分割を扱うので、正し くは逐次的意思決定ではなく、あくまで同時的意思決定なのであるが、理解のしやす さのために逐次的意思決定のイメージを用いている。
信速度に劣るダイアルアップの代替性パターン(交叉弾力性)と、FTTHとADSLの代替 性パターン(交叉弾力性)が同じと考えることは不自然である。例えばダイアルアップ、 ISDNを一つの入れ子と考え、ナローバンド・カテゴリーとしよう。ADSL、CATVインター ネット、FTTHを別の入れ子と考え、ブロードバンド・カテゴリーとする。選択者が第一段 階でナローバンドかブロードバンドを選択し、第二段階で選択された入れ子の中から 個別の選択肢を選択する。さらにブロードバンド・カテゴリーはADSL、CATVインター ネットの低速度ブロードバンド・カテゴリーとFTTHの高速度ブロードバンド・カテゴリー とに分割されるかもしれない。以上がNLモデルの骨子である9。 それではNLモデルを解説しよう10。選択肢jの集合をK個の入れ子に分割し、 1, , K B L B で表す。NLモデルの誤差項ベクトルをεnj =<εn1,...,εnJ > K = とすれば、その累 積分布は / ( ) ( ) , 1... nj k k k j Bke nj F e k ε λ λ ε = −∑ ∑∈ − (3.16) と書ける。ここで k λ は入れ子kのスケール・パラメータと呼ばれ、ε εnj, nm∈Bkの場合εnj とεnmの相関度の指標になる。λkが高ければそれらの相関度は低い。上位レベルのス ケール・パラメータの下位レベルのスケール・パラメータに対する比率をIVパラメータと いう11。少なくとも一つのスケール・パラメータは 1 に基準化される必要がある。上位レ ベルのスケール・パラメータと下位レベルのスケール・パラメータのどちらを基準化する かでNLモデルのランダム効用(RU)は 2 つのタイプに分けられる(Louviere et al. 2000 pp.165-167 参照)。
z ランダム効用モデル・タイプ 1(RU1):下位レベルのスケール・パラメータを基準化 する。
z ランダム効用モデル・タイプ 2(RU2):上位レベルのスケール・パラメータを基準化 する。
RU1 と RU2 のどちらのモデルを採用するかは分析者に委ねられるが、RU2 推定値 9 実際には入れ子構造の決定は難しい問題である(Cameron 1982 参照)。そこでNLモ デルではモデルの選択が重要な問題となる。大まかな基準としては、(1)直感的な選択、 (2)IVパラメータが持つ入れ子内の選択肢の相関度、(3)モデルの対数尤度関数の比 較などが提案されている(Louviere et al. 2000 参照)。 10
NLモデルの選択確率はDaly and Zachary (1978)、McFadden (1978)、Williams (1977)によってほぼ同時に証明された。
11
は高次レベルを含んだ複雑なモデルでも RUT と整合的であることから、RU2 の方が望 ましいと言えよう(Hund 1998 参照)。 NL モデルの選択確率(以下 NL 選択確率)は / / 1 / 1 ( ) ( ) nj k ni k k k nj k l l V V j B ni K V l j B e e P e λ λ λ λ λ − ∈ = ∈ Σ = Σ Σ (3.17) と書ける(Train 2003 pp.83-84 参照)。 NL モデルの推定は CL モデル同様に最尤法を用いるが、最尤法は逐次的でも同 時的でも実行できる。もしも入れ子のレベルが 2 から 4 程度であれば、完全情報最尤 法(full information maximum likelihood FIML)と呼ばれる同時推定が一般的である。 同時推定の方が逐次的に推定するよりも効率的なパラメータ推定値を得ることができ る。 3.3.1(*) NL 選択確率の分解 本項では NL 選択確率について解説する。(3.17)式で与えられた NL 選択確率を理 解するには、入れ子選択確率と選択肢選択確率に分解することが便利である。選択 者 n が入れ子B 内の選択肢 j を選ぶ時、その代表的効用を入れ子内の選択肢共通k の属性Wnkと選択肢固有の属性Ynjに分け、効用を , nj nk nj nj k U =W +Y +ε j∈B (3.18) と書く。その時 NL 選択確率は | ni ni B nB P =P P k k (3.19) ただし / | / ni k k nj k k Y ni B Y j B e P e λ λ ∈ = Σ , 1 nk k nk k nl l nl W IV nB K W IV l e P e λ λ + + = = Σ , / ln nj k k Y nk j B IV = Σ ∈ e λ と書ける(Train 2003 pp.85-87 参照)。言葉で説明すると、 は二つの確率に分解でき る。 は選択者 n が入れ子 ni P | k ni B P B を選んだという条件のもとで選択肢 i を選ぶ確率であk り、選択肢選択確率に関してロジット形式が成立している。 は選択者 n が入れ子 k nB P k B を選ぶ確率であり、入れ子選択確率に関してロジット形式が成立している。さらに
kIVnk λ は選択者 n が入れ子B 内の選択肢を選んだ時の期待効用を表し、k IV は包括nk 値、λkは IV パラメータである。 3.3.2(*) NL 弾力性 本項では NL モデルの弾力性(以下 NL 弾力性)を解説する。NL 弾力性は選択肢が 同じ入れ子に所属するかどうかで異なる。この意味で CL モデルの交叉弾力性一定条 件は部分的に緩和される。線形効用の場合、NL 自己弾力性は | 1 [(1 ) ( 1)(1 )] , ni ni i k P x n ni B n k i k E P P βx λ = − + − − i∈B (3.20) と書ける。交叉弾力性は | 1 [ ( 1) ] , , ni nj j k P x n nj B nj k k E P P βx i j λ = − + − ∈ B (3.21) と書ける。λk ≠ の場合、CL弾力性とNL弾力性は[ ]内第二項の効果により異なる1 12。 1 k λ = の場合、CL弾力性とNL弾力性は形式的に一致する。 3.3.3 NL モデルの例示 本項では NL モデルの推定結果のイメージを例示しよう。数字はすべて説明のため の「便宜的」なものである。選択肢を ADSL、CATV インターネットと FTTH の三つ、説 明変数を価格と通信速度の二つとする。 NLモデルを適用するに先立って、IIA条件が成立しているかどうかを確認するため、 CLモデルにハウスマン・テストを行う必要がある。ADSL、CATVインターネット、FTTH の選択比率が 3:1:1 である時、CATVインターネットが削除されると、IIA条件によれば ADSL、FTTHの選択比率が 3:1 で保存される必要がある。しかし例えばCATVインタ ーネットはADSLと完全な代替性を持つ場合、ADSL、FTTHの選択比率が 4:1 となる。 このような場合ADSLとCATVインターネットを一つの入れ子と見なし、FTTHを別の入 れ子と見なすことができよう。そこでCATVインターネット選択肢を落としてCLモデルの 推定を行い、ハウスマン統計量を導出した。自由度 2 のχ2分布の片側 5%臨界値は 5.99 であるから、ハウスマン統計量がその値以上であれば、IIA条件が成立するという 12 従って同じ入れ子に所属する選択肢と異なる入れ子に所属する選択肢の間で交 叉弾力性一定条件が緩和される。
帰無仮説は棄却される13。 ハウスマン・テストで IIA 条件が棄却されれば、もはや CL モデルの採用は適当では ない。そこで第一段階で ADSL・CATV カテゴリーか FTTH を選び、第二段階で ADSL・CATV カテゴリーを選んだ場合いずれかの選好肢を選ぶという NL モデルを推 定した。表 3.2(b)の NL モデル推定結果を表 3.1(b)の CL モデル推定結果と比較する と、モデル適合度を表すρ が 0.40 に向上している。変数の推定値の符号と統計的有 意性の傾向は CL モデルとそれほど変わらないが、個々の t 値は良くなっている。変数 には IV パラメータが追加されている。IV パラメータ推定値は 0-1 区間にあり、t 値は統 計的に有意である。 表 3.2(c)のNL弾力性を見ると、交叉弾力性が入れ子の内外の選択肢間で異なり、 交叉弾力性一定条件がもはや成立していない。同じ入れ子内にある選択肢(ADSLと CATVインターネット)の交叉弾力性が入れ子外の選択肢(FTTH)の交叉弾力性よりも 高くなっている14。つまり入れ子内にある選択肢間の需要代替性の方が入れ子外にあ る選択肢間の需要代替性よりも高い。 <表 3.2 挿入> 3.3.4(**) HEV モデル 本項では最も一般的なGEVモデルである分散不均一極値分布(heteroscedastic extreme value HEV)モデルを紹介しよう。HEVモデルは全ての誤差項が可変な極値 分布に従うモデルである15。従ってHEVモデルでは全ての交叉弾力性が自由に決ま る。NLモデルがIIN仮定を持っていたのに対して、HEVモデルはIIA条件を完全に緩 和したモデルである。HEV選択確率は ( ) / / / [ ] ( VniVnj ni j ni i ni i e e ni j i ni i P e e e d ε θ ε θ ε θ / ) ε θ − − + − − − − ≠ = Π
∫
(3.22)と書ける(Train 2003 p.96 参照)。積分が閉鎖形式(closed form)になっておらず、選択 確率に積分記号がそのまま残っている。従って HEV モデルは解析的に解くことができ ず、シミュレーションを用いる必要がある。 13 ハウスマン・テストでは定数項を落として計算することがある。ここでは価格と速度を 推定パラメータとしているので、自由度は 2 である。 14 FTTH価格に関するADSLとCATVインターネット選択確率の交叉弾力性は一定で ある。これはIIN条件を表す。 15
実例としてAllenby and Ginter (1995), Bhat (1995), Hensher (1997a, 1998a, b)など参 照。
3.4 ミックスド・ロジット(ML)・モデル
本節では、CLモデルの嗜好多様性・代替性パターン・系列相関の制約を全て緩和 したミックスド・ロジット(mixed logit ML)・モデルを紹介する(Louviere et al. 2000 Ch.6; Train 2003 Ch.5,6; Hensher et al. 2005 Ch.15,16 参照)。MLモデルは誤差項に共分散 の多様性を考慮した一般性の高いモデルである。MLモデルはランダム・パラメータ (random parameter)・モデルと呼ばれることもある16。 MLモデルではパラメータβ が確率分布 f( )β に従うと仮定する。 f( )β は正規分布 や対数正規分布がよく仮定される17。パラメータβ を所与とすると、選択者nが選択肢i を選ぶ選択確率は ( ) ( ) 1 ( ) ni nj V ni J V j e L e β β β = =
∑
(3.23) とロジット形式を用いて書くことができる。パラメータβ が確率的に分布する時、ML モ デルの選択確率(以下 ML 選択確率)は f( )β 上のLni( )β の積分となる。従って ML 選 択確率は ( ) ( ) ni ni P =∫
L β f β βd (3.24) と書ける(Train 2003 p.138 参照)。 入れ子内の選択肢に 1、入れ子外の選択肢に 0 となるダミー変数を付けると、ML モ デルは NL モデルに似た階層的選択構造を表現できる。EV 誤差項の他に、誤差項 1 ' K n xnj k nkdjk μ =∑
= μ を加える。ここでdjk =1は選択肢が入れ子 k 内にある時に 1、それ 以外の時 0 となるようなダミー変数、μnkを正規分布 (0,N σk)とする。ダミー変数によっ て、分散σkは入れ子毎に決まるので、入れ子毎に選択肢の相関が異なる。さらにダミ ー変数djkを選択肢が交叉するように特定化すれば、より複雑な交叉した入れ子構造 16MLモデルの初期の実例としてTrain et al. (1987a) and Ben-Akiva et al. (1993)がある。 コンピューターによるシミュレーション手法の発達によって近年MLモデルは広く用いら れるようになり、実例はBhat (1998a), Brownstone and Train (1999)、Erden (1996)、 Revelt and Train (1998)、Bhat (2000)など多数ある。
17
対数正規分布は価格パラメータのように係数が正負いずれかの符号を持つ場合に 用いられる。
も表現できる(Ben-Akiva et al. 2001 参照)。 ML モデルの弾力性(以下 ML 弾力性)も f( )β 上の積分として表現できる。選択肢 j の第 k 属性が 1%変化した時、選択肢 i の選択確率の変化率は ( ) ( )[ ] ( ) knj ni ni x k nj ni L E L f P d β β β = −
∫
β β (3.25) と書ける(Train 2003 p.145 参照)。ML 弾力性は選択肢毎に異なり、もはや交叉弾力性 一定条件は成立しない。 3.4.1(*) シミュレーション 本項では ML モデルの推定法について解説する。ML 選択確率は閉鎖形式ではな いので、推定にはシミュレーションを用いる必要がある。θをパラメータ密度関数の平 均や分散を表すパラメータとし、パラメータ密度関数を f(β θ とする。ML 選択確率| ) はθの値に対するシミュレーションを通じて計算される。具体的な計算方法は次の通り である(Train 2003 p.148 参照)。 z f(β θ から β を R 回抽出する(| ) βr,r=1...R)。 z βr毎に ( ) Lni β を計算する。 z Lni( )β の平均値 1 1 ˆ R ( r ni r ni P L ) R = β =∑
を求める。 シミュレーション選択確率 は ML 選択確率の不偏推定量であり、抽出回数 R が増 えるほど分散は減少する。シミュレーション対数尤度(simulated log likelihood SLL)関数は である。ここで選択者 n が選択肢 j を選ぶとき 、それ以外
の時 0 とする。最大シミュレーション尤度(maximum simulated likelihood MSL)推定値 は SLL を最大化するような ˆ ni P 1 1 ˆ ln N J nj ni n= j= d P
∑ ∑
dnj =1 β である。 シミュレーションで用いられる抽出方法であるが、ランダム・ドロー法とハルトン・シー クエンス法が代表的である。 z ランダム・ドロー(random draw)法 正規分布や一様分布から変数を抽出する方法(Train 2003 p.208 参照)。推定量の 計算が簡単なため最も良く利用される。しかしランダム・ドロー法ではカバーする 範囲が偏る危険性と変数が互いに独立なために多くのドロー回数が必要になると いう欠点がある。5 選択肢、10 選択肢、1000 サンプル程度の標準的問題では 100 回程度の抽出回数が必要とされる(Louviere et al. 2000 参照)。 z ハルトン・シークエンス法一連のドローが負の相関を持つような素数を用いたアルゴリズム(Train 2003 p.224 参照)。素数 3 を例にとると、先ず 0-1 区間を 1/3 と 2/3 で分割し、それらの区間を 1/9、4/9、7/9、さらに 2/9、5/9、8/9 と一定の間隔で細かく分割していく。ハルトン・シ ークエンス法の方がランダム・ドロー法よりも広い範囲を効率的にカバーできる。 100 回抽出ハルトン・シークエンスを用いたMSLの方が 1000 回抽出ランダム・ドロ ー法を用いたMSLよりも推定結果が優れることもある(Bhat 2001 参照)18。 3.4.2 ML モデルの例示 本項では ML モデルの推定結果のイメージを例示する。数字はすべて説明のため の「便宜的」なものである。選択肢を ADSL、CATV インターネットと FTTH の三つ、説 明変数を価格と通信速度の二つとする。 ML モデルでは変数をランダムと見なす。重要なのはどの変数をランダムとし、どの 変数を非ランダムにするかである。この問題は分析者の問題意識に依存する。ここで は二つの変数をランダムであるとみなし、MSL 法を用いる。 z ADSL と CATV インターネットが共通の定数項を持ち、それが正規分布に従うと仮 定する。この結果 ADSL と CATV インターネットの間に NL モデル同様の相関が 生れ、柔軟な代替性パターンが表現される。交叉弾力性も選択肢間で異なる。 z 通信速度パラメータが正規分布に従うと仮定する。この結果通信速度に関する嗜 好多様性がサンプル別に表現できる。サンプル毎のWTPを計算することもできる 19。 推定結果が表 3.3(b)に掲載されている。説明変数がランダム・パラメータと非ランダ ム・パラメータに分かれ、ランダム・パラメータは平均値と標準偏差が報告されている。 この分布が嗜好多様性を表す。ADSL・CATVインターネット定数項は平均 1、標準誤 差 0.7 を持つ正規分布である。従って 8%のサンプルが負の係数を持ち、92%のサンプ ルが正の係数を持つと予想できる。同様に通信速度パラメータは平均 0.02、標準誤差 0.015 を持つ正規分布である。従って 5%のサンプルが負の係数を持ち、95%のサンプ ルが正の係数を持つと予想される20。 18 しかしハルトン・シークエンスには二つの問題がある。一つはまれに例外(anomaly) が発生すること、もう一つは高次元を伴うシミュレーションではハルトン・ドローの変数が 高度に相関することである。従ってハルトン・シークエンスにはさらなる研究が必要とさ れている(詳細はTrain 2003 参照)。 19 価格パラメータもランダムと仮定できるが、WTPは通信速度パラメータの価格パラメ ータに対する比率であるから、両方のパラメータをランダムにすると数値の解釈が難し くなる。 20 速度パラメータが負であるサンプルが存在するというのは直感に反する。速度パラ
ML 弾力性が表 3.3(c)に掲載されている。ML モデルでは柔軟な代替性パターンが 表現可能であり、ここでは ADSL と CATV インターネットがランダムに分布する共通定 数項を持つと仮定しているので、ADSL と CATV インターネットが入れ子になっている ように交叉弾力性が選択肢間で異なる。 <表 3.3 挿入> 3.4.3(**) プロビット・モデル 本項ではMLモデル同様にCLモデルの全ての制約を緩和する多項プロビット (multinomial probit MNP) ・ モ デ ル を 紹 介 し よ う21。 効 用 関 数 の 誤 差 項 ベ ク ト ル 1, , n n nj ε =<ε L ε >が平均ゼロ、共分散行列Ωを持つJ次元正規分布と仮定すると、密 度関数は 1 1 ' 2 / 2 1/ 2 1 ( ) (2 ) | | n n J e n ε ε φ ε π − − Ω = Ω (3.26) で与えられる。この時 MNP モデルの選択確率(以下 MNP 選択確率)は ( ) ni ni ni nj nj n n P =
∫
I V +ε >V +ε φ ε( )dε (3.27) と書ける(Train 2003 pp.101-102 参照)。MNP選択確率は閉鎖形式とならず、(J-1)次元 の積分が残るので、推定には計算負荷の高いシミュレーションが必要になる。MNPモ デルは全ての変数がランダムかつ変数間の相関も許容するMLモデルと形式的に一 致するので、分析者の目的に応じて使い分けが可能である(Louviere et al. 2000 pp.199-204 参照)22。 3.5 RP データと SP データ ここまで実際に離散選択分析で用いるデータについては説明してこなかった。本節 メータは全てのサンプルで正の符号を持つと考えるならば、対数正規分布を仮定すべ きであろう。 21 二項プロビット・モデルはThurstone (1927)によって提唱された。近年の選択分析に おけるMNPの発展はHausman and Wise (1978)、Daganzo (1979)などに負う。重要な 先行研究としてはBen-Akiva and Bolduc (1996), Revelt and Train (1998), Bhat (1997a), McFadden and Train (1996), Brownstone, Bunch and Train (1998)が挙げられる。22
MLモデルで変数間の相関を許すには、推定時にコレツキ(Cholesky)行列を制約し ないようにする。コレツキ行列Lとは、行列AをA=LL’のように分解する行列である。
では 2 種類のデータについて解説する(Louviere et al. 2000 Ch.8,9; Train 2003 Ch.7; Hensher et al. 2005 Ch.4.6 参照)。一つは顕示選好(revealed preference RP)データと呼 ばれ、実際の市場で観察される選択に基づく。もう一つは表明選好(stated preference SP)データと呼ばれ、仮想的な実験で観察される選択に基づく。 先ず RP データから説明する。RP データは分析者の市場観察にせよ、選択者のアン ケート回答にせよ、現実の選択に基づくデータである。従って現実の制約条件を反映 し、実際に選択されたという点で高い信頼性を持つ。RUT に従えば RP データは現在 の制約条件下での効用最大化行動を表すと考えられるので、RP データに基づく推定 結果は短期予測に適している。他方で RP データの長所は同時に短所でもある。RP データは既存のサービスや技術に関する選好を表すので、仮想的なサービスや技術 を予測するような場面では利用できない。また一般に変数の変動が乏しく、変数間の 相関が観察されるので、優れた推定結果が得られない場合も多い。 RP データの特質をまとめると次のようになる(Louviere et al. 2000 pp.23-24 参照)。 z RP データは現実の市場均衡を表現する。 z RP データは技術制約を所与として扱う。 z RP データは観察可能な選択肢のみを扱う。 z RP データは実際の制度与件や制約条件を考慮に入れている。 z RP データは現実的信頼性と妥当性を持っている。 z RP データは各時点で選択者毎に一データのみ観察可能である。 RP データが利用できれば RP データを利用することが望ましい。しかし実際には RP データが存在しないか、収集に時間と費用がかかることが多い。医療経済学・環境経 済学のような分野では市場の組織化が限られているし、ブロードバンド・サービスのよう に技術革新が著しい新興分野では RP データがすぐに陳腐化し意味を持たなくなる。 このような時に分析を諦めてしまうと、分析可能な範囲は極めて限られることになる。 長らく経済学は実験のできない学問と見なされてきた。近年では事情が異なる。仮想 的市場における選択を通じてデータを収集し、それを離散選択モデルで分析すること ができる。SP データは RP データよりも広範囲で柔軟な意思決定問題を扱うことができ る。例えば現実には存在しない選択肢や属性をプロファイルに付加したり、現実の技 術制約に縛られず属性レベルを変化させたりすることが可能である。従って SP データ は長期予測に向いている。しかし SP データは仮想的選択実験に基づくので、選択結 果が現実の制約条件を反映していないのではないかと懸念される。また選択者の回 答が分析者の意向に左右されるというフレーミングの問題も指摘されている。 SP データの特質をまとめると次のようになる(Louviere et al. 2000 pp.23-24 参照)。 z SP データは仮想的な意思決定問題を扱う。 z SP データは現実には存在しないようなサービスや技術に関する選好も扱うことが できる。
z SP データは製品に商標(label)がある場合もない場合も処理できる。 z SP データは制度与件や制約条件を十分に考慮していない危険性がある。 z SP データの信頼性は選択者が意思選択の構造、分析者の意図をどの程度理解 しているかに依存する。 z SP データは一時点で選択者毎に複数の回答を集めることができる。 重要な点は RP データと SP データを比較してどちらが良いか悪いかを議論している のではないことだ。RP データと SP データはそれぞれ互いの弱点を補う利用が可能で ある。ことにブロードバンド・サービスのように技術革新が早く、RP データの収集が困 難な場合には、SP データを積極的に利用すべき場面も出てくる。RP データと SP デー タを使い分け、あるいは合わせて使い、両面から分析することが重要である。 3.5.1(*) RP データと SP データの結合 本項ではRPデータとSPデータの結合について解説する。RPデータは現実の市場で の選択を反映するという強みを持つが、変数の変動が足りず、多重共線性の影響を受 けやすいという弱みを持つ。他方でSPデータは変数の変動や直交性に関して柔軟な 設計が可能という強みを持つが、選択結果の比率が現実の市場シェアを意味しないと いう弱点を持つ。そこでRPデータとSPデータを結合してしまうというのが一つの方策で ある23。 もしも RP データと SP データが同じ属性を持つならば、二つのデータの結合は簡単 にできる。しかし両者を結合するにあたって両者のパラメータが同一であるという仮説 を検定する必要がある。この RP データと SP データの結合テストは次のような手順で行 われる(Louviere et al. 2000 pp.244 参照)。 z RP データと SP データそれぞれ別々に CL モデルを推定する。対応する対数尤度 関数を LL(RP)、LL(SP)とする。 z RP データと SP データをプールしたモデルを CL モデルで推定する。対応する対 数尤度関数を LL(RP+SP)とする。 z RP データと SP データのパラメータ・ベクトルをβ とし、パラメータ共通仮説 (βRP=βSP)のための検定統計量を−2[(LL RP( )+LL SP( ))−LL RP( +SP)]とする。 この統計量は漸近的にχ2分布に従う。 例えば表 3.1 の RP データ・CL モデルの対数尤度関数は LL(RP)=-1000 である。次 節で紹介するようなコンジョイント分析を実施し、SP データ・CL モデルの対数尤度関 数が LL(SP)=-900 であったとしよう。さらに RP データと SP データを結合したプール・ 23
このような取り組みはMorikawa (1989)、Ben-Akiva and Morikawa (1990)、 Ben-Akiva, Morikawa and Shiroishi (1991)によって発展された。
データ・CL モデルの対数尤度関数が LL(RP+SP)=-1896 であったとしよう。この時パ ラメータ共通仮説の統計量は 8 である。自由度 4 のχ2分布の片側 5%臨界値は 9.49 であるから、RP データ・モデルと SP データ・モデル間でパラメータが同一であるという 仮説は棄却されない。従って RP データと SP データを結合することが可能である。 3.6 コンジョイント分析 前節で SP データについて解説した。本節では SP データを得るための具体的手法と してコンジョイント(conjoint)分析を解説しよう(Louviere et al. 2000 Ch.4,5,7; Hensher et al. 2005 Ch.4,5,6 参照)。コンジョイント分析とは、選択者がプロファイルを順序づけるた めの仮想的市場の分析である。また実験の設計(experimental design)とは、実験で用 いられる属性と属性レベルの組み合わせであるプロファイル(profile)を特定化すること である。実験を設計するには次のようなステップが必要である(Hensher et al. 2005 Figure 5.1 参照)。 1. 問題の決定(problem refinements) 2. 説明変数の決定(stimuli refinements) z 選択肢の特定化(alternative identification) z 属性の特定化(attributes identification)
z 属性レベルの特定化(attributes level identification) 3. 実験の設計の決定(experimental design consideration)
z 実験設計のタイプ(types of design) z モデルの特定化(model specification)
z 実験サイズの縮減(reducing experimental size) 4. 実験のデザインの生成(generate experimental design)
5. プロファイルの属性の決定(allocate attributes to design columns) z 主効果か交叉効果か(main effects vs. interactive effects) 6. 選択集合の生成(generate choice sets)
7. 選択集合のランダマイズ(randomize choice sets) 8. 質問形式の決定(construct survey instrument)
特にステップ 3 の実験設計の決定には解説が必要である。実験設計には全てのプロ ファイルの組み合わせを網羅する完全要素設計(full factorial design)法がある。ブロー ドバンド・サービスを例にとって考えよう。ここでは価格と通信速度という 2 つの属性を 考える。それぞれの属性には低(L)、中(M)、高(H)という 3 レベルがあると仮定する。こ れらのレベルが選択肢間で共通である必要はない。ここで完全要素設計法を考えると、 [価格,通信速度]に関して 9 つのプロファイルがある。
その他実験を設計する上で考えるべきことについて触れていこう。コード(code)とは 属性レベルにそれぞれ数字を対応させることである。コードには 2 つの様式がある。設 計コード(design code)とは、L=0、M=1、H=2 と数字を割り振っていくやり方である。直 交コード(orthogonal code)とは、全ての数字が集計してゼロとなるように L=-1、M=0、 H=1 と数字を割り振っていくやり方である。様々な取り扱い上の理由から、足してゼロと なる直交コードを用いる方が望ましい。コードの付け方を表 3.4 に例示しておく。 <表 3.4 挿入> 選択肢にラベルを貼るかどうかを決める必要がある。無ラベル実験とは、選択肢に商 品ラベルが付けられてなく、ただ選択肢 1、2 とのみ表記される。ラベル実験とは、選択 肢に商品ラベルが付けられていて、例えば ADSL とか FTTH と表記される。どちらを採 用するかは分析者の目的によるが、パラメータの係数値に純粋な興味がある場合には 無ラベル実験が、予測や市場シェアに興味がある場合にはラベル実験が望ましい。無 ラベル実験とラベル実験を表 3.5 に例示しておく。 <表 3.5 挿入> 実験をデザインするにあたってプロファイルにどのように属性を割り当てるかを決定 する必要もある。大きく分けて一次項と高次項の二つの効果の取扱が焦点になる。主 効果(main effects)モデルとは各属性の一次項(価格、通信速度)だけを考慮に入れる モデルである。交叉効果(interaction effects)モデルとは一次項のみならず複数の属性 を交叉させた項(価格*通信速度)も考慮に入れるモデルである。交叉効果を入れれ ば属性の非線形な影響も分析できるが、説明された変動部分の 70-90%が主効果だ けで説明され、交差項の説明する部分は僅かに過ぎないという指摘もある(Dawes and Corrigan 1974 参照)。 3.6.1(*) 直交性 本項ではプロファイルの数を減らし、コンパクトな実験設計を解説する。多くの実験で 32 以上のプロファイルを処理することに成功しているとされる(Carson et al. 1994 参照)。 しかし属性や属性レベルの数が増えれば、完全要素設計法に基づくプロファイル数は 膨大になる。 例えばLを属性レベル数、Mを選択肢数、Aを属性数とすると、完全要素設計法が要 求するプロファイル数はラベル実験の場合LMA、無ラベル実験の場合LAになる。先ほ どのブロードバンド・サービスの例では、選択肢数が 2、属性数が 2、属性レベル数が 3
であるから、プロファイル数はラベル実験の場合 32*2 =81、無ラベル実験の場合 32=9 に なる。単純な意思決定問題でも、ラベル実験の場合かなり大がかりな設計が必要なこ とが判る。完全要素設計法が要求するプロファイルのサイズを縮減するためには、プロ ファイルの一部だけを効率的に用いる必要がある。そのための基準として直交性 (orthogonality)を利用する。直交性とは変数が互いに独立ということである。直交性が 満たされないと、推定量の効率性が失われ、バイアスが発生する。直交要素設計 (orthogonal factorial design)法とは属性間の相関がゼロという性質を維持しながら、プ ロファイル数を節約する方法である。現在はSPSSなどのソフトを利用して直交要素設 計 法 に 基 づ き 、 直 交 性 を 保 っ た プ ロ フ ァ イ ル を 作 成 で き る (Hensher et al. 2005 pp.112-116 参照)。 3.6.2(*) 自由度 本項では自由度を解説する。実験設計に必要な自由度はサンプル数から推定パラ メータ数を引いた数である。2 選択肢、2 属性のブロードバンド・サービスの例で言えば、 (選択肢固有)パラメータは 4 である。実際に推定するにはもう一つ自由度が必要にな るから、少なくとも 5 の自由度が必要である。こうして主効果モデルに必要な自由度は、 ラベル実験の場合 MA+1、無ラベル実験の場合 A+1 となる。 3.7 要約 本章で得られた結論を要約すると次のようになる。 z 近年ミクロ計量経済学の分野ではランダム効用理論に基礎を置く離散選択分析 の発展が著しく、消費者行動分析などに広く使われている。 z 最も基本的な離散選択モデルは CL モデルである。CL 選択確率は簡単なロジッ ト形式で表されるので、簡単に計算できる。しかし CL モデルには IID 条件が課さ れているので、IIA 仮定が派生する。そのため交叉弾力性が一定など分析上の 不便もある。 z IID 条件を部分的に緩和したのが NL モデルである。NL モデルは選択肢間の類 似性に従って選択肢を入れ子でグループ化する。NL モデルでは入れ子が異な る選択肢間の交叉弾力性が一定ではなくなる。 z IID 条件を完全に緩和したのが ML モデルである。ML モデルはパラメータがラン ダムに分布することを許容し、柔軟な需要代替性パターンも記述できる。ML モデ ルの推定にはシミュレーションが用いられるので、その精度を高めることが今後の 課題である。 z 離散選択モデルで利用されるデータには RP と SP がある。RP は現実の均衡を反
映するが、柔軟性に乏しい。逆に SP データは柔軟性に富むが、仮想性という弱 点も持つ。RP と SP を結合するなど、両者の長所を補完する利用法が重要であ る。 z SP データの採集にはコンジョイント分析を用いることが可能である。コンジョイント 分析は仮想市場における離散選択からデータを得るので、柔軟かつ信頼性の高 いデータを集めることができる。特にデザイン設計を単純化するための直交計画 法などの有用性が高い。 以上説明したように、離散選択モデルは実用性の高い経済学のフロンティアの一つ である。本書はそうした分析を駆使して、日本のブロードバンドを研究していく。
表3.1:CL推定結果例示
(a)記述統計 選択者 選択比率 価格平均 速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b)推定結果 観察数 1000 -1000.0 -1500.0 0.3333 変数 推定値 標準誤差 t値 ADSL定数項 1.5000 0.5000 3.0000 FTTH定数項 0.2000 0.4000 0.5000 価格 -0.0008 0.0003 -2.6667 速度 0.0200 0.0100 2.0000 (c)価格弾力性 ADSL CATV FTTH ADSL -0.9600 1.4400 1.4400 CATV 0.6400 -2.5600 0.6400 FTTH 0.8000 0.8000 -3.2000 (d)通信速度WTP \25 /1Mbps 価格 選択確率 (0) LLρ
( ) LL β表3.2:NL推定結果例示
(a)記述統計 選択者 選択比率 価格平均 速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b)推定結果 観察数 1000 -900 -1500 0.4000 変数 推定値 標準誤差 t値 ADSL定数項 1.0000 0.3000 3.3333 FTTH定数項 0.4000 0.4000 1.0000 価格 -0.0009 0.0003 -3.0000 速度 0.0250 0.0100 2.5000 IVパラメータ 0.7500 0.2500 3.0000 (c)価格弾力性 選択確率 ADSL CATV FTTH 価格 ADSL -0.9113 2.2950 1.6200 CATV 1.0200 -2.2050 0.7200 FTTH 0.9000 0.9000 -3.6000 (d)通信速度WTP \28 /1Mbps ( ) LLβ
(0) LLρ
表3.3:NL推定結果例示
(a)記述統計 選択者 選択比率 価格平均 速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b)推定結果 観察数 1000 -850 -1500 0.4333 変数 推定値 標準誤差 t値 ランダム・パラメータ(平均値) 定数項 1.0000 0.3000 3.3333 速度 0.0200 0.0100 2.0000 ランダム・パラメータ(標準誤差) 定数項 0.7000 0.2500 2.8000 速度 0.0150 0.0050 3.0000 非ランダム・パラメータ 価格 -0.0008 0.0003 -2.6667 (c)価格弾力性 選択確率 ADSL CATV FTTH 価格 ADSL -0.9600 1.6400 1.2400 CATV 0.8400 -2.5600 0.4400 FTTH 1.0000 0.6000 -3.2000 (d)通信速度WTP \25 /1Mbps ( ) LLβ
(0) LLρ
表3.4:完全要素設計とコード様式 価格 速度 価格 速度 価格 速度 1 L L 0 0 -1 -1 2 L M 0 1 -1 0 3 L H 0 2 -1 1 4 M L 1 0 0 -1 5 M M 1 1 0 0 6 M H 1 2 0 1 7 H L 2 0 1 -1 8 H M 2 1 1 0 9 H H 2 2 1 1 プロファイル 属性レベル 設計コード 直交コード
表3.5:無ラベル実験vs.ラベル実験 価格 速度 価格 速度 プロファイル \3,000 12Mbps \5,000 100Mbps 価格 速度 価格 速度 プロファイル \3,000 12Mbps \5,000 100Mbps ADSL FTTH 無ラベル実験 ラベル実験 選択肢1 選択肢2