35
不完全情報下の為替レート変動
−ゲーム論的接近−
青木浩治
I.序
現行の変動相場制の一つの特徴は,短期に おける為替レートの浮動性(volatility)であ る。この現象を説明する代表的枠組として,
オーバーシューティング理論,ニュース理論 などがあげられるが,本稿はこれらの枠組と 異なり,短期の為替レート変動においてある 種の「意見の不一致」−より正確には「共通 知乱(commonknowledge)(1)の欠如一が果 たす役割に焦点を当てる。とくに,ファンダ メンタルズに変化がなく,また全ての市場参 加者がこのことを知っているとしても為替レ ートが変化しうることを示す。
この分析含意を確立する上で,月並みでは あるものの,Keynes(1936,Chap.12)によ る有名な美人投票の例が有効な出発点を与え ているように思われる。と・いうのも,資産市 場一般における投機の本質的側面を,その例 は巧みに捉えているからである。実際,投機 ポジションが創出される一つの環境は,他の 市場参加者による同方向への追随的ポジショ
ン変化が期待できるときである。この場合,
投機家の関心は,将来のファンダメンタルズ に照らして適切と判断される資産価格の私的
(1)ここで,ある事象Eが共通知識であるとは,「全 ての人が事象Eが生起したことを知っており,ま た,このことを全ての人が知っており,さらには,
このことを全ての人が知っていることを全ての人 が知っている……」状況を言う。より厳密な定義 については,Aumann(1976)を参照されたい。
予想を形成することにはなく,まして他の市 場参加者による代表的個人見解を推測するこ とにもない。そこは他人の予想の予想,そし てそめ予想の予想……という予想の相互連関 が支配する世界であり,真の個人的見解など さして重きをなさないのである。かくして,
投機がこうした動機に導かれ,また資産価格 形成において投機がドミナントな影響を及ぼ す市場環境では,資産価格が市場ファンダメ ンタルズと整合的でない方向へ変化しうるこ とは,ある意味では自然のことと言えよう。
このように,われわれの問題は最近脚光を 浴びつつある「投機の泡沫」(speculativebub−
bles)と密接な関連がある。しかし,現行の
「合理的」バブル理論(2)は,為替レート決定 モテつレの構造ならびにその与件集合で定義さ れるファンタ)ンタルズ(の確率分布構造)
に関して共通知識を仮定する,もしくは,た とえ当初それが欠如いているとしても,為替 レートという価格シグナルを媒介として共通 知識が確立される状況を暗黙に前提すること によって,先のケインズ的状況を予め排除し ているように思われる。また,このことを前
(2)これに対し,「非合理的」(irrational)バブルと いう考え方がある。たとえばKrugman!1985),
Frankeland Froot(1986)・を参照。とくに後者は,
ある種の不均衡理論に立脚するものであり,Wick−
Sell,Harrodを彷彿させて興味深い。しかし,理 論の枠組を異質の情報構造という前提から出発さ せているという点で,われわれのアプローチとの 類似点は多いように思われる。
36
提として認める限り,為替レートがファンダ メンタルズとは無関係な方向へ変化するとい う意味での投機の泡沫を説明する枠組は,常 に追随的投機の出現を期待できるもしくはそ の可能性を原理上排除できない無限反復ゲー ム,あるいは終りの不確実な反復ゲームに限
、(3)
定されることになろっ。前者は非確率的バブ ル (deterministic bubbles), また後者は確 率的ノ〈フボル (stochasticbubbles)としてそれ
ぞれ知られているところで、ある(4)
しかし,囚人のディレンマ・ゲームを無限 反復ゲームのコンテクストへ拡張することに よって,非協力解とともに協力解の可能性が 生じるものの,モデルから内在的に協力解の 実現メカニズムを説明することは難しい。こ のことと全く同様に,現行の合理的バブル理 論は,合理性と矛盾しない多様なバブル経路 の「存在」を示しうるけれども,バブル発生 メカニズムの説明を理論の射程外に置くこと
(5)
になるのである。こつした現状からすれば,
バブル理論は「まだ経済的要素が乏しいJ(天 野(1984,p. 7) )という見解,そのミクロ 的基礎にまで遡ってバブル解を積極的に排除 してゆこうとする試み (Farmer(1984), Obsf‑ feld and Rogo百(1983),(1986) ),また実証 面からの識別問題の提起 (Hamilton(1986) 1 ) などの形で,従来,合理的バブル理論に対し 様々の懐疑論が提起されてきたことは容易に 肯首できょう。
本稿は,合理的バブル理論の暗黙の前提か
(3) 私見によれば,これが Tirole(1982)の 主 要 含 意である。
(4) Blanchard (1979), Flood and Garber (1980),翁 (1985)を参照。
(5) この点は翁(1985)によって指摘されている。
おそらくその理由は,合理的バブル理論がunsta. ble saddle point pathの経済的解釈から出発し
ていることに求められるのではないかと考えられる。
ら離れ,より明示的に意見の一致が確立され ていない状況から出発する。そしてこの市場 環境における為替レート変動の一つの特徴的 側面を分析するであろっ。しかし,注意すべ きは,このことがただちに「合理性」仮説の 否定を意味しないことである。なぜなら,合 理的期待形成仮説そのものはいかなる情報構 造とも整合的でありうるからである。実際,
われわれはこの仮説を情報整合性という条件 によって保持するであろう。その替わり,本 稿のアプローチでは投機家全体としてのパイ
を決定するファンダメンタルズの不確実性が 重要な意味をもつことになる。やや正確さを 欠くが,プレーされているゲームがゼロサム
・タイプなのか,それともポジティヴサム・
タイプなのかの意見の不一致(6)が追随期待の 投機ポジション創出をうながし,その結果と して為替レートが変化する。そして,本稿の 分析対象はこうした環境における投機なので
ある。
以下,簡単に本稿の構成を示しておこう。
まず次節においてゲームの構造を説明し,続 く111節で「逐次均衡J(sequential equilibrium) を導出する。また,同時に若干の分析含意に も言及する。なお,これらの諸節では,共通 知識の欠知が中心的役割を果たすアカーロフ 的状況が想定されている。この設定はシンプ ルではあるものの最も基本的なものである。
実際,後に明らかにされるように,それを基 礎として様々のバリエーションが生まれる。
W節では一層複雑な状況が考察される。また,
最後のV節において残された若干の課題に触
(6) ゲームが有限でかつゼロサム・タイプであり,
また,このことが共通知識であるとき,情報の優 位性に基づく投機は発生しえない。このとき,取 引は成立せず,価格のみが変化することになろう。
詳しくはMilgromand Stokey (1982)を参照され たいo
れる。
11.ゲームの構造
1. 為替レート決定モデル
外国為替市場に焦点を絞った次のような簡 単な部分均衡モデルを考えよう。
(1) it = it + ft ‑St (2) Bt = SFt‑1
(3) Bt + (‑at+ sft) =SFt (s> 0) ここで、
自国金利 i*=外国金利
f=自国通貨建て先物為替レートの対数値 S =自国通貨建て直物為替レートの対数値 Bt=外国証券需要(価格を外国通貨で測っ
て 1に規準化) SF=先物投機需要
であり,また添字(t)は時間を表す。
(1)式は,いわゆる「カバー付き金利平価」
(covered interest parity)であり,自国証券 とカバーを付けた場合の外国証券とが完全代 替物であるという仮定を定式化したものであ る(この仮定の下では,外国証券需要Btが 受動的に決定されることになる)0(2)式は直物 為替市場の需給均衡式を意味し,金利裁定取 引からの直物需要が過去の先物投機の清算額 と等しくなったとき直物市場がクリアーされ る。また, (3)式は先物為替市場の需給均衡式 である。単純化のため利払い分を無視すれば,
金利裁定取引からの直物需要と同額の先物供 給が発生する(左辺第一項)。また,分離定理 を援用して契約ベースの貿易収支が先物レー トに依存すると特定化すれば,左辺第二項は 商業上のへッジ動機から発生するネットの先 物供給である。なお,外国証券投資および貿 易取引が全額先物でカバーきれる必然性はな
37
い。しかし,ここでは伝統的なツィアン・ゾ ーメン流のアプローチに従って,カバー付き 金利裁定およぴ商業上のへッジ動機と先物投
(7)
機とを機能的に分離する立場をとっている。
したがって,カバー付き金利裁定および貿易 取引からの先物供給が先物投機需要と見合う
とき先物為替市場の需給が均衡する。
以下では内外金利差別=if‑it, お よ び 契 約ベースの貿易収支をバランスさせる先物為 替レ‑1:ft=政/β(8)を外生変数として扱う。
またこれらがわれわれのモデルにおける「フ アンダメンタ/レズ」である。そして
三t=ft+Vt
によって定義される直物為替レートを「ファ
(9)
ンダメンタルズ・レート」と呼ぶことにする。
そうすると, Stー忌=ft‑ftということに注意 すれば, モテソレは,
(7) 例を金利裁定取引にとって説明しよう。いま,
外国証券需要B*の中, 100α%を先物でカバーす るとすれば,金利裁定取引からの先物供給は αB*
となる。しかし,この活動は,外国証券残高を全 額先物でカバーし, (1‑α)B*の 先 物 買 持 ち を 創 出することと実質的に同じである。このように,
先物投機の多くは,具体的にはカバー率の調整と して現われると考えられる(たとえば,円高予想 に伴う先物カバー率の引上げは,ネットの先物買 持ちを縮少させることを意味する)。
(8) ぬには外国為替市場介入を含めることができよ う。いま, Itでt期の直物買介入額を定義すれば,
直物市場の需給均衡条件は Bt + It = SFt‑1
と表すことができる。したがって,これを(3)式へ 代入して整理すると,
SFt‑1 + {一(α't+lt)+βι}=SFt
を得る。このとき,ぬ+Itを改ためてαtと再定義 すればよいわけである。但し,この扱いには,介 入が自国金利に及ぽす効果を内生化していない点 で問題が残る。
(9) この定義は,将来のファンダメンタルズ予想を 折込んでいない点で伝統的なそれと異なる。
38
(4) SFt = SFt‑1十β(St一忌)
のように縮約できる。このように,直物為替 レートのファンダメンタルズ・レートからの 恭離は,先物投機ポジションの変化に依存す る。そして,この(4)式が以下での基本的枠組 である。但し, (4)式で表わされる為替レート 決定モデルの構造自体は共通知識と仮定して 分析を進めることにする。
2. 簡単な逐次ゲーム
まず,最も単純なケースから始めよう。基 本的アイディアを抽出するため,ゲームを t=O, 1, 2の三段階ゲームに限定するo 当初,
ファンダメンタルズ・レートは当該期間中不 変であると期待され,またこのことが共通知 識であったとする。そして,後の便宜のため,
この初期ファンダメンタルズ・レートを否てや 表す。さらに,分析の複雑化を回避するた め,全ての投機家の先物投機ポジションは,
当初,ゼロであったと仮定する (SF̲1ニ 0)。 以上の初期条件の下に,いまt=2段階での フアンダメンタルズ・レートが言からずへ 上昇することを予想させるような何らかの ニュース(もしくはうわさ,憶測)が市場へ 流れたとする。但し,そのニュースが示唆す るようなファンダメンタルズ・レート上昇の 実現可能性,あるいはニュースの信溶性その ものは確かで、ない(たとえば,そのニュース は意図的に流された方、セであるかもしれない)。
市場にはn+1人の投機家(以下,プレー ヤーと呼ぶ)が存在する。単純化のため,各 プレーヤーの利用可能な選択を, 'F>Oの先 物買持ちを創出する」と「スクウェア・ポジ ションを維持する」の二つに限定する。ここ で,先物ポジションFは市場取引慣行等その 他何らかの理由で所与と仮定され,また先物 売持ちの可能性を捨象する。前者はもっぱら 分析技術上の理由によるものであり,また,
後者はここでの分析状況がレート上昇局面に
( JO)
あることによっている。しかし,その選択可 能性を考慮、しても,結論に大幅な修正はない
と考えられる。
n+1人のプレーヤーはこつのタイプに区 分される。あるプレーヤーは,他のプレーヤ ーによってニュースの実現可能性もしくは信 滋性を確認する上での何らかの有用な情報ア
(JJ)
クセスをもっていると信じられており,この プレーヤーを以下単に「セッター」と呼ぶ。
この意味で,彼は俗に言っところの情報通 である。但し,残り n人のプレーヤー(以下
「追随者」と呼ぶ)にはそうしたアクセスが ない。
しかし,追随者は,セッターがニュースに 関連した何らかの有用な情報をもっているこ とを知っているが,それが実際にどのような 内容のものであるかを知らない。単純化のた め,セッターの私的情報は,ニュースの実現 可能性もしくは信恵性を支持する内容のもの か,またはそれを否定するものかのいずれか であるとしよう。そして,セッターが前者の タイプの情報を保有していると追随者の判断 する初期主観的確立をgo(l> go > 0)で表 す (goは共通と仮定する)。このように,われ われは,市場に到達したニュースの実現可能 性もしくは信忠性に関して,アカーロフ的状 況を想定していることになる。なお,追随者 の情報構造は全て同じであり,かっこのこと は共通知識とする。この仮定によって追随者 は同じ行動に従うと期待できょう。しかし,
この仮定は後に緩められる。
(
10) 将来のファンダメンタルズ・レートが低下する 局面では Fを負値と再解釈し,そして買持ちの 選択を売持ちのそれで置きかえればよい。
(11) ニュースがプレーヤーによって戦略的に流され た誤った情報である場合,彼は,定義的にニュー スの真疑を知っていることになる。
以上の各プレーヤーの情報構造は,より形 式的には次のように表現できょう。いまx=
{1,2}を状態集合と定義する。ここで,状態 1が生起すると,ニュースが示唆するように t=2段階でのファンダメンタルズ・レートが 上昇し,また状態2が生起するとそうでない。
この内いずれの状態が生起するかを決定する のは自然 (nature)であり,またgoが状態l の生起する事前確率(prior)である。そして,
セッターおよび追随者の各々の情報構造は,
次のようなX上の情報分割(information'par‑ tition)によって記述される。
セッター :{1},{2}
追 随 者 :{ 1, 2}
すなわち,セッターは状態1と状態2のいず れが実際に生起したかを識別できるが,追随 者はそうでない。また,このことは共通知識 である。
なお, U(・), V(・)をそれぞれ,セッター および、追随者のフォンノイマン・モルゲンシ ュテルン型効用関数と定義し, U(O)=V(O)
、(12)
=0となるようそれらを規準化しておこっ。
ゲームは次のように進行する。 t=O段階は セッターの手番であり,彼は「先物買持ち」
かそれとも rスクウェア・ポジションの維持」
かの選択を行う。但し,追随者はニュースの 実現可能性もしくは信浩性の不確かさのため 市場の成行きを静観すると考え, t=O段 階 で は彼らはスクウェア・ポジションを維持する
と仮定する。 t=O段階で展開されたゲームの プレーを所与として,続く t=l段 階 に お い てセッターと追随者が同時に moveする。そ して,真のファンダメンタルズ・レートが判 明する t=2段階でゲームは終了する。
(
12) よく知られているょっに,フォンノイマン・モ ルゲンシュテルン型効用関数は,任意の線型変換 に関して}11ft序保存的である。
39
3. 可能な戦略と利得構造
分析の単純化のため,本質を損うことなく t=O,l段階での内外金利差をゼロと仮定す
る。このとき直先スプレッドがゼロとなるた め ((1)式), t= 2の最終段階を別として,直 物レートと先物レートを特に区別する必要が ない。また,将来のゲインもしくはロスの割 引を捨象する。以上を前提して,次にゲー ムの可能なプレーとそれに対応する利得構造
を導出しよう。
簡略化のため,先物買持ちという選択を記 号Lで, またスクウェア・ポジションの維持 という選択を記号Oでそれぞれ表わす。そし て,プレーヤーの戦略を [jO,h,j2]によって 記述することにする。ここで, jt= {L, O}は t 段階での選択を意味する。たとえば, [L, 0,0]はプレーヤーがt=O段階でLを,また 残りのt=1,2段 階 でOを選択する戦略を 表す。なお,全てのプレーヤーは t=2の 最終段階で必ずOを選択することに注意しよ
う。というのも, もはやゲームが残されてい ないからである。また,不確実性のゆえに追 随者は最初の t=O段階でOを選択すると仮 定されている。それゆえ,追随者の可能な戦 略は
[0, L, 0], [0, 0, 0]
の二つに制限される。
このことを念頭に置いて,まず,状態1が 生起した場合の可能なプレーとそれに対応す る利得構造を考える。この場合,セッターは ニュース通り将来のファンダメンタルズ・レ ートが上昇することを識別できる。そして,
彼の可能な戦略は次の四つである。
[L, L, 0], [L, 0, 0], [0, L, 0], [0, 0, 0]
しかし, t=2f支階でのファンダメンタノレズ・
レートずが十分高いと仮定すれば, [L, L, 0]
によって記述される戦略が他のそれを優越す る。以下このことを示そう。
40
まず,セッターが戦略[L,L, 0]をプレー する場合を考えよう。このとき,初期投機ポ ジションSF̲1カfセーロであり, また ,t=Of支 階で追随者はOを選択すると仮定されている から, (4)式より, t=O段階での為替レート
s。は
F=β(so ‑s)
によって決定され,これより So=言‑Fjβ
を得る。
t=l段階では追随者がmoveする。しかし,
セッターが t=l段階でも買持ちを維持する のであれば,彼は過去の先物予約を直物で清 算し,引続き同額の先物を購入しなければな らない。それゆえ, t= 1段 階 で の 為 替 レ ー トを決定するのは追随者のポジションである。
ここで,追随者がt=l段 階 でLを選択す るとしよう。このことは,追随者が戦略 [0, L,O]をプレーすることを意味する。そうす ると, t=l段階での為替レート SIは
nF=β(SI ‑s)
によって決定され,これより SI=三+nFjβ
である。なお,後にわれわれは n>2を仮 定する。したがって SI>SOとなる。
t=2の最終段階を考える。既にt=l段階 でセッター,追随者の双方ともLを選択して いるから,いまやこの過考の先物予約を清算 しなければならない。それゆえ, t=2段 階 での直物レート S2を決定する市場均衡式は
O=F+nF+β(S2一ず) によって記述され,これより
S2 =言*ー(n+l)F jβ
を得る。なお,上式を導出する際,状態1が 生起した場合のファンダメンタルズ・レート はずであるという事実を用いている。
ここで〉
S2ーSI=ず‑[長十(2n十l)Fjβ]
ということに注意しよう。それゆえ (5) 言*>豆+(2n+l)Fjβ
であれば,そしてその場合にのみ,追随者は 正の投機利潤を得ることができる。明らかに,
(5)式が充たされなければ追随者はLを選択す る誘因がなしその結果分析の興味は失われ てしまう。そこで,以下では(5)式を前提して 分析を進めることにしょっ。また,このとき SI > SOであるから,セッターの投機利潤はた とえ追随者がLを選択しても正となる。それ ゆえ,ゼロの利得しかもたらさないセッター の戦略 [0,0,0]は明らかに戦略 [L,L,O]に よって優越される。ここで, log‑1 StをStで 表そう(以下,特にことわらない限り,大 文字は小文字の対数値の逆関数を表す)。か くしてセッターが戦略 [L,L, 0]を, また追 随者が戦略 [0,L, 0]をプレーしたときのセ
ッターの利得は
e = U ( (S2 ‑SO) F) > 0 また,個々の追随者のそれは
c= V((S2‑S1)F)>O となる。
代替的に,追随者が戦略 [0,0,0]をプレ ーするとき, t=2段階での直物為替レート
S
; は
O=F+β(S;‑s*) によって決定され,これより
S;=吉本‑Fjβ
である。この場合明らかに s;> S2であり,セ ッターの利得は
e' = U((S; ‑So)F) (>e)
となる。また,追随者の利得がゼロであるこ とは言うまでもない。
次に,セッターが戦略 [L,O,O]をプレーす る場合を考えよう。この場合, t=O段階での 為替レートは SOとなる。しかし,セッターは t=O段階で先物を清算し,もはや買持ちを負 わない。それゆえ,追随者が戦略 [0,0,0]
をプレーすれば, t=l段階での為替レート
s;は
O=F+β(s; ‑s) より
s; =s‑F/β
となる。明らかにso> s;であるから,この場 合セッターは損失を負つ。他方,追随者が戦 略 [0,L,O]をプレーすれば, t= 1段階での 為 替 レ ー ト ぱ は
nF=F+β(s~ ‑s) より
s~ =8+(n‑l)F/β となる。しかし
S2-S~ =計‑[s+2nF/β]
であり, (5)式を考慮すれば S2>ぱを得る。
かくして, [L, 0, 0']によって記述されるセ ッターの戦略は [L,L, 0]によって優越され ることが分かる。
最後に,セッターが戦略[0,L,O]をプレー するケースを考える。この場合,セッター,
追随者の双方がt=O段階でOを選択するか ら, t=l段階以降だけを考察すれば十分で、
ある。 t=l段階で双方とも Lを選択すれば,
t=l段階での為替レート s'{'は F+nF=β(s'{' ‑s) より
s'{'=吾十(n+l)F/β
となる。ここで s~'>soということに注意し よう。他方, t=O段階での直物レートは S2
で与えられる。それゆえ,セッターは戦略 [0,
L,O]よりも戦略 [L,L, 0]をプレーした方 が有利となろう。後者の戦略を選択した場合 に較べ前者の戦略をプレーした場合の方が,
先物購入レートが高くなるからである。
他方,追随者が t=l段階でOを選択する 場合, t= 1段階での為替レートはso, また t=2段階での直物レートは誌となる。 しか し,このとき得られるセッターの投機利潤は,
41
割引を無視すれば,戦略 [L,L, 0]をプレー した場合のそれと同じである。かくして,セ ッターの可能な戦略 [0,L, 0]もまた戦略[L, L"O]によって優越される。
以上の検討により,状態1が生起すれば,
セッターは確実に戦略 [L,L, 0]をプレーす ることが分かった。また,その場合の利得構 造は表1の上段のようにまとめられよう。
しかしながら,追随者は状態1と状態2 のいずれが実際に生起したかを少なくとも事 前には識別できない。ここで,状態2が生起 した場合, t= 1段階以降,セッターには投 機ポジションを負う誘因がないことに注意し よう。なぜなら,彼は将来ファンダメンタル ズ・レートが変化しないことを知っているか らである。このことはまた,状態2が生起し た場合のセッターの可能な戦略が
[L, 0, 0], [0, 0, 0]
の二つに制限されることを意味する。
いま,状態2が生起したとしよう。そして,
セッターが戦略 [L,0, 0]をプレーすると仮 定する。この場合, t=O段 階 で の 為 替 レ ー トはs。となろう。他方, t= 1段階でセッタ ーはそのポジションをスクウェアにする。そ れゆえ,彼の利得はこの段階での追随者の選 択に依存することになる。
もし追随者が戦略 [0,L, 0] をプレーすれ ば, t=l段階での為替レート s?は
nF=F+β(s '1‑8) によって決定される。すなわち
s1'=三+(n‑l)F /β てやある。 ここで、
s '1‑so = (n‑2)F /β
ということに注意する。それゆえ, n>2で あれば,そしてその場合にのみセッターは正 の投機利潤を得ることができる。以下ではこ
うした状況に関心があるから,この条件を前 提して分析を進めることにする。そうすると,
42
セッターが戦略 [L,0, 0] を,また追随者が 戦略 [0,L, 0] をプレーした場合のセッター の利得は
a = u((S~ ‑So)F) > 0 となる。
状態2が生起したとき, t=2段階でのファ ンダメンタンズ・レートは否で不変で、ある。
したがって,追随者が戦略[0,L, 0]をプレー すれば,市場均衡条件
。 =nF+β(s~‑8)
より, t=2 段階での直物為替レート s~ は s~=s-nF/β
なる水準に決定される。この場合,明らかに 追随者は損失を負い,その利得は
‑d= V((S~-Si) F) く O によって与えられる。?
他方,追随者が戦略[0,0,0]をプレーする 場合,今度はセッターが損失を負う。この場 合, t= 1段階での為替レート st*は
st*=s‑F/β(くso) となり,セッターの利得は
‑b= U((Si*‑So)F)くO
で記述される。もちろん追随者の利得はゼロ である。
最後に,セッターが戦略[0,0,0]をプレー する場合について簡単に触れておこう。この 場合,セッターの利得がゼロであることは自 明であろう。また,状態1が生起すればセッ ターは確実にt=l段階でLを選択する。そ れゆえ,セッターがtニ 1段 階 でOを選択す れば,このことが追随者に対して状態1が生 起していないことを顕示することになろう。
かくして, t=O段階でセッターがOを 選 択 すると,追随者は決して買持ちを負うことは なく(すなわち,必ず[0,0,0] をプレーす る),それゆえ追随者の利得もゼロである。
以上の結果は,表lの下段のように整理で きる。
表l 状態lが生起したとき
戦 略 利 得
セッタ一 追随者 セッター 追随者 [L, L, 0] [0, L, 0] e c [L, L, 0] [0, 0, 0] e' 0
状態2が生起したとき
戦 略 利 得
セッター 追随者 セッター 追随者 [L, 0, 0] [0, L, 0] a ‑d [L, 0, 0] [0,0,0] ‑b O [0,0,0] [0,0,0] O O
ill. 逐次均衡
1. 定義および導出
以上でゲームの記述が完了した。そこで,
次にこのゲームの逐次均衡を導出しよう。
前節で明らかとなったように, [L, L, 0]で 表 さ れ る 戦 略 は , 状 態1が 生 起 し た 場 合 の セッターの優越戦略 (dominantstrategy)で ある。それゆえ,状態1が生起すれば,彼は 確実にこの戦略をプレーするであろう。他方,
状態2が生起した場合, セ ッ タ ー の 戦 略 は [L, 0, 0]と [0,0,0]の二つに制限される。
また,追随者の戦略も [0,L, 0] と [0,0,0]
の二つである。但し,いずれの状態が生起し ようとも,追随者は同じ戦略をプレーしなけ ればならない。これらのことを念頭に置いて,
新たに記号を次のように定義する。
x=状態2が生起したとき,セッターが 戦略[L,O,O]をプレーする確率 y=追随者が戦略[0,L, 0]をプレーする
確 率
gt =状態1が生起していると追随者が判 断する段階tでの主観的確率 (1) go > 0)
なお,状態2が生起した場合のセッターの戦
略はt=O段階での選択によって完全に特徴 付けられる。それゆえ, Xをセッターがt=O段 階でLを選択する確率と考えてもよい。同様の 理由で Yを追随者がt=l段階でLを選択 する確率とも解釈できる。また,ここでは混 合戦略を考慮しているから,以下では代替的 にxを状態2が生起した場合のセッターの戦 略,そしてyを追随者の戦略と呼ぶことにす る。このとき,逐次均衡は次のように定義さ れ る ?
1. セッターの戦略xは追随者の戦略yに 対する最善反応、である
2. 追随者の戦略yは, t=l段階での状態 1の生起確率glを所与として,セッタ ーの戦略Xに対する最善反応である 3. t= 1段階において状態1が生起して
いると追随者の判断する確率glは, そ の初期値go,t = 0段 階 で 展 開 さ れ た プ レーの結果として利用可能となった情報,
そして,セッターの規定された戦略がプ レーされてきたといっ仮説とコンシステ ントで、ある
これらの諸要件を満たす各プレーヤーの均衡 戦略ならびに事後確率(posterior )の改訂プ ロセスは,次のように記述できる。
状態2が生起したときのセッターの均衡戦略
r 1 for go ~d/(c+d) (6) x =1σ r.
1fZJ‑言forgoくd/(c+d)
追随者の均衡戦略(14)
(7) Y=1b/(a+b) I 0
for gl>d/(c十d) for gl =d/(c+d) for glくd/(c+d)
(
13) 詳細については Krepsand Wilson (1982a)を 参照されたい。
事後確率の改訂フ。ロセス go
Igo+(l‑go)x ' (8) glニ{
o ・
43
t=Of支F皆でセッ ターが Lを選択 したとき その他の場合
なお, goヰd/(c+d)のとき,この逐次均衡は ユニークである。順序は前後するが,以下簡 単に証明を与えておこう。
追随者の均衡戦略
もしgl=OであれLf,追随者が戦略[0,L, 0]
をフ。レーする誘因がないことは明らかである。
他方, gl >0で,かつ追随者がt=l段階 でLを選択すれば,各追随者の期待利得は
gl・c+(1‑g1)・(‑d)=(c+d)gl‑d で与えられよう。また,代替的に,彼らがt
=1段階でOを選択すれば,その期待利得は ゼロとなる。それゆえ, (7)式は確かに追随者 の均衡戦略である。なお, gl =d/(c+d)の場 合 Yは閉区間[0,1]上の任意の値でありう
る。というのも, t=l段階でLとOのいずれ を選択しようとも無差別で、あるからである。
しかし,後に説明されるように,諸プレーヤ ーの戦略のコンシステンシーは y=b/(a+b) で表わされる混合戦略を必要とする。
事後確率改訂プロセス
セッターがt=O段階でLを選択すれば,
ベイズの定理より
gl =Prob.{状態1IL}
=Prob.{LI状態1}・Prob.{状態1}/(Prob. {LI状態1}・Prob.{状態1}+ Prob.{LI 状態2}・Prob.{状態2})
(14) 追随者の均衡戦略は,
r 1 for go > d/ (c十d)
Y =ib/(a + b) for go壬d/(c+d)
とも表せる。