不完全情報下の為替レート変動 −ゲーム論的接近−

(1)

35

不完全情報下の為替レート変動

−ゲーム論的接近−

青木浩治

I．序

現行の変動相場制の一つの特徴は，短期における為替レートの浮動性（volatility）である。この現象を説明する代表的枠組として，

オーバーシューティング理論，ニュース理論などがあげられるが，本稿はこれらの枠組と異なり，短期の為替レート変動においてある種の「意見の不一致」−より正確には「共通知乱（commonknowledge）（1）の欠如一が果たす役割に焦点を当てる。とくに，ファンダメンタルズに変化がなく，また全ての市場参加者がこのことを知っているとしても為替レートが変化しうることを示す。

この分析含意を確立する上で，月並みではあるものの，Keynes（1936，Chap．12）による有名な美人投票の例が有効な出発点を与えているように思われる。と・いうのも，資産市場一般における投機の本質的側面を，その例は巧みに捉えているからである。実際，投機ポジションが創出される一つの環境は，他の市場参加者による同方向への追随的ポジショ

ン変化が期待できるときである。この場合，

投機家の関心は，将来のファンダメンタルズに照らして適切と判断される資産価格の私的

（1）ここで，ある事象Eが共通知識であるとは，「全ての人が事象Eが生起したことを知っており，また，このことを全ての人が知っており，さらには，

このことを全ての人が知っていることを全ての人が知っている……」状況を言う。より厳密な定義については，Aumann（1976）を参照されたい。

予想を形成することにはなく，まして他の市場参加者による代表的個人見解を推測することにもない。そこは他人の予想の予想，そしてそめ予想の予想……という予想の相互連関が支配する世界であり，真の個人的見解などさして重きをなさないのである。かくして，

投機がこうした動機に導かれ，また資産価格形成において投機がドミナントな影響を及ぼす市場環境では，資産価格が市場ファンダメンタルズと整合的でない方向へ変化しうることは，ある意味では自然のことと言えよう。

このように，われわれの問題は最近脚光を浴びつつある「投機の泡沫」（speculativebub−

bles）と密接な関連がある。しかし，現行の

「合理的」バブル理論（2）は，為替レート決定モテつレの構造ならびにその与件集合で定義されるファンタ）ンタルズ（の確率分布構造）

に関して共通知識を仮定する，もしくは，たとえ当初それが欠如いているとしても，為替レートという価格シグナルを媒介として共通知識が確立される状況を暗黙に前提することによって，先のケインズ的状況を予め排除しているように思われる。また，このことを前

（2）これに対し，「非合理的」（irrational）バブルという考え方がある。たとえばKrugman！1985），

Frankeland Froot（1986）・を参照。とくに後者は，

ある種の不均衡理論に立脚するものであり，Wick−

Sell，Harrodを彷彿させて興味深い。しかし，理論の枠組を異質の情報構造という前提から出発させているという点で，われわれのアプローチとの類似点は多いように思われる。

(2)

36

提として認める限り，為替レートがファンダメンタルズとは無関係な方向へ変化するという意味での投機の泡沫を説明する枠組は，常に追随的投機の出現を期待できるもしくはその可能性を原理上排除できない無限反復ゲーム，あるいは終りの不確実な反復ゲームに限

、(3)

定されることになろっ。前者は非確率的バブル (deterministic bubbles)，また後者は確率的ノ〈フボル (stochasticbubbles)としてそれ

ぞれ知られているところで、ある(4)

しかし，囚人のディレンマ・ゲームを無限反復ゲームのコンテクストへ拡張することによって，非協力解とともに協力解の可能性が生じるものの，モデルから内在的に協力解の実現メカニズムを説明することは難しい。このことと全く同様に，現行の合理的バブル理論は，合理性と矛盾しない多様なバブル経路の「存在」を示しうるけれども，バブル発生メカニズムの説明を理論の射程外に置くこと

(5)

になるのである。こつした現状からすれば，

バブル理論は「まだ経済的要素が乏しいJ(天野(1984，p. 7) )という見解，そのミクロ的基礎にまで遡ってバブル解を積極的に排除してゆこうとする試み (Farmer(1984)， Obsf‑ feld and Rogo百(1983)，(1986) )，また実証面からの識別問題の提起 (Hamilton(1986) 1 ) などの形で，従来，合理的バブル理論に対し様々の懐疑論が提起されてきたことは容易に肯首できょう。

本稿は，合理的バブル理論の暗黙の前提か

(3) 私見によれば，これが Tirole(1982)の主要含意である。

(4) Blanchard (1979)， Flood and Garber (1980)，翁 (1985)を参照。

(5) この点は翁(1985)によって指摘されている。

おそらくその理由は，合理的バブル理論がunsta. ble saddle point pathの経済的解釈から出発し

ていることに求められるのではないかと考えられる。

ら離れ，より明示的に意見の一致が確立されていない状況から出発する。そしてこの市場環境における為替レート変動の一つの特徴的側面を分析するであろっ。しかし，注意すべきは，このことがただちに「合理性」仮説の否定を意味しないことである。なぜなら，合理的期待形成仮説そのものはいかなる情報構造とも整合的でありうるからである。実際，

われわれはこの仮説を情報整合性という条件によって保持するであろう。その替わり，本稿のアプローチでは投機家全体としてのパイ

を決定するファンダメンタルズの不確実性が重要な意味をもつことになる。やや正確さを欠くが，プレーされているゲームがゼロサム

・タイプなのか，それともポジティヴサム・

タイプなのかの意見の不一致(6)が追随期待の投機ポジション創出をうながし，その結果として為替レートが変化する。そして，本稿の分析対象はこうした環境における投機なので

ある。

以下，簡単に本稿の構成を示しておこう。

まず次節においてゲームの構造を説明し，続く111節で「逐次均衡J(sequential equilibrium) を導出する。また，同時に若干の分析含意にも言及する。なお，これらの諸節では，共通知識の欠知が中心的役割を果たすアカーロフ的状況が想定されている。この設定はシンプルではあるものの最も基本的なものである。

実際，後に明らかにされるように，それを基礎として様々のバリエーションが生まれる。

W節では一層複雑な状況が考察される。また，

最後のV節において残された若干の課題に触

(6) ゲームが有限でかつゼロサム・タイプであり，

また，このことが共通知識であるとき，情報の優位性に基づく投機は発生しえない。このとき，取引は成立せず，価格のみが変化することになろう。

詳しくはMilgromand Stokey (1982)を参照されたいo

(3)

れる。

11.ゲームの構造

1. 為替レート決定モデル

外国為替市場に焦点を絞った次のような簡単な部分均衡モデルを考えよう。

(1) it = it + ft ‑St (2) Bt = SFt‑1

(3) Bt + (‑at+ sft) =SFt (s> 0) ここで、

自国金利 i*=外国金利

f=自国通貨建て先物為替レートの対数値 S =自国通貨建て直物為替レートの対数値 Bt=外国証券需要(価格を外国通貨で測っ

て 1に規準化) SF=先物投機需要

であり，また添字(t)は時間を表す。

(1)式は，いわゆる「カバー付き金利平価」

(covered interest parity)であり，自国証券とカバーを付けた場合の外国証券とが完全代替物であるという仮定を定式化したものである(この仮定の下では，外国証券需要Btが受動的に決定されることになる)0(2)式は直物為替市場の需給均衡式を意味し，金利裁定取引からの直物需要が過去の先物投機の清算額と等しくなったとき直物市場がクリアーされる。また， (3)式は先物為替市場の需給均衡式である。単純化のため利払い分を無視すれば，

金利裁定取引からの直物需要と同額の先物供給が発生する(左辺第一項)。また，分離定理を援用して契約ベースの貿易収支が先物レートに依存すると特定化すれば，左辺第二項は商業上のへッジ動機から発生するネットの先物供給である。なお，外国証券投資および貿易取引が全額先物でカバーきれる必然性はな

37

い。しかし，ここでは伝統的なツィアン・ゾーメン流のアプローチに従って，カバー付き金利裁定およぴ商業上のへッジ動機と先物投

(7)

機とを機能的に分離する立場をとっている。

したがって，カバー付き金利裁定および貿易取引からの先物供給が先物投機需要と見合う

とき先物為替市場の需給が均衡する。

以下では内外金利差別=if‑it，および契約ベースの貿易収支をバランスさせる先物為替レ‑1:ft=政/β(8)を外生変数として扱う。

またこれらがわれわれのモデルにおける「フアンダメンタ/レズ」である。そして

三t=ft+Vt

によって定義される直物為替レートを「ファ

(9)

ンダメンタルズ・レート」と呼ぶことにする。

そうすると， Stー忌=ft‑ftということに注意すれば，モテソレは，

(7) 例を金利裁定取引にとって説明しよう。いま，

外国証券需要B*の中， 100α%を先物でカバーするとすれば，金利裁定取引からの先物供給は αB*

となる。しかし，この活動は，外国証券残高を全額先物でカバーし， (1‑α)B*の先物買持ちを創出することと実質的に同じである。このように，

先物投機の多くは，具体的にはカバー率の調整として現われると考えられる(たとえば，円高予想に伴う先物カバー率の引上げは，ネットの先物買持ちを縮少させることを意味する)。

(8) ぬには外国為替市場介入を含めることができよう。いま， Itでt期の直物買介入額を定義すれば，

直物市場の需給均衡条件は Bt + It = SFt‑1

と表すことができる。したがって，これを(3)式へ代入して整理すると，

SFt‑1 + {一(α't+lt)+βι}=SFt

を得る。このとき，ぬ+Itを改ためてαtと再定義すればよいわけである。但し，この扱いには，介入が自国金利に及ぽす効果を内生化していない点で問題が残る。

(9) この定義は，将来のファンダメンタルズ予想を折込んでいない点で伝統的なそれと異なる。

(4)

38

(4) SFt = SFt‑₁十β(St一忌)

のように縮約できる。このように，直物為替レートのファンダメンタルズ・レートからの恭離は，先物投機ポジションの変化に依存する。そして，この(4)式が以下での基本的枠組である。但し， (4)式で表わされる為替レート決定モデルの構造自体は共通知識と仮定して分析を進めることにする。

2. 簡単な逐次ゲーム

まず，最も単純なケースから始めよう。基本的アイディアを抽出するため，ゲームを t=O， 1， 2の三段階ゲームに限定するo 当初，

ファンダメンタルズ・レートは当該期間中不変であると期待され，またこのことが共通知識であったとする。そして，後の便宜のため，

この初期ファンダメンタルズ・レートを否てや表す。さらに，分析の複雑化を回避するため，全ての投機家の先物投機ポジションは，

当初，ゼロであったと仮定する (SF̲1^ニ 0)。以上の初期条件の下に，いまt=2段階でのフアンダメンタルズ・レートが言からずへ上昇することを予想させるような何らかのニュース(もしくはうわさ，憶測)が市場へ流れたとする。但し，そのニュースが示唆するようなファンダメンタルズ・レート上昇の実現可能性，あるいはニュースの信溶性そのものは確かで、ない(たとえば，そのニュースは意図的に流された方、セであるかもしれない)。

市場にはn+1人の投機家(以下，プレーヤーと呼ぶ)が存在する。単純化のため，各プレーヤーの利用可能な選択を， 'F>Oの先物買持ちを創出する」と「スクウェア・ポジションを維持する」の二つに限定する。ここで，先物ポジションFは市場取引慣行等その他何らかの理由で所与と仮定され，また先物売持ちの可能性を捨象する。前者はもっぱら分析技術上の理由によるものであり，また，

後者はここでの分析状況がレート上昇局面に

( JO)

あることによっている。しかし，その選択可能性を考慮、しても，結論に大幅な修正はない

と考えられる。

n+1人のプレーヤーはこつのタイプに区分される。あるプレーヤーは，他のプレーヤーによってニュースの実現可能性もしくは信滋性を確認する上での何らかの有用な情報ア

(JJ)

クセスをもっていると信じられており，このプレーヤーを以下単に「セッター」と呼ぶ。

この意味で，彼は俗に言っところの情報通である。但し，残り n人のプレーヤー(以下

「追随者」と呼ぶ)にはそうしたアクセスがない。

しかし，追随者は，セッターがニュースに関連した何らかの有用な情報をもっていることを知っているが，それが実際にどのような内容のものであるかを知らない。単純化のため，セッターの私的情報は，ニュースの実現可能性もしくは信恵性を支持する内容のものか，またはそれを否定するものかのいずれかであるとしよう。そして，セッターが前者のタイプの情報を保有していると追随者の判断する初期主観的確立をgo(l> go > 0)で表す (goは共通と仮定する)。このように，われわれは，市場に到達したニュースの実現可能性もしくは信忠性に関して，アカーロフ的状況を想定していることになる。なお，追随者の情報構造は全て同じであり，かっこのことは共通知識とする。この仮定によって追随者は同じ行動に従うと期待できょう。しかし，

この仮定は後に緩められる。

(

10) 将来のファンダメンタルズ・レートが低下する局面では Fを負値と再解釈し，そして買持ちの選択を売持ちのそれで置きかえればよい。

(11) ニュースがプレーヤーによって戦略的に流された誤った情報である場合，彼は，定義的にニュースの真疑を知っていることになる。

(5)

以上の各プレーヤーの情報構造は，より形式的には次のように表現できょう。いまx=

{1，2}を状態集合と定義する。ここで，状態 1が生起すると，ニュースが示唆するように t=2段階でのファンダメンタルズ・レートが上昇し，また状態2が生起するとそうでない。

この内いずれの状態が生起するかを決定するのは自然 (nature)であり，またgoが状態l の生起する事前確率(prior)である。そして，

セッターおよび追随者の各々の情報構造は，

次のようなX上の情報分割(information'par‑ tition)によって記述される。

セッター :{1}，{2}

追随者 :{ 1， 2}

すなわち，セッターは状態1と状態2のいずれが実際に生起したかを識別できるが，追随者はそうでない。また，このことは共通知識である。

なお， U(・)， V(・)をそれぞれ，セッターおよび、追随者のフォンノイマン・モルゲンシュテルン型効用関数と定義し， U(O)=V(O)

、(12)

=0となるようそれらを規準化しておこっ。

ゲームは次のように進行する。 t=O段階はセッターの手番であり，彼は「先物買持ち」

かそれとも rスクウェア・ポジションの維持」

かの選択を行う。但し，追随者はニュースの実現可能性もしくは信浩性の不確かさのため市場の成行きを静観すると考え， t=O段階では彼らはスクウェア・ポジションを維持する

と仮定する。 t=O段階で展開されたゲームのプレーを所与として，続く t=l段階においてセッターと追随者が同時に moveする。そして，真のファンダメンタルズ・レートが判明する t=2段階でゲームは終了する。

(

12) よく知られているょっに，フォンノイマン・モルゲンシュテルン型効用関数は，任意の線型変換に関して}11ft序保存的である。

39

3. 可能な戦略と利得構造

分析の単純化のため，本質を損うことなく t=O，l段階での内外金利差をゼロと仮定す

る。このとき直先スプレッドがゼロとなるため ((1)式)， t= 2の最終段階を別として，直物レートと先物レートを特に区別する必要がない。また，将来のゲインもしくはロスの割引を捨象する。以上を前提して，次にゲームの可能なプレーとそれに対応する利得構造

を導出しよう。

簡略化のため，先物買持ちという選択を記号Lで，またスクウェア・ポジションの維持という選択を記号Oでそれぞれ表わす。そして，プレーヤーの戦略を [jO，h，j2]によって記述することにする。ここで， jt= {L， O}は t 段階での選択を意味する。たとえば， [L， 0，0]はプレーヤーがt=O段階でLを，また残りのt=1，2段階でOを選択する戦略を表す。なお，全てのプレーヤーは t=2の最終段階で必ずOを選択することに注意しよ

う。というのも，もはやゲームが残されていないからである。また，不確実性のゆえに追随者は最初の t=O段階でOを選択すると仮定されている。それゆえ，追随者の可能な戦略は

[0， L， 0]， [0， 0， 0]

の二つに制限される。

このことを念頭に置いて，まず，状態1が生起した場合の可能なプレーとそれに対応する利得構造を考える。この場合，セッターはニュース通り将来のファンダメンタルズ・レートが上昇することを識別できる。そして，

彼の可能な戦略は次の四つである。

[L， L， 0]， [L， 0， 0]， [0， L， 0]， [0， 0， 0]

しかし， t=2f支階でのファンダメンタノレズ・

レートずが十分高いと仮定すれば， [L， L， 0]

によって記述される戦略が他のそれを優越する。以下このことを示そう。

(6)

40

まず，セッターが戦略[L，L， 0]をプレーする場合を考えよう。このとき，初期投機ポジションSF̲1^カ^fセーロであり，また，t=Of支階で追随者はOを選択すると仮定されているから， (4)式より， t=O段階での為替レート

s。は

F=β(so ‑s)

によって決定され，これより So=言‑Fjβ

を得る。

t=l段階では追随者がmoveする。しかし，

セッターが t=l段階でも買持ちを維持するのであれば，彼は過去の先物予約を直物で清算し，引続き同額の先物を購入しなければならない。それゆえ， t= 1段階での為替レートを決定するのは追随者のポジションである。

ここで，追随者がt=l段階でLを選択するとしよう。このことは，追随者が戦略 [0， L，O]をプレーすることを意味する。そうすると， t=l段階での為替レート SIは

nF=β(SI ‑s)

によって決定され，これより SI=三+nFjβ

である。なお，後にわれわれは n>2を仮定する。したがって SI>SOとなる。

t=2の最終段階を考える。既にt=l段階でセッター，追随者の双方ともLを選択しているから，いまやこの過考の先物予約を清算しなければならない。それゆえ， t=2段階での直物レート S2を決定する市場均衡式は

O=F+nF+β(S2一ず) によって記述され，これより

S2 =言*ー(n+l)F jβ

を得る。なお，上式を導出する際，状態1が生起した場合のファンダメンタルズ・レートはずであるという事実を用いている。

ここで〉

S2ーSI=ず‑[長十(2n十l)Fjβ]

ということに注意しよう。それゆえ (5) 言*>豆+(2n+l)Fjβ

であれば，そしてその場合にのみ，追随者は正の投機利潤を得ることができる。明らかに，

(5)式が充たされなければ追随者はLを選択する誘因がなしその結果分析の興味は失われてしまう。そこで，以下では(5)式を前提して分析を進めることにしょっ。また，このとき SI > SOであるから，セッターの投機利潤はたとえ追随者がLを選択しても正となる。それゆえ，ゼロの利得しかもたらさないセッターの戦略 [0，0，0]は明らかに戦略 [L，L，O]によって優越される。ここで， log‑1 StをStで表そう(以下，特にことわらない限り，大文字は小文字の対数値の逆関数を表す)。かくしてセッターが戦略 [L，L， 0]を，また追随者が戦略 [0，L， 0]をプレーしたときのセ

ッターの利得は

e = U ( (S2 ‑SO) F) > 0 また，個々の追随者のそれは

c= V((S2‑S1)F)>O となる。

代替的に，追随者が戦略 [0，0，0]をプレーするとき， t=2段階での直物為替レート

S

; ^は

O=F+β(S;‑s*) によって決定され，これより

S;=吉本‑Fjβ

である。この場合明らかに s;> S2であり，セッターの利得は

e' = U((S; ‑So)F) (>e)

となる。また，追随者の利得がゼロであることは言うまでもない。

次に，セッターが戦略 [L，O，O]をプレーする場合を考えよう。この場合， t=O段階での為替レートは SOとなる。しかし，セッターは t=O段階で先物を清算し，もはや買持ちを負わない。それゆえ，追随者が戦略 [0，0，0]

(7)

をプレーすれば， t=l段階での為替レート

s;は

O=F+β(s; ‑s) より

s; =s‑F/β

となる。明らかにso> s;であるから，この場合セッターは損失を負つ。他方，追随者が戦略 [0，L，O]をプレーすれば， t= 1段階での為替レートぱは

nF=F+β(s~ ‑s) より

s~ =8+(n‑l)F/β となる。しかし

S2-S~ =計‑[s+2nF/β]

であり， (5)式を考慮すれば S2>ぱを得る。

かくして， [L， 0， 0']によって記述されるセッターの戦略は [L，L， 0]によって優越されることが分かる。

最後に，セッターが戦略[0，L，O]をプレーするケースを考える。この場合，セッター，

追随者の双方がt=O段階でOを選択するから， t=l段階以降だけを考察すれば十分で、

ある。 t=l段階で双方とも Lを選択すれば，

t=l段階での為替レート s'{'は F+nF=β(s'{' ‑s) より

s'{'=吾十(n+l)F/β

となる。ここで s~'>soということに注意しよう。他方， t=O段階での直物レートは S2

で与えられる。それゆえ，セッターは戦略 [0，

L，O]よりも戦略 [L，L， 0]をプレーした方が有利となろう。後者の戦略を選択した場合に較べ前者の戦略をプレーした場合の方が，

先物購入レートが高くなるからである。

他方，追随者が t=l段階でOを選択する場合， t= 1段階での為替レートはso，また t=2段階での直物レートは誌となる。しかし，このとき得られるセッターの投機利潤は，

41

割引を無視すれば，戦略 [L，L， 0]をプレーした場合のそれと同じである。かくして，セッターの可能な戦略 [0，L， 0]もまた戦略[L， L"O]によって優越される。

以上の検討により，状態1が生起すれば，

セッターは確実に戦略 [L，L， 0]をプレーすることが分かった。また，その場合の利得構造は表1の上段のようにまとめられよう。

しかしながら，追随者は状態1と状態2 のいずれが実際に生起したかを少なくとも事前には識別できない。ここで，状態2が生起した場合， t= 1段階以降，セッターには投機ポジションを負う誘因がないことに注意しよう。なぜなら，彼は将来ファンダメンタルズ・レートが変化しないことを知っているからである。このことはまた，状態2が生起した場合のセッターの可能な戦略が

[L， 0， 0]， [0， 0， 0]

の二つに制限されることを意味する。

いま，状態2が生起したとしよう。そして，

セッターが戦略 [L，0， 0]をプレーすると仮定する。この場合， t=O段階での為替レートはs。となろう。他方， t= 1段階でセッターはそのポジションをスクウェアにする。それゆえ，彼の利得はこの段階での追随者の選択に依存することになる。

もし追随者が戦略 [0，L， 0] をプレーすれば， t=l段階での為替レート s?は

nF=F+β(s '1‑8) によって決定される。すなわち

s1'=三+(n‑l)F /β てやある。ここで、

s '1‑so = (n‑2)F /β

ということに注意する。それゆえ， n>2であれば，そしてその場合にのみセッターは正の投機利潤を得ることができる。以下ではこ

うした状況に関心があるから，この条件を前提して分析を進めることにする。そうすると，

(8)

42

セッターが戦略 [L，0， 0] を，また追随者が戦略 [0，L， 0] をプレーした場合のセッターの利得は

a = u((S~ ‑So)F) > 0 となる。

状態2が生起したとき， t=2段階でのファンダメンタンズ・レートは否で不変で、ある。

したがって，追随者が戦略[0，L， 0]をプレーすれば，市場均衡条件

。 =nF+β(s~‑8)

より， t=2 段階での直物為替レート s~ は s~=s-nF/β

なる水準に決定される。この場合，明らかに追随者は損失を負い，その利得は

‑d= V((S~-Si) F) く O によって与えられる。?

他方，追随者が戦略[0，0，0]をプレーする場合，今度はセッターが損失を負う。この場合， t= 1段階での為替レート st*は

st*=s‑F/β(くso) となり，セッターの利得は

‑b= U((Si*‑So)F)くO

で記述される。もちろん追随者の利得はゼロである。

最後に，セッターが戦略[0，0，0]をプレーする場合について簡単に触れておこう。この場合，セッターの利得がゼロであることは自明であろう。また，状態1が生起すればセッターは確実にt=l段階でLを選択する。それゆえ，セッターがt^ニ 1段階でOを選択すれば，このことが追随者に対して状態1が生起していないことを顕示することになろう。

かくして， t=O段階でセッターがOを選択すると，追随者は決して買持ちを負うことはなく(すなわち，必ず[0，0，0] をプレーする)，それゆえ追随者の利得もゼロである。

以上の結果は，表lの下段のように整理できる。

表l 状態lが生起したとき

戦略利得

セッタ一追随者セッター追随者 [L， L， 0] [0， L， 0] e c [L， L， 0] [0， 0， 0] e' 0

状態2が生起したとき

戦略利得

セッター追随者セッター追随者 [L， 0， 0] [0， L， 0] a ‑d [L， 0， 0] [0，0，0] ‑b O [0，0，0] [0，0，0] O O

ill. 逐次均衡

1. 定義および導出

以上でゲームの記述が完了した。そこで，

次にこのゲームの逐次均衡を導出しよう。

前節で明らかとなったように， [L， L， 0]で表される戦略は，状態1が生起した場合のセッターの優越戦略 (dominantstrategy)である。それゆえ，状態1が生起すれば，彼は確実にこの戦略をプレーするであろう。他方，

状態2が生起した場合，セッターの戦略は [L， 0， 0]と [0，0，0]の二つに制限される。

また，追随者の戦略も [0，L， 0] と [0，0，0]

の二つである。但し，いずれの状態が生起しようとも，追随者は同じ戦略をプレーしなければならない。これらのことを念頭に置いて，

新たに記号を次のように定義する。

x=状態2が生起したとき，セッターが戦略[L，O，O]をプレーする確率 y=追随者が戦略[0，L， 0]をプレーする

確率

gt =状態1が生起していると追随者が判断する段階tでの主観的確率 (1) go > 0)

なお，状態2が生起した場合のセッターの戦

(9)

略はt=O段階での選択によって完全に特徴付けられる。それゆえ， Xをセッターがt=O段階でLを選択する確率と考えてもよい。同様の理由で Yを追随者がt=l段階でLを選択する確率とも解釈できる。また，ここでは混合戦略を考慮しているから，以下では代替的にxを状態2が生起した場合のセッターの戦略，そしてyを追随者の戦略と呼ぶことにする。このとき，逐次均衡は次のように定義される ?

1. セッターの戦略xは追随者の戦略yに対する最善反応、である

2. 追随者の戦略yは， t=l段階での状態 1の生起確率glを所与として，セッターの戦略Xに対する最善反応である 3. t= 1段階において状態1が生起して

いると追随者の判断する確率glは，その初期値go，t ⁼0段階で展開されたプレーの結果として利用可能となった情報，

そして，セッターの規定された戦略がプレーされてきたといっ仮説とコンシステントで、ある

これらの諸要件を満たす各プレーヤーの均衡戦略ならびに事後確率(posterior )の改訂プロセスは，次のように記述できる。

状態2が生起したときのセッターの均衡戦略

r 1 for go ~d/(c+d) (6) x =1σ r.

1fZJ‑言^f^o^rgo^く^d/(c+d)

追随者の均衡戦略(1⁴⁾

(7) Y=1b/(a+b) I 0

for gl>d/(c十d) for gl =d/(c+d) for glくd/(c+d)

(

13) 詳細については Krepsand Wilson (1982a)_を参照されたい。

事後確率の改訂フ。ロセス go

Igo+(l‑go⁾^x ' (8) glニ{

o ^・

43

t=Of支F^皆でセッターが Lを選択したときその他の場合

なお， goヰd/(c+d)のとき，この逐次均衡はユニークである。順序は前後するが，以下簡単に証明を与えておこう。

追随者の均衡戦略

もしgl=OであれLf，追随者が戦略[0，L， 0]

をフ。レーする誘因がないことは明らかである。

他方， gl >0で，かつ追随者がt=l段階でLを選択すれば，各追随者の期待利得は

gl・c+(1‑g₁₎・(‑d)=(c+d)gl‑d で与えられよう。また，代替的に，彼らがt

=1段階でOを選択すれば，その期待利得はゼロとなる。それゆえ， (7)式は確かに追随者の均衡戦略である。なお， gl =d/(c+d)の場合 Yは閉区間[0，1]上の任意の値でありう

る。というのも， t=l段階でLとOのいずれを選択しようとも無差別で、あるからである。

しかし，後に説明されるように，諸プレーヤーの戦略のコンシステンシーは y=b/(a+b) で表わされる混合戦略を必要とする。

事後確率改訂プロセス

セッターがt=O段階でLを選択すれば，

ベイズの定理より

gl =Prob.{状態1IL}

=Prob.{LI状態1}・Prob.{状態1}/(Prob. {LI状態1}_・Prob.{状態1}+ Prob.{LI 状態2}_・Prob.{状態2})

(14) 追随者の均衡戦略は，

r ¹ ^f^o^r^g^o> ^d^/⁽^c^十^d⁾

Y =ib/(a + ^b⁾for go壬d/(c+d)

とも表せる。