微分ゲームにおける時間整合的戦略 : 二主体のオ ープン・ループ解
その他のタイトル Time‑consistent Open‑loop Strategies in Continuous Time Dynamic Games
著者 村田 安雄
雑誌名 關西大學經済論集
巻 37
号 3
ページ 219‑245
発行年 1987‑09‑30
URL http://hdl.handle.net/10112/14331
2 1 9
論 文
微分ゲームにおける時間整合的戦略*
—二主体のオープン・ループ解—
村 田
安 雄
目 次
1 .
微分ゲームにおける主要戦略2 .
一般形ナッシュ戦略 3. ナッシュ戦略の時間整合性4. 浜田の二国間政策連関のナッシュ戦略
5 .
一般形シュタッケルベルク戦略6 .
シュタッケルベルク戦略の時間非整合性7 .
時間整合的シュタッケルベルク戦略8. 浜田モデルの時間整合的シュタッケルベルク戦略
1. 微分ゲームにおける主要戦略
我々は政策決定の主体が二人である場合について動学的ゲームの解を求め,
そ れ ら が 時 間 整 合 的 で あ る よ う に 調 整 す る こ と を 試 み る 。 二 主 体 に 限 定 す る の は計算の簡単化のためと,経済問題では二主体間のゲームが多いためであり,
分 析 結 果 を 多 数 主 体 へ 拡 大 す る こ と は 容 易 で あ ろ う 。 ま た 本 稿 で は 時 間 を 連 続 的に扱う微分ゲームについて考察する(離散時間動学ゲームは村田
( 1 9 8 5 )が詳論し
ている)。先 ず 微 分 ゲ ー ム の ナ ッ シ ュ 戦 略 に つ い て 概 説 し よ うI)o X(f) を 第
t
時 点 の*本稿は関西大学学術研究(テーマ:「寡占経済戦略の動学ゲーム論的分析」)助成基金に よる助成を受けた成果の一部分である。また第
8
節の数値例における三次方程式の根の 計算は本学吉田達雄助教授に負う。ここに謝意を表したい。1) Cruz(1975)
を参照。2 2 0 闊西大學「経清論集」第 3 7 巻第 3
号( 1 9 8 7
年9 月 )
状態変数とし,ぇ
( t ) = f ( x ( t ) , U 1 ( t ) , u i ( t ) , t )
(1) の微分方程式がその進行を定める。ここにえはXの変化率, u ; ( i = l , 2 )
は 各主体の制御変数を示し, fは既知の関数である。経済学の問題でのfの形態 はえ ( t )=ax(t) + b 1 u 1 ( t ) +b 必 ( t ) ( 1 ' )
の一次式で与えられることが多い2)。各主体は(1)の状態式と相手方に関する情 報に基づいて,自己の制御変数を決定する戦略を考えるが,その基準は自己の 異時点間損失を全期間にわたって極小化することである。例えば初期時点0
か ら最終時点T
までの第i
主体の異時点間損失関数( i n t e r t e m p o r a ll o s s f u n c t i o n )
をL;=
化( u ,( t ) + u 2 ( t ) ) 2
e― P ' d t (i= 1 , 2 )
゜
( 2 )
として叫その損失関数に対する第
i
主体の戦略をU;=V; ( i = l , 2 ) ( 3 )
とすると,L ,
は次のように表現される。L,=Lh1, 1 1 2 ) ( i = l , 2 ) ( 4 )
各主体の持つ情報が(1)式と (2)式に限られる場合に,もし可能なあらゆる戦略 附,
l l zに対して
L i
伍*,ll z * ) : 0 : :
ム(巧,l l z * ) Lz
伍*,11 2 * ) : 0 : : L 2
伍*,ll z )
(5a) (5b) とするような一組の戦略
1 , 1 1 * ,ゲが存在すれば,
これをナッシュ均衡戦略の 組と呼ぶ。各主体による戦略決定に際して,現時点の状態変数の情報を追加的 に得ると,x ( t )
が相手の戦略に直接的に影響する関係を考慮することになり,かくして
1 , 1 1
と1 1 2がぉ( t )
に依存する形のナッシュ均衡戦略をクローズド・Jレープのナッシュ戦略と言う。巧と厄が必(t)に依存しない時に (5a)・(5b)
2) ( 1 ' )
式の説明は次節を参照。3) ( 2 )
式の説明は次節を参照。微分ゲームにおける時間整合的戦略(村田)
を充たすが,ゲはオープン・ループのナッシュ戦略と呼ばれ,それは時間
t
にのみ依存する制御関数として最初の時点において確定され得る。これに 対してクローズド・ループの戦略は,各時点で状態変数からのフィードバック を含む制御}レールの形をとる%我々は状態式として(1りのような一次式と,損失関数として(2)のような二次式を想定して,オープン・ループのナッシュ均 衡戦略を導出し(第
2
節),その時間整合性について考察し(第3
節)5), そしてニ 国間政策連関モデルヘの適用例を示す(第4
節)。次にシュタッケルベルク戦略について概説しよう。いま第
2
主体の制御する 戦略リ2を第1
主体が与件として受け止めて, 自分の損失関数ムを極小化す るように戦略巧を決める時に, 第2
主体はその巧の決定方式を明確に認知 して自己の損失関数ムを極小化する戦略を採用するものとしよう。この場合 には第2
主体はリーダー( l e a d e r )
として自分の戦略l l zを最初に宣言して,それ
に対する第1
主体の反応の仕方を観察する。第1
主体はフォロワー( f o l l o w e r )
として,与えられたl l zに対応して一つの戦略 l / 1を決めるので,(附,%)の組が
出来る。別個の%に対応して新しくl / 1が決まり,かくして成立する(巧, l l z )
の組の全体をフォロワーの反応集合と呼ぶ。その集合内における或る一組の侶*,
l l 2 * )
が他の如何なる組の(%均)に対してもL2
伍*,ll z * ) : C : : L 2
伍,心 (6) の関係を充足する時に,( 1 1 1* , 1 1 2 * )
は第2
主体をリーダーとするシュタッケル ベルク戦略であると定義される。もし現時点の状態変数を追加的情報として両 主体が取得するならば,その戦略はクローズド・ループのシュタッケルベルク 戦略であり,そうでないならば,ォープン・ループのシュタッケルベルク戦略 であると言われる6)。本稿ではナッシュ戦略の場合と同様の関数形を想定し4)
クローズド・ループ戦略のフィードバック制御ルールは離散時間動学ゲームにおいて分 析 す る 方 が 理 解 し 易 い ( 村
r l l ( 1 9 8 5 )
を参照)。5)
戦 略 系 列 の 時 間 撒 合 性 の 定 義 は 第3
節にて与えられる。6)
シュタッケルベルク戦略のクローズド・ルーフ゜解とフィードバック解は微妙に違って いるが(Cruz( 1 9 7 5 ) ,
p.3 4 2
を参照), 我 々 は 両 者 を 同 義 に 扱 う 。 離 散 時 間 動 学 ゲ2 2 2 闊西大學「綬清論集」第 3 7 巻第 3
号( 1 9 8 7 年 9
月)て,オープン・ループのシュクッケルベルク戦略を導出して(第5節),その時 間非整合性を示し(第
6
節),ついでそれを時間整合的戦略へ改修する(第7
節)。 最後にそれを二国間政策連関モデルヘ適用する(第8節)。なお計算の簡単化のために,本稿での状態変数と制御変数はスカラーである が,このことは問題の解明に妨げとはならない。
2 .
一 般 形 ナ ッ シ ュ 戦 略本節のナッシュ戦略の枠組みでは,次節以降の特殊な関数形に縮小可能な比 較的一般性をもつ関数形が想定される。状態方程式として
( 1 ' )
を採るが,これ に定数 Cが加わってえ =ax+b 必 +b 必 +c
であっても,y==x
―c / a
と置いて,
y
を新しく状態変数と考えると 少=ay+b 必 +b 必
となるから,最初から
(7)
(8)
(7')
ぇ
( t )= a x ( t ) + b , u ,
(t)+ b 2 u ( t )
(9) を状態方程式と想定しておく。ただし$は状態変数,u ; ( i = l , 2 )
は第i
主 体の制御変数で, これらは連続時間t
と共に変化する。そして X の変化率( d x / d t )
を土と表し,係数のa ,b ; ( i = l , 2 )
は定数である。 (9)式は一次元で の状態空間形式( s t a t e ‑ s p a c e f o r m )
を成す°。また Xの初期値はダ。と与えら れている。すなわちームにおけるシュタッケルベルク戦略のフィードバック解は村田
( 1 9 8 5 )
に詳しく解 説されている。7)
一般的な状態空間形はx=Ax+Bu
と表され, Xはn
次ベクトル, Uはm
次ベク トルである。( 9 )
式はn=1,m=2
の場合である。M i l l e r ‑ S a l m o n( 1 9 8 5 b)
は一般的 状態空間形を想定して我々と同様の分析を行う。微分ゲームにおける時間整合的戦略(村田)
223x(O)=X
。 UDl第
i
主体の異時点間損失関数として,( 2 )
式より複雑な次の形を想定しよう( s ; , q ; , r ; , p
は非負の定数)。1
0 0L;=
。廿[ s
ぽ+q
心 ー が+ r ; ( u
げ 醐 ] だdt U l l
ここに
P
は時間割引率で,これが大きい程遠い将来の損失の現在価値は小さ くなる。元は Xの望ましい水準で, がえより乖離する大きさの二乗にq ;
のウエイトを付したもの, 制御変数の合計値の二乗に r;のウエイトを付した もの,およびェの変化率の二乗にS
のウエイトを付したものが各時点での損 失を構成する。これを現在値へ割引き,初時点0
から無限の将来までにわたっ て集計した総価値がU l l
の損失関数の内容である8)。さて(9)とUDlの制約の下にUりの関数を極小化するような制御変数約を各
i(=
1 , 2 )
について導出するに際して, 各主体は相手の制御する戦略(3)を認知しな いという(オープン・ループの)ナッシュ戦略を得る必要条件は下記の通りで ある9)。各i
についてハミルトニャンH ;
H
戸 一1 [ s
ぽ+q
心 ー が+ r ; ( u
けu
が]+か(仰+b1u1+b
必) U2l2
を定義し(ただしかは補助変数),
d(P 面
pt)a ( H ; e ‑ P ' ) d t
=a x
〇=警
C i = l , 2 )
および横断条件
( i = l , 2 ) ・ .
U3} 閥limp 面 P1=0 ( i = l , 2 ) [ 5 )
I→O O
が(9), UO)と共に成立することである。 U2)式 の 中 の 公 を(9)で代替して, U3l式を 整理すると次のようになる。
‑A= ( s ; a 2 + q ; ) x + ( a ‑ p ) p ; + s ; a b 1 u 1 + s ; a b 2 u 2
一ぇq ; ( i = l , 2 )
U6) 同様にU 4 l
式を整理して次式を得る。8) 正確には集計された現在値の半分であるが,ーは後の計算の便宜のために付されてい 1
2るに過ぎない。
9) S t a r r ‑ H o ( 1 9 6 9 )
お よ びM u r a t a ( 1 9 7 7 ) , p . 3 4 4 を参照。
3 7
2 2 4 闊西大學「綬清論集」第 3 7 巻第 3 号 ( 1 9 8 7 年 9
月)O=s1ab1x+b
必+ C s 1
釘+れ池+ ( s 1 b
必+r 1 ) U 2 O=s2ab2x+b
必+ ( s 2 b
必+乃)U
げ( s 2
射+ r 2 ) U 2 ( 1 7 a ) , ( 1 7 b )
の両式をU 1 ,U 2
について解くと( 1 7 a )
(17b)「 ] = 1 [ ̲aD b 1 ( s
ぷ+ r 2 ) ‑ b 2 C s
砧+ r 1 )
Xu , (b,‑b,)D ‑aD ‑b,(,
砧+ r , ) b , C ,
討+ r , )] [ : : ] u m
となる。ただし
D
を次のように置く。D = = s 1 b 1 r 2 ‑ s
必r1
U9) (9)とU6lから成る三式は, US)を代入すると連立一次微分方程式の体系に書き換えられる。すなわち,
︱
︱
⑳ 0 I
Xq I‑ 5
︱
︱
+
︱
︱ u l
約
l
‑
︳ 一
︱
I O I X q I
知叫叫[•
+ ゎ
81 82
l l
‑ ︳
P l
柘
la
bl
ab
l‑
︱
b s l 8 2 p
︱
‑ +
l
﹃
r l a
+ 叫
D
‑
︱
‑ S t r l
P l 拓 血
D甘廿廿且紀
D
‑ 8 2
a
o o
‑ P
P +
a a
‑ 0
2 2
゜
r r
2 r p
q i
の
b l
D a
b l
D a
b l
D
̲ ︳
︳
S l 8 2 a2a2a
ー の Sl 82
o
q
︱
︱
︱ ︱
︱
︱
=l
︳ ︳
l
‑
え.
P l
. 拓
︱
︱
体系(20)の特性方程式は
O+a‑p) ( A 2 ‑ p A ‑ r p ) =O
と整理できる。ここに次の想定を置こう。r p = = ( q 1 b 1 乃一 q 2 b
か)ID >O
かくして特性根は入
1=p‑a
A2=‑(p‑i/ 1
が十4 r p ) < O 2
入
3=‑(p+i/ 1
亨 )>P 2
となり,各根に対応する固有ベクトルは順に次のように算定される。
(21)
(22)
(23)
[
臼
H
今l
三[H :
唸号:][三H : : :
喜三:j : ~
更に(20)式の非同次項に対して特解{え,
0 ,O }
を求め,( 2 0 )
式の一般解を次のように 表す。[ : : I ! J
哀・ , t : : J
砂;'+[i :
(25)最後に横断条件
( 1 5 )
と初期条件(10)に配慮して( 2 5 )
式のa j ( j = 1 ,
2.3 )
を決める。( 2 4 )
を( 2 5 )
式へ代入し, (10)の条件を用いると幼
=a2
十叩+ぇを得,また
As‑P>O
と( 1 5 )
を考慮してas=O
であり,
( 2 6 )
と( 2 7 )
からa 2が次のように決まる。
伶
=x
。―ぇかくして
t=Oの時の ( 2 5 )
式は,a : : : o
を想定すると,b
ぬ ‑q , + s , a ‑ l 2 p , ( O ) =a1 b — , r 2 +(xo-x)
入s‑a
加(O)=a1+(x゜―え)qz+s2a
入2
入
a‑a
になり,従って
a 1は次の二つの表現を持つ。
Q1+S1a
入2
a 1 =[P1
(0)‑( x o X b 1 r 2
入
a‑a
ー)]b釦Q 2 + s 2 a . l 2
約 = か(0)‑ (x。―え)入
a‑a
P 1 C O )
ま た は 加( 0 )
を任意に定めると,約が決定する。要約するとa>O
の場合にはx ( t ) =(xo‑
え)e > ‑ , 1
十え( 2 6 )
(2~
(28)
(29a) (29b)
(30a) (30b)
(31)
2 2 6 闊西大學「純清論集」第 3 7 巻第 3
号( 1 9 8 7 年 9
月)q
けs ; a . . t 2
p ; ( t ) =P;(O)e
団+( ゜―え). . t a ‑ a
(e入•'-かりC i = l , 2 )
(32) と表される。もし a:S:Oであれば, a1
=0
と置くので'( 3
加の代りにp , ( t )
=.Cxo一え)止皇~e入•'. . t a ‑ a ( i = l , 2 ) ( 3 3 )
になり,
p i ( O )
と か(0 )
は一義的に決まる。( 3 U
はこの場合にも妥当する。オープン・ループのナッシュ戦略は
( 3 U( 3 3 lの { x ( t ) ,P 1 C t ) , P 2 C t ) }
を( 1 8 )
式 の右辺へ代入することにより確定する。3 .
ナ ッ シ ュ 戦 略 の 時 間 整 合 性オープン・ループのナッシュ戦略が時間整合的
( t i m ec o n s i s t e n t )であるかど
うかを検討しよう。Cohen‑Michel(l984)
によると,動学ゲームの各主体i
の 戦略の或る系列伽*( t ) }
t~O が,状態変数の系列{が (t)} t~O に対応するものとし,もしこのゲームを任意の時点
t=t
。(>O)
においてやりなおしてが(t o )
か ら再出発したとすれば,そのやりなおした戦略がすべてのi
について佃*( t ) }
や
t oI
こ等しい場合にのみ;元の戦略伽*( t ) }1 : : ; ; : oは時間整合的であると言われ
る。Cohen‑Michel(l9 8 4 )は多数主体の微分ゲームについて,第 i
主体の損失 関数として下記の関の形を想定し, ナッシュ戦略の時間整合性を明らかにし た。L;=
廿2
O O。年 ( が+ r ; u ; ( t ) 2 ] d t ( 3 4 )
これはn n
の関数においてぇ=p=Oと置き,がと他主体の制御変数を除いたも
ので,その結果,ナッシュ戦略は簡単な形になり,それの時間整合性が比較的 容易に確かめられる。我々は(34)の損失関数を用いて二主体のオープン・ループ のナッシュ戦略を前節での手続きによって導出する(状態方程式は( 9 )
を想定)。この場合には
( 1 8 )
に相当する式はb ;
u,=‑‑P, r , C i = l , 2 )
であり
' ( 2 3 )の特性根は
入i=‑a A2=‑r
炉 =r==(a吐生釘+匈社)究>〇 r1 r2
となり,従って(
3 1 )
と(32)に相当するものはx(t)=x
゜e ―
(幼=x(O):
定数)p ; ( t ) =
̲r‑a ̲!jj̲ク( t )
+( p ; ( O )
一年r‑a )¢―a t (i=
1, 2)227 ( 3 5 )
(36)
(37) (38) である。 (38)を(35)へ代入すると,ォープン・ループのナッシュ戦略が次のように 確定する。
u;(t)=え竺/-y号(竺—p;(O))e―at
( i = l , 2 ) ( 3 9 )
いま
t=t
。C > o )
において同じ微分ゲームをやりなおして,xCto)=x
゜e ― r t
。( 3 7 ' )
を
t
。時点での元の出発値とすると,新しい戦略は( 3 9 )
においてX oをぷ( t o ) , tを t‑t
。,p ; ( O )
を砂)で置き換えたものである。すなわちU;(t)=
r;(a‑r) 姶j 此0 ) e ‑ r ( t ‑ t o )
+糾年( t
。)-p;(to))e-a(ヽ—lo)( 3 9 ' )
そして
( 3 7 ' )より得られる
x ( t o ) e ‑ Y ( t ‑ t o ) = x o e ‑ Y t ( 3 7 ° )
および(38)より得られる砂 ) = 直 邸 )r‑a +
( P , ( O )
一年r‑a )e ‑ a t o ( 3 8 ' )
を
( 3 9 ' )
へ考慮すれば,それは( 3 9 )
と全く同一になる。かくして(3 9 )
は時間整合的で ある。前節で我々の導出したナッシュ戦略
{ u ; ( t ) }
t~o も時間整合的であることを示 すには, 任意のt=t
。> o
において微分ゲームをやりなおした時の状態変数2 2 8 闊西大學「純清論集」第 3 7 巻第 3
号( 1 9 8 7 年 9
月)x ( t )
と補助変数p ; ( t ) ( i = 1 , 2 )
が,元のt=O
より出発した時のそれらに一 致することを証明すればよい。t=O
より出発した時のx ( t
。)とかCt o )は x ( t
。)=(xo
一え)e
入が0
十えか
( t o )=p;(O)
かり+(xo‑x‑q)
け s;a,l2( e l
がo‑e
入1 1 0 ) As‑a
( 3 1 ' ) ( 3 2 ' )
である。toC>O)より再出発してナッシュ解を求めなおすと, t(>t
。)時点にお いてはx ( t ) = ( x ( t o )
一え)e h o (
ーヽl o ) +
え( 4 0 )
q;+s;aA2p ; ( t )
=P;(to)ex•<ヽ— to)+( x ( t o )
一え) (必2(1-lo)- が(ヽ—lo))( 4 1 ) . . t 3 ‑ a
となる。(船)と
( 4
りの各式は,その中のx ( t
。),p ; ( t
。)を( 3 1 ' ) ,( 3 2 ' )
で代替して整理す れば,それぞれ(3 1 )
と( 3 2 )
に帰着することが分かる。かくしてナッシュ戦略U ; ( t )
はU 8 l
式に示されているように,x ( t )とか( t )の一次結合であるので,再出発し
た{ U ; * ( t ) }
I述の系列は,t=Oから出発した元の系列 { u ; ( t ) }
、:2,0の上に重な る。つまりこの元の系列は時間整合的である。4 .
浜 田 の 二 国 間 政 策 連 関 の ナ ッ シ ュ 戦 略本節ではオープン・ループのナッシュ戦略が二国間政策問題へ応用される。
応用例として浜田
( 1 9 8 2 )の第 V
章「貨幣政策連関の戦略分析」の付論「微分ゲ ームとしての世界マネー・ゲーム」を取り扱う。それは二国から成る世界を考 えて,第i
国の貨幣市場での変動をM;=
応 冗ーU;( i = l , 2 )
と示す。ここに応=第
i
国の外貨準備増加額 冗=各国共通のインフレ率U戸=第
i
国の超過信用拡張率M,=
第i
国の貨幣残高( 4 2 )
である。また
冗
=w
必+CiJ2U2+G ( 4 3 )
の関係がある。ただし叫=全世界の貨幣残高
(M1+
島)に占めるM,の比率 R 1 R 2
G=(
科+島)/CM:
げM2)=w1
玩 呵 石+ ( 4 4 )
いま簡単化のために次の想定C i / 1 =
匹=百,1 G=O
(45) を置くので, (42)と(43)は第t
時点で次のようになる。Z;(t)=
ー1 C u i( t ) ‑ u 2 ( t ) ) 2
1
冗
( t )
=ーC2 u i( t ) + u 2 ( t ) )
ここに Z;=応/M;と記し,更に
炉 我 1C=
丸/M1)
( 4 2 ' )
(43')
( 4 6 )
と表すことにすれば,( 4 4 )
式に(45)の想定を置いて,Z2=
一公となる。従って (42') はx ( t )
=百1 ( u 1( t ) ‑u2 ( t ) )
(47) と書き換えられる。さて第
2
国を基軸通貨国と想定し,その異時点間損失関数をL2=~00[年(が+上磁(t)2]e―P'dt0
2 ( 4 8 )
とし,第
1
国のそれをL1=~)2が(t)2 嗜S1i(が+和 (x(t) ーが]e―ptdt (49)
としよう10)。(43')を代入すると, (48)と(49)の関数は我々のUl)式に一致する(ただ し
q2=0)
。初期時点における第
1
国での外貨準備と貨幣残高によってx(O).
がx
。と与1 0 ) 浜田の損失関数にはんの一次の項が入っていたが, これは今後の分析に本質的影響 を与えないので,省略された。
(49)式中の
Xーえは第
1国 の 外 貨 準 備 の 目 標 と の 差 を 表す代理項目である。
43
230 閥西大學「綬清論集」第37巻第3号 (1987年9月)
えられたとして,
( 4
加式の状態方程式の下で,各国は(4 8 ) , ( 4 9 )
をそれぞれ極小化す るナッシュ戦略を決めるであろう。 この場合は第2
節の(9)式にてa=O,b1=
1 1
百,炉ーすとなっており,
q2=0
も考慮に入れると,U B l
に相当するのは 叫 ) = 紅2ls2rJ‑(
い)か( t )
+(い)P 2 C t ) ] ( 5 0 a l
叫 ) = 紺
2ls2rJ‑(
い)か( t ) +
(い)加w ]
であり
' ( 2 3 )
の特性根は次のようになる。ここに
A1=P
i
戸 ー1 (p‑,1
が十4 r p ) < O 2
圧 ー
1 (p+,I 三 ) >P 2
' P " = Q 1 r 2
S1
乃十
S釦かくして'
( 3 1 ) , ( 3 3 )
は次のものに帰着する11)0x ( t ) = ( x o
一え)e叫+ぇか(t)
=(xo
一え)生e
叫As 拓
( t ) = O
そして浜田モデルに従って
r1=
乃= 1 / 2 ,s 1 = s 2 = 2 s , Q1=2q ( s , q>O)
( 5 0 b )
(51)
(52)
( 5 3 )
(54a)( 5 4 b )
邸) と置いて,
( 5 4 )
を(50)へ代入して整理すると,ォープン・ループのナッシュ戦略は叫 )
=
1(己)q(えーX o )
s P+V
が+ 2 q / s
e入●t (56a) 叫 )=
U1( t ) 1 ( ‑ + ) / 1 ( +¼) ( 5 6 b )
となる。ぇ
> x
。の時には U1(t)は正値で減少し続け,その減少率はU 1 1
‑=..l2=‑(p‑i/
が+2q/s)<o
U1
2
であり,これは U2,
P 1 ,
Xーえの減少率と同一である。1 1 ) ( 5 4 b )
の導出は( 3 Q a ) = ( 3 0 b )
を考慮した。(57)
2 3 1
5 .
一般形シュタッケルベルク戦略さて二主体のうち第
2
主体のみが第1
主体の戦略決定方式を知っている時の シュタッケルベルク解を,第2
節での一般形の損失関数U l l
を想定して導出しよ う。第1主体がフォロワー,そして第 2主体がリーダーとして,共に(9)とUO)の 状態変数に関する情報を有して,U l )
の損失関数を極小化するオープン・ループ 戦略を得るための必要条件は下記の通りである1 2 )
。第1
主体についてはナッシュ解と同ーであり,ハミルトニャン
H1
Hi=‑[s, 1
が十q
心 ー が+r1(U
げU2)2]+
か(ax+b
必+b 西)
2
を定義し(公は(9)式で代替),
d ( P 1
げ )a ( H 1 e ‑ P 1 )
‑ =
゜
dt
ax
= ー
8H1 a u 1 =s1ab1x+b
必+(s
如+ r , ) u 1+ ( s 1 b
必+ r 1 ) U 2 1imP1e ― P'=o
t
→
OOが成立することである。 (59)は次のように書き換えられる。
炉=ー
( s
ぷ+q
心+(p‑a)P1‑s,ab
必ーs 1 a b
必+ぇq,
(58)
(59) (60)
( 6 1 )
(59') 第 2主 体 の ハ ミ ル ト ニ ャ ン 比 は(9),(59')および(60)を含むが,予め(60)よ り 約 を
u 1 = ‑( s 1 a b 1 x + b 1 P 1 + C s 1 b 1 b 2
十r 1 ) u 2 ) / ( s 1 b 1 2
十r 1 )
三U 1
と求め,比を次のように定義する1 3 )
0H
戸 一1 2 [ s 2 ( a x + b 1 u 1+b 西 ) 吐 Q 2 ( X ーえ)吐乃 (u1+U2)2]+
加(ax+(60')
b 1 u 1 + b 2 u 2 ) +p3[ ‑(s1a2+q1)x+ (p‑a)P1 ‑ s 1 a b 1 u 1 ‑ s 1 a b 2 u 2 J
(62)U 1
に (60')を代入した後の比について,1 2 ) Simaan‑Cruz ( 1 9 7 3 ) および Murata ( 1 9 7 7 ) , p . 3 4 4 を参照。
1 3 ) Simaan‑Cruz ( 1 9 7 3 ) による出は次のようになる。
H2==—[s炉十q2(か→か+乃(佑十約)
1
22 J + P 2
え+Pa
か+ P . C 8 H i / 8
約)た だ し 公 は(9)で,かは(59')で,
a H i 1 a
約 は(60)でそれぞれ代替される。このH
の中の p .
の存在が解の導出を困難にする。•4 5
2 3 2 閥西大學「純清論集」第 3 7 巻第 3
号( 1 9 8 7 年 9
月)d ( P 2 e ― p t )
acH: 牙p t )
‑ =
dt
a x
d ( P a e
―P l )
8(H: 硲")‑ dt
= a p 1
゜
=8H2 a u 2
limP2e‑P1=0
t→OO
加
(O)=O
がすべて充たされることが必要である。
F = = s 2
が+ s 1 2 r 2 b 1 2
( 6 3 ) ( 6 4 ) ( 6 5 )
(61')( 6 6 )
(67) と置いて,
( 6 5 )
より次の関係を得る。U
戸( b
こ恥[aFx
十射( s 1 乃ー s 2 r 1 )
か+r1(r1+s
討)( P 2 ‑ a s 1
加)]( 6 5 ' )
そして(
6 3 ) , ( 6 4 )
を整理して(6 5 ' )
を考慮すると,Pz=‑qzx+p̲
加+q
必+ぇQ z Ps= . . . : . . b i 2 s 2 r 2 b 1 2 s 1 r 2 a s 2
がF
か +F
加 +F
加 が導出される。また( 6 0 ' )
へ( 6 5 ' )
を代入すると,1 .
u 1 = ( b 2 ‑ b 1 ) F [aFx+b1P
か+ r 1 C s 1 b
必+r 1 ) C P 2 ‑ a s 1 P s ) ] ( 6 0 ° )
を得る。そして(9)式,( 5 9 ' )
式へ(6 0 ° )
と( 6 5 ' )
を代入して整理するとそれぞれ次のよ( 6 3 ' ) ( 6 4 ' )
うになる。
公 = 一
‑1F [ s
山射P
げ が(P2‑as
必)]゜
るなこ, 9
O l
↓
↓
.狐
00 I
X q
l ‑ 叩
q i
る
l
̲
ぇ 十
+ め
︱
︱
〇 と
xpsplかP
ま
︱
︱ S l
こ
a I
亡 [ [ ふ
F叩 F P
2方2
5F 分 釘 釘 年
F o a微
rZ Fr zF a
+ 次 Slsz
︳
p ーP
‑
︱ ︳
り 立
Y
2 2
ー
r l FS zr Fa sl Fq i
s z r F
連
r l
aを
S l
り
a a ( 6 3
L>
︵ 一
+び
︒︒
qlqzx
ょ 一
︱ ぉ ーq
,
.
︐
6I‑︵ ︐
9 ,
4
•Pl,
6
9 9
饂
. x
•Pa
•Pl
拓
(68)
( 6 9 )
『0)
{70)についての特性方程式を整理して間を得る(ただし入は特性根である)。
0=( えー p ) 2 , ' ! 2 ‑ ( , ' ! ‑ p )
ぇR/F+Q/F
ただしQ=q
品兄一q 2 a r 1 2 ( p ‑ a )
R = 2 q 1 s 1 r 2
肝+q2
が一a s 2
が(p‑a)
233
( J l )
⑳
t
huhuと置く。『1)に根の公式を適用して
J . ( , l ‑ p ) = (R‑(K:
げ十4r
釘( q
裕,‑q
函)K
況)/(2F)==C1( 7 4 a ) え ( , l ‑ p )=(R+(K:
げ十4r
釘( q
袋1‑q
心)K
閃)/(2F)==C2( 7 4 b l
を得る。ただしK==(q; +as;(P‑a))
が である。かくして(7 0 )
式の特性根はl1=(p‑i/
炉十4 C 1 ) / 2 l2=(p+i/
炉十4C 1 ) / 2 la=(p‑i/
炉十4C 2 ) / 2
入
4=(p+
‑V炉十4C 2 ) / 2
と導出され,特解を加えた『0)の一般解は
( i = l , 2 )
(75)(76)
X (t)
K 。
jl
「え釦(t) 4 知 。
=J~=l
a; e X J ' +
P 1 C t )
知 Io
加Ct) 知J L
o
(77)
となる。ここに
{ k
。;,k a ; , k l j , k 2 ; )
は朽に対応する固有ベクトルである。いまC
ぷ0 ,C2>0
と想定すると,
入
1 6 0 ,
入2 ; ; ; ; ; P , A s < O ,
心>P
閥
( 7 9 )
となり, (61)または(61りの条件のために( 7 7 )
においてa4=0でなければならない。
故に
koi=l
とおくと, (77)より(j=l, 2 , 3 )
(80)2 3 4 関西大學「経清論集」第 3 7 巻第 3
号( 1 9 8 7 年 9
月)x(t)
= I :
3: a
投> ‑ ; t +
え (BUi=l
が得られ,また
3
p;(t)
= I : : a ; k ; ; e ザ ( i = l , 2 , 3 ) ( 8 2 )
i=l
となるが,特に加について(66)の初期条件が充たされなければならない。すな わち
加
( 0 ) = a 1 k a 1 +a2ks2+askss=O
(66') また x(O)の初期値はUO)で与えられているので, (BUよりXo=
佑+a2+aa
十えとなる。いま仮に加(
0 )を任意に与えると
加( 0 ) = a 1 k 2 1
十 叫 知+ a a k 2 s
( 8 1 ' )
( 8 2 ' )
を得るので,( 6 6 ' ) ・ ( 8 1 ' ) ・ ( 8 2 ' )
を用いて%叫,a gを決定する。かくして x ( t ) , p;(t) ( i
==1 , 2 , 3 )
の行動式が確定し,これらを( 6 5 ' )
と( 6 0 H )
へ代入することにより,シュクッケルベルク戦略
u 2 C t )
とU 1 ( t )
も確定する。6 .
シュタッケルベルク戦略の時間非整合性前節で求めたオープン・ループのシュタッケルベルク戦略が,第
3
節で定義 された時間整合性を備えるか否かを検討しよう。Cohen‑Michel ( 1 9 8 4 )
は( 3 4 )
の 損失関数を想定した場合において,この戦略が時間非整合的であることを明ら かにした。この場合にはt/ 0 )
に相当する連立一次方程式は(8 3 )
のようになり,『6)
に 相当する特性根は( 8 4 )
のようになる。え a 0 ‑ b i 2 / r 1
ー射/ r 2
柘゜ a ゜
釘/ r 1 P a
か
‑qi
゜ ‑a ゜ P i
か
‑q2 Q i
゜ ‑a P 2
. l . 1 = ‑ r
入2=[a吐Aげー(A2-VA社十 4A1A2)J½==r
2 1
( 8 3 )
(84a)
J3=‑6
J4=[a
吐A
け ー2 1 (A
け, I Ai
十4 A 1 A 2 ) ]
垢 畔ここに
A1=Q1
釘!r 1 > 0 ,A
戸q
起/r2>0
とおく。この時入
a<A1<0,O<A2<A4
235
( 8 4 b )
(85)
( 8 6 )
の関係があるものと考えられ,従って(81)と(82)に当たる式はそれぞれ次のように なる。x ( t ) =a1e
→t + a a e ‑ a t
p ; ( t ) = a 1 k ; 1
戸 +叫i s B ― a t ( i = l , 2 , 3 )
そして初期条件UO }
と( 6 6 )
を充たさなければならないので,゜
=x(O)=a1 +a8 O = P s ( O )
=叫k s 1+ a s k s s
よりa 1
とa s
がa 1 = k s s X o / C k s s ‑ k s 1 ) , a s = k s 1 X
。/ ( k s 1‑ k s s )
と決まる。ここに加
( i = l ,2 , 3 ; j = l , 3 )
はku q l
, k 2 1 = q 2 ( l ‑B) ‑ A 1 k 2 1
=
r‑a 2(r‑a) , k s 1 =
q 1 ( r + a )
知見,
k 2 s = q 2(6‑a) , 2 ( 1 + B) k s s = q ‑ 1 : ( ‑ i ‑ A l 1 + k 2 a s )
と算定され
(B==V1+4Ai/A2),(
9該を(9Uへ代入して罰 闊
闘 闊
(91)
( 9 2 a ) ( 9 2 b l
. (B‑l)xo (B+l)x
゜a 1 = 2B , aa= 2B
となる。 (92)と(93)を用いて,シュクッケルベルク戦略は次のように確定される。
( 9 3 )
U 1 ( t ) =
―:以呵阿げ+化;¢―a t )
(94a)叫)=唸(竺」叫—-yt_ 『;)2 げ)
( 9 4 b )
いま
t=t
。C>O)
において同じ微分ゲームをやりなおすと,その時点での の再出発値は4 9
236 闊西大學「純清論集」第 3 7 巻第 3
号( 1 9 8 7
年9
月)巡)=嘉
((B‑l)e
→t 。 +(B+l)e‑810)
(95) であり,新しい戦略は(9 4 )
においてX oを 以t o ) ,t
をt‑t
。で置き換えたもので ある。すなわちU1(t)=
―盆竺(口6 ‑ r ( t ‑ t o )
+記e ‑ 8 ( t ‑ t o ) ) ( 9 4 ' a )
x ( t
。)b 2 q 2 (B‑1)2
u 2 ( t ) = 4 B r 2 ( (B+l)2
r‑a e
→< t ‑ t o ) + . B‑a e ‑ a < t ‑ t o ) ) ( 9 4 ' b ) ( 9 4 ' )
式 の 以to )へ( 9 5 )
を代入した時,( 9 4 ' )
が(9 4 )
式へ戻るための必要十分条件はO=r ( 9 6 )
であることが判明する。しかし
( 8 4 )における Ai2+4A1A2
は正値であるので( 9 6 )
の条件は充たされない。かくして{9 4 )
のシュクッケルベルク戦略は時間整合的で はない。闊と同様の論理を使うと,第
5
節における一般形のシュタッケルベルク戦略 が時間整合的であるためには,( J 6 )
における特性根のうちで(8 1 ) , ( 8 2 )
に表れるもの がすべて相等しいことが必要である。しかしこの条件は(J 9 )
に鑑みて充足されな いであろう。そこで時間整合性を充たすようにするには別の条件を考慮しなけ ればならない。シュタッケルベルク戦略が時間非整合的となる主たる原因は,任意の再出発 時点
t
。において次の条件が充たされなければならないことである14)。加(t。)
=O ( 6 6 " )
この条件は再出発後のa 1
と西の新値として' ( 9 3 )
の中のx
。の代りにx ( t o )
を入れたものとするので,( 9 4 )
にて表される戦略U ; ( t )の中の x
。もx C t o )で置・
き換えられ,