微分ゲームにおける時間整合的戦略 : 二主体のオープン・ループ解

(1)

微分ゲームにおける時間整合的戦略 : 二主体のオ ープン・ループ解

その他のタイトル Time‑consistent Open‑loop Strategies in Continuous Time Dynamic Games

著者村田安雄

雑誌名關西大學經済論集

巻 37

号 3

ページ 219‑245

発行年 1987‑09‑30

URL http://hdl.handle.net/10112/14331

(2)

2 1 9

論文

微分ゲームにおける時間整合的戦略＊

—二主体のオープン・ループ解—

村田

安雄

1 .

微分ゲームにおける主要戦略

2 .

一般形ナッシュ戦略 3. ナッシュ戦略の時間整合性

4. 浜田の二国間政策連関のナッシュ戦略

5 .

一般形シュタッケルベルク戦略

6 .

シュタッケルベルク戦略の時間非整合性

7 .

時間整合的シュタッケルベルク戦略

8. 浜田モデルの時間整合的シュタッケルベルク戦略

1. 微分ゲームにおける主要戦略

我々は政策決定の主体が二人である場合について動学的ゲームの解を求め，

それらが時間整合的であるように調整することを試みる。二主体に限定するのは計算の簡単化のためと，経済問題では二主体間のゲームが多いためであり，

分析結果を多数主体へ拡大することは容易であろう。また本稿では時間を連続的に扱う微分ゲームについて考察する（離散時間動学ゲームは村田

( 1 9 8 5 )が詳論し

ている）。

先ず微分ゲームのナッシュ戦略について概説しようI)o X(f) を第

t

時点の

＊本稿は関西大学学術研究（テーマ：「寡占経済戦略の動学ゲーム論的分析」）助成基金による助成を受けた成果の一部分である。また第

8

節の数値例における三次方程式の根の計算は本学吉田達雄助教授に負う。ここに謝意を表したい。

1) Cruz(1975)

を参照。

(3)

2 2 0 闊西大學「経清論集」第 3 7 巻第 3

号

( 1 9 8 7

年

9 月）

状態変数とし，

ぇ

( t ) = f ( x ( t ) , U 1 ( t ) , u i ( t ) , t )

(1) の微分方程式がその進行を定める。ここにえは

Xの変化率， u ; ( i = l , 2 )

は各主体の制御変数を示し， fは既知の関数である。経済学の問題でのfの形態は

え ( t )=ax(t) + b 1 u 1 ( t ) +b 必 ( t ) ( 1 ' )

の一次式で与えられることが多い2)。各主体は(1)の状態式と相手方に関する情報に基づいて，自己の制御変数を決定する戦略を考えるが，その基準は自己の異時点間損失を全期間にわたって極小化することである。例えば初期時点

0

から最終時点

T

までの第

i

主体の異時点間損失関数

( i n t e r t e m p o r a ll o s s f u n c t i o n )

を

L;=

化

⁽ ^u ^,( ^t ⁾ ⁺ ^u ² ⁽ ^t ⁾ ⁾ ²

^e

^― ^P ^' ^d ^t ⁽ⁱ⁼ ¹ ^, ² ⁾

゜

⁽ ² ⁾

として叫その損失関数に対する第

i

主体の戦略を

U;=V; ( i = l , 2 ) ( 3 )

とすると，

L ,

は次のように表現される。

L,=Lh1, 1 1 2 ) ( i = l , 2 ) ( 4 )

各主体の持つ情報が(1)式と (2)式に限られる場合に，もし可能なあらゆる戦略附

，

l l zに対して

L i

伍*,l

l z * ) : 0 : :

ム（巧，

l l z * ) Lz

伍*,1

1 2 * ) : 0 : : L 2

伍*,l

l z )

(5a) (5b) とするような一組の戦略

1 , 1 1 * ,ゲが存在すれば，

これをナッシュ均衡戦略の組と呼ぶ。各主体による戦略決定に際して，現時点の状態変数の情報を追加的に得ると，

x ( t )

が相手の戦略に直接的に影響する関係を考慮することになり，

かくして

1 , 1 1

と

1 1 2がぉ( t )

に依存する形のナッシュ均衡戦略をクローズド・

Jレープのナッシュ戦略と言う。巧と厄が必(t)に依存しない時に (5a)・(5b)

2) ( 1 ' )

式の説明は次節を参照。

3) ( 2 )

式の説明は次節を参照。

(4)

微分ゲームにおける時間整合的戦略（村田）

を充たすが，ゲはオープン・ループのナッシュ戦略と呼ばれ，それは時間

t

にのみ依存する制御関数として最初の時点において確定され得る。これに対してクローズド・ループの戦略は，各時点で状態変数からのフィードバックを含む制御｝レールの形をとる％我々は状態式として(1りのような一次式と，

損失関数として(2)のような二次式を想定して，オープン・ループのナッシュ均衡戦略を導出し（第

2

節），その時間整合性について考察し（第

3

節）5), そしてニ国間政策連関モデルヘの適用例を示す（第

4

節）。

次にシュタッケルベルク戦略について概説しよう。いま第

2

主体の制御する戦略リ2を第

1

主体が与件として受け止めて，自分の損失関数ムを極小化するように戦略巧を決める時に，第

2

主体はその巧の決定方式を明確に認知して自己の損失関数ムを極小化する戦略を採用するものとしよう。この場合には第

2

主体はリーダー

( l e a d e r )

として自分の戦略

l l zを最初に宣言して，それ

に対する第

1

主体の反応の仕方を観察する。第

1

主体はフォロワー

( f o l l o w e r )

として，与えられた

l l zに対応して一つの戦略 l / 1を決めるので，（附，％）の組が

出来る。別個の％に対応して新しく

l / 1が決まり，かくして成立する（巧， l l z )

の組の全体をフォロワーの反応集合と呼ぶ。その集合内における或る一組の

侶*,

l l 2 * )

が他の如何なる組の（％均）に対しても

L2

伍*,l

l z * ) : C : : L 2

伍，心 (6) の関係を充足する時に，

( 1 1 1* , 1 1 2 * )

は第

2

主体をリーダーとするシュタッケルベルク戦略であると定義される。もし現時点の状態変数を追加的情報として両主体が取得するならば，その戦略はクローズド・ループのシュタッケルベルク戦略であり，そうでないならば，ォープン・ループのシュタッケルベルク戦略であると言われる6)。本稿ではナッシュ戦略の場合と同様の関数形を想定し

4)

クローズド・ループ戦略のフィードバック制御ルールは離散時間動学ゲームにおいて

分析する方が理解し易い（村

r l l ( 1 9 8 5 )

を参照）。

5)

戦略系列の時間撒合性の定義は第

3

節にて与えられる。

6)

シュタッケルベルク戦略のクローズド・ルーフ゜解とフィードバック解は微妙に違っているが

(Cruz( 1 9 7 5 ) ,

p.

3 4 2

を参照），我々は両者を同義に扱う。離散時間動学ゲ

(5)

2 2 2 闊西大學「綬清論集」第 3 7 巻第 3

号

( 1 9 8 7 年 9

月）

て，オープン・ループのシュクッケルベルク戦略を導出して（第5節），その時間非整合性を示し（第

6

節），ついでそれを時間整合的戦略へ改修する（第

7

節）。最後にそれを二国間政策連関モデルヘ適用する（第8節）。

なお計算の簡単化のために，本稿での状態変数と制御変数はスカラーであるが，このことは問題の解明に妨げとはならない。

2 .

一般形ナッシュ戦略

本節のナッシュ戦略の枠組みでは，次節以降の特殊な関数形に縮小可能な比較的一般性をもつ関数形が想定される。状態方程式として

( 1 ' )

を採るが，これに定数 Cが加わって

え =ax+b 必 +b 必 +c

であっても，

y==x

―

c / a

と置いて，

y

を新しく状態変数と考えると少

=ay+b 必 +b 必

となるから，最初から

(7)

(8)

(7')

ぇ

( t )= a x ( t ) + b , u ,

(t)

+ b 2 u ( t )

(9) を状態方程式と想定しておく。ただし＄は状態変数，

u ; ( i = l , 2 )

は第

i

主体の制御変数で，これらは連続時間

t

と共に変化する。そして X の変化率

( d x / d t )

を土と表し，係数の

a ,b ; ( i = l , 2 )

は定数である。 (9)式は一次元での状態空間形式

( s t a t e ‑ s p a c e f o r m )

を成す°。また Xの初期値はダ。と与えられている。すなわち

ームにおけるシュタッケルベルク戦略のフィードバック解は村田

( 1 9 8 5 )

に詳しく解説されている。

7)

一般的な状態空間形は

x=Ax+Bu

と表され， Xは

n

次ベクトル， Uは

m

次ベクトルである。

( 9 )

式は

n=1,m=2

の場合である。

M i l l e r ‑ S a l m o n( 1 9 8 5 b)

は一般的状態空間形を想定して我々と同様の分析を行う。

(6)

微分ゲームにおける時間整合的戦略（村田）

223

x(O)=X

。 UDl

第

i

主体の異時点間損失関数として，

( 2 )

式より複雑な次の形を想定しよう

( s ; , q ; , r ; , p

は非負の定数）。

1

0 0

L;=

。廿

^[ ^s

^ぽ

^+q

^{心ーが}

⁺ ^r ^; ⁽ ^u

^{げ醐］だd}

^t ^U ^l ^l

ここに

P

は時間割引率で，これが大きい程遠い将来の損失の現在価値は小さくなる。元は Xの望ましい水準で，がえより乖離する大きさの二乗に

q ;

のウエイトを付したもの，制御変数の合計値の二乗に r;のウエイトを付したもの，およびェの変化率の二乗に

S

のウエイトを付したものが各時点での損失を構成する。これを現在値へ割引き，初時点

0

から無限の将来までにわたって集計した総価値が

U l l

の損失関数の内容である8)。

さて(9)とUDlの制約の下にUりの関数を極小化するような制御変数約を各

i(=

1 , 2 )

について導出するに際して，各主体は相手の制御する戦略(3)を認知しないという（オープン・ループの）ナッシュ戦略を得る必要条件は下記の通りである9)。各

i

についてハミルトニャン

H ;

H

戸一

1 [ s

ぽ

+q

心ーが

+ r ; ( u

け

u

が］＋か（仰

+b1u1+b

必） U2l

2

を定義し（ただしかは補助変数），

d(P 面

^p^t⁾

a ( H ; e ‑ P ' ) d t

＝

a x

〇＝警

^C ⁱ ⁼ ^l ^, ² ⁾

および横断条件

( i = l , 2 ) ・ .

U3} 閥

limp 面 P1=0 ( i = l , 2 ) [ 5 )

I→^{O O}

が(9), UO)と共に成立することである。 U2)式の中の公を(9)で代替して， U3l式を整理すると次のようになる。

‑A= ( s ; a 2 + q ; ) x + ( a ‑ p ) p ; + s ; a b 1 u 1 + s ; a b 2 u 2

一ぇ

q ; ( i = l , 2 )

U6) 同様に

U 4 l

式を整理して次式を得る。

8) 正確には集計された現在値の半分であるが，ーは後の計算の便宜のために付されてい 1

2

るに過ぎない。

9) S t a r r ‑ H o ( 1 9 6 9 )

および

M u r a t a ( 1 9 7 7 ) , p . 3 4 4 を参照。

3 7

(7)

2 2 4 闊西大學「綬清論集」第 3 7 巻第 3 号 ( 1 9 8 7 年 9

月）

O=s1ab1x+b

必

+ C s 1

釘＋れ池

+ ( s 1 b

必+

r 1 ) U 2 O=s2ab2x+b

必

+ ( s 2 b

必＋乃）

U

げ

( s 2

射

+ r 2 ) U 2 ( 1 7 a ) , ( 1 7 b )

の両式を

U 1 ,U 2

について解くと

( 1 7 a )

(17b)

「 ] = ^{1 [} ^{̲aD b} ¹ ⁽ ^s

^ぷ

⁺ ^r ² ^{) ‑} ^b ² ^C ^s

^砧

⁺ ^r ¹ ⁾

^X

u , (b,‑b,)D ‑aD ‑b,(,

砧

+ r , ) b , C ,

討

+ r , )] [ : : ] u m

となる。ただし

D

を次のように置く。

D = = s 1 b 1 r 2 ‑ s

必r

1

U9) (9)とU6lから成る三式は， US)を代入すると連立一次微分方程式の体系に書き換え

られる。すなわち，

︱

⑳ 0 I

Xq I‑ 5

︱

＋

︱

︱ u l

約

l

‑

︳一

︱

I O I X q I

知叫叫[•

＋ゎ

81 82

l l

‑ ︳

P l

柘

la

bl

ab

l‑

︱

b s l 8 2 p

︱

‑ +

l

﹃

r l a

＋叫

D

‑

︱

‑ S t r l

P l 拓血

D甘廿廿且紀

D

‑ 8 2

a

o o

‑ P

P +

a a

‑ 0

2 2

゜

r r

2 r p

q i

の

b l

D a

b l

D a

b l

D

̲ ︳

︳

S l 8 2 a2a2a

ーの Sl 82

o

q

︱

︱︱

︱

＝l

︳︳

l

‑

え．

P l

．拓

︱

体系(20)の特性方程式は

O+a‑p) ( A 2 ‑ p A ‑ r p ) =O

と整理できる。ここに次の想定を置こう。

r p = = ( q 1 b 1 乃一 q 2 b

か）

ID >O

かくして特性根は

入

1=p‑a

A2=‑(p‑i/ 1

が十

4 r p ) < O 2

入

3=‑(p+i/ 1

亨）

>P 2

となり，各根に対応する固有ベクトルは順に次のように算定される。

(21)

(22)

(23)

(8)

［

臼

H

^今

l

^三^[

^H ^:

^唸^号^：^］^［^三

^H ^: ^: ^:

^喜^三^：

^j ^: _~

更に(20)式の非同次項に対して特解｛え，

0 ,O }

を求め，

( 2 0 )

式の一般解を次のように表す。

[ : : I ! J

^哀

^・ ^, ^t ^: ^: ^J

^砂;'+[

i :

⁽²⁵⁾

最後に横断条件

( 1 5 )

と初期条件(10)に配慮して

( 2 5 )

式の

a j ( j = 1 ,

2.

3 )

を決める。

( 2 4 )

を

( 2 5 )

式へ代入し， (10)の条件を用いると

幼

=a2

十叩＋ぇ

を得，また

As‑P>O

と

( 1 5 )

を考慮して

as=O

であり,

( 2 6 )

と

( 2 7 )

から

a 2が次のように決まる。

伶

=x

。―ぇ

かくして

t=Oの時の ( 2 5 )

式は，

a : : : o

を想定すると，

b

ぬ ‑q , + s , a ‑ l 2 p , ( O ) =a1 b — , r 2 +(xo-x)

入

s‑a

加(O)=a1+(x゜―え）

qz+s2a

入

2

入

a‑a

になり，従って

a 1は次の二つの表現を持つ。

Q1+S1a

入

2 a 1 =[P1

(0)‑

( x o X b 1 r 2

入

a‑a

^ー^）^］b釦

Q 2 + s 2 a . l 2

約＝か(0)‑ (x。―え）

入

a‑a

P 1 C O )

または加

( 0 )

を任意に定めると，約が決定する。要約すると

a>O

の場合には

x ( t ) =(xo‑

え）

e > ‑ , 1

十え

( 2 6 )

(2~

(28)

(29a) (29b)

(30a) (30b)

(31)

(9)

2 2 6 闊西大學「純清論集」第 3 7 巻第 3

号

( 1 9 8 7 年 9

月）

q

け

s ; a . . t 2

p ; ( t ) =P;(O)e

団＋（゜―え）

. . t a ‑ a

(e入•'-かり

^C ⁱ ⁼ ^l ^, ² ⁾

⁽³²⁾ と表される。

もし a:S:Oであれば， a1

=0

と置くので'

( 3

加の代りに

p , ( t )

=.Cxo一え）止皇~e入•'

_. _. _t _a _‑ _a ⁽ ⁱ ⁼ ^l ^, ² ⁾ ⁽ ³ ³ ⁾

になり，

p i ( O )

とか(

0 )

は一義的に決まる。

( 3 U

はこの場合にも妥当する。

オープン・ループのナッシュ戦略は

( 3 U( 3 3 lの { x ( t ) ,P 1 C t ) , P 2 C t ) }

を

( 1 8 )

式の右辺へ代入することにより確定する。

3 .

ナッシュ戦略の時間整合性

オープン・ループのナッシュ戦略が時間整合的

( t i m ec o n s i s t e n t )であるかど

うかを検討しよう。

Cohen‑Michel(l984)

によると，動学ゲームの各主体

i

の戦略の或る系列伽*

( t ) }

t~O が，状態変数の系列｛が (t)} t~O に対応するものと

し，もしこのゲームを任意の時点

t=t

。

(>O)

においてやりなおしてが(

t o )

から再出発したとすれば，そのやりなおした戦略がすべての

i

について佃*

( t ) }

や

t oI

こ等しい場合にのみ；元の戦略伽*

( t ) }1 : : ; ; : oは時間整合的であると言われ

る。

Cohen‑Michel(l9 8 4 )は多数主体の微分ゲームについて，第 i

主体の損失関数として下記の関の形を想定し，ナッシュ戦略の時間整合性を明らかにした。

L;=

廿

2

^{O O}。^{年（が}

+ r ; u ; ( t ) 2 ] d t ⁽ ³ ⁴ ⁾

これは

n n

の関数においてぇ

=p=Oと置き，がと他主体の制御変数を除いたも

ので，その結果，ナッシュ戦略は簡単な形になり，それの時間整合性が比較的容易に確かめられる。我々は(34)の損失関数を用いて二主体のオープン・ループのナッシュ戦略を前節での手続きによって導出する（状態方程式は

( 9 )

を想定）。

この場合には

( 1 8 )

に相当する式は

(10)

b ;

u,=‑‑P, r , ^C ⁱ ⁼ ^l ^, ² ⁾

であり

' ( 2 3 )の特性根は

入i=‑a A2=‑r

炉 =r==(a吐生釘＋匈社）究＞〇 r1 r2

となり，従って(

3 1 )

と(32)に相当するものは

x(t)=x

゜

^e ^―

^（^幼

^=x(O):

^定数）

p ; ( t ) =

̲_r‑a̲!jj̲ク

( t )

+

( p ; ( O )

一年_r‑a）￠―

^a ^t ⁽ⁱ⁼

¹^,²⁾

227 ( 3 5 )

(36)

(37) (38) である。 (38)を(35)へ代入すると，ォープン・ループのナッシュ戦略が次のように確定する。

u;(t)=え竺/-y号（竺—p;(O))e―at

⁽ ⁱ ⁼ ^l ^, ² ⁾ ⁽ ³ ⁹ ⁾

いま

t=t

。

C > o )

において同じ微分ゲームをやりなおして，

xCto)=x

゜

^e ^― ^r ^t

^。

⁽ ³ ⁷ ^' ⁾

を

t

。時点での元の出発値とすると，新しい戦略は

( 3 9 )

において

X oをぷ( t o ) , tを t‑t

。,

p ; ( O )

を砂）で置き換えたものである。すなわち

U;(t)=

_r;(a‑r)姶j 此

0 ) e ‑ r ( t ‑ t o )

+糾年

⁽ ^t

^。⁾-p;(to))e-a(ヽ—lo)

⁽ ³ ⁹ ^' ⁾

そして

( 3 7 ' )より得られる

x ( t o ) e ‑ Y ( t ‑ t o ) = x o e ‑ Y t ( 3 7 ° )

および(38)より得られる

砂）＝直邸）_r‑a +

⁽ ^P ^, ⁽ ^O ⁾

一年_r‑a）

ê ^‑ â ^t ô ⁽ ³ ⁸ ^' ⁾

を

( 3 9 ' )

へ考慮すれば，それは

( 3 9 )

と全く同一になる。かくして(

3 9 )

は時間整合的である。

前節で我々の導出したナッシュ戦略

{ u ; ( t ) }

t~o も時間整合的であることを示すには，任意の

t=t

。

> o

において微分ゲームをやりなおした時の状態変数

(11)

2 2 8 闊西大學「純清論集」第 3 7 巻第 3

号

( 1 9 8 7 年 9

月）

x ( t )

と補助変数

p ; ( t ) ( i = 1 , 2 )

が，元の

t=O

より出発した時のそれらに一致することを証明すればよい。

t=O

より出発した時の

x ( t

。)とかC

t o )は x ( t

。)

=(xo

一え）

e

入が

0

十え

か

( t o )=p;(O)

かり+(xo‑x^‑q

)

^{け s}^;^a^,^l²

( e l

が

o‑e

入

1 1 0 ) As‑a

( 3 1 ' ) ( 3 2 ' )

である。

toC>O)より再出発してナッシュ解を求めなおすと， t(>t

。)時点においては

x ( t ) = ( x ( t o )

一え）

e h o (

ーヽ

l o ) +

え

( 4 0 )

q;+s;aA2

p ; ( t )

=P;(to)ex•<ヽ— to)+

( x ( t o )

一え）（必2(1-lo)- が（ヽ—lo))

( 4 1 ) . . t 3 ‑ a

となる。（船）と

( 4

りの各式は，その中の

x ( t

。)，

p ; ( t

。)を

( 3 1 ' ) ,( 3 2 ' )

で代替して整理すれば，それぞれ(

3 1 )

と

( 3 2 )

に帰着することが分かる。かくしてナッシュ戦略

U ; ( t )

は

U 8 l

式に示されているように，

x ( t )とか( t )の一次結合であるので，再出発し

た

{ U ; * ( t ) }

I述の系列は，

t=Oから出発した元の系列 { u ; ( t ) }

、^:²^,⁰の上に重なる。つまりこの元の系列は時間整合的である。

4 .

浜田の二国間政策連関のナッシュ戦略

本節ではオープン・ループのナッシュ戦略が二国間政策問題へ応用される。

応用例として浜田

( 1 9 8 2 )の第 V

章「貨幣政策連関の戦略分析」の付論「微分ゲームとしての世界マネー・ゲーム」を取り扱う。それは二国から成る世界を考えて，第

i

国の貨幣市場での変動を

M;=

応冗ーU;

( i = l , 2 )

と示す。ここに

応＝第

i

国の外貨準備増加額冗＝各国共通のインフレ率

U戸＝第

i

国の超過信用拡張率

M,=

第

i

国の貨幣残高

( 4 2 )

(12)

である。また

冗

=w

必

+CiJ2U2+G ( 4 3 )

の関係がある。ただし

叫＝全世界の貨幣残高

(M1+

島）に占める

M,の比率 R 1 R 2

G=(

科＋島）

/CM:

げ

M2)=w1

玩呵石

+ ( 4 4 )

いま簡単化のために次の想定

C i / 1 =

匹＝百，

1 G=O

(45) を置くので， (42)と(43)は第

t

時点で次のようになる。

Z;(t)=

ー

1 C u i( t ) ‑ u 2 ( t ) ) 2

1

冗

( t )

=ーC

2 u i( t ) + u 2 ( t ) )

ここに Z;=応/M;と記し，更に

炉我 1C=

丸

/M1)

( 4 2 ' )

(43')

( 4 6 )

と表すことにすれば，

( 4 4 )

式に(45)の想定を置いて，

Z2=

一公となる。従って (42') は

x ( t )

=百

1 ( u 1( t ) ‑u2 ( t ) )

(47) と書き換えられる。

さて第

2

国を基軸通貨国と想定し，その異時点間損失関数を

L2=~00[年（が＋上磁(t)2]e―P'dt₀

₂ ⁽ ⁴ ⁸ ⁾

とし，第

1

国のそれを

L1=~)2が(t)2 嗜S1i(が＋和 (x(t) ーが]e―ptdt ⁽⁴⁹⁾

としよう10)。(43')を代入すると， (48)と(49)の関数は我々のUl)式に一致する（ただし

q2=0)

。

初期時点における第

1

国での外貨準備と貨幣残高によって

x(O).

が

x

。と与

1 0 ) 浜田の損失関数にはんの一次の項が入っていたが，これは今後の分析に本質的影響を与えないので，省略された。

(49)

式中の

X

ーえは第

1

国の外貨準備の目標との差を表す代理項目である。

43

(13)

230 閥西大學「綬清論集」第37巻第3号 (1987年9月）

えられたとして，

( 4

加式の状態方程式の下で，各国は(

4 8 ) , ( 4 9 )

をそれぞれ極小化するナッシュ戦略を決めるであろう。この場合は第

2

節の(9)式にて

a=O,b1=

1 1

百，炉ーすとなっており，

q2=0

も考慮に入れると，

U B l

に相当するのは叫）＝紅

2ls2rJ‑(

い）か

⁽ ^t ⁾

+(い）

^P ² ^C ^t ⁾ ^] ⁽ ⁵ ⁰ ^a ^l

叫）＝紺

2ls2rJ‑(

い）か

⁽ ^t ⁾ ⁺

(い）加

w ]

であり

' ( 2 3 )

の特性根は次のようになる。

ここに

A1=P

i

戸ー

1 (p‑,1

が十

4 r p ) < O 2

圧ー

1 (p+,I 三） >P 2

' P " = Q 1 r 2

S1

乃十

S釦

かくして'

( 3 1 ) , ( 3 3 )

は次のものに帰着する11)0

x ( t ) = ( x o

一え）e叫＋ぇ

か(t)

=(xo

一え）生

e

叫

As 拓

( t ) = O

そして浜田モデルに従って

r1=

乃

= 1 / 2 ,s 1 = s 2 = 2 s , Q1=2q ( s , q>O)

( 5 0 b )

(51)

(52)

( 5 3 )

(54a)

( 5 4 b )

邸）と置いて,

( 5 4 )

を(50)へ代入して整理すると，ォープン・ループのナッシュ戦略は

叫）

=

1(己）^q(^え^ー

X o )

s P+V

が

+ 2 q / s

^e^入^●^t ⁽⁵⁶^a⁾ 叫）

=

U1

( t ) 1 ( ‑ + ) / 1 ( +¼) ⁽ ⁵ ⁶ ^b ⁾

となる。ぇ

> x

^{。の時には} ^U1(t)は正値で減少し続け，その減少率は

U 1 1

‑=..l2=‑(p‑i/

が

+2q/s)<o

U1

2

であり，これは U2,

P 1 ,

Xーえの減少率と同一である。

1 1 ) ( 5 4 b )

の導出は

( 3 Q a ) = ( 3 0 b )

を考慮した。

(57)

(14)

2 3 1

5 .

一般形シュタッケルベルク戦略

さて二主体のうち第

2

主体のみが第

1

主体の戦略決定方式を知っている時のシュタッケルベルク解を，第

2

節での一般形の損失関数

U l l

を想定して導出しよう。第1主体がフォロワー，そして第 2主体がリーダーとして，共に(9)とUO)の状態変数に関する情報を有して，

U l )

の損失関数を極小化するオープン・ループ戦略を得るための必要条件は下記の通りである

1 2 )

。第

1

主体についてはナッシ

ュ解と同ーであり，ハミルトニャン

H1

Hi=‑[s, 1

が十

q

心ーが

+r1(U

げ

U2)2]+

か

(ax+b

必

+b 西）

2

を定義し（公は(9)式で代替），

d ( P 1

げ）

a ( H 1 e ‑ P 1 )

‑ =

゜

dt

ax

＝ー

8H1 a u 1 =s1ab1x+b

必

+(s

如

+ r , ) u 1+ ( s 1 b

必

+ r 1 ) U 2 1imP1e ― P'=o

t

→

OO

が成立することである。 (59)は次のように書き換えられる。

炉＝ー

( s

ぷ

+q

心

+(p‑a)P1‑s,ab

必ー

s 1 a b

必＋ぇq

,

(58)

(59) (60)

( 6 1 )

(59') 第 2主体のハミルトニャン比は(9),(59')および(60)を含むが，予め(60)より約を

u 1 = ‑( s 1 a b 1 x + b 1 P 1 + C s 1 b 1 b 2

十

r 1 ) u 2 ) / ( s 1 b 1 2

十

r 1 )

三

U 1

と求め，比を次のように定義する

1 3 )

0

H

戸一

1 2 [ s 2 ( a x + b 1 u 1+b 西）吐 Q 2 ( X ーえ）吐乃 (u1+U2)2]+

加(ax+

(60')

b 1 u 1 + b 2 u 2 ) +p3[ ‑(s1a2+q1)x+ (p‑a)P1 ‑ s 1 a b 1 u 1 ‑ s 1 a b 2 u 2 J

(62)

U 1

に (60')を代入した後の比について，

1 2 ) Simaan‑Cruz ( 1 9 7 3 ) および Murata ( 1 9 7 7 ) , p . 3 4 4 を参照。

1 3 ) Simaan‑Cruz ( 1 9 7 3 ) による出は次のようになる。

H2==—[s炉十q2(か→か＋乃（佑十約）

1

₂

2 J + P 2

え

+Pa

か

+ P . C 8 H i / 8

約）

ただし公は(9)で，かは(59')で，

a H i 1 a

約は(60)でそれぞれ代替される。この

H

の中

の p .

の存在が解の導出を困難にする。•

4 5

(15)

2 3 2 閥西大學「純清論集」第 3 7 巻第 3

号

( 1 9 8 7 年 9

月）

d ( P 2 e ― p t )

acH: 牙

p t )

‑ =

dt

a x

d ( P a e

―

P l )

8(H: 硲＂）

‑ dt

= a p 1

゜

^＝

^8H2 ^a ^u ²

limP2e‑P1=0

t→OO

加

(O)=O

がすべて充たされることが必要である。

F = = s 2

が

+ s 1 2 r 2 b 1 2

( 6 3 ) ( 6 4 ) ( 6 5 )

(61')

( 6 6 )

(67) と置いて，

( 6 5 )

より次の関係を得る。

U

戸

( b

こ恥

^[aFx

^十射

⁽ ^s ¹ ^乃ー ^s ² ^r ¹ ⁾

^か

^+r1(r1+s

^討）

⁽ ^P ² ^‑ ^a ^s ¹

^加^）]

⁽ ⁶ ⁵ ^' ⁾

そして(

6 3 ) , ( 6 4 )

を整理して(

6 5 ' )

を考慮すると，

Pz=‑qzx+p̲

加

+q

必＋ぇ

Q z Ps= . . . : . . b i 2 s 2 r 2 b 1 2 s 1 r 2 a s 2

が

F

か +

F

加 +

F

加が導出される。また

( 6 0 ' )

へ

( 6 5 ' )

を代入すると，

1 .

u 1 = ( b 2 ‑ b 1 ) F [aFx+b1P

か

+ r 1 C s 1 b

必+

r 1 ) C P 2 ‑ a s 1 P s ) ] ( 6 0 ° )

を得る。そして(9)式，

( 5 9 ' )

式へ(

6 0 ° )

と

( 6 5 ' )

を代入して整理するとそれぞれ次のよ

( 6 3 ' ) ( 6 4 ' )

うになる。

公＝一

‑1

F [ s

山射

P

げが

(P2‑as

必）］

゜

るなこ

, 9

O l

↓

．狐

00 I

X q

l ‑ 叩

q i

る

l

̲

ぇ十

＋め

︱

〇と

xpsplかP

ま

︱

︱ S l

こ

a I

亡 [ [ ふ

F叩 F P

2方2

5F 分釘釘年

F o a微

rZ Fr zF a

＋次 Slsz

︳

p ー

P

‑

︱︳

り立

Y

2 2

ー

r l FS zr Fa sl Fq i

s z r F

連

r l

aを

S l

り

a a ( 6 3

L>

︵一

＋び

︒︒

qlqzx

ょ一

︱ぉーq

,

．

︐

6

I‑︵ ︐

9 ,

4

•Pl,

6

9 9

饂

. x

•Pa

•Pl

拓

(68)

( 6 9 )

『0)

{70)についての特性方程式を整理して間を得る（ただし入は特性根である）。

(16)

0=( えー p ) 2 , ' ! 2 ‑ ( , ' ! ‑ p )

ぇ

R/F+Q/F

ただし

Q=q

品兄一

q 2 a r 1 2 ( p ‑ a )

R = 2 q 1 s 1 r 2

肝

+q2

が一

a s 2

が

(p‑a)

233

( J l )

⑳

t

huhu

と置く。『1)に根の公式を適用して

J . ( , l ‑ p ) = (R‑(K:

げ十4

r

釘

( q

裕

,‑q

函）

K

況）/(2F)==C1

( 7 4 a ) え ( , l ‑ p )=(R+(K:

げ十4

r

釘

( q

袋

1‑q

心）

K

閃）/(2F)==C2

( 7 4 b l

を得る。ただし

K==(q; +as;(P‑a))

がである。かくして(

7 0 )

式の特性根は

l1=(p‑i/

炉十

4 C 1 ) / 2 l2=(p+i/

炉十4

C 1 ) / 2 la=(p‑i/

炉十4

C 2 ) / 2

入

4=(p+

‑V炉十4

C 2 ) / 2

と導出され，特解を加えた『0)の一般解は

( i = l , 2 )

(75)

(76)

X (t)

K 。

^j

l

_「_え

釦(t) 4 知。

=J~=l

a; e X J ' +

P 1 C t )

知 I

o

加Ct) 知J L

o

(77)

となる。ここに

{ k

。;,

k a ; , k l j , k 2 ; )

は朽に対応する固有ベクトルである。いま

C

ぷ

0 ,C2>0

と想定すると，

入

1 6 0 ,

入

2 ; ; ; ; ; P , A s < O ,

心

>P

閥

( 7 9 )

となり， (61)または(61りの条件のために

( 7 7 )

において

a4=0でなければならない。

故に

koi=l

とおくと， (77)より

(j=l, 2 , 3 )

(80)

(17)

2 3 4 関西大學「経清論集」第 3 7 巻第 3

号

( 1 9 8 7 年 9

月）

x(t)

= I :

3

: a

投

> ‑ ; t +

え (BU

i=l

が得られ，また

3

p;(t)

= I : : a ; k ; ; e ザ ( i = l , 2 , 3 ) ( 8 2 )

i=l

となるが，特に加について(66)の初期条件が充たされなければならない。すなわち

加

( 0 ) = a 1 k a 1 +a2ks2+askss=O

(66') また x(O)の初期値はUO)で与えられているので， (BUより

Xo=

佑

+a2+aa

十え

となる。いま仮に加(

0 )を任意に与えると

加

( 0 ) = a 1 k 2 1

十叫知

+ a a k 2 s

( 8 1 ' )

( 8 2 ' )

を得るので，

( 6 6 ' ) ・ ( 8 1 ' ) ・ ( 8 2 ' )

を用いて％叫，

a gを決定する。かくして x ( t ) , p;(t) ( i

==

1 , 2 , 3 )

の行動式が確定し，これらを

( 6 5 ' )

と

( 6 0 H )

へ代入することによ

り，シュクッケルベルク戦略

u 2 C t )

と

U 1 ( t )

も確定する。

6 .

シュタッケルベルク戦略の時間非整合性

前節で求めたオープン・ループのシュタッケルベルク戦略が，第

3

節で定義された時間整合性を備えるか否かを検討しよう。

Cohen‑Michel ( 1 9 8 4 )

は

( 3 4 )

の損失関数を想定した場合において，この戦略が時間非整合的であることを明らかにした。この場合にはt

/ 0 )

に相当する連立一次方程式は(

8 3 )

のようになり，『6

)

に相当する特性根は

( 8 4 )

のようになる。

え a 0 ‑ b i 2 / r 1

ー射

/ r 2

柘

゜ ^a ゜

^釘

^/ ^r ^{1 P} ^a

か

^‑qi

゜ ^‑a ゜ ^P ⁱ

か

^‑q2 ^Q ⁱ

゜ ^‑a ^P ²

. l . 1 = ‑ r

入2=[a吐Aげー(A2-VA社十 4A1A2)J½==r

2 1

( 8 3 )

(84a)

(18)

J3=‑6

J4=[a

吐

A

けー

2 1 (A

け

, I Ai

十

4 A 1 A 2 ) ]

垢畔

ここに

A1=Q1

釘!

r 1 > 0 ,A

戸

q

起

/r2>0

とおく。この時

入

a<A1<0,O<A2<A4

235 ( 8 4 b )

(85)

( 8 6 )

の関係があるものと考えられ，従って(81)と(82)に当たる式はそれぞれ次のようになる。

x ( t ) =a1e

→

^t ⁺ â â ê ^‑ â ^t

p ; ( t ) = a 1 k ; 1

戸＋叫

i s B ― a t ( i = l , 2 , 3 )

そして初期条件U

O }

と

( 6 6 )

を充たさなければならないので，

゜

=x(O)=a1 +a8 O = P s ( O )

=叫

k s 1+ a s k s s

より

a 1

と

a s

が

a 1 = k s s X o / C k s s ‑ k s 1 ) , a s = k s 1 X

。

^/ ⁽ ^k ^s ^1‑ ^k ^s ^s ⁾

と決まる。ここに加

( i = l ,2 , 3 ; j = l , 3 )

は

ku q l

, k 2 1 = q 2 ( l ‑B) ‑ A 1 k 2 1

＝

r‑a 2(r‑a) , k s 1 =

q 1 ( r + a )

知見，

^k ² ^s ⁼ ^q _2(6‑a) , ² ⁽ ¹ ⁺ ^B) ^k ^s ^s ⁼ _q ^‑ ₁ ^: ₍ ^‑ _i ^‑ ^A _l ¹ ₊ ^k ² _a ^s ₎

と算定され

(B==V1+4Ai/A2),(

9該を(9Uへ代入して

罰闊

闘闊

(91)

( 9 2 a ) ( 9 2 b l

. (B‑l)xo (B+l)x

゜

a 1 = 2B , aa= 2B

となる。 (92)と(93)を用いて，シュクッケルベルク戦略は次のように確定される。

( 9 3 )

U 1 ( t ) =

―：以呵阿げ＋化；￠―

^a ^t ⁾

⁽⁹⁴^a⁾

叫）＝唸（竺」叫—-yt_ 『;)2 げ）

⁽ ⁹ ⁴ ^b ⁾

いま

t=t

。

C>O)

において同じ微分ゲームをやりなおすと，その時点でのの再出発値は

4 9

(19)

236 闊西大學「純清論集」第 3 7 巻第 3

号

( 1 9 8 7

年

9

月）

巡）＝嘉

((B‑l)e

→

t 。 +(B+l)e‑810)

(95) であり，新しい戦略は(

9 4 )

において

X oを以t o ) ,t

を

t‑t

。で置き換えたものである。すなわち

U1(t)=

―盆竺（口

⁶ ^‑ ^r ⁽ ^t ^‑ ^t ^o ⁾

+記

ê ^‑ ⁸ ⁽ ^t ^‑ ^t ô ⁾ ⁾ ⁽ ⁹ ⁴ ^' â ⁾

x ( t

。)

b 2 q 2 (B‑1)2

u 2 ( t ) = 4 B r 2 ( (B+l)2

r‑a e

→

^< ^t ^‑ ^t ô ⁾ ^+ . ^{B‑a e} ^‑ â ^< ^t ^‑ ^t ô ⁾ ⁾ ( 9 4 ' b ) ( 9 4 ' )

式の以t

o )へ( 9 5 )

を代入した時，

( 9 4 ' )

が(

9 4 )

式へ戻るための必要十分条件は

O=r ( 9 6 )

であることが判明する。しかし

( 8 4 )における Ai2+4A1A2

は正値であるので

( 9 6 )

の条件は充たされない。かくして{

9 4 )

のシュクッケルベルク戦略は時間整合的ではない。

闊と同様の論理を使うと，第

5

節における一般形のシュタッケルベルク戦略が時間整合的であるためには，

( J 6 )

における特性根のうちで(

8 1 ) , ( 8 2 )

に表れるものがすべて相等しいことが必要である。しかしこの条件は(

J 9 )

に鑑みて充足されないであろう。そこで時間整合性を充たすようにするには別の条件を考慮しなければならない。

シュタッケルベルク戦略が時間非整合的となる主たる原因は，任意の再出発時点

t

。において次の条件が充たされなければならないことである14)。

加(t。)

=O ( 6 6 " )

この条件は再出発後の

a 1

と西の新値として

' ( 9 3 )

の中の

x

。の代りに

x ( t o )

を入れたものとするので，

( 9 4 )

にて表される戦略

U ; ( t )の中の x

。も

x C t o )で置・

き換えられ，

t

。以降の佑系列はその変化に応じてシフトする。このようなシフトを生じさせない方策が，一般的シュタッケルベルク戦略についても不可欠なのである。

1 4 )

この点を最初に指摘したのは

B u i t e r ( 1 9 8 3 )

である。

微分ゲームにおける時間整合的戦略 : 二主体のオ ープン・ループ解

2 1 9

1 .

2 .

5 .

6 .

7 .

( 1 9 8 5 )が詳論し

t

8

1) Cruz(1975)

2 2 0 闊西大學「経清論集」第 3 7 巻第 3

( 1 9 8 7

9 月 ）

( t ) = f ( x ( t ) , U 1 ( t ) , u i ( t ) , t )

Xの変化率， u ; ( i = l , 2 )

え ( t )=ax(t) + b 1 u 1 ( t ) +b 必 ( t ) ( 1 ' )

0

T

i

( i n t e r t e m p o r a ll o s s f u n c t i o n )

L;=

( u ,( t ) + u 2 ( t ) ) 2

― P ' d t (i= 1 , 2 )

( 2 )

i

U;=V; ( i = l , 2 ) ( 3 )

L ,

L,=Lh1, 1 1 2 ) ( i = l , 2 ) ( 4 )

l l zに対して

L i

l z * ) : 0 : :

l l z * ) Lz

1 2 * ) : 0 : : L 2

l z )

1 , 1 1 * ,ゲが存在すれば，

x ( t )

1 , 1 1

1 1 2がぉ( t )

2) ( 1 ' )

3) ( 2 )

t

2

3

4

2

1

2

2

( l e a d e r )

l l zを最初に宣言して，それ

1

1

( f o l l o w e r )

l l zに対応して一つの戦略 l / 1を決めるので，（附，％）の組が

l / 1が決まり，かくして成立する（巧， l l z )

l l 2 * )

L2

l z * ) : C : : L 2

( 1 1 1* , 1 1 2 * )

2

4)

r l l ( 1 9 8 5 )

5)

3

6)

(Cruz( 1 9 7 5 ) ,

3 4 2

2 2 2 闊西大學「綬清論集」第 3 7 巻第 3

( 1 9 8 7 年 9

6

7

2 .

( 1 ' )

え =ax+b 必 +b 必 +c

y==x

c / a

y

=ay+b 必 +b 必

( t )= a x ( t ) + b , u ,

微分ゲームにおける時間整合的戦略 : 二主体のオープン・ループ解

9 月）

⁽ ^u ^,( ^t ⁾ ⁺ ^u ² ⁽ ^t ⁾ ⁾ ²

^― ^P ^' ^d ^t ⁽ⁱ⁼ ¹ ^, ² ⁾

⁽ ² ⁾

^[ ^s

^+q

⁺ ^r ^; ⁽ ^u

^t ^U ^l ^l

^C ⁱ ⁼ ^l ^, ² ⁾

「 ] = ^{1 [} ^{̲aD b} ¹ ⁽ ^s

⁺ ^r ² ^{) ‑} ^b ² ^C ^s

⁺ ^r ¹ ⁾