• 検索結果がありません。

汚染的寡占の微分ゲーム分析

N/A
N/A
Protected

Academic year: 2022

シェア "汚染的寡占の微分ゲーム分析"

Copied!
18
0
0

読み込み中.... (全文を見る)

全文

(1)

汚染的寡占の微分ゲーム分析

著者 藤原 憲二

雑誌名 経済学論究

巻 63

号 3

ページ 499‑515

発行年 2009‑12‑15

URL http://hdl.handle.net/10236/3713

(2)

汚染的寡占の微分ゲーム分析

A Differential Game Model of Polluting Oligopoly

藤 原 憲 二  

This paper formulates a differential game model of polluting oligopoly to compare the steady state in cooperative, open-loop and feedback solutions, and prove the following ranking. The steady state pollution stock is largest under the linear feedback strategy, second largest under the open-loop strategy, third largest under the nonlinear feedback strategy, and smallest under the cooperative solution. However, in the limiting case where the discount rate approaches zero, the steady state with the nonlinear feedback strategy coincides with the cooperative equilibrium.

Kenji Fujiwara

  

JEL

C61, C73, L13

キーワード:微分ゲーム、汚染的寡占、オープンループ解、フィードバック解

1

導入

微分ゲームはストック変数が時間と共に変化する微分方程式を制約として、

プレーヤーが生涯にわたる目的汎関数の値を最大化するように戦略の時間流列 を決めるゲームである。ナッシュ均衡やシュタッケルベルク均衡といった解概 念に依拠する点では静学ゲームや多段階ゲームと同じだが、戦略がどのような 情報に依存するかによって複数の解概念を定義できる点に特徴がある。また解 を求める際に求められる数学的手法は動学最適化理論であり、ハミルトン関数 を用いる最大値原理とハミルトン=ヤコビ=ベルマン方程式を用いる動学計画 法が援用される点でも教科書的なゲーム理論とは一線を画する。

経済学への応用を念頭に書かれた微分ゲームの邦文による入門的な解説に ついては、既に柴田・竹田

(1997),

柴田

(2004)

が要領よく展望している。ま

(3)

たそれらの文献を理解するに際しては三野

(1985, 1986)

がテクニカルな点に まで立入って丁寧な解説を行っている。下村(

2002, 2004

)は

3

期間ゲームを 用いて動学ゲームで用いられる

2

つの解概念、オープンループ・ナッシュ均衡 とフィードバック・ナッシュ均衡を解析的に求め初等的な解説を行っている。

さらに

Dockner

et al.

(2000)

は微分ゲームの理論と応用例を盛込んだ教科書 として微分ゲームを理解する上での必読文献となっている1)

従って微分ゲームとはどのようなもので、それがどのような場面で応用さ れているのかについての概説は必要十分である。本稿ではむしろ微分ゲームの 持つ経済学的な解釈やインプリケーションについてできるだけ詳細に考察する ことで上述の解説論文との差別化を図る。ここでも柴田・竹田

(1997),

柴田

(2004),

下村(

2002, 2004

)と同じく一般的なモデルや関数形は考えず、特定 化されたモデルを解きながら微分ゲームの持つ経済学的意味を探る。

本稿で使うモデルは次のようなものである。

n

2

社からなる寡占産業を 考え各企業はクールノー競争を行う。生産量

1

単位について同単位の汚染が 排出される。これは社会に存在する汚染ストックを蓄積させ各時点での汚染ス トックは企業の利潤を引下げるように作用する。よって企業の毎時点における 利得は生産から得られる利潤から汚染による被害を差引いたものとして定義さ れる。汚染ストックの蓄積方程式を制約条件として上で定義された利得の割引 現在価値を最大化するように各企業は生産量を決定する。ここで企業間の手番 は同時的でありシュタッケルベルク・ゲームのような多段階の決定は考えな い。従って本稿で考えるゲームの解はナッシュ解のみである。しかし既に述べ たようにナッシュ解にも複数の定義が考えられ、以下では(

1

)オープンルー プ・ナッシュ均衡、(

2

)線形フィードバック・ナッシュ均衡(線形マルコフ完 全ナッシュ均衡)、(

3

)非線形フィードバック・ナッシュ均衡(非線形マルコ フ完全ナッシュ均衡)の

3

つを考える。これらを共謀解と比較することにより 動学的なナッシュ解の持つインプリケーションを考える。

本稿の構成は次の通りである。第

2

節ではモデルの提示を行い、第

3

節で

1) Dockneret al.(2000)以前にはBasar and Olsder (1995)がよく引用されていたが記述 はより数学的で難解である。

(4)

は後の比較におけるベンチマークを与える共謀解を求める。第

4

節ではオープ ンループ解を、第

5

節では線形・非線形のフィードバック解を導出する。第

6

節では各解の比較を行う。第

7

節には本稿で最も強調する非線形フィードバッ ク戦略に関する文献リストと結論を付す。

2

モデル

モデルは標準的なクールノー寡占モデルである。代表的消費者を考えその効 用最大化から導出された逆需要関数は

p = A

X, A > 0

であるとする。こ こで

p

は価格、

X

は市場供給量である。他方各企業は全て同じ費用を持つと し、

c

0

という一定の限界費用で生産を行う。既述の通り各企業の生産量

1

単位当たり同単位の汚染が排出される。その結果、汚染ストックは次のような 微分方程式に従って蓄積される。

Z ˙ = X

kZ, k

[0, 1].

ここで

Z

は各時点における汚染ストックを指し、

k

は自然に汚染が浄化され る率を表す。各時点で存在する汚染ストックは各企業の利潤を引下げるように 作用し、企業

i

の利潤は

(A

c

X)x

i

sZ

2

/2, s > 0

と定義されるものと する。2) ここで

x

i は企業

i

の生産量である。以上の前提により企業

i

の目 的は次のような動学最適化問題として表される。

max

xi

Z

0

e

rth

(A

c

X)x

i

s 2 Z

2i

dt

subject to Z ˙ = X

kZ, r

0.

ここで

r

は各企業に共通の割引率である。3)

この問題は典型的な動学最適化問題なので最大値原理や動学計画法を用い て分析される。ただ各企業が同時手番で戦略を決めるゲームであっても、それ がどのような情報に依存するかに応じて複数の解概念が定義できる。数学的な

2) これを利潤と呼ぶことに批判する方もいよう。むしろこの目的関数を各企業の株主の純便益で あると解釈する方が自然であろう。つまり配当として受取る利潤から汚染による被害を差引い たものとして株主の純便益を定義する。ただ以下では単に企業の目的関数を利潤と呼ぶ。

3) 消費者は動学的な効用最大化を行わないのでrは利子率でもあり割引率でもある。

(5)

扱い易さから多くの文献で使われてきたのはオープンループ解である。これは 問題の期首に戦略の時間経路を決め、後はそれを忠実に遵守する。よってオー プンループ解は最大値原理を用いて求められ、その解は初期の汚染ストック量

Z (0)

と各時点

t

の関数となる。

これに対してフィードバック解(マルコフ解)とは各期の生産量は各期首 の汚染ストック量

Z(t)

の関数として定義される。これは

Z(t)

という時点

t

において実現されるストック変数にそれまでの状態変数に関する情報(繰返し ゲームでいうところの歴史)が集約されていることを意味する。ここでオープ ンループ解とフィードバック解とは次のような差異がある。例えばある時点

t > 0

Z (t)

という汚染量が実現したとする。オープンループ解ではそれが どんな値であっても最初に決めた戦略をかたくなに守ること(プレコミットメ ント)が想定されている。だがもし何らかの理由により時点

t

における汚染 量が

Z(t)

とは違ったものになったとする。この時にもオープンループ戦略に 従う限り、最初に決めた戦略がそのまま実行される。しかし真に合理的なプ レーヤーなら汚染量の変化に対応して自分の戦略も再び決め直すはずである。

フィードバック解の場合にはそのような再最適化が許される。以上よりオープ ンループ解は最大値原理を用いて、フィードバック解は動学計画法を用いて解 かれることが理解されよう。4) この点からプレコミットメントを想定しない フィードバック解の方が解概念としては望ましいという意見もあるが、実際に は一方が他方より優れているとはいい難く扱う問題に応じてあるいはモデルの 扱い易さに応じて使い分けが行われている。

3

共謀解

以上のモデルで種々の解を導出していく。本節では比較をする際の基準を与 える共謀解を求める。共謀解は全ての企業の利潤合計を最大化する解として定 義される。同じことだが形式的には次のような代表的な

1

企業の問題として定

4) 数学的にはフィードバック解を最大値原理を用いて解くこともできるが、既存文献を見る限り フィードバック解は動学計画法で解かれることが多く動学計画法を用いる方がイメージをつかみ やすいので本稿でも動学計画法を利用する。

(6)

義する。なお本稿では一貫して全ての企業が同じ生産量を選ぶ対称均衡にのみ 注目する。

max

x

Z

0

e

−rt h

(A

c

nx)x

s 2 Z

2

i

dt subject to Z ˙ = nx

kZ.

これは

1

主体の動学最適化問題なので最大値原理で解ける。

λ

を制約式に付す 補助変数としてハミルトン関数を

H = (A

c

nx)x

sZ

2

/2 + λ(nx

kZ)

と設定すると最適化の

1

階条件は次のように求められる。

0 = A

c

2nx + (1)

λ ˙ = λ(r + k) + sZ (2)

Z ˙ = nx

kZ, (3)

及び横断条件

lim

t→∞

e

rt

λZ = 0

(1)

x

について解いて

(3)

に代入すれ ば均衡体系は

(2)

と次式から成る連立微分方程式で与えられる。

Z ˙ = A

c +

2

kZ. (4)

この体系は定数係数の線形連立微分方程式なので明示的に

λ

Z

の解を求め ることができるが、本稿では関心を定常状態にのみ絞ることにする。すると定 常状態では以下が成立する。

2 4

r + k s

n 2

k

3 5 2 4

λ

Z

3 5

=

2 4

0

A2c 3 5

.

左辺の係数行列の行列式は負になるから定常状態は按点安定である。この体系 の内生変数を求めると次のようになる。

λ

F

=

s(A

c) 2k(r + k) + sn < 0 Z

F

= (r + k)(A

c)

2k(r + k) + sn . (5)

ここで上添字の

F

は共謀解であることを表す。

ここで

λ

F が負になる点に注意せよ。補助変数

λ

は経済学的には

t

期にお ける汚染ストックが

1

単位増えたことによって

t

期以降に稼得できる利潤の 割引現在価値が何単位増加するかを表すという意味で

Z

のシャドー・プライ スと呼ばれる。利潤の定義から明らかなように汚染は利潤にマイナスの影響を

(7)

与えるので、

λ

が負になるのはそうした汚染の限界利潤が負になることを意味 する。

4

オープンループ・ナッシュ均衡

前節では全企業が産業全体の利潤を最大にするという意味での共謀解を求 めたが、以下の諸節では各企業が自らの利潤追求のみを行う非協力解を導出 する。まず本節では最も扱い易く教科書的なナッシュ均衡との繋がりが理解 しやすいオープンループ・ナッシュ均衡を求める。オープンループ・ナッシュ 均衡は最大値原理を用いて求めることができ、企業

i

のハミルトン関数を

H

i

= (A

c

X )x

i

sZ

2

/2 + λ

i

(X

kZ)

と設定すると、対称均衡におい て成立する最適化のための

1

階条件は次のように求められる。

0 = A

c

(n + 1)x + λ (6)

λ ˙ = λ(r + k) + sZ (7)

Z ˙ = nx

kZ, (8)

及び横断条件

lim

t→∞

e

−rt

λZ = 0

。共謀解を求めるときと同じく体系から

x

を消去すると以下の

2

変数の連立微分方程式を得る。

2 4

r + k s

n n+1

k

3 5 2 4

λ

Z

3 5

=

2 4

0

n(A−c)n+1 3 5

.

この連立方程式を

λ, Z

について解き、求められた

λ

(6)

に代入すれば オープンループ・ナッシュ均衡における生産量が得られる。ただ以下では定常 状態における汚染ストック量の比較だけに関心があるので定常状態における汚 染量だけを次のように求めておく。

Z

O

= n(r + k)(A

c)

k(r + k)(n + 1) + sn . (9)

ここで上添字の

O

はオープンループ・ナッシュ均衡であることを示す。

5

フィードバック・ナッシュ均衡

導入で触れたようにオープンループ・ナッシュ均衡が最大値原理を用いて 導出されるのに対しフィードバック・ナッシュ均衡は最大値原理でも動学計画

(8)

法のいずれを用いても求めることができる。5)だがフィードバック解のイメー ジを捉え易くするために動学計画法を採用する。ここで使う手法は

Tsutsui and Mino (1990), Shimomura (1991)

で開発され、後に

Dockner and Long (1993), Itaya and Shimomura (2001)

などによって広く用いられるようになっ たものである。6)

フィードバック戦略は各期の生産量を当該期の状態変数の関数として定義す る。7)そこで企業

i

以外の企業が

x(Z)

という戦略を採用しているとして、企 業

i

は次のようなハミルトン・ヤコビ・ベルマン方程式を用いて問題を解く。

rV

i

(Z ) = max

xi

˘

[A

c

x

i

(n

1)x(Z)] x

i

+ V

i0

(Z) [x

i

+ (n

1)x(Z )

kZ]

¯

.

(10)

ここで

V

i

(Z)

は企業

i

の価値関数であり次のように定義される。

V

i

(Z )

max

xi

Z

t

e

−r(s−t)

[A

c

x

i

(n

1)x(Z )]x

i

ds

|

Z ˙ = x

i

+ (n

1)x(Z)

kZ, Z (t) : given

o

.

対称均衡に着目してこの問題の1階条件を求めると、

A

c

(n + 1)x(Z ) + V

0

(Z) = 0

となり、これを

V

0

(Z) = (n + 1)x(Z)

(A

c)

と改めておく。

これをハミルトン・ヤコビ・ベルマン方程式の右辺に代入すると次のような

Z

に関する恒等式を得る。

rV (Z ) = [A

c

nx(Z)]x(Z)

s

2 Z

2

+[(n +1)x(Z)

(A

c)][nx(Z)

kZ].

(11)

これは

Z

に関する恒等式なので両辺を

Z

で微分しても等式が維持される。そ

5) Cornes, Long and Shimomura (2001), Kemp, Long and Shimomura (2001), Benchekroun and Long (2008)は最大値原理を使ってフィードバック解を導出している。

6) この手法については柴田・竹田(1997),柴田(2004)を合わせて参照されるとより理解が深ま る。公共財の自発的供給という限定された応用例だが板谷(2004)も極めて有益である。

7) 厳密にいうとフィードバック解はt時点における状態変数だけでなく、tそのものにも独立 に依存し、x(t, Z(t)) と定義される。これと区別するために本稿での解x(Z(t))を定常的

(stationary)フィードバック解と呼ぶこともあるが、経済学での応用に関する限り定常的フィー ドバック解を単にフィードバック解と呼んでおりここでもその慣例に従う。

(9)

こで両辺を

Z

で微分して

x

0

(Z )

について解くと次のようになる。

x

0

(Z) = (r + k)[(n + 1)x(Z)

(A

c)] + sZ

2n

2

x(Z)

k(n + 1)Z

(n

1)(A

c) . (12)

これはフィードバック戦略が

Z

にどのように依存しているのかを表す微分方 程式であり、原理的にはこれを解けば対称均衡におけるフィードバック戦略が 求められる。だが

(12)

から分かるように解析的に

x(Z )

を求めることは極め て難しい。8)

そこで

(12)

を図

1

を用いて視覚的に理解する。ここで横軸に状態変数であ る

Z

、縦軸に操作変数である

x

が取られている。

(12)

から次の関係が分かる。

x

0

(Z ) = 0

⇐⇒

x(Z) = (r + k)(A

c)

sZ (r + k)(n + 1)

x

0

(Z ) =

∞ ⇐⇒

x(Z) = (n

1)(A

c) + k(n + 1)Z

2n

2

.

つまり上の

2

式は

x(Z )

が水平になる軌跡と垂直になる軌跡を与えている。こ れらは図の

x

0

(Z) = 0

線と

x

0

(Z ) =

線として表されている。この

2

つの 補助線によって全領域は

4

つに区切られる。

(12)

を利用すると、

x

0

(Z ) = 0

線、

x

0

(Z) =

線の両方の上にある領域では

x

0

(Z ) > 0

、つまり右上がりに なることが分かる。その作業を

4

つの部分領域について行うと図

1

に描かれ ている双曲線群を得ることができ、それらのそれぞれが

(12)

を満たすフィー ドバック戦略の候補を与える。なお図にはさらに

x

0

(Z) = 0

線と

x

0

(Z) =

線の交点

M

を通る

2

本の直線、

x

L2

x

L1 が付加されている。これは後に求 める線形フィードバック戦略である。

以下では定常状態に収束する戦略だけに関心を絞る。そこで時間と共に生産 量がどのように変化するのかを考えるために、次のような定常状態条件を付加 する。

Z ˙ = 0

⇐⇒

x = kZ n .

これを追加したのが図

2

である。そこで

Z ˙ = 0

線で与えられる直線が定常状 態を表す軌跡であり、

Z ˙ = 0

線の右の領域では

Z < ˙ 0

つまり

Z

は時間と共 に減り、左の領域では

Z

は時間と共に増える方向に進む。

8) Cornes, Long and Shimomura (2001)は明示的に解を求めるモデルを提示している(筆者 の知る)唯一の例である。

(10)

O

Z x

x0(Z) =1

x0(Z) = 0 xL

2

xL 1

M

図1

5.1 線形フィードバック・ナッシュ均衡

以上の準備を基に線形・非線形フィードバック戦略下における定常状態汚染 量を求める。図

2

には

2

つの線形戦略が描かれておりそれらは次のようにし て求められる。各企業の生産量は汚染量の

1

次関数で

x(Z)

αZ + β, (13)

という形をしているとする。ここから

x

0

(Z ) = α

となり、これを

(12)

の左辺 に、そして

(13)

自身を

(12)

の右辺に代入すると次式を得る。

α = (r + k)[(n + 1)(αZ + β)

(A

c)] + sZ 2n

2

(αZ + β)

(n

1)(A

c)

k(n + 1)Z .

これを満たす未定係数

α

β

を求め、それらを

(13)

に戻せば明示的な線形 フィードバック戦略を求めることができる。未定係数は次のように求められる。

(11)

O

Z

x .

Z= 0 xL

2

xL 1

xN

ZN ZL N

L M

x0(Z) =1

x0(Z) = 0

図2

α = (r + 2k)(n + 1)

−√

4n

2

(14)

β = [r + k

(n

1)α](A

c)

(n + 1)(r + k)

2n

2

α (15)

(n + 1)

2

(r + 2k)

2

+ 8sn

2

> 0. (16)

ここで

(14)

の根号記号の前には形式的にはプラスとマイナスの両方を付すこ とができるが、定常状態に収束するのは

α < 0

に対応する

x

L1 だけであるこ とは図

2

からも分かるので

α > 0

に対応する不安定解

x

L2 は捨象しても構わ ない。

(14), (15)

(13)

に代入すると線形フィードバック戦略を明示的に得るこ とができ、それを定常状態条件

Z ˙ = n(αZ + β)

kZ = 0

Z

について解い たものに代入すると次のように、線形フィードバック戦略

x

L1 によって達成さ れる定常状態汚染量

Z

Lが決定される。

(12)

Z

L

= k

= 2

n

4n

2

(r + k)

(n

1)

h

(n + 1)(r + 2k)

−√

io

(A

c)

h

∆ + (n + 1)r

i h

∆ + 2(n

1)k

(n + 1)r

i

=

n

4n

2

(r + k)

(n

1)

h

(n + 1)(r + 2k)

−√

io

(A

c) k(n + 1) [(3n + 1)r + 2(n + 1)k] + 4sn

2

+ (n

1)k

. (17)

5.2 非線形フィードバック・ナッシュ均衡

最後に非線形フィードバック・ナッシュ均衡下における定常状態汚染量を求 めよう。ここで

Z

が時間と共に定常状態に収束するためには次の条件が成立 していなければならない。

d Z ˙

dZ = nx

0

(Z )

k

0

⇐⇒

x

0

(Z)

k n .

これは非線形戦略の傾きが

Z ˙ = 0

線上でそれよりも緩くなければならないこ とを要求している。戦略が右下がりである場合にはこの条件は必ず満たされ る。その境界を与えるのが図

2

における

x

N である。

Z

の初期値

Z(0)

が適 当な条件を満たせば、

x

N が採用され、時間と共に

N

へと収束する。9) その 時の汚染量は

Z

N として表されている。この

x

N 及び

Z

N は以下で示すよう に興味深い意味を持っている。

N

では非線形戦略の傾き

x

0

(Z )

Z ˙ = 0

線の傾き

k/n

に等しい。しか

N

Z ˙ = 0

線上にあるから

x(Z) = kZ/n

が成立している。そこでこの

x(Z) = kZ/n

(5)

に代入して、それを

k/n

に等しくおくことによって次式 を得る。

k

n = (r + k)[(n + 1)

kZn

(A

c)] + sZ 2n

2kZn

k(n + 1)Z

(n

1)(A

c) .

これを

Z

について解くと、

N

における

Z = Z

N を明示的に求めることがで き次のようになる。

Z

N

= (k + rn)(A

c)

k[2k + r(n + 1)] + sn . (18)

9) xN が採用されるための条件については、Itaya and Shimomura (2001), Rubio and Casino (2002)が詳細に論じている。さらにテクニカルに詳しい解説はRowat (2007)が与えている。

(13)

これが非線形フィードバック戦略

x

N が取られたときの定常状態における汚 染量である。

6

均衡の比較

以上で我々は

4

つの代表的な解における定常状態汚染量を導出してきた。す なわち(

1

)共謀解、(

2

)オープンループ・ナッシュ均衡、(

3

)線形フィード バック・ナッシュ均衡、(

4

)非線形フィードバック・ナッシュ均衡である。以 下ではこれらの均衡における汚染量がどのような関係になっているのかを考え る。その結果は次の定理にまとめることができる。

定理.

4

つの均衡汚染量に関して以下のランキングが成立する。

Z

L

> Z

O

> Z

N

Z

F

. (19)

[

証明

] (17)

(9)

の比を取ると次のようになる。

Z

L

Z

O

=

n

4n

2

(r+k)−(n−1)

h

(n+1)(r+2k)−

io

[k(r+k)(n+1)+sn]

n

k(n + 1) [(3n + 1)r + 2(n + 1)k] + 4sn

2

+ (n

1)k

o

n(r + k) .

この分数の分子から分母を引き煩雑な計算を行うと

(n

1)k(r + k + sn)

h

(n + 1)(r + 2k)

i

> 0

となるから

Z

L

> Z

O が証明される。次に

Z

O

/Z

N を求めると

(9), (18)

より

Z

O

Z

N

= n(r + k)

{

k[2k + (n + 1)r] + sn

}

(k + nr)[k(r + k)(n + 1) + sn] ,

であり、分子から分母を引くと

k(n

1)[k(r+k)+sn] > 0

となるから

Z

O

> Z

N が確認される。最後に

Z

N

Z

F を比較すると次のようになる。

Z

N

Z

F

= (k + nr)[2k(r + k) + sn]

(r + k)

{k[2k

+ r(n + 1)] + sn} .

この分数の分子から分母を差引いたものは

r(n

1)[k(r + k) + sn]

0

よう になるから

Z

N

Z

F が従う。以上より

(19)

の不等式が証明される。

[

証了

]

ここまで数学的な議論に終始してきたので、なぜ上の定理が成り立つのかの 経済学的な直観を説明しよう。まずオープンループ解についてであるが、割引

(14)

r

をゼロに近づけると

Z

O は静学的なクールノー均衡に収束することが知 られている。なぜならオープンループ解では状態変数の値に依存せずに毎期の 生産量を決めており、

r

0

とするというのは単に毎期静学的なクールノー ゲームが繰返されるだけだからである。

しかしフィードバック解では

r

0

にしても

Z

L

, Z

N は静学クールノー 均衡には収束しない。その理由を線形フィードバック戦略から考える。図

2

か ら安定的な線形フィードバック戦略は

Z

に関する減少関数である点に注意し よう。その上で仮に企業

1

が生産量を増やしたときに何が起こるのかを考えよ う。企業

1

が生産量を増やすと汚染が増えて

Z

も増える方向に働く。先述の 通り線形戦略では生産量は

Z

の減少関数であるから、この

Z

の増加を見て企

2

は生産量を減らそうとする。すると企業

2

の生産量減少に伴い

Z

は減る 方向に向かう。これは企業

1

の生産量増加をもたらす。ゆえに企業

1

Z

を 通じた影響のないオープンループ戦略または静学クールノー生産量よりも多く 生産しようとする。全く同じことは企業

2

にもいえる。よって産業全体の生 産量はオープンループ均衡よりも多くなり汚染量にも同様のことが成り立つ。

つまり

(19)

1

つ目の不等式が成り立つ。

次に非線形フィードバック戦略

x

N が採られたときを考えよう。

Tsutsui

and Mino (1990)

が最初に指摘したようにこの戦略は繰返しゲームにおける

トリガー戦略と同じ役割を持っている。実際、

r

0

にすると

Z

N

= Z

F、す なわち

x

N で達成される定常状態は協調解と一致するというフォーク定理が 成立する。ただ

r

が大きい場合には両者には乖離が生じ非協力解である

Z

N の方が協調解よりも大きくなる。それでも他の解に比べると協調の度合いが強 いためにオープンループ、線形フィードバックのいずれよりも低い汚染量に抑 えられる。これが

2

つ目の不等式の解釈である。

7

文献の紹介と結論

本節では本稿で展開してきた微分ゲームの手法やその応用に興味のある人を 対象に最近の文献も含めたサーベイを簡単に行う。なおオープンループ・ナッ シュ均衡と線形フィードバック・ナッシュ均衡に関する文献は膨大なので省略

(15)

する。10) 専ら非線形フィードバック・ナッシュ均衡に特化したものだけを紹 介する。

本稿で用いた非線形フィードバック戦略の導出法は

Tsutsui and Mino (1990),

Shimomura (1991)

に依る。前者は硬直価格を入れたクールノー複占モデルを、

後者は資本家と労働者が動学ゲームを行うという資本主義ゲームを扱ってい る。

Tsutsui and Mino (1990), Shimomura (1991)

のアイデアを越境汚染に 苦しむ

2

国ゲームに応用したのが

Dockner and Long (1993)

であり、環境経 済学における微分ゲームの有用性を高めたものとしてよく引用される。

Rubio and Casino (2002)

Dockner and Long (1993)

の非協力戦略による共謀 解の達成に関する結論は(

1

)割引率が十分に小さいだけでなく(

2

)汚染の 初期値が適当な条件を満たさねばならないことを詳細に論じている。さらに

Rubio and Casino (2003)

Tsutsui-Mino-Shimomura

の手法がうまく応用 できない環境経済学の例を提示している。一般に上の

(12)

式は明示的に解く ことはできない。しかし

Cornes, Long and Shimomura (2001)

は枯渇性資 源をストックとして非線形フィードバック戦略を明示的に導出している。公共 経済学における例では公共財の自発的供給における応用が多い。

Wirl (1996)

Fershtman and Nizman (1991)

で無視されていた非線形フィードバック戦 略を

Tsutsui-Mino-Shimomura

の手法を用いて求めている。

Ihori and Itaya (2001), Itaya and Shimomura (2001)

もその手法を公共財供給モデルに応用 している。

Tsutsui-Mino-Shimomura

の手法のテクニカルな部分や問題点に ついては、

Dockner

et al.

(2000), Sorger (1998), Rowat (2007)

が詳説し ている。なお近時の筆者による応用例として

Fujiwara (2008), Fujiwara and Matsueda (2007, 2009a, 2009b)

がある。

本稿で考えたのはいわゆる線形

2

次モデルと呼ばれるものである。つまり プレーヤーの目的関数が操作変数と状態変数に関して

2

次関数となっており、

制約条件は各プレーヤーの戦略に関して

1

次関数となっているようなモデルで ある。上でサーベイした文献の大半も関数形を特定化して線形

2

次モデルに落

10) 柴田・竹田(1997),柴田(2004)を参照。

(16)

とす形で非線形フィードバック戦略を導出している。その意味で興味ある問題 を線形

2

次形式にすることができれば本稿で紹介した手法がそのまま利用で きる。

なお本稿ではナッシュ解に議論を絞った。これに対してあるプレーヤーが他 のプレーヤーの反応関数を知った上で行動するというシュタッケルベルク解を 定義することもできる。例えば

Kemp, Long and Shimomura (1993)

は政府 を先導者、資本家を追随者とするシュタッケルベルク微分ゲームを考え、オー プンループ解、フィードバック解における最適資本課税を分析している。ただ オープンループ・シュタッケルベルク均衡には時間整合性の問題がつきまと う上にモデルが複雑になるという理由で文献は多くない。また

Dockner and Long (1993)

と同様のモデルで

Long (1992)

はオープンループ・シュタッケル ベルク均衡を導出しているが、

Kemp, Long and Shimomura (1993)

Long

(1992)

も共通しているのは安定性の議論が中心となり解の比較が難しいとい

う点で応用経済学での汎用性はこれからの発展を待たねばならない。微分ゲー ムにおけるシュタッケルベルク解の研究は課題が多いといえる。

参考文献

[1] Basar, T. and G. J. Olsder (1995),Dynamic noncooperative game theory, New York: Academic Press.

[2] Benchekroun, H. and N. V. Long (2008), ‘The build-up of cooperative behavior among non-cooperative selfish agents,’Journal of Economic Be- havior and Organization, 67, 239-252.

[3] Cornes, R., N. V. Long and K. Shimomura (2001), ‘Drugs and pests:

intertemporal production externalities,’Japan and the World Economy, 13, 255-278.

[4] Dockner, E. J. and N. V. Long (1993), ‘International pollution control:

cooperative versus noncooperative strategies,’ Journal of Environmental Economics and Management, 24, 13-29.

(17)

[5] Dockner, E. J., s. Jorgensen, N. V. Long and G. Sorger (2000),Differen- tial games in economics and management science, Cambridge: Cambridge University Press.

[6] Fershtman, C. and S. Nitzan (1991), ‘Dynamic voluntary provision of public goods,’European Economic Review, 35, 1057-1067.

[7] Fujiwara, K. (2008), ‘Duopoly can be more anti-competitive than duopoly,’Economics Letters, 101, 217-219.

[8] Fujiwara, K. and N. Matsueda (2007), ‘On a nonlinear feedback strategy equilibrium of a dynamic game,’Economics Bulletin, 3, 1-10.

[9] Fujiwara, K. and N. Matsueda (2009a), ‘Dynamic voluntary provision of public goods: a generalization,’Journal of Public Economic Theory, 11, 27-36

[10] Fujiwara, K. and N. Matsueda (2009b), ‘A game-theoretic analysis of trade liberalization in the presence of transboundary stock pollution,’

Mimeo., Kwansei Gakuin University.

[11] Ihori, T. and J. Itaya (2001), ‘A dynamic model of fiscal reconstruction’, European Journal of Political Economy, 17, 779-797.

[12] Itaya, J. and K. Shimomura (2001), ‘A dynamic conjectural variations model in the private provision of public goods: a differential game ap- proach’,Journal of Public Economics, 81, 153-172.

[13] Kemp, M. C., N. V. Long and K. Shimomura (1993), ‘Cyclical and non- cyclican redistributive taxation’,International Economic Review, 34, 415- 430.

[14] Kemp, M. C., N. V. Long and K. Shimomura (2001), ‘A differential game model of tariff war,’Japan and the World Economy, 13, 279-298.

[15] Long, N. V. (1992), ‘Pollution control: a differential game approach’, Annals of Operations Research, 37, 283-196.

[16] Rowat, C. (2007), ‘Non-linear strategies in a linear quadratic differential game’,Journal of Economic Dynamics and Control, 31, 3179-3202.

[17] Rubio, S. J. and B. Casino (2002), ‘A note on cooperative and noncoop- erative strategies in international pollution control’,Resource and Energy Economics, 24, 261-271.

(18)

[18] Rubio, S. J. and B. Casino (2003), ‘Strategic behavior and efficiency in the common property extraction of groundwater’,Environmental and Resource Economics, 26, 73-87.

[19] Shimomura, K. (1991), ‘The feedback equilibria of a differential game capitalism’,Journal of Economic Dynamics and Control, 15, 317-338.

[20] Sorger, G. (1998), ‘Markov-perfect Nash equilibria in a class of resource games’,Economic Theory, 11, 79-100.

[21] Tsutsui, S. and K. Mino (1990), ‘Nonlinear strategies in dynamic duopolistic competition with sticky prices’,Journal of Economic Theory, 52, 136-161.

[22] Wirl, F. (1996), ‘Dynamic voluntary provision of public goods: extension to nonlinear strategies’,European Journal of Political Economy, 555-560.

[23] 板谷淳一(2004),「公共財の自発的供給と推測的変動」,西村和雄・福田慎一

編『非線形均衡動学』,第9章,東京大学出版会.

[24] 柴田章久(2004),「ダイナミック・ゲームと経済動学」,西村和雄・福田慎一

編『非線形均衡動学』第6章,東京大学出版会.

[25] 柴田章久・竹田之彦 (1997),「経済学における微分ゲーム理論の応用につい て」,経済学雑誌(大阪市立大学), 98, 1-22.

[26] 下村和雄(2002),「越境的環境汚染への動学ゲーム論的アプローチ」,国民経

済雑誌, 185, 35-43.

[27] 下村和雄 (2004),「越境的環境汚染への動学ゲーム論的アプローチ−国際的

ならびに時間的な相互依存関係−」,池田三郎・酒井泰弘・多和田眞編『リスク、

環境および経済』第9章,勁草書房.

[28] 三野和雄(1985),「経済システムの最適制御と時間整合性問題I」,広島大学

経済論叢, 8, 55-81.

[29] 三野和雄(1986),「経済システムの最適制御と時間整合性問題II」,広島大学

経済論叢, 9, 73-98.

参照

関連したドキュメント

事業セグメントごとの資本コスト(WACC)を算定するためには、BS を作成後、まず株

市民的その他のあらゆる分野において、他の 者との平等を基礎として全ての人権及び基本

これから取り組む 自らが汚染原因者となりうる環境負荷(ムダ)の 自らが汚染原因者となりうる環境負荷(ムダ)の 事業者

の主として労働制的な分配の手段となった。それは資本における財産権を弱め,ほとん

とりわけ、プラスチック製容器包装については、国際的に危機意識が高まっている 海洋プラスチックの環境汚染問題を背景に、国の「プラスチック資源循環戦略」 (令和 元年

自分ではおかしいと思って も、「自分の体は汚れてい るのではないか」「ひどい ことを周りの人にしたので

SDGs を学ぶ入り口としてカードゲームでの体験学習を取り入れた。スマ

きけん (リスク) をへらす