汚染的寡占の微分ゲーム分析

(1)

汚染的寡占の微分ゲーム分析

著者藤原憲二

雑誌名経済学論究

巻 63

号 3

ページ 499‑515

発行年 2009‑12‑15

URL http://hdl.handle.net/10236/3713

(2)

汚染的寡占の微分ゲーム分析

A Diﬀerential Game Model of Polluting Oligopoly

藤原憲二

This paper formulates a diﬀerential game model of polluting oligopoly to compare the steady state in cooperative, open-loop and feedback solutions, and prove the following ranking. The steady state pollution stock is largest under the linear feedback strategy, second largest under the open-loop strategy, third largest under the nonlinear feedback strategy, and smallest under the cooperative solution. However, in the limiting case where the discount rate approaches zero, the steady state with the nonlinear feedback strategy coincides with the cooperative equilibrium.

Kenji Fujiwara

JEL

：

C61, C73, L13

キーワード：微分ゲーム、汚染的寡占、オープンループ解、フィードバック解

1

導入

微分ゲームはストック変数が時間と共に変化する微分方程式を制約として、

プレーヤーが生涯にわたる目的汎関数の値を最大化するように戦略の時間流列を決めるゲームである。ナッシュ均衡やシュタッケルベルク均衡といった解概念に依拠する点では静学ゲームや多段階ゲームと同じだが、戦略がどのような情報に依存するかによって複数の解概念を定義できる点に特徴がある。また解を求める際に求められる数学的手法は動学最適化理論であり、ハミルトン関数を用いる最大値原理とハミルトン＝ヤコビ＝ベルマン方程式を用いる動学計画法が援用される点でも教科書的なゲーム理論とは一線を画する。

経済学への応用を念頭に書かれた微分ゲームの邦文による入門的な解説については、既に柴田・竹田

(1997),

^柴田

(2004)

が要領よく展望している。ま

(3)

たそれらの文献を理解するに際しては三野

(1985, 1986)

^{がテクニカルな点に} まで立入って丁寧な解説を行っている。下村（

2002, 2004

）は

3

期間ゲームを用いて動学ゲームで用いられる

2

つの解概念、オープンループ・ナッシュ均衡とフィードバック・ナッシュ均衡を解析的に求め初等的な解説を行っている。

さらに

Dockner

et al.

(2000)

は微分ゲームの理論と応用例を盛込んだ教科書として微分ゲームを理解する上での必読文献となっている¹⁾。

従って微分ゲームとはどのようなもので、それがどのような場面で応用されているのかについての概説は必要十分である。本稿ではむしろ微分ゲームの持つ経済学的な解釈やインプリケーションについてできるだけ詳細に考察することで上述の解説論文との差別化を図る。ここでも柴田・竹田

(1997),

柴田

(2004),

下村（

2002, 2004

）と同じく一般的なモデルや関数形は考えず、特定化されたモデルを解きながら微分ゲームの持つ経済学的意味を探る。

本稿で使うモデルは次のようなものである。

n

≥

2

社からなる寡占産業を考え各企業はクールノー競争を行う。生産量

1

単位について同単位の汚染が排出される。これは社会に存在する汚染ストックを蓄積させ各時点での汚染ストックは企業の利潤を引下げるように作用する。よって企業の毎時点における利得は生産から得られる利潤から汚染による被害を差引いたものとして定義される。汚染ストックの蓄積方程式を制約条件として上で定義された利得の割引現在価値を最大化するように各企業は生産量を決定する。ここで企業間の手番は同時的でありシュタッケルベルク・ゲームのような多段階の決定は考えない。従って本稿で考えるゲームの解はナッシュ解のみである。しかし既に述べたようにナッシュ解にも複数の定義が考えられ、以下では（

1

）オープンループ・ナッシュ均衡、（

2

）線形フィードバック・ナッシュ均衡（線形マルコフ完全ナッシュ均衡）、（

3

）非線形フィードバック・ナッシュ均衡（非線形マルコフ完全ナッシュ均衡）の

3

つを考える。これらを共謀解と比較することにより動学的なナッシュ解の持つインプリケーションを考える。

本稿の構成は次の通りである。第

2

節ではモデルの提示を行い、第

3

節で

1) Dockneret al.(2000)以前にはBasar and Olsder (1995)がよく引用されていたが記述はより数学的で難解である。

(4)

は後の比較におけるベンチマークを与える共謀解を求める。第

4

^{節ではオープ} ンループ解を、第

5

節では線形・非線形のフィードバック解を導出する。第

6

節では各解の比較を行う。第

7

節には本稿で最も強調する非線形フィードバック戦略に関する文献リストと結論を付す。

2

モデル

モデルは標準的なクールノー寡占モデルである。代表的消費者を考えその効用最大化から導出された逆需要関数は

p = A

−

X, A > 0

であるとする。ここで

p

は価格、

X

は市場供給量である。他方各企業は全て同じ費用を持つとし、

c

≥

0

という一定の限界費用で生産を行う。既述の通り各企業の生産量

1

単位当たり同単位の汚染が排出される。その結果、汚染ストックは次のような微分方程式に従って蓄積される。

Z ˙ = X

−

kZ, k

∈

[0, 1].

ここで

Z

は各時点における汚染ストックを指し、

k

は自然に汚染が浄化される率を表す。各時点で存在する汚染ストックは各企業の利潤を引下げるように作用し、企業

i

の利潤は

(A

−

c

−

X)x

i−

sZ

²

/2, s > 0

と定義されるものとする。²⁾ ここで

x

i は企業

i

の生産量である。以上の前提により企業

i

の目的は次のような動学最適化問題として表される。

max

xi

Z _∞

0

e

⁻^rth

(A

−

c

−

X)x

i−

s 2 Z

²i

dt

subject to Z ˙ = X

−

kZ, r

≥

0.

ここで

r

は各企業に共通の割引率である。³⁾

この問題は典型的な動学最適化問題なので最大値原理や動学計画法を用いて分析される。ただ各企業が同時手番で戦略を決めるゲームであっても、それがどのような情報に依存するかに応じて複数の解概念が定義できる。数学的な

2) これを利潤と呼ぶことに批判する方もいよう。むしろこの目的関数を各企業の株主の純便益であると解釈する方が自然であろう。つまり配当として受取る利潤から汚染による被害を差引いたものとして株主の純便益を定義する。ただ以下では単に企業の目的関数を利潤と呼ぶ。

3) 消費者は動学的な効用最大化を行わないのでrは利子率でもあり割引率でもある。

(5)

扱い易さから多くの文献で使われてきたのはオープンループ解である。これは問題の期首に戦略の時間経路を決め、後はそれを忠実に遵守する。よってオープンループ解は最大値原理を用いて求められ、その解は初期の汚染ストック量

Z (0)

と各時点

t

の関数となる。

これに対してフィードバック解（マルコフ解）とは各期の生産量は各期首の汚染ストック量

Z(t)

の関数として定義される。これは

Z(t)

という時点

t

において実現されるストック変数にそれまでの状態変数に関する情報（繰返しゲームでいうところの歴史）が集約されていることを意味する。ここでオープンループ解とフィードバック解とは次のような差異がある。例えばある時点

t > 0

^で

Z (t)

という汚染量が実現したとする。オープンループ解ではそれがどんな値であっても最初に決めた戦略をかたくなに守ること（プレコミットメント）が想定されている。だがもし何らかの理由により時点

t

における汚染量が

Z(t)

とは違ったものになったとする。この時にもオープンループ戦略に従う限り、最初に決めた戦略がそのまま実行される。しかし真に合理的なプレーヤーなら汚染量の変化に対応して自分の戦略も再び決め直すはずである。

フィードバック解の場合にはそのような再最適化が許される。以上よりオープンループ解は最大値原理を用いて、フィードバック解は動学計画法を用いて解かれることが理解されよう。⁴⁾ この点からプレコミットメントを想定しないフィードバック解の方が解概念としては望ましいという意見もあるが、実際には一方が他方より優れているとはいい難く扱う問題に応じてあるいはモデルの扱い易さに応じて使い分けが行われている。

3

共謀解

以上のモデルで種々の解を導出していく。本節では比較をする際の基準を与える共謀解を求める。共謀解は全ての企業の利潤合計を最大化する解として定義される。同じことだが形式的には次のような代表的な

1

企業の問題として定

4) 数学的にはフィードバック解を最大値原理を用いて解くこともできるが、既存文献を見る限りフィードバック解は動学計画法で解かれることが多く動学計画法を用いる方がイメージをつかみやすいので本稿でも動学計画法を利用する。

(6)

義する。なお本稿では一貫して全ての企業が同じ生産量を選ぶ対称均衡にのみ注目する。

max

x

Z _∞

0

e

^−rt h

(A

−

c

−

nx)x

−

s 2 Z

²

i

dt subject to Z ˙ = nx

−

kZ.

これは

1

主体の動学最適化問題なので最大値原理で解ける。

λ

を制約式に付す補助変数としてハミルトン関数を

H = (A

−

c

−

nx)x

−

sZ

²

/2 + λ(nx

−

kZ)

と設定すると最適化の

1

階条件は次のように求められる。

0 = A

−

c

−

2nx + nλ (1)

λ ˙ = λ(r + k) + sZ (2)

Z ˙ = nx

−

kZ, (3)

及び横断条件

lim

t→∞

e

⁻^rt

λZ = 0

。

(1)

を

x

について解いて

(3)

に代入すれば均衡体系は

(2)

と次式から成る連立微分方程式で与えられる。

Z ˙ = A

−

c + nλ

2

−

kZ. (4)

この体系は定数係数の線形連立微分方程式なので明示的に

λ

と

Z

の解を求めることができるが、本稿では関心を定常状態にのみ絞ることにする。すると定常状態では以下が成立する。

2 4

r + k s

n 2 −

k

3 5 2 4

λ

Z

3 5

=

2 4

0

−^A⁻₂^c 3 5

.

左辺の係数行列の行列式は負になるから定常状態は按点安定である。この体系の内生変数を求めると次のようになる。

λ

^F

=

−

s(A

−

c) 2k(r + k) + sn < 0 Z

^F

= (r + k)(A

−

c)

2k(r + k) + sn . (5)

ここで上添字の

F

は共謀解であることを表す。

ここで

λ

^F が負になる点に注意せよ。補助変数

λ

は経済学的には

t

期における汚染ストックが

1

単位増えたことによって

t

期以降に稼得できる利潤の割引現在価値が何単位増加するかを表すという意味で

Z

のシャドー・プライスと呼ばれる。利潤の定義から明らかなように汚染は利潤にマイナスの影響を

(7)

与えるので、

λ

が負になるのはそうした汚染の限界利潤が負になることを意味する。

4

オープンループ・ナッシュ均衡

前節では全企業が産業全体の利潤を最大にするという意味での共謀解を求めたが、以下の諸節では各企業が自らの利潤追求のみを行う非協力解を導出する。まず本節では最も扱い易く教科書的なナッシュ均衡との繋がりが理解しやすいオープンループ・ナッシュ均衡を求める。オープンループ・ナッシュ均衡は最大値原理を用いて求めることができ、企業

i

のハミルトン関数を

H

i

= (A

−

c

−

X )x

i−

sZ

²

/2 + λ

i

(X

−

kZ)

と設定すると、対称均衡において成立する最適化のための

1

階条件は次のように求められる。

0 = A

−

c

−

(n + 1)x + λ (6)

λ ˙ = λ(r + k) + sZ (7)

Z ˙ = nx

−

kZ, (8)

及び横断条件

lim

t→∞

e

^−rt

λZ = 0

。共謀解を求めるときと同じく体系から

x

を消去すると以下の

2

変数の連立微分方程式を得る。

2 4

r + k s

n n+1 −

k

3 5 2 4

λ

Z

3 5

=

2 4

0

−^n(A−c)_n+1 3 5

.

この連立方程式を

λ, Z

について解き、求められた

λ

を

(6)

に代入すればオープンループ・ナッシュ均衡における生産量が得られる。ただ以下では定常状態における汚染ストック量の比較だけに関心があるので定常状態における汚染量だけを次のように求めておく。

Z

^O

= n(r + k)(A

−

c)

k(r + k)(n + 1) + sn . (9)

ここで上添字の

O

はオープンループ・ナッシュ均衡であることを示す。

5

フィードバック・ナッシュ均衡

導入で触れたようにオープンループ・ナッシュ均衡が最大値原理を用いて導出されるのに対しフィードバック・ナッシュ均衡は最大値原理でも動学計画

(8)

法のいずれを用いても求めることができる。⁵⁾だがフィードバック解のイメージを捉え易くするために動学計画法を採用する。ここで使う手法は

Tsutsui and Mino (1990), Shimomura (1991)

^{で開発され、後に}

Dockner and Long (1993), Itaya and Shimomura (2001)

などによって広く用いられるようになったものである。⁶⁾

フィードバック戦略は各期の生産量を当該期の状態変数の関数として定義する。⁷⁾そこで企業

i

以外の企業が

x(Z)

という戦略を採用しているとして、企業

i

は次のようなハミルトン・ヤコビ・ベルマン方程式を用いて問題を解く。

rV

i

(Z ) = max

xi

˘

[A

−

c

−

x

i−

(n

−

1)x(Z)] x

i

+ V

i⁰

(Z) [x

i

+ (n

−

1)x(Z )

−

kZ]

¯

.

(10)

ここで

V

i

(Z)

は企業

i

の価値関数であり次のように定義される。

V

i

(Z )

≡

max

xi

Z _∞

t

e

^−r(s−t)

[A

−

c

−

x

i−

(n

−

1)x(Z )]x

i

ds

|

Z ˙ = x

i

+ (n

−

1)x(Z)

−

kZ, Z (t) : given

o

.

対称均衡に着目してこの問題の１階条件を求めると、

A

−

c

−

(n + 1)x(Z ) + V

⁰

(Z) = 0

となり、これを

V

⁰

(Z) = (n + 1)x(Z)

−

(A

−

c)

と改めておく。

これをハミルトン・ヤコビ・ベルマン方程式の右辺に代入すると次のような

Z

に関する恒等式を得る。

rV (Z ) = [A

−

c

−

nx(Z)]x(Z)

−

s

2 Z

²

+[(n +1)x(Z)

−

(A

−

c)][nx(Z)

−

kZ].

(11)

これは

Z

に関する恒等式なので両辺を

Z

で微分しても等式が維持される。そ

5) Cornes, Long and Shimomura (2001), Kemp, Long and Shimomura (2001), Benchekroun and Long (2008)は最大値原理を使ってフィードバック解を導出している。

6) この手法については柴田・竹田(1997),柴田(2004)を合わせて参照されるとより理解が深まる。公共財の自発的供給という限定された応用例だが板谷(2004)も極めて有益である。

7) 厳密にいうとフィードバック解はt時点における状態変数だけでなく、tそのものにも独立に依存し、x(t, Z(t)) と定義される。これと区別するために本稿での解x(Z(t))を定常的

（stationary）フィードバック解と呼ぶこともあるが、経済学での応用に関する限り定常的フィードバック解を単にフィードバック解と呼んでおりここでもその慣例に従う。

(9)

こで両辺を

Z

^{で微分して}

x

⁰

(Z )

について解くと次のようになる。

x

⁰

(Z) = (r + k)[(n + 1)x(Z)

−

(A

−

c)] + sZ

2n

²

x(Z)

−

k(n + 1)Z

−

(n

−

1)(A

−

c) . (12)

これはフィードバック戦略が

Z

にどのように依存しているのかを表す微分方程式であり、原理的にはこれを解けば対称均衡におけるフィードバック戦略が求められる。だが

(12)

から分かるように解析的に

x(Z )

を求めることは極めて難しい。⁸⁾

そこで

(12)

を図

1

を用いて視覚的に理解する。ここで横軸に状態変数である

Z

、縦軸に操作変数である

x

が取られている。

(12)

から次の関係が分かる。

x

⁰

(Z ) = 0

⇐⇒

x(Z) = (r + k)(A

−

c)

−

sZ (r + k)(n + 1)

x

⁰

(Z ) =

∞ ⇐⇒

x(Z) = (n

−

1)(A

−

c) + k(n + 1)Z

2n

²

.

つまり上の

2

式は

x(Z )

が水平になる軌跡と垂直になる軌跡を与えている。これらは図の

x

⁰

(Z) = 0

線と

x

⁰

(Z ) =

∞線として表されている。この

2

つの補助線によって全領域は

4

つに区切られる。

(12)

を利用すると、

x

⁰

(Z ) = 0

線、

x

⁰

(Z) =

∞線の両方の上にある領域では

x

⁰

(Z ) > 0

、つまり右上がりになることが分かる。その作業を

4

つの部分領域について行うと図

1

に描かれている双曲線群を得ることができ、それらのそれぞれが

(12)

を満たすフィードバック戦略の候補を与える。なお図にはさらに

x

⁰

(Z) = 0

線と

x

⁰

(Z) =

∞ 線の交点

M

を通る

2

本の直線、

x

^L₂ と

x

^L₁ が付加されている。これは後に求める線形フィードバック戦略である。

以下では定常状態に収束する戦略だけに関心を絞る。そこで時間と共に生産量がどのように変化するのかを考えるために、次のような定常状態条件を付加する。

Z ˙ = 0

⇐⇒

x = kZ n .

これを追加したのが図

2

である。そこで

Z ˙ = 0

線で与えられる直線が定常状態を表す軌跡であり、

Z ˙ = 0

線の右の領域では

Z < ˙ 0

つまり

Z

は時間と共に減り、左の領域では

Z

は時間と共に増える方向に進む。

8) Cornes, Long and Shimomura (2001)は明示的に解を求めるモデルを提示している（筆者の知る）唯一の例である。

(10)

O

Z x

x⁰(Z) =1

x⁰(Z) = 0 xL

2

xL 1

M

図1

5.1 線形フィードバック・ナッシュ均衡

以上の準備を基に線形・非線形フィードバック戦略下における定常状態汚染量を求める。図

2

には

2

つの線形戦略が描かれておりそれらは次のようにして求められる。各企業の生産量は汚染量の

1

次関数で

x(Z)

≡

αZ + β, (13)

という形をしているとする。ここから

x

⁰

(Z ) = α

となり、これを

(12)

の左辺に、そして

(13)

^自身を

(12)

の右辺に代入すると次式を得る。

α = (r + k)[(n + 1)(αZ + β)

−

(A

−

c)] + sZ 2n

²

(αZ + β)

−

(n

−

1)(A

−

c)

−

k(n + 1)Z .

これを満たす未定係数

α

と

β

を求め、それらを

(13)

に戻せば明示的な線形フィードバック戦略を求めることができる。未定係数は次のように求められる。

(11)

O

Z

x .

Z= 0 xL

2

xL 1

xN

Z^N Z^L N

L M

x⁰(Z) =1

x⁰(Z) = 0

図2

α = (r + 2k)(n + 1)

−√

∆

4n

²

(14)

β = [r + k

−

(n

−

1)α](A

−

c)

(n + 1)(r + k)

−

2n

²

α (15)

∆

≡

(n + 1)

²

(r + 2k)

²

+ 8sn

²

> 0. (16)

ここで

(14)

の根号記号の前には形式的にはプラスとマイナスの両方を付すことができるが、定常状態に収束するのは

α < 0

^{に対応する}

x

^L1 だけであることは図

2

からも分かるので

α > 0

に対応する不安定解

x

^L₂ は捨象しても構わない。

(14), (15)

^を

(13)

に代入すると線形フィードバック戦略を明示的に得ることができ、それを定常状態条件

Z ˙ = n(αZ + β)

−

kZ = 0

を

Z

について解いたものに代入すると次のように、線形フィードバック戦略

x

^L1 によって達成される定常状態汚染量

Z

^L^{が決定される。}

(12)

Z

^L

= nβ k

−

nα

= 2

n

4n

²

(r + k)

−

(n

−

1)

h

(n + 1)(r + 2k)

−√

∆

io

(A

−

c)

h√

∆ + (n + 1)r

i h√

∆ + 2(n

−

1)k

−

(n + 1)r

i

=

n

4n

²

(r + k)

−

(n

−

1)

h

(n + 1)(r + 2k)

−√

∆

io

(A

−

c) k(n + 1) [(3n + 1)r + 2(n + 1)k] + 4sn

²

+ (n

−

1)k

√

∆ . (17)

5.2 非線形フィードバック・ナッシュ均衡

最後に非線形フィードバック・ナッシュ均衡下における定常状態汚染量を求めよう。ここで

Z

が時間と共に定常状態に収束するためには次の条件が成立していなければならない。

d Z ˙

dZ = nx

⁰

(Z )

−

k

≤

0

⇐⇒

x

⁰

(Z)

≤

k n .

これは非線形戦略の傾きが

Z ˙ = 0

線上でそれよりも緩くなければならないことを要求している。戦略が右下がりである場合にはこの条件は必ず満たされる。その境界を与えるのが図

2

における

x

^N である。

Z

の初期値

Z(0)

が適当な条件を満たせば、

x

^N が採用され、時間と共に

N

へと収束する。⁹⁾ その時の汚染量は

Z

^N として表されている。この

x

^N 及び

Z

^N は以下で示すように興味深い意味を持っている。

N

^{では非線形戦略の傾き}

x

⁰

(Z )

^が

Z ˙ = 0

^線の傾き

k/n

^{に等しい。しか} も

N

は

Z ˙ = 0

線上にあるから

x(Z) = kZ/n

が成立している。そこでこの

x(Z) = kZ/n

を

(5)

に代入して、それを

k/n

に等しくおくことによって次式を得る。

k

n = (r + k)[(n + 1)

^kZ_n −

(A

−

c)] + sZ 2n

²^kZ_n −

k(n + 1)Z

−

(n

−

1)(A

−

c) .

これを

Z

について解くと、

N

における

Z = Z

^N を明示的に求めることができ次のようになる。

Z

^N

= (k + rn)(A

−

c)

k[2k + r(n + 1)] + sn . (18)

9) x^N が採用されるための条件については、Itaya and Shimomura (2001), Rubio and Casino (2002)が詳細に論じている。さらにテクニカルに詳しい解説はRowat (2007)が与えている。

(13)

これが非線形フィードバック戦略

x

^N が取られたときの定常状態における汚染量である。

6

均衡の比較

以上で我々は

4

つの代表的な解における定常状態汚染量を導出してきた。すなわち（

1

）共謀解、（

2

）オープンループ・ナッシュ均衡、（

3

）線形フィードバック・ナッシュ均衡、（

4

）非線形フィードバック・ナッシュ均衡である。以下ではこれらの均衡における汚染量がどのような関係になっているのかを考える。その結果は次の定理にまとめることができる。

定理.

4

つの均衡汚染量に関して以下のランキングが成立する。

Z

^L

> Z

^O

> Z

^N ≥

Z

^F

. (19)

[

証明

] (17)

と

(9)

の比を取ると次のようになる。

Z

^L

Z

^O

=

n

4n

²

(r+k)−(n−1)

h

(n+1)(r+2k)−

√

∆

io

[k(r+k)(n+1)+sn]

n

k(n + 1) [(3n + 1)r + 2(n + 1)k] + 4sn

²

+ (n

−

1)k

√

∆

o

n(r + k) .

この分数の分子から分母を引き煩雑な計算を行うと

(n

−

1)k(r + k + sn)

h√

∆

−

(n + 1)(r + 2k)

i

> 0

となるから

Z

^L

> Z

^O が証明される。次に

Z

^O

/Z

^N を求めると

(9), (18)

より

Z

^O

Z

^N

= n(r + k)

{

k[2k + (n + 1)r] + sn

}

(k + nr)[k(r + k)(n + 1) + sn] ,

であり、分子から分母を引くと

k(n

−

1)[k(r+k)+sn] > 0

となるから

Z

^O

> Z

^N が確認される。最後に

Z

^N と

Z

^F を比較すると次のようになる。

Z

^N

Z

^F

= (k + nr)[2k(r + k) + sn]

(r + k)

{k[2k

+ r(n + 1)] + sn} .

この分数の分子から分母を差引いたものは

r(n

−

1)[k(r + k) + sn]

≥

0

ようになるから

Z

^N≥

Z

^F が従う。以上より

(19)

の不等式が証明される。

[

証了

]

ここまで数学的な議論に終始してきたので、なぜ上の定理が成り立つのかの経済学的な直観を説明しよう。まずオープンループ解についてであるが、割引

(14)

率

r

^{をゼロに近づけると}

Z

^O は静学的なクールノー均衡に収束することが知られている。なぜならオープンループ解では状態変数の値に依存せずに毎期の生産量を決めており、

r

→

0

とするというのは単に毎期静学的なクールノーゲームが繰返されるだけだからである。

しかしフィードバック解では

r

→

0

にしても

Z

^L

, Z

^N は静学クールノー均衡には収束しない。その理由を線形フィードバック戦略から考える。図

2

から安定的な線形フィードバック戦略は

Z

に関する減少関数である点に注意しよう。その上で仮に企業

1

が生産量を増やしたときに何が起こるのかを考えよう。企業

1

が生産量を増やすと汚染が増えて

Z

も増える方向に働く。先述の通り線形戦略では生産量は

Z

の減少関数であるから、この

Z

^{の増加を見て企} 業

2

は生産量を減らそうとする。すると企業

2

の生産量減少に伴い

Z

は減る方向に向かう。これは企業

1

の生産量増加をもたらす。ゆえに企業

1

は

Z

を通じた影響のないオープンループ戦略または静学クールノー生産量よりも多く生産しようとする。全く同じことは企業

2

にもいえる。よって産業全体の生産量はオープンループ均衡よりも多くなり汚染量にも同様のことが成り立つ。

つまり

(19)

の

1

つ目の不等式が成り立つ。

次に非線形フィードバック戦略

x

^N が採られたときを考えよう。

Tsutsui

and Mino (1990)

が最初に指摘したようにこの戦略は繰返しゲームにおける

トリガー戦略と同じ役割を持っている。実際、

r

→

0

にすると

Z

^N

= Z

^F、すなわち

x

^N で達成される定常状態は協調解と一致するというフォーク定理が成立する。ただ

r

が大きい場合には両者には乖離が生じ非協力解である

Z

^N の方が協調解よりも大きくなる。それでも他の解に比べると協調の度合いが強いためにオープンループ、線形フィードバックのいずれよりも低い汚染量に抑えられる。これが

2

つ目の不等式の解釈である。

7

文献の紹介と結論

本節では本稿で展開してきた微分ゲームの手法やその応用に興味のある人を対象に最近の文献も含めたサーベイを簡単に行う。なおオープンループ・ナッシュ均衡と線形フィードバック・ナッシュ均衡に関する文献は膨大なので省略

(15)

する。¹⁰⁾ 専ら非線形フィードバック・ナッシュ均衡に特化したものだけを紹介する。

本稿で用いた非線形フィードバック戦略の導出法は

Tsutsui and Mino (1990),

Shimomura (1991)

に依る。前者は硬直価格を入れたクールノー複占モデルを、

後者は資本家と労働者が動学ゲームを行うという資本主義ゲームを扱っている。

Tsutsui and Mino (1990), Shimomura (1991)

のアイデアを越境汚染に苦しむ

2

国ゲームに応用したのが

Dockner and Long (1993)

であり、環境経済学における微分ゲームの有用性を高めたものとしてよく引用される。

Rubio and Casino (2002)

は

Dockner and Long (1993)

の非協力戦略による共謀解の達成に関する結論は（

1

）割引率が十分に小さいだけでなく（

2

^）汚染の初期値が適当な条件を満たさねばならないことを詳細に論じている。さらに

Rubio and Casino (2003)

は

Tsutsui-Mino-Shimomura

の手法がうまく応用できない環境経済学の例を提示している。一般に上の

(12)

式は明示的に解くことはできない。しかし

Cornes, Long and Shimomura (2001)

は枯渇性資源をストックとして非線形フィードバック戦略を明示的に導出している。公共経済学における例では公共財の自発的供給における応用が多い。

Wirl (1996)

は

Fershtman and Nizman (1991)

で無視されていた非線形フィードバック戦略を

Tsutsui-Mino-Shimomura

の手法を用いて求めている。

Ihori and Itaya (2001), Itaya and Shimomura (2001)

もその手法を公共財供給モデルに応用している。

Tsutsui-Mino-Shimomura

の手法のテクニカルな部分や問題点については、

Dockner

et al.

(2000), Sorger (1998), Rowat (2007)

が詳説している。なお近時の筆者による応用例として

Fujiwara (2008), Fujiwara and Matsueda (2007, 2009a, 2009b)

がある。

本稿で考えたのはいわゆる線形

2

次モデルと呼ばれるものである。つまりプレーヤーの目的関数が操作変数と状態変数に関して

2

次関数となっており、

制約条件は各プレーヤーの戦略に関して

1

次関数となっているようなモデルである。上でサーベイした文献の大半も関数形を特定化して線形

2

次モデルに落

10) 柴田・竹田(1997),柴田(2004)を参照。

(16)

とす形で非線形フィードバック戦略を導出している。その意味で興味ある問題を線形

2

次形式にすることができれば本稿で紹介した手法がそのまま利用できる。

なお本稿ではナッシュ解に議論を絞った。これに対してあるプレーヤーが他のプレーヤーの反応関数を知った上で行動するというシュタッケルベルク解を定義することもできる。例えば

Kemp, Long and Shimomura (1993)

は政府を先導者、資本家を追随者とするシュタッケルベルク微分ゲームを考え、オープンループ解、フィードバック解における最適資本課税を分析している。ただオープンループ・シュタッケルベルク均衡には時間整合性の問題がつきまとう上にモデルが複雑になるという理由で文献は多くない。また

Dockner and Long (1993)

と同様のモデルで

Long (1992)

はオープンループ・シュタッケルベルク均衡を導出しているが、

Kemp, Long and Shimomura (1993)

も

Long

(1992)

も共通しているのは安定性の議論が中心となり解の比較が難しいとい

う点で応用経済学での汎用性はこれからの発展を待たねばならない。微分ゲームにおけるシュタッケルベルク解の研究は課題が多いといえる。

参考文献

[1] Basar, T. and G. J. Olsder (1995),Dynamic noncooperative game theory, New York: Academic Press.

[2] Benchekroun, H. and N. V. Long (2008), ‘The build-up of cooperative behavior among non-cooperative selﬁsh agents,’Journal of Economic Be- havior and Organization, 67, 239-252.

[3] Cornes, R., N. V. Long and K. Shimomura (2001), ‘Drugs and pests:

intertemporal production externalities,’Japan and the World Economy, 13, 255-278.

[4] Dockner, E. J. and N. V. Long (1993), ‘International pollution control:

cooperative versus noncooperative strategies,’ Journal of Environmental Economics and Management, 24, 13-29.

(17)

[5] Dockner, E. J., s. Jorgensen, N. V. Long and G. Sorger (2000),Diﬀeren- tial games in economics and management science, Cambridge: Cambridge University Press.

[6] Fershtman, C. and S. Nitzan (1991), ‘Dynamic voluntary provision of public goods,’European Economic Review, 35, 1057-1067.

[7] Fujiwara, K. (2008), ‘Duopoly can be more anti-competitive than duopoly,’Economics Letters, 101, 217-219.

[8] Fujiwara, K. and N. Matsueda (2007), ‘On a nonlinear feedback strategy equilibrium of a dynamic game,’Economics Bulletin, 3, 1-10.

[9] Fujiwara, K. and N. Matsueda (2009a), ‘Dynamic voluntary provision of public goods: a generalization,’Journal of Public Economic Theory, 11, 27-36

[10] Fujiwara, K. and N. Matsueda (2009b), ‘A game-theoretic analysis of trade liberalization in the presence of transboundary stock pollution,’

Mimeo., Kwansei Gakuin University.

[11] Ihori, T. and J. Itaya (2001), ‘A dynamic model of ﬁscal reconstruction’, European Journal of Political Economy, 17, 779-797.

[12] Itaya, J. and K. Shimomura (2001), ‘A dynamic conjectural variations model in the private provision of public goods: a diﬀerential game approach’,Journal of Public Economics, 81, 153-172.

[13] Kemp, M. C., N. V. Long and K. Shimomura (1993), ‘Cyclical and non- cyclican redistributive taxation’,International Economic Review, 34, 415- 430.

[14] Kemp, M. C., N. V. Long and K. Shimomura (2001), ‘A diﬀerential game model of tariﬀ war,’Japan and the World Economy, 13, 279-298.

[15] Long, N. V. (1992), ‘Pollution control: a diﬀerential game approach’, Annals of Operations Research, 37, 283-196.

[16] Rowat, C. (2007), ‘Non-linear strategies in a linear quadratic diﬀerential game’,Journal of Economic Dynamics and Control, 31, 3179-3202.

[17] Rubio, S. J. and B. Casino (2002), ‘A note on cooperative and noncooperative strategies in international pollution control’,Resource and Energy Economics, 24, 261-271.

(18)

[18] Rubio, S. J. and B. Casino (2003), ‘Strategic behavior and eﬃciency in the common property extraction of groundwater’,Environmental and Resource Economics, 26, 73-87.

[19] Shimomura, K. (1991), ‘The feedback equilibria of a diﬀerential game capitalism’,Journal of Economic Dynamics and Control, 15, 317-338.

[20] Sorger, G. (1998), ‘Markov-perfect Nash equilibria in a class of resource games’,Economic Theory, 11, 79-100.

[21] Tsutsui, S. and K. Mino (1990), ‘Nonlinear strategies in dynamic duopolistic competition with sticky prices’,Journal of Economic Theory, 52, 136-161.

[22] Wirl, F. (1996), ‘Dynamic voluntary provision of public goods: extension to nonlinear strategies’,European Journal of Political Economy, 555-560.

[23] 板谷淳一(2004),「公共財の自発的供給と推測的変動」,西村和雄・福田慎一

編『非線形均衡動学』,第9章,東京大学出版会.

[24] 柴田章久(2004),「ダイナミック・ゲームと経済動学」,西村和雄・福田慎一

編『非線形均衡動学』第6章,東京大学出版会.

[25] 柴田章久・竹田之彦 (1997),「経済学における微分ゲーム理論の応用について」,経済学雑誌（大阪市立大学）, 98, 1-22.

[26] 下村和雄(2002),「越境的環境汚染への動学ゲーム論的アプローチ」,国民経

済雑誌, 185, 35-43.

[27] 下村和雄 (2004),「越境的環境汚染への動学ゲーム論的アプローチ−国際的

ならびに時間的な相互依存関係−」,池田三郎・酒井泰弘・多和田眞編『リスク、

環境および経済』第9章,勁草書房.

[28] 三野和雄(1985),「経済システムの最適制御と時間整合性問題I」,広島大学

経済論叢, 8, 55-81.

[29] 三野和雄(1986),「経済システムの最適制御と時間整合性問題II」,広島大学

経済論叢, 9, 73-98.

汚染的寡占の微分ゲーム分析

汚染的寡占の微分ゲーム分析

著者 藤原 憲二

雑誌名 経済学論究

巻 63

号 3

ページ 499‑515

発行年 2009‑12‑15

URL http://hdl.handle.net/10236/3713

汚染的寡占の微分ゲーム分析

A Diﬀerential Game Model of Polluting Oligopoly

藤 原 憲 二

JEL

C61, C73, L13

1

(1997),

(2004)

(1985, 1986)

2002, 2004

3

2

Dockner

(2000)

(1997),

(2004),

2002, 2004

n

2

1

1

2

3

3

2

3

4

5

6

7

2

p = A

X, A > 0

p

X

c

0

1

Z ˙ = X

kZ, k

[0, 1].

Z

k

i

(A

c

X)x

sZ

/2, s > 0

x

i

i

max

e

(A

c

X)x

s 2 Z

dt

subject to Z ˙ = X

kZ, r

0.

r

Z (0)

t

Z(t)

Z(t)

t

t > 0

Z (t)

t

著者藤原憲二

雑誌名経済学論究

藤原憲二