再生可能資源の動学的最適管理:経路積分の近似に よる解法
著者 山下 純一
雑誌名 産業経済研究
巻 49
号 3
ページ 293‑322
発行年 2008‑12‑25
URL http://hdl.handle.net/11316/261
久 留 米 大 学 産 業 経 済 研 究 第
49巻 第
3号
(2008年
12月) 一
1一
論 文
再生可能資源の勤学的最適管理:
経路積分の近似による解法
山 下 純
要 約
再生可能な自然資源の最適収穫問題は.資源経済学の重要なテーマであった。
従来.この問題は決定論的な枠組みで論じられることが多かったが.近年.
不確実性を考慮したモデルへと議論が発展している。この展開は.動学分析 の枠組みを確かに拡張したが 一方で 最適解の分析をより困難なものとし た。この課題に応えるべく.近似計算によって解の挙動を分析する手法が試 みられるようになった。一方.金融市場におけるアメリカンオプション取引 と資源管理問題の本質的な類似に注目して.そこで地われた手法を応用する 流れも鳩加している。そこでもやはり.数値的な分析が不可欠となる.本稿 は.この二つの流れをふまえ.不確実な環境の下での動学的な最適収穫問題 をアメリカンオプションのリアルヴァージョン(リアルオプション)と見な して考察する。その際.これまでの数値的な手法では無視されていた
Feynman‑Kac
による経路積分の近似によって.最適管理政策の数値解を求 める。
目 次
1.再生可能資源の収穫:資源ストックの最適管理 1.1.はじめに
1 .
2.伝統的なモデル:私的所有権を前提にする管理政策 1 .
3.古典的な動学モデルの定常解
1 .
4.ストック効果の導入 1 .
5.ストック成長の不確実性
1 .
6.ストック効果を考慮した社会的資源管理モデル
2.収穫問題の理論的な基礎:最適停止問題
2.
1.臨界的なストック水準
(293 )
‑2ー
2.2.
割引のないケース
2.3.
割引因子を伴う最適停止問題
2.4. 1
次元の
Bang‑Bang制御
2.5.
アメリカンオプションとしてみた収穫停止問題
3.収穫問題の理論的な基礎:最適停止問題
3.1. Feynman‑Kac
の公式
3.2.
離散化とベルマンの鼠適性の原理
3.3.確率的な最適収穫問題の数値解
3.4.結語
1.再生可能資源の収穫:資源ストックの最適管理
1.1.はじめに
漁業や林業のような再生可能資源の収穫において.資源ストックの枯渇はもっ とも深刻な問題の一つである.本来,海洋資源などの再生可能資源は,その適正 な管理がなされている限り,ほとんどの場合.持続的な収穫が可能である。とこ ろが,最近のFAOやその他の報告によれば,これらが枯渇に向かう傾向は深刻度 を増しているように思えるl。
こうした問題が生じるのは,ひとつには.再生可能資源が私的所有権に基づく 法的強制力をもった管理になじまない場合が少なくないからである。もっとも,
所有権が個人に属さない場合でも.管理が可能な場合もある。たとえば,その資 源の所有がある共同体に帰属するような場合がそれである。共同体の中での信頼 や社会的規範が揺るがない限り,共有財産としての管理は可能であろう。ところが,
資源の収穫がひとたび市場経済を経由する生産・消費の循環に組み込まれてしま うと.資源管理は市場原理の壁に直面する。
1 F AO Fisheries and Aquaculture Department :
The State of World
丹I ' s heries and AQuaculture. 2006.
(294 )
再生可能資源の動学的最適管理:経路積分の近似による解法 一
3‑この「壁」とは.たとえば次のようにいえる。財の所有権が取引の基礎となる 市場経済では,投資の果実は.当然その主体に帰属する。漁業の場合でも.漁獲 に対しては.いうまでもなく所有権を主張できる。しかし.取り残した魚につい ては.だれもそれを主張できない。取り残しを一種の将来投資とみれば.その投 資収益に対する所有権が主張できない。つまり.資源保護の意図を.市場機構の なかの誘因として実現するメカニズムが存在しない。存在しないだけではなく.
資源の市場価格が高い場合は特に.より強力な動機付けとなるのは.保護ではなく.
収穫である。結果として.資源の枯渇が現実的な懸念となりやすい。
本稿では.特に漁業における資源管理を念頭に置いて.オープンアクセスの再 生可能資源の最適管理問題を理論的に考察する。この問題そのものは古くから議 論されており.理論的な蓄積も多い。静学的にも,動学的にも.最適管理は議論 されてきた
(Sheafer [
14],
Gordon[4 J.Clark and Munro[2])。さらにここ数年.
従来のアプローチに加えて,再生可能な生物資源の収穫意図を.金融資産の派生 証券の理論と同じ観点からとらえようとする議論が増加している
(Arantzaand Chamorro[l],
Dangl and Wirl[3]),
Nφstbakken[7])。本稿は.資源管理を本質的に金融派生証券におけるアメリカオプションの評価 と同一の問題として扱う。文字通りの派生証券の場合には.権利行使に関する意 思決定の分岐点となるのは,資産価格のある臨界値である。資産管理の場合も同 様に,収穫政策における態度の変更.すなわち.収穫か保護か.という最適政策 の切り替えが,どのレベルの資源ストック水準をもって実施されるべきかが.考 察の核となる。その際 本稿が従来のアプローチと異なるのは.最適解を見いだ すための数値的な手法においてである。すなわち これまでの数値的アプローチ(差 分法や選点法など)とは異なり.境界値問題を解くために
Feyman‑Kacの経路積 分法に注目する。その積分の数値解を求めることによって,最適解を近似する九
( 2 9 5 )
‑4‑
以下ではまず
1節で.再生可能資源の収積問題が伝統的にどのように定式化さ れてきたかを概観する。伝統的なモデルの重要な問題点のひとつが、所有権と外 部性の扱いにあることを振り返る。
2節では.資源管理問題を収種オプションの 権利行使問題とみる立場から.巌適管理を収種の最適停止問題として定式化する。
3
節では,最適政策の数値解を経路積分の近似によって求める。
1.2.
伝統的なモデル:私的所有権を前提にする管理政策
漁業における収種管理モデルは.伝統的にいくつかの特徴をもっている。その 基本的な構造を決定づける点で特に重要なのが.収離における私的所有権の仮定 である。この仮定を一言で言えば,漁業は,収積(生産)した財に対する私有権 制度の下で,自由競争的に操業する多数の企業からなる産業と同一視できるとい う前提である。したがって 各収穫主体は 市場で定まる価格を受け入れて,利 潤最大化原理に基づいて行動する私企業とみなされる。収穫量の決定弘私企業 が生産量を決定するのと基本的に同一で 利潤最大化原理によって決定される。
この利潤原理は.オープンアクセス漁業においては 収穫の最適管理と矛盾する 傾向をもっ。
具体的なモデルの特徴をみよう。モデル全体は.大きく分けて,二つのサブモ デルに分けて考えることができる。一つは 経済学的な最適化行動を記述する部 分であり,もう一つは生物学的な資源の成長プロセスを記述する部分である。
後者からみよう。 X(t) を時刻
tにおけるある漁業資源のストックサイズとする。
ストックサイズの自然成長を記述する関数を G(X
(t))とおしさらに. h
(t)を時刻 t の収穫量とする。このとき,
dX(t)
= (G( X ( t ) ) ‑h ( t ) ) d t ︑
EF
唱EA
︐ ︐
E
︑
2
選点法
(collocationmethod)の解説書としては,たとえば石岡
[16]がある。
( 296 )
再生可能資源、の動学的民適管埋:経路純分の近似による解法
ー 5一 は.収稽によるストックの減少を考慮したストックサイズの変動を記述する方程 式である。古典的なモデルでは.関数
G(・)は確率的な要素を含まないので.
x(,)は収穫の大きさ
h(,)が決まれば.決定論的に定まる。一般には.ストックの変動は 人為的な要因だけで定まるのではないので.
x(のは確率変数とみる方が妥当である。
ストックの変動を所与として.漁撞による市場での利潤を鼠大化するように収 稽量が決定される。利潤を式でかくと.次のようにあらわされる。
C=C(h( , ) .
x(, ) ) を収穫に要するコスト
.pを収磁 l単位の市場価格とすると .
ph( , ) ‑
C(h( , ) .
x(,))が利潤である。ここで.簡単化のために
.価格pは一定であるとする。
1.3.
古典的な動学モデルの定常解
所有権を前提とするときの最適収穫問題は,たとえば次のようになる九収穫管 理の時間的視野が無限大で,資源ストックの成長プロセス(1)に不確実性は存在し ないとすれば.
max I e‑rt (ph(t) ‑C(h(t), X(t))) dt subject to dX(t) = (G(X(t)) ‑h(t)) dt
h(t)
J o
(2)を解くことによって最適収穫の時間的な経路
h(,)が決定される。ここで
rは安全 資産の市場利子率(=割引率).
pは収穫
1単位の市場価格.h (,)は収穫量.
x(,)は(非確率的な)資源ストック水準.
C(・
,・)は費用関数.
G(・)は資源、の再生産関 数である。また.
r. pともに一定と仮定する。
(2)
は,資源ストック量の変動が決定論的なケースにおける利潤
π(, )
=ph (t) ‑Cの最大化問題である。ここでは,収穫量とストック量がコストに影響を与えるこ とはあっても.収入
ph(t)に影響することはない。価格が固定されているので.ス トックレベルを無視して収穫しでも.当座のところはストックの減少による収入
3 Perman et aL [l 0]の17章参照。
( 297 )
‑6ー
への影響は存在しない。ストック減少の影響は.コスト面から利潤に反映される。
そのような前提で.収穫量そのものも最適水準に決定できるというモデルである。
資源ストックが減少しているような魚類の収穫管理をこのモデルに即して考え てみよう。そのような資源の市場価格
pは高止まり状態にある可能性が高い。し たがって.漁獲が増加するにつれて収穫も増加すると予想される(ここでは漁護 規制は考えない)。とはいえ.この推論はストレートに結論に結びつくわけではな い。コスト関数
C=C(X
(t). h (t))に.ストック減少の影響がコスト増としてあら われるであろうからである。その分だけ利潤の増加は相殺され,収穫努力に歯止 めがかかるだろう。このとき ストックレベルの均衡がどのようになるかは.次 のようにしてわかる。
最大値原理をもちいて.最大化問題
(2)の必要条件をもとめると.
λ(t) = P ‑Ch (h(t),X(t)).
入
'(t)=r 入
(t)一入
(t)G'(X(t))+
C", (h(t), X(t))となる.ここで.プライム'は導関数をあらわし .
C:.. Chはそれぞれの添字につい てのコスト関数の偏導関数をあらわす。入
(t)はシャドウプライスである。
上の必要条件においてd
λ(t)ldt=Oとおいて,定常状態において成立する関係を 求めれば.
r=G'
一 千 入
=pーCh( 3 ) をえる。
( 3 ) をもちいて.資源ストックの定常状態がどのように決まるかを知ることがで きる。いま,資源の追加
1単位を取得するか.それとも,収穫を停止するかの決 定を考えてみよう。もし収穫しなければ,それは
G'の資源の増加をもたらす。一 方.資源の増加は収穫コストの減少
CxくOをもたらすであろう。このコストをシャ ドウプライス (=価格から限界コスト分を控除した収穫
1単位の限界収入)で相 対評価して,収穫しないという決定のもたらす便益を考えると.それは
G'一
Cxlλ(298 )
再生可能資源の動学的最適管理:経路積分の近似による解法 一
7ー である。つまり,収穫しないという選択を投資であると考えれば.この投資のも たらす収益がこれである。この収益を,投資
1単位の機会費用 r と比較する。両者 が一致するレベルに均衡ストック量が決定されることになる。
このようにみると,均衡ストック水準が.一般の投資理論とほとんど同じ原理 で決定されることがわかる。ところが.漁業のようなオープンアクセス資源では.
たとえ投資のつもりで収穂を控えても.そのリターンがだれに帰属するかを前もっ て知ることはできない。自分の取り残した魚が.他の漁船に収穫されてしまうこ とがおこる。つまり.投資決定の比較対象となる安全資産の市場利子率は,オー プンアクセス資産の投資のリスクからすれば低すぎる可能性がある。その結果と して,ここから理論的に導出されるストックの定常水準は.持続可能な資源管理 のメルクマールとしては信頼できない可能性が生じる。
このモデルの欠陥のひとつは.未収穫分については所有権が基本的に設定でき ない再生可能資源を,あたかもそれが可能な一般の投資財と同列に論じることによっ て生じている。また.収穫による便益がもっぱら生産者の側からのみ把握されて いることも問題であろう。オープンアクセス資源については,社会全体での便益 を考えるのでなけらばならない。
1.4.
ストック効果の導入
これらの問題点を解消し,社会的に適正な資源ストック水準は何か,を考察す るアプローチとして, リアルオプションは有力である。これはオープンアクセス 資源の私的収穫の機会を,一種のデリパティプとみなすという考え方である。そ の際,理論立ての基礎となる資産は再生可能資源そのものである。生産者は,そ のストックサイズおよび価格変動の不確実性によって生じるリスクを,収穫権利 の行使(留保)によってへッジしようとすると考える。金融オプションの場合と 同じく,どの水準の価格あるいはストックで収穫権利を行使するかが問題となる。
(299 )
‑8
一
以下では.簡単化のために.このうちストックサイズのみが.確率的に変動する とみなす.
ただし.注意すべき点として.このストック量の減少リスクの社会的影響は.
必ずしも市場経由で生じるとは限らない。たとえば.特定の生物資源の過剰な収 穫が生物多様性のバランスを破壊し 遺伝子の多様性の面で偏った生物環境が生 まれると.ある伝染病に対する耐性が著しく損なわれることが知られている。結 果として.生物資源の再生可能性を支える環境の基盤そのものが失われるリスク が生じる。そうしたりスクを最適収穫の評価の中に含めるためには.収穫の社会 的利益をあらわす便益関数のなかに.それらが何らかの形で表現されるのが望ま しいであろう。しかし.その種の社会的効用の表現は必ずしも容易ではなく.そ れ自身で全く独立した考察を必要とする問題である。
以下では,もっとも単純な方法で.ストック減少の社会的効果を調べる。すな わち,ストックレベルの低下が収入の減少につながるように生産者の利得関数を 定める。前項のモデルのように.社会的な便益が利潤の大きさだけで決定される のではなく.直接的に資源ストックのサイズにも依存すると仮定する。その結果.
その他の変数を一定とすれば.ストックレベルが落ち込めば利益も減少し,一方 ストックの増加は利得の増加をもたらすことになる。
1.5.ストック成長の不確実性
さらにもう一点,上記モデルの拡張を試みる。モデルにストック水準の不確実 な変動を導入する。モデル(2)では.制約条件の動学が示しているように,資産ス トックの増減を規定する要因は.自然の再生産過程と収穫量だけである。その再 生産過程は決定論的に記述されているから 関数 Gが即知であれば.収穫量がス
トック増減を左右する唯一の制御となる。
ところが.生物資源の増減に影響を与える要素がすべて知られているわけでは (300 )
再生可能資源の動学的最適管理:経路積分の近似による解法
‑9ーない。たとえば 漁業の場合. 海洋環境の変化に伴って 「漁種交代
jとよばれる 現象が起きる。 この一例として. イワシのストック水準の変化がある。現在.
1980
年代と比較して. 世界的にマイワシ
(Sardinops melanostictus)の漁獲が 激減し. これに替わってカタクチイワシ
(Engraulis japonica)のストックが培 加している ( 図
l参照)。 この変動は. 主として魚種交代の結果であるとされる九 にもかかわらず. 実際はストック水準が危機的に減少しているのに
.高値で売れ るというだけの理由で, 収機が継続されるといったことが生じ得る。実際. これ は我が国の漁業の現場で起きていることである (小松. 前掲書
[17]参照)。決定論
6.000.0001 一一一一一~, ". .‑.ー
5.000.0001
4.000.0001
3.000.0001・4 ・
2.000.0001 ‑̲ー
‑ j / l
/
017 ーでで~明白..(
_一 …
~~~~~まま S8222222sasa S22222222
‑ーー・マイワシ
‑‑‑̲.カヲクチイワシ
図 1 :鰯の世界的な漁獲高の推移(国連食糧農業機関のデータより作成)
4 r
魚が棲息する海洋の環境は.常に一定ではない。全体が,
30年から
50年の周期で変 動している。日本でいえば.親潮の強い時期と,黒潮の強い時期が.交
Eに訪れるの だ。現在.海が温かくなっているのは.一つは地球温暖化のためだが.それだけでは ない。(中略)マイワシが「バブル」を起こすほど獲れていたのは.親潮の強い時期だっ た。事実.それより以前に線潮が弱くなった時期には.そんなに獲れていない。
1965年には.わずか9000 トンまで減少している。
450万トンを記録した年のおよそ
20年前 のことだ。海洋環境の変化は.それぐらい多大な影響を及ぼしているのである。
J( 小 松
[17],pp.58・59)( 301 )
‑10‑
的な動学で許容される収穫量のみ管理する資源政策では.こうした確率的なストッ ク変動は考慮されない。最適管理政策を導出するモデルとしては,不十分といわ ねばならない。
まとめると.ストックレベルは.自然の不確実な増加プロセスとそこからの収 穫による減少の二つの相互作用によって決定される。また.この不確実な変動が.
ストックレベルの不確実性となり.収穫オフションを行使するかどうかという問 題へ発展する。
1.6.ストック効果を考慮した社会的資源管理モデル
資源管理モデルとして以下であらたに考察するのは.ストックレベルの影響を 受ける便益関数と.不確実な資源の変動を考慮したモデルである。具体的には.
d 経 H ι f 門 バ ( t )‑c ) h ( t ) d t
(4)subject to
dX(t)
= α(X ( t ) ( l ‑X ( t ) ) ‑h ( t ) X ( t ) )
dt +σX(t)
dW( t ) , X(O)
=x ( 5 )
である。 (4)で
h =h ω
は収穫努力をあらわす実数(=制御変数)で, W ( t )
は標準 プラウン運動である。 X=X(t)
は時刻t
での資源量の確率過程をあらわし.積X' hが努力 h に対応する収穫量である。この収穫に応じて.社会的余剰(=生産者 余剰)としての利潤 (p'X為一 c ' h )
が生じる。ここでcは収穫努力1単位の限界費 用(一定)であり,
pは資源の市場価格(一定)である。したがって,前節の費用 関数は, C ( h ( t ) , X ( t ) ) =c'h(t)
となる。つまり,このモデルでは, rストック効果」は費用関数を通してではなく,生産関数を通してあらわれる。
X ( t )
が確率変数で あることを除けば,これは古典的なSchaefer型の生産関数である。(302 )
再生可能資源の動学的最適管理:経路積分の近似による解法
‑11‑stock level
0.8
0.6
0
. 4
0.2
tJme
。
2 3 4 5図
2:決定論的および確率的なロジスティック成長の時間経路:
α=1
,
o=0.4,
h=0.8,
x=1のケース
制約条件(5)
は ,
α,
0を非確率的な定数とする資源ストックの確率的なロジスティッ ク成長モデルである。
0=0のとき,これは決定論的なロジスティックモデルとな る。図
2では初期値を
x=1として ,
0=0,
α=1,
h=0.8のときの解の経路を描 いている九
0=0のときには, ( 5 ) の厳密解X(t)は.
( α ‑h)x
X(t)
= x+
(α(1 ‑x) ‑h )
e‑(a‑h)t
である。したがって ,
t→∞となるとき ,
X(t)は単調に減少して
(α‑h)/α=0.2に収束する。
これに対して,
α>0のときは,環境に依存する不確定な変動が,ストック水 準に影響を与える。図
2は ,
0=0.4のときの確率微分方程式
(5)の解経路の例(モ
5 図 2 の滑らかな曲線に対応する.
(303 )
‑12ー
ンテカルロ解) も描いている九
附 )
= ぷ
EHEzlfrt(PX(t)‑c)h(t)dtl (6)とおけば. この問題の
Bellman方程式は
げ (x)=
必
"H{(Pxー 仙+[ω(1‑x) ‑xhJ九+jσ2仇)
(7)である。
social benefits
M~(p 一九 )x
‑c >0
のケース Max: (p一九
) x‑c
くOのケースH
h
。
図
3:再生可能資源の最適収稽量の選択
この最適問題の
l階条件からわかるのは. 次のように
hを定めるのが最適であ るということである:
f H if (p一九)x> C, h={
l 0 if (p一九)x< c.
6 rギザギザ」の経路がそれである。これは疑似正規乱数を発生させて標準ブラウン運 動を近似し.さらに.同様にして確率積分を近似して得られる。ただし.ここではh
を常に一定に定めている。したがって.収機量の主体的な変更が.更にストック水準 に影響を与える様はとらえられていないことに注意すべきである.
( 304 )
再生可能資源の動学的最適管理:経路積分の近似による解法
‑13ーここで得られる収穫政策は.いわゆる
Bang‑Bang制御である。現在のストック レベル X( O )
=xで評価して
,(p一九)xー
Cがプラスであるかマイナスであるかに 応じて.フル操業と禁漁という両極端の政策をスイッチする。たとえば.追加 l 単位のストックからもたらされる社会的余剰,すなわち社会的な限界収入凡 ( x )
三v ' ( x ) が,市場価格(私的限界収入)より小さいストックレベル
xを考えてみよう。
つまり , p‑V'( x
)>Oとする。この場合.資源ストックの市場評価は社会的評価を 上回っている。さらに,その差額で.単位コスト c /
xをまかなうことができるとき.
(p
一九 )x ー c
>0にはフル操業が選択される。ただし.最適政策がどちらの選択で あっても.資源ストック成長の最適経路そのものはやはり確率過程である。したがっ て,その経路は確率的に変動する。これは決定論的なモデルと本質的に異なる点 である。
次に.二つの政策を切り替えるべき臨界的なストック水準について考察する。
まず.
So = {xl(p
一九
)x<
c}, SI = {xl(p ‑Vz)X>
c}とおく。この段階では v ( x ) そのものが知られていないので.その導関数九を含 むこれらの集合も未知であり ,
v(x)と同時に決定されることになる。それぞれの 集合上では,以下の微分方程式が成り立つ:
rV‑ω(1一 机
‑ j σ 2 九 =
0 on品,rVーα[x(l‑x) ‑Hx] Vz
一一
1 σ2X2Vzzー(px‑c)H = 0 on SI・2
ストックのダイナミクスについての仮定から,
V(O) = 0
(8)
(9)
である。これは.生物資源ストックがひとたび
0に落ち込めば,そこから再び回 復しない (x=
0は吸収壁)ので.資源、は無価値になるという意味である。
(305 )
¥ '(x) (p ‑Vz(x.))x. ‑c = 0
v
‑14ー
stock level (p ‑Vz)x > c
z
S •
• ︐ .
z
(p ‑\・~)x く r
S
。
。
図
4:ストック水準の臨界値
収穫問題の理論的な基礎:最適停止問題 2.
2.
1.臨界的なストック基準
現在の資源のストック水準を
xとおこう。そのときの社会的便益は
V( X ) である。
まず全 この関数関係がどうなるかを考察しよう。厳密な議論はひとまずおいて.
体的な見通しを描いてみる。
V(O) = 0
である 図
4は,経済学的にみて予想される両者の関係を描いている。
ストック水準が増加する ので.社会的な便益曲線引
x)は原点から出る。そして.
ある臨界的な水 について.高くなると考えるのが合理的である。その大きさが.
このような場合に 準
f以下では,収穫による資源ストックの減少が懸念される。
資源の 一方.
x.を超えると.
収穫の凍結
h=Oが選択されると予想される。
は ,
相対的にストッ ストッ クレベルが落ち込んでいるときには.
x.になるまで収穫を控える。一方.
(306 )
収穫による社会的利益は高まると考えることができる。 つまり.
再生可能資源の動学的最適管理:経路積分の近似による解法
‑15ークレベルが臨界値 f 以上に回復すれば.収穫を開始する.そして,その臨界的な 収積水準の決定は,社会的余剰の最大化から導かれるのでなければならない。
このような経済学的な推論を.前節のモデルと対比させてみよう。まず ,
xが臨 界値以上のストック水準.すなわち.領域
SIに属する場合から考えよう(図
4参 照)。このときは.収穫努力がフルに発揮され , h=Hである。そのときの社会的 余剰 V ( X ) は微分方程式
j σ 2
仇+[ax(l‑x)‑HxJ
九一rV+ 印Ix‑c)H=O ( 1 0 ) を解くことによって決定される。
一例として.システム状態を記述する微分方程式
(5)が ,
X( O ) =x
εSIから出発 して時刻 τではじめて f に到達すると仮定してみよう:ある時刻 τ=τ ( x ) に対し て ,
X(T) = x..
このとき,それ以前の期間
O壬tく
τまでは.社会的余剰として j(X ( t )) = =
(PX ( t )
‑c)H が発生したことになる。これに加えて,
τの時点で.残っている資源ストッ クの社会的な便益を g (X(
τ))とかく。この両者の価値を集計し.割引現在価値と してあらわせば.
v(
←
ι[ l
T e‑r川
である。ここで
τI〈∞は
τが有限であるとき
1,そうでないときは値
0をとる指示 関数である。
(11)の最初の項は X ( t ) が図
2のような経路上を確率的に動くとき,
それが時刻
τで臨界水準に到達するまでの社会的余剰の値を総計したものである。
第
2項 g (X( τ))e 一円が,残された資源の価値である。両者の期待値の合計が(計 算可能であると仮定して),
v( x ) と定義されている。
(307 )
‑16ー
2.2.
割引のないケース
2.1
節の例にしたがえば.問題は収種をいつやめるか.すなわち.どのストック 水準で
h=0とするかということである。この種の問題は.最適停止問題として 定式化される。この問題も含めて.確率微分方程式のドリフトに制御項が入る形 のダイナミクスのもとでは 最適停止問題は一般的に次のように記述できる〉
まず.一般に.収纏停止時のストックレベルを
Bとおいてみよう。すなわち.上 の例では
,B=x*であり
, (B,∞)
= (x*,∞)の範囲のストックで収種がなされると 仮定した。さらに.制御
uEUは実数空間
R1におけるフィードパックタイプの制 御であるとする。ここで
Uはがのコンパクト集合で.制御変数の変域をあらわ す。状態変数のダイナミクスは.
dX(t) = b(X(t), U(X(t))) dt + 0 (X(t)) dW(t) (12)
とする。ここで
U(・)がフィードパック制御プロセスをあらわす確率過程である。
停止時刻
τを
T = inf {tl X(t)極(0,B)}
とおく。この時刻は,
2.1節の例でみれば.収穫がいつ解禁になるかをあらわす。
さらに.利得関数を
川 ) =
勾 叫 [ ! か か O
Tい
T)k州
k収 削 (
X刻(伏 閃 附
とおく。作用素 E~ は X(ω0)
=x, U(x) =uとして期待値をとる操作をあらわしてい る。さらに
,vの境界条件を.
V(O, u)
=
g(O), V(B, u)=
g(B).( 1 4 ) とする。ここでが・)は所与の関数である。伊藤の公式を関数
V(X,u)に当てはめれ
同?.
ぴ(:r:)V(x,u)+k(x,u(x))=O if xε(O,B) (15) 7この部分については. Kushuner and Dupuis [6]
.例
4(p.97)参照。(308 )
再生可能資源の動学的最適管理:経路積分の近似による解法
‑17ーという形になる。ここで
.ζαは制御が
αであるときの微分作用素であり.境界条 件(1 4) のもとで,この微分方程式を考察することになる。
αιの具体的な形がどう なるか.また割引因子をもっときの最適停止問題がどう記述されるかを次に述べる。
2.3.
割引因子を伴う最適停止問題
割引因子
s>Oが入っているモデルのケースは.最適停止問題は一般的に以下 のように記述される。状態変数のダイナミクスは.やはりドリフトに制御変数が 入る形の式(1
2)とする。
τ =inf {tlx(t) ~GO} とおく。ここで,集合 G(CR
n)はあ るターゲット集合 ,GO はその
n次元空間における内部をあらわす。前記の例ではがにおける開集合 ( 0 , B) が GO に相当した。このとき.社会的便益は割引因子で現 在価値評価された形で,
V(日 )=母
[ l
T九 州 , 削ds+内
(X(T))] ωとなる。このとき.すべての制御
uEUのなかで.期待効用を最大にする選択を
V(x) = sup V(X, U)uεu
とおく。この V ( x ) が満足すべき微分方程式は次のようになる
8•βV(x) = sup [.cuV(x)
+
k (x,
u)]uEU
三supI九(x)b(い)+ふr[弘 (x)α(x)]+ k(日 )1, x ε GO•
( 1
7)uEU
L
~ JV(x) = g(x)
,
xε8G.( 1
8)ただしここで,
α( x )
三 σ( x )aT ( x ) であり θG は G の
Rnにおける境界をあらわす'。
8
証明については,
Kushner and Dupuis [6]. PP.62・65を参照。
9
上付の添字
Tは行列の転置をあらわし.
trはトレース
(trace)である.
( 309 )
‑18‑
2.4. 1
次元の
Bang‑B釦 g制御
1 .
6節のモデルに戻って.上の一般的な定式化をそのモデルに再度当てはめてみ よう。次のように対応していることがわかる。
l次元で
Bellman方程式(1
7)を かきなおすと,
sup I九
( x ) b (い
)+:σ2(机 z(x)‑rV(x)
+k(x
, u) I =0 , xε G
O( 1 9 )
ueu L .c. J
となる。1.
6節のモデルでは.制御は
u=hとかかれていた。そして.
U
= [0, H] , b ( x , h )
=αx ( 1 ‑x ) ‑hx , k(x , h )
=( p x ‑c ) h
となり.社会的余剰を最大にする制御は II=Hあるいは II=
0であった。これは(1
9)のカギ指弧[ ]の中が. h の
1次式であり,その係数部分(スウィッチング関数) p ( x ‑c) ‑xV
xがプラスであるか.マイナスであるかによって,最大値が領域 Uの右 端か左端になるからである(図
3参照)。このように制御が拡散項に影響せず, ド
リフト項にのみ
l次式であらわれるときは.
Bang‑Bang制御となる。
さらに. 1 .
6節のモデルについて,上で定義したターゲット集合の内部
GOと境 界条件がどうなるのかをみてみよう。 ( 1 9 ) は. ( 9 ) に対応している。 Vx が
xの連 続関数であると仮定すれば.集合
Slは開集合だから.
Sl=
GO= (xへ∞)である.
また.
θG ={ x * } となる(図
4参照)。ただし.
g( x * ) がどうなるか,すなわち.
V( x * ) がどうなるかは.ここで決定することはできないことに注意しなければなら ない。点 f は,微分方程式
(8)の右側の境界に相当するもので,境界を共有する これら二つの微分方程式の解が
x*で一致すること
(value‑matchingcondition)および両方の解の接続が
x*で滑らかになされること
(sm∞ 血
pastingcondition)を要求するのが,常套的な解法である。
とはいえ,このような方法で
fを求めることができるのは.解
V( x ) の形があら
(310 )再生可能資源の動学的最適管男:経路積分の近似による解法 ‑19ー かじめ予測できるときである。そのような場合.まず係数を未定としたままでV
( X )
の関数型を一般的にかく。次に.臨界点において.上記2条件が満たされるよう に未定係数を決定する。一方,関数型が定めることが困難な場合や数値的に解く しかない場合は.この手法でV(x)
をもとめることはできない。いずれにせよ.通 常の境界値問題と異なり .dGが実際どのレベルになるのかが.事前には知られて いないため.そのときの臨界値もあらかじめ決定することはできない。これが収 穫最適停止問題の重要な特徴である。そして.それはまさに金融市場におけるア メリカンオプションの特徴に他ならない。2.5.アメリカンオプションとしてみた収穫停止問題
数値的なアプローチで.V
( X )
をストック水準 xの関数として図示することが.ここからの課題である。前節で言及したように 金融市場におけるアメリカンオ プションの評価問題は.収穫停止問題と本質に於いて同ーの問題を扱っている。
異なるのは.議論の文脈だけである。したがって.前者を解くために利用できる 数値的手法が後者にもそのまま適用できる。ただし われわれがもちいるやり方は,
これまでのものとは異なり.Feynman‑Kacによる経路積分を数値的に近似する 手法である。
最初に厳密解が知られているアメリカンオプション評価問題をもちいて.この 手法を例証する。例としてもちいるのは,永久アメリカンプット (perpetual American put)である。これは権利行使の時間的な限度がなく,いつでも権利行 使が可能なプットオプションである。権利行使価格を
K .
資産価格をX(O)=xとす れば,そのときの利得関数は max(K‑x.O)である。このオプション価値をV=V(t.
x )
とおく。再生可能資源の収穫問題では.資源ストックのレベルの変動がシステムの基礎 的な状態変数であった。金融オプションでは資産価格の変動がそれに対応する。
( 3 1 1 )
‑20ー
例を単純にするために.価格は幾何ブラウン運動にしたがうと仮定しよう:非確 率的な定数μ> 0
,
0>0に対して.dX =μXdt+σX d W
,
X(O) = x. (20)このとき無裁定原理(危険中立評価)から,このオフション価値 Vは Black司 Scholesの基本方程式
av 1 "。θ2V av
一一+ー
θt . 2‑ ‑θσ"l.x"l.一 一
xー
2+rx・一一一
θz rV= 0 (21)を満足しなければならない。すなわち.現在の資産価格の状態に関わりなく.無 裁定市場では常に Vと max(K‑x,O)である。 V >max(K‑x, 0)となるときは.
(21)が成り立つヘ
永久プットオプションの解は時間に依存しない定常解である。すなわち, (21) においてθV/θ1=0.そこでV=V(x)と置き直して 定常解を考えると,次のよう になる。,>0を安全資産の利子率,g(x) = max(K‑x, 0)とし,
G = {xl V(x)
三
g(x)} と定める。さらに微分作用素ι。をとおく。このとき.
乙n‑1‑22θ2
, 、 一 一
(1‑X一 一 一
・+rrxθx‑̲‑v 2 ‑ θx2・『θz
( W
川州刊……
(ω 仲 山 …
Z吋
x← 山 山
=c哨) = 円 同
ι白0V(x) = g(x) i汀
fxεθG
(22)
(23)
である。 V(X)を求めることはもちろんだが,集合 G の境界 θGを定める資産価格
10
この例は,
Wilmott [15]による。解の導出法そのほかについても.同書の
9章を参 照せよ。
( 312 )