最適制御理論について--経済・地域・都市計画の基礎理論として---香川大学学術情報リポジトリ

(1)

最適制御理論について1）

一経済・地域・都市計画の基礎理論として−

井原健雄 Ⅰ．ほじめにⅠⅠ段通制御問題の振起と定式化による分塀ⅠⅠⅠ，タイプ 1の問題匿．対する最大原理ⅠⅤ．タイプ1の問題の応用 Ⅴ．タイプ2の問題忙対する最大原理 ⅤⅠ．タイプ2の問題の応用 ⅤⅠⅠ．タイプ3の問題に対する段大原理 ⅤⅠⅠⅠ．タイプ3の問題の応用ⅠⅩ結びに代えて ⅤⅠⅠ この章では，タイプ3の問題に対する最大原理が考察される。まず最初に，われわれの最適制御問題の分類にもとづき，タイプ3の問題の紹介とその定式化が与えられる。ついで，状態制約の導入によって惹起される境界上の最適トラジェクトリ・一に／ついて検討が加えられ，さらに，3っの法線ベクトルの関係が明らかにされる。以上の検討結果にもとづき，限定された許容制御の最大原理と跳躍条件の具体的内容がそれぞれ明らかにされ，そして，最後に，それらを包括したタイプ3の問題に．対する最大原理が導出される。 §1一・問題の定式化これまでにとりあげてきたシステムにおける許容制御〟は，状態変数ズとほまったく独立に与えられている−すなわち，W∈こ仁一か，あるいはまた，状態変数ズとある関係をもって与えられている−すなわち，祝（f）∈Ⅴ（ズ（り， 1）本稿は，見出しに．記した目次のうち，ⅤⅠⅠ．タイプ8の問題に．対する最大原理，ⅤⅠⅠⅠ．タイプ3の問題の応用，およびⅠⅩ．．結び軋代えて，について言及したものである。なお，ⅠからⅠⅤまでの部分は，香川大学経済学部研究年報15（1975）に，また，ⅤからⅤⅠまでの部分は，香川大学経済学部研究年報16（1976）に．，それぞれ分けて所収されている。また，谷川玲子さんには，椿事の労を煩わした。ここに記して，謝意を衆明したい。

(2)

香川大学経済学部研究年報19 Jβ7ター 42 − ￡）・一場合に．限定されていたが2），状態変数∬自体については，なんの制約も与えられてはいなかった。しかし，問題によってはりそのシステ∴ムの状態を，状態空間のある領域内に∴限定しておいた方がふさわしい場合もある。たとえば，異なる2地点間に介在するある領域（たとえば，沼地）を迂回して最短距離で結ぶ径路を決定する問題とか，あるいはまた，ある都市の住宅政策を立案する際に，その都市の総面積を上廻る住宅を建設することができないといった条件をあらかじめ規定しておくことなどが，その例にあたる。そこで，本章でほ，システムの状態ズ（f）が，つねに状態空間のある与えられた閉領域（Closed region） lγ⊂居れ _（7．1）内に．限定されている場合の最適制御問題8）について考察することに．しよう。換言すれば，初期多様体β0を起点として−，最終多様体β1を終点とするすべての径路pのうち，叙上の閉領域lγのなかに．完全に含まれている径路のみを考察の対象とするのである。したがって，許容径路上の任意の状態点∬（豪），（f。≦ ≠≦fl）は，つねにつぎの条件をみたすことに．なる。ズ（舌）∈l坑∀￡∈【fo，り（7．2）また，この状態領域Ⅳを，簡単化のため，次式に．よって規定することにしよう。 1γ仝（∬lダ（ざ）≦0）（7．3）ただし， ♂（ズ）ほ，g（ズ）＝0の近傍で連続な2階偏導関数をもち，その勾配ベクトル Fg（ズ）＝（紬（ズ）／∂∬1，∂g（g）／∂∬ゎ…，∂g（ズ）／紬％）ほ，g（∬）＝0をみたす任意の点において，ゼロ・ベクトルにはならないものとする。このとき，ダ（ズ）＝0 （7．4）をみたす状態点ズの集合ほ，（7・3）に・よって，状態領域Ⅳの境界（Boundary）を定義することになる。そこで，この状態領域Ⅵ′の境界を∂Ⅳに．よって表わ 2）前者の場合を「タイプ1の問題」とよび，また，後者の場合を「タイプ2の問題」とよんでいたことを想起せよ。（2」・31）および（232），参照。 3）これは「タイプ3の問題」とよばれる。（2．33），参照。

(3)

最適制御理論に．ついて 1−4β − すこ．とにしよう。図64は，かかる状態制約1γを伴なった状態空間（月舘）内における1つの径路pを例示したものである。 Ⅹ0 図64．状態制約のある状態空間（En）内の経路p すでに，われわれほ，−・般的な状態空間としてニ他次元のユ・・−クリッド空間（β穐）を想定し，さらに，その空間内における状態の推移過程を評価するべく評価基準を導入した。そして，この両者を分離することなく同時に考慮することによって，その相互関連を明らかに・するため，≠次元の状態空間をさらに1 次元拡張し，その拡張された（れ・十1）次元空間内に形成されるトラジェ．クトリ −・に．注目した4〉。したがって，ここでもまた，（7・3）によって規定される状態領域Ⅳを，（％＋1）次元のユ・1−・クリッド空間（βれ十1）内に・おいて検討することにしよう。すなわち，いま，1つの変数（これをガ0とする）を測る方向として，新たに1 次元空間（ガ1）をとり，これと％次元の状態空間（βりとの直積集合を考えれば，点ズ＝（ガ。，ズ）＝（∬○，ガl，・・・，ガれ）の集合は，（彿＋1）次元のユ・・−クリッド空間（ガ症1）に拡張される。このとき，もとのシステムの状態ズは，拡張された状態点ズ＝（ガ0，ズ）の状態空間（ガ花）への射影となっている。また，（7．3）における関数g（ズ）には，新しい変数∬0が明示的に含まれて 4）ⅠⅠ章，第2節の（29），参照ム

(4)

香川大学経済学部研究年報19 ヱタ7∂ ー 44 −・・ほいない結果，ズを（≠＋1）次元のベクトルとするとき，〟（考）は， g（ズ）≡g（ズ）（7・5）として表わされる。したがって，（彿＋1）次元のユ・・−クリッド空間（ガ机1）内に形成される，霊。に平行な軸をもつ拡張された状態制約の領域をGで表わすことにすれば，このGは，つぎのように定義される。 G仝（ズIg（ズ）≦0）（7・6）いうまでもなく，ガ花への射影が許容径路になっているすべてのトラジごクトリ−を許容トラジェクトリ・−・とよぶことに．すれば，許容トラジェクトリ・一は，すべて（7．6）に．よって定義される領域G内に含まれることになる。すなわち，許容トラジ宣．クトリー・上の点ズ（りは，ズ（￡）∈G，∀￡∈【と0，り（7・7：）をつねにみたすものとなっている。図65ほ，拡張された状態空間（屈か1）内における許容径路pとそのトラジェクトリ−・rを例示したものである。図85拡張された状態空間（En＋1）内の許容経路pとトラジェクトリ1−r とくにいま，最適トラジェクトリ・−・のうち，（7・6）によって定義される領域 Gの境界∂Gに含まれている部分についてのみ考察を限定することにしよう。

(5)

最適制御理論について・−4J− このとき，境界∂Gは，図65より明らかなように．，ガ。軸と平行な軸をもったなめらかな円柱面（Cylindricalsurface）で， g（．方）＝0 （7．8）に．よって定義され，また，

Fダ（ズ）仝（忍，各…・，怠）＝（0，各…，老）

（7・9）は，境界∂Gのいかなる点においてもゼロ・べクレレにはならないものとする。つぎに，制御〝が状態変数ズとほ独立に与えられている，いわゆるタイプ 1の問題での制御制約を合わせ考えることにすれほ，われわれの制御制約ほ，つぎのように示される。 w∈打（7．10）ただし，打仝（叫如（〟）≦0，（α＝1，2，…，∼）〉（7・11）を表わすものとし，≠α（捉），および∂れ肋妬（α＝1，2，…・，∼；た＝1，2，…，仇）ほ，Ⅳの境界∂打の近傍で定義され，連続であるものとする。かくして，われわれの解明すべきタイプ3の最適制御問題ほ．，つぎのように定式化される。タイプ3の問題（狭義の場合）さ）つぎの評価基準

†：ニム（ズ（￡），祝（￡））d亡

（7．12）を，以下の制約に従って最小にする制御祝（￡），（￡0≦￡≦￡1）を求めよ。（i）状態方程式史＝爪牙，W）（ii）初期条件ズ（亡。）∈β0（≠0） G揖終端条件ズ（￡1）∈が（と1）（7．13）（7．14）（7．15）、 5）後・で，状態変数ズに依存する制御制約のある問題をとりあげるので，それと区別するため，この問題に対して（狭義の場合）という注釈をつけておくことにする。

(6)

J97夕香川大学経済学部研究年報19 ・−−4β− 裾制御制約祝∈打仝（叫如（〟）≦0，（α＝1，2，‥…，ヱ）〉（Ⅴ）状態制約ズ（￡）∈lγ仝（ズ桓（ズ）≦0），∀￡∈【￡0，りただし，ズ∈ガ殉，祝∈β仇，β0⊂ガの，β1⊂丘㍗，￡0，孟1は，所与，または未知とする。この場合，われわれは，以下に示す5つの仮定を設けることにする。（仮定1）ム（∬，≠），鱗（ズ，祝）／蝕ゎ雛（ズ，W）／∂≠ゎ（宜＝0，1，…・，％；∫＝1，2，…‖，れ；た＝1，2，…・，彿）

ほっそれぞれⅣ×打内で定義され，かつ達統である。ただし，Ⅳ，および

打は，町および打を含むある開集合を表わすものとする。（仮定2）最適制御〟＊（￡），（￡0≦≠≦fl）ほ，（㈲，および（Ⅴ）をみたす）許容制御のなかから選ばれるものとする。（仮定3） β0，およびがは，それぞれ適当な次元をもった，なめらかな多様体である。（仮定4）九（従），∂ん（祝）／∂祝わ（α＝1，2，…，∼；ん＝1，2，…‖，仇）は，Uの境界∂打の近傍で定義され，連続である。（仮定5） g（ズ）ほ，g（ズ）＝0の近傍で連続な2次偏導関数をもち，その勾配ベクトルFg（ズ）＝（∂g（ズ）／紬1，∂g（ズ）／∂ガ2，…，∂g（ズ）／弛れ）は，g（ズ）＝0をみたす任意の点において，ゼロ・ベクトルにはならないものとする。これらの仮定により，叔上の問題をすでに導出した定理を用いた解明することが可能となる。以下，この点を逐次明らかにしていこう。 §2．境界上の最適トラジェクトリーすでに，われわれは，最適制御理論についての基礎的理解を深めている。すなわち，まず，最大原理の導出にとって重要を意味をもつ限界面∑の定義を

(7)

最適制御理論について −−47−

与え，一また，その性質を【定理1】として記述した8）。つぎに，その限界面∑の正

則な内点に注目して，最適トラジェクトリ・−・r＊上の点ズ＊（￡）がみたすべき性

質を【定理2】として要約し7），さらに，限界面∑に対する接平面アユ（且サ（￡））

の移動をトラジェクトリー・方程式に対応する変分方程式笹よって規定し，ま

た，その按平面アユ（ズ＊（亡））に垂直な法線ベクトル彿（ズ＊（孟））の移動をその変

分方程式に対応する随伴方程式によって規定すること8）により，タイプ1の最

適制御問題に対する最大原理を，結局，【定理3】として導出したわけである9）。

その際，とくに盈要な点は，最適トラジェクトリ・−上の点g＊（りが限界面

∑の正則な内点であるものと仮定して，その点属サ（の，およびその点の近傍

∠（ズ＊（￡））の変換を最適制御祝＊（￡′）に・よって試みている，ということにあっ

た。その結果，もとのトラジェクトリ・−方程式に対応する変分方程式によって

線形変換された新しい按平面，すなわち，

アユ（題号（￡′））＝A（￡′，のアユ（ズ等（の）（7・18）

が，最適制御祝＊（￡′）によって変換された限界面∑上の点ズ＊（￡′）およびその

近傍d（ズ坤（￡′））の同じ接平面になっている，すなわち，

r。（ズ＊（f′））＝アユ（ヱサ（≠′））（7・19）

の関係が成立するという，重要な性質が導かれた10）。図66は，この関係を示

したものである11）。

したがって，われわれは，最適トラジェクトリt−・r＊上のすべての点が（7・6）

で定義される状態制約の領域Gの内部に食まれている場合にのみ，【定理3】を

適用することができる点に注意すべきである。これを言い換えるならば，もし

も最適トラジェクトリ−・r＊のある部分が，図65に示されるように，領域G

の境界∂G上にある場合には，与えられた問題に対して【定理3】を直接適用す

ることは許されず，それを修正する必要が生ずるのである。

なぜなら，まず第1に，境界∂G上にある最適トラジェクトリ・→r＊の部分

6）HI章，第宰節，参照。 7）（S小42），参照。 8）ⅠⅠⅠ章，第3節，参照。 9）ⅠⅠⅠ章，第5節，参照。 10）ⅠⅠⅠ章，第4節の（3い83）および〔補助定理6〕，参照。 11）これは，図30と同じものである。

(8)

一J∂・− _{香川大学経済学部研究年報19} _ヱ97β ∑ T∑（X＊（t）） ∑ T∑（X＊（t′））図68．点ズ＊（￡），その近傍∠（ズ＊（￡））および接平面アユ（ズ＊（り）の変換に∴ついてほ，限界面∑が領域Gの外部にある点に対しては定義されないことから，点ズ＊（舌）が限界面∑の正則な内点ではないこ．とになり，第2に，近傍 ∠（ズ＊（の）の移動が状態制約（7・6）をみたす許容制御（7．10）によって一行わなければならないからである。そこで，境界∂G上にあるr＊の部分に対して−，叔上の【定理．3】がどのように修正されるかを，つぎに考察することにしよう。まず，最適制御祝＊（りおよび解Ⅹ＊（り，（舌0≦壬≦亡1）に対応する最適トラジェクトリー・r＊を想定しよう。さらに，≠0≦￠8＜≠‘≦￡1に対して，ズ＊（￡）∈∂G，∀￡∈【舌e，ち】（7．20）をみたすものとする。このとき，最適トラジェクトリ・−r＊上の点ズ＊（f8），およびX＊（tl）を，境界に入る点（Enteringpoint）および境界から出る点（Leavingpoint）とそれぞれ卓二ぶことにしよう。図67は，この最適トラジェクトリ・−・r＊を，拡張された（耽＋1）次元の状腰空間内における限界面∑上において例示したものである。つぎに，状態制約を鹿定する（7・6）の関数g（孝）の勾配ベクトルFg（ズ）12）と，（7・12）の被積分関数ム（ズ（￡），祝（り）および状態方程式（7・13）の右辺の関数′（ざ，祝）用）との内環をア（．ち牒）によって表わせば，このスカラ・一関数 12）／（7．9）に．対応する。 13）すなわち，カ（ズ，祝），（宜＝1，2，い・l，れ）を意味するものである。

(9)

・−4クー最適制御理論について図67．拡張された状態空間（E刷）内め最適トラジユタトリ・−・r＊

P（ズ，α）ほ，次式によって定義される14〉。

ク（ろ祝）仝Fg（ズ）・′（g，祝）

（7・21）

このとき，勾配ベクトルFg（孝）は，状態制約の境界∂馴こ垂直な方向ベク

トルを表わし15），また′（考祝）ほ，（7・13）の状態方程式に・よって，拡張された

状態空間内のトラジェクトリ1−・の方向を表わすことから，境界∂G上にある√＊

の部分−すなわち，（7．20）をみたす点ズ嘗（￡）一についてほ，つぎの関係が

成立することになる。 P（エア（￡），祝＊（￡））＝0，∀f∈【fe，￡￡1 いま，ある時刻￡′∈［￡e，舌エ】においてズ＊（舌′）∈∂G および祝＊（￡′）∈∂ひ16）がともに成立しているものと仮定しよう。すなわち，その時刻ま′において（7．公） g（ズ＊（孟′））＝0 および 14）′仝（ム，′）＝（ふム，…，．ん）である点に注意せよ。 15）図31，参照。 16）（7．11），参照。

(10)

香川大学経済学部研究年報19 ■−∂り−・ヱβ79 （7．26）丸（従＊（￡′））＝0，（α＝1，2，…，り17）がともにみたされているものとする。そのとき，つぎのベクトル関数

F％ア（鋤）仝（貰，芸，…，芸）

および

F％拍）仝（畿，各…，畿）

（7．㌘）（7．28）（α＝1，2，…，ヱ′）から求められる，つぎの（∼′＋1）個のベクトルーF祝P（考ル），F祝直（祝），…， F鮎≠古′（γ）−が，ズ＝ズ＊（￡′）および朋美＝別＊（￡′）に．おいて1次独立．であるとき，この点（戌誉，u＊）ほ正則点（Regular point）と定義される18）。以下，（彿＋1）次元のユ・・−・クリッド空間内において，芽＊（￡）＝ズ∈∂Gの近傍〉〟が存在し，・その近傍ノダと最適トラジユタトリ−r＊が乗っている限界面 ∑との共有点−すなわち，レグ∩∑をみたす点−が，すべて限界面∑の正則点である場合にかぎって，すでに導出した【定理3】がどのように修正される T∑（ズ（t）） ∂G 囲88．境界∂G上の点ズ（￡）における限界面∑の按平面アユ（g（￡）） 17）ただし，∼′≦ほあり，α＝∼′＋1，∼′＋・2，…，∼のとき，声（祉＊（亡′））＜0が成立することを意味する。（5り86），（5．87），および（5‖88），参照。 18）ただし，爪‘P（ズ，祉）キ0である。

(11)

・−∂J−− 最適制御理論について

ベきかを検討することにしよう。いうまでもなく，この場合には，図68からも

明らかなように，すべての点ズ∈J〆∩∑に対して接平面アユ（耳）が定義可能

となり，また，アユ（ざ）は，g∈∂Gn∑に周しても定義可能となっている。

そこで，まず，境界∂Gに入る点j？（￡。）の近傍d（ズ＊（舌￠））の移動を考える

（Admissible control）でなければな（7．29）（7．30）（7．31）ということである。とき，そのもとになる制御が許容制御らない点に注意しよう。すなわち，制御祝（り∈坊 ∀舌∈【fe，￡￡】に対応するトラジェ．クトリ・−・方程式19）慮＝′（考祝）の解g（豪）がi許容トラジェ．クトリーズ（り∈G，∀￡∈【舌。，fI】を形成するものでなければならない20），したがって，（7．凱）の示す許容トラジェクトリ・−であるべき条件を保証するため，つぎの条件を付加することに・しよう。 P（ズ（り，祝（￡））＝0，∀≠∈【f￠，り（7・32）なぜなら，まず，（7．21）に．よって与えられたスカラー・関数ア（考祝）の定義に．より，如（ズ（豪））＝Fg（g）・′（考祝）＝タ（g（￡），祝（￡））（7・33） d舌となり，さらに（7．32）の追加条件式の成立を仮定すれは， g（ズ（の）＝定数，∀f∈【f￠，≠‘】（7・34）となる。また，境界∂Gに入る点ズ坤（≠。）の近傍∠（g＊（fe））は限界面∑に含まれており，その限界面∑は状態制約の領域Gに・含まれていることから， ∠（ズ準（f￠））⊂∑⊂G （7・35）となり，したがって，（7・6）より g（g（舌￠））≦0 （7・36）となる。かくして，（7．34）と（7。36）とを同時に考慮すれば，さきの条件（7・31）を導くことができ，その結果，先述したとおり，（7・32）の条件を付加すること 19）ただし，′（考従）＝（ふ（ざ，祝），∫1（才，従），・り，ム（g，祝））である点に注意せよ。 20）すなわち，（7−6）に．よって定義される領域Gに食まれるということである。

(12)

香川大学経済学部研究年報19 J夕7夕・−52− によって，許容トラジェクトリ・−・の形成が保証されることになるのである。したがって，境界∂Gに入る点ズ＊（舌￠）の近傍∠（ズ＊（舌8））の移動を可能にする許容制御は，（7．11）と（7．32）の条件をと．もにみたす限定された制御変数の集

合（Res七ricted controIset）−これをE2で表わすことにする・rに属する

ものでなければならない。とくに．この場合，限定された制御変数の集合Qほ，明らかに打の部分集合となっており，しかもこのE2が，状態に依存する制御集合（State−dependent COntrOIset）となっている点に．注意する必要がある。なぜなら，この性質ほ，すでにわれわれがタイプ2の問題として検討した内容と棋似しており，したがって−，また，その理論的帰結を当該問題に対して適用することが可能となるからである。そこで，タイプ2の問題を解明した主要な論点を想起してみよう。この場合，制御祝（りに対する拘束が状態ズに関係していた結果，最適点ズ＊（f）の近傍∠（ズ＊（り）を最適制御祝＊（り∈乙ベガ（￡））に・よって移動させることがつねにできるという保証はなかったのである。換言すれば，g（孟）≒見ゃ（舌）に対しては，祝＊（￡）∈と尺ズ（舌））が許容制御であるか否かが不明であったのである。したがって，最適点ズ＊（りの近傍∠（j？（舌））が，つねに許容制御に・よって変換されるように．，その制御を変更する必要が生じたわけである。ただし，そこでいう許容制御とは，制御〝（孟）が制御空間の固定された部分集合打に含まれるというのではなく，制御祝（ゎが状態ズに依存する所与の部分集合こぺズ（￡））に含まれることを意味するものであった21）。そこで，いま，あらためて，制御祝（￡），（舌0≦≠≦￡1）が， w（￡）∈ぴ（ズ（￡）），∀￡∈【f。，り（7・37）をみたすとき，その制御u（t）を許容制御（Admissible control）とよぶことにしよう。ただし，ズ（￡）ほ．祝＝祝（≠），（￡0≦f≦ら）に対するトラジェクトリ・一方程式 21）しかし，われわれの取り扱ったタイプ2の問題が非フトーり■マス系であったために，（5∩5）に．おけるUは，ズ（￡）のほかに」も独立変数として含んでいたが，非オ■・− トノマス系をオ・−トノマス系に変換することが可儲である結果，その差異に重要な意味があるわけではない。

(13)

一占∂− （7．38）（7．39）（7．40）最適制御理論について鬼＝′（孝ル）の解であり，集合打（ズ（舌））22）は， P（考w）＝0 およびん（祝）≦0，（α＝1，2，‥l・，￡）によって定義されるものとする28）。つぎに，最適制御祉＊（舌）と，これに対応する状態脛（￡）が，（7・40）に・よって示される∼個の制約式のうち，ヱ′個で等号が成立しているものと想定しよう。すなわち，もしも必要ならはその順序を入れ替えることによって，次式が成立しているものと考えてみよう。巌（祝＊（り）＝0，（α＝1，2，…，∼′）（7・41）巌（γ＊（吉））＜0，（α＝￡′＋1，ヱ′＋2，…，∼）（7・42）また，実際に拘束のきいている制約式の数（すなわち，∼′＋・1）は，制御変数の数（すなわち，肌）を上廻ることはなく，したがって，（7．43）ヱ／＋1≦竹もとし，つぎの行列関数 ∂P ∂P ∂％1 ∂％2

姓坐L

∂≠1 ∂％2 旦虹姓 ∂≠1 ∂髄2 F≠ア（斉川） F祝￠1（祝）

軌⋮監

_（7．44） F？↓≠￡・（祝）

ほ，ズ＝ズ＊（￡）および祝＝眈＊（ので最大のランクをもつものとしよう。すな

わち，点（ズ＊，W＊）が正則点であると仮定するのである。そのとき，われわれ

は，点ズ＝ズ坤（￡）の近傍』（ズ＊（舌））を移動させる許容制御祝（孟）∈Ⅳ（ズ（≠））

を，つぎのようにして求めることができるのである。まず，彿次元の制御ベク

トル祝を，つぎの2っの部分に分けて考えよう。 22）したがって，この集合び（ズ（舌））は，前述の限定された制御変数の集合倉に対応するものである。 23）（7．39）は，（7．32）に．，また，（7．40）は，（7・・16）にりそれぞれ対応する。

(14)

香川大学経済学部研究年報19 −54 − J5仁7β （7・45）（7．46）（7・47）が仝（叫，祝2，…，≠Ⅰ′．1）祝￠仝（≠㍗ヰわ祝＝わ…，祝偶）すなわち，祝＝（祝￠，保つとして表わされる24〉。そこで，この制御ベクトルなのうち祝￠ほ，（7．44）のランクが（∼′＋1）であることから，（7．39）と（7．41）を連立させて解くことにより，状態ベクトルズと残りの制御ベクトル祝αの各成分の関数として−・意的に求められる。簡単化のため，記号Rに．よって R仝（ア，直，如，…，≠乙・）を表わすものと定義すれば，さきの（7．39）と（7．41）は，月（ろ祝α，祝つ＝0 と凄くことができる。したがって，これらの記号を用いて，以上の議論をまとめれば，月（考が，ぴ‥（．ち祝つ）＝0 をみたす関数混亡＝こ声（∫，祉d）が存在する，ということである。いま，祝￠＝なα（f）を祝α（≠）＝（％＊￡′＋2（孟），γ＊叫（り，…，％＊仇（り）（7・52）とおき，時刻ちK∴Ⅹ＊（fe）の近傍∠（ズ＊（とe））に属する点を起点として，制御祝（f）＝（w￠，眈つ（7．58）によって形成されるトラジェクトリー・に注目してみよう。ただし，（7．53）の右辺の祝￠および従￠ほ，（7．51）および（7．52）に．よって，それぞれ，祝e＝こ吾（ズ（舌），従α（舌））（7．54）および祝α＝従α（￡）（7．55）で与えられるものとする。つぎに，さきのトラジェクトリ・一方程式（7．38）をこの祝＝祉（り，（≠e≦￡≦fl）に．関して積分すれば， 24）（5．122），参照。

(15)

ー55− （7．56）最適制御理論についてズ（f）＝ズ＊（り・十印（り＋0（ちe），（fe≦≠≦と‘）

となる。ただし，上武右辺ので（￡）ほ，つぎの変分方程式

＝中たC

の解であり，また，上武右辺のおよびほ，（7．57）

畿畿・⋮︰畿

畿畿⋮畿

二∴∴⋮∴㍉

（7．58）（7．59）

艶畿…・頂監

で定義され，そのそれぞれを点（ズ＊（り，祝＊（￡））において評価したものであ

る。さらに．，また，鬼eは，（エ′＋1）次元のベクトルであり，それを，

（7．60）か＝（帆，鹿e2，…・，机・．1）と表わせは，その第ん番目の成分は，㌻∂こ戸た（考 _（7．61）たe鳥仝∑ ズ＝ズ＊（￡）で′ ∂勘として与えられる。そこで，さきの（7．50）に対して，（7・56）で与えられるⅩ＝g（￡）および

（7．52）で与えられるWα＝祝α（￡）を代入すれば，つぎの関係を得る0

濃中た￠＝0

（7．62）

(16)

香川大学経済学部研究年報19 J∂7β

⋮⋮翠恵薮

（7．64） ∂点‘・＋1 ∂局￡′＋1 _{∂屈Ⅰ・．1} ∂≠1 ∂％2 ∂町．1 で定義され，そのそれぞれを点（g＊（り，祝＊（≠））において評価したものである。さらに，（7・62）をかについて解き，その結果をさきの（7．57）に代入すれば，状態制約を考慮して修正された変分方程式は，認＝［叢一叢（器）￣1濃］ヮとなり，また，その解ほ，ヤ（≠）＝A【ち舌加￠，（豪8≦藍≦と↓）（7．65）（7・66）をみたすあらたな線形変換を定義することになる25）。したがって，境界∂G上にある最適トラジェクトリ・−r＊の部分に沿ってその近傍∠（ズ＊（≠￠））を移動させる場合にほ，その近傍∠（詔（舌￠））の接平面 rJ（ズ＊（舌e））の変換をこの新しい線形変換−すなわち，（7．66）一によって行えばよいことになる。また，その接平面r。（ズ＊（舌g））に垂直な法線ベクトルの変換については，この修正された変分方程式（7・65）に対応する随伴方程式，すなまっち， 25）（7165）は，（5，．126）に対応する。

(17)

−57− 最適制御理論に・ついて￣1 昔＝−ス［甚一意（器）濃・］

の解ス（電）に従って行えばよいことになる26〉。簡単化のため，

ソ＝（肘1，1湖）仝磁（器）￣1

（7．67）（7．68）とお桝ゴ，修正された随伴方程式（7・67）は，つぎのように表わされる0 （7・69）

昔＝一桜＋償

これより明らかなように，もしも（7・39）および（7・40）によって規定される制約条件が状態ガに・依存しない場合には，上式右辺の∂月／∂ズがゼロとなる結果，（7・69）＝一（7・70）に帰着する27）。しかし，（7．69）の右辺に・ある点が，さきの（7・48）に・よって定義されたものであるかぎり，（7．63）の∂β〃ズほ，ゼロに・ほならず， ∂ア（ズ，従） ∂ア（ズ，W） ∂ア（ズ，祉） ∂ユ「。 ∂拍） ∂ガ○

aR _

−￣￣ち芳 j￠・・l＿ガ ∂∬1 ∂P（ズ，祝）旦麺と ∂打0 ∂ア（．ち祝） ∂∬1 ∂ガ0 0 0 （7．71）︰：︰ 0 ：◆︰・ 0 ︰︰・・ 0 26）（7り67）は，（5・127）に対応する。 27）すなわち，（7．70）は，（385）に対応する。

(18)

Ⅶ−5ぎー− _{香川大学経済学部研究年報19} Jタ7タとなる28〉。その結果，修正された随伴方程式（7．69）は，＝一 _{力。Fク（考〟）} _（7．72）ただし， FP（考ル）仝（ ∂ク（旦那）∂ア（．ち牒） _{∂∬0 ’ ∂ガ1，} ∂ク（耳ル））（7・73） ∂ガ乃としで与えられることになる。最後に，状態点ズサ（舌），（fe≦≠≦吏エ）が限界面∑の．正則な内点（Interior point）でほないことによって生ずる問題に言及しておこう。すでに，われわれほ，限界面∑の重要な性質として，【定理1】を導出した29）すなわち，それほ，「ある与えられた限界面∑上に初期点をもつトラジェクトリ・−が，（それが最適であっても，最適でなくてこも）その限界面∑た関するβ点を持ち得ない」ことを内容とするものであり，その意味で，この定理ほ，限界面∑のまさに限界的な性質を端的に・示すものであった。そこで，状態点ズ＊（￡）の近傍d（g＊（豪）），（￡￠≦≠≦≠‘）に属する点は，すべて限界面∑上に初期点をもつ許容トラジェクトリ一に含まれていることから，叙上の【定理1】によって，いずれもその限界面∑に・関してβ点を持ち得ないことが，まず明らかとなる。しかしながら，その状態点ズ＊（り，（fe≦舌≦舌‘）ほ，仮定により境界∂G上に属している，すなわちズ＊（舌）∈∂G，（fe≦￡≦右上）（7．74）をつねにみたしていることから，その状態点ズ＊（舌）ほ，限界面∑の正則な内点ではないaO）。したがって，近傍∠（且坤（舌））の移動を修正された変分方程式（7・65）に従って行った場合に，その変換された近傍∠（ズ＊（≠））ともとの限界面∑とが，最適制御従＊（≠）によって変換された状態点ズ＊（≠），（￡e＜￡≦f￡）において−，共通の按平面を持つとは必ずしもいえなくなるのである81）。図69は， 28）∂R／∂ズは，（∼′＋1）×（％＋1）の行列関数である点に注意せよ。 29）ⅠⅠⅠ草，第2節，参照。 30）図67，参照。 31）すなわち，ⅠⅠⅠ章，第4節の〔補助定理6一〕が正則な内点を前提としている結果，ここでは妥当しないのである。

(19)

最適制御理調に・ついて −∂クー・図69、境界∂G上の点g＊（￡）における限界面∑と近傍∠（ズ＊（≠））この状況を例示している。これを言い換えれば，境界∂Gに．入る点ズ＊（舌。）について，その近傍∠（ズ＊（￡e））と限界面∑とが，共通の按平面をもっている，すなわち， r。（ズ＊（￡e））＝アユ（Ⅹ＊（≠￠））（7・75）が成立しているとしても，すべての￡∈【￡‘，りに対して，（7・69）をみたす随伴ベクトルス（￡）が，点戊？（≠）における限界面∑の按平面アユ（ズ＊（り）に垂直である，とほ，主張し得なくなるのである。 §3．境界上の法線ベクトル本節では，境界∂G上にある最適点ズ＊（り，（fe≦￡≦f￡）に・注目して，その点ズ＊（りにおける限界面∑，その近傍』（g＊（舌）），および境界∂Gに対する接平面にそれぞれ垂直なべクトル相互の関係を明らかにしよう。なぜなら，境界 ∂G上にある最適点ズ＊（り，（舌e≦￡≦￡g）に注目するとき，変分方程式（7・65）に従って変換された近傍∠（ズ＊（り）の按平面rd（ズ＊（￡））と，限界面∑の按平面アユ（ズ等（り）とが，必ずしも等しくなるとはかぎらないからである。そこで，叔上の3つのベクトルを区別するため，つぎの記号を用いることにしよう。まず，限界面∑の正則な内点ズにおいてその按平面アユ（ズ）に垂直

(20)

香川大学経済学部研究年報19 Jタ79 ーβ0− で，領域β／∑82）に向かう単位法線ベクトルを彿（孝）とする糊。この単位．法線ベクトルがβ／∑に向かうということは，ある正数αが存在して，すべてのど（ただし，0＜ど＜α）に対して，点ズ＋∈彿（耳）がβ／∑に含・まれることを意味するものである。そこで，このベクトル彿（ズ）のガ0軸方向の成分を彿0（考）とすれば，彿0（ズ）≦0 （7・76）となる。したがって，いま，点ズ∈、〃′∩∑において，限界面∑の按平面rヱ（耳）に．垂直なべクトルーすなわち，竹（孝）一について，その第1成分− すなわち，彿0（ズ）−の絶対値が1となるように・標準化した法線ベクトルを Ⅳ（Ⅹ）に．よって表わすことに・しよう。ただし，れd（ズ）がゼロのときは，もとのベクトル彿（g）の方向を変えないかぎり，彿（ズ）のノルムを自由に変更し得るものとしよう。すなわち‥点ズ＊（≠），（fβ≦￡≦亡エ）における限界面∑の接平面アユ（ズ＊（り）に対して垂直な標準化された法線ベクトルjV（ズ＊（り）は，つぎのように定義される。れ0（X＊）キ0⇒Ⅳ（ズ＊）仝（−1，彿1（ズ＊），彿2（ズ嘗），…，れ乃（ズサ））彿0（ズ＊）＝0⇒Ⅳ（ズ＊）仝ゐれ（孝），ん＞0 （7．77）ただし，んほ，任意の定数を表わすものとする。つぎに，点ガ（舌），（￡e≦f≦舌エ）における近傍∠（ズ＊（り）の接平面rJ（ズ坤（り）に垂直な法線ベクトルは，ス（孟）によって与えられる。いうまでもなく，このス（のは，修正された随伴方程式（7・69）の解ベクトルである。とくに，それをわれわれの解明すべきタイプ3の問題抽に・即して述べれば，（7・69）の右辺の月が（7．48）によって定義されている結果，この法線ベクトルス（りは，（7．72）の解ベクトルであるといえる。また，すでに述べたように，最適トラジェクトリ・−r＊が境界∂Gに入る点ズ＊（￡e）においては，その近傍∠（ズ＊（≠￠））と限界 32）（3．、29），参照。 33）かかる正則な内点ズ＝∬＊（壬）＋・A方∈、ノダn∑と，これに対応する法線ベクトル彿（ズ）に注目すれば，法線ベクトル彿（ズ＊（f））は，llム訓rOに．よって定義される。また，彿（ズ）が単位ベクトルであるというのは，肋（ズ）l】＝1をみたすべクレレを意味するものである。 34）ただし，狭義の場合である。本草，第2節，参照。

(21)

最適制御理論について面∑とが同一の接平面を共有する，すなわち， r。（j誉（￡e））＝アズ（ズ等（￡￠）） −βユー（7．78）が成立する結果，ス（亡￠）＝jV（ズ＊（f￠））（7．79）となるように，近傍∠（Ⅹ＊（￡8））の接平面に対する法線ベクトルス（亡e）を選ぶことが許されようさ5）。さらに■また，ガ0が修正された随伴方程式（7．72）のなかには明示的に入っていないことから，ここでもまた，ん（り＝定数≦0，（舌。≦≠≦亡と）（7．80）であることが判明する8＄）。したがって，さきの（7．77）と（7．79）とを同時に考慮すれば，すべてのか≡払，りに対して，彿○（∬＊（￡e））キ0＝⇒ん（り＝−1 彿。（g＊（￡￠））＝0⇒ス。（舌）＝0 ）（7・81）の関係が成立することになる。最後に・，点g＊（りにおける境界∂Gの按平面r∂￠（ズ＊（孟））に対して垂直な法線ベクトルは，グg（詔（と））によっで与えられる。このことは，（7．9）に．よって定義された勾配ベクトルFg（孝）の幾何学的意味を想起されれば明らかである抑。以上，3つの法線ベクトルーすなわち，Ⅳ（ズ＊（￡）），ス（り，およびアg（ズ＊（舌））−相互の関係を，【補助定理7】として要約すれば，つぎのようになる。【補助定理7】 r＊を，ズ篭（舌），（舌。≦￡≦ち）によって与えられる最適トラジェクトリ1− とし，時間区間【舌。，舌と】で，境界∂Gに食まれているものとする。このとき，領域Gの内部に向かうベクトルが，同時に領域g＊の内部に向かっているならば88），ベクトルス（り，Ⅳ（ズ＊（￡）），およびFg（ズ＊（り）は，1次従属である。さらに，ベクトルス（りとFg（ズ坤（の），およびベクトルⅣ（ズ篭（り） 35）したがって，ス（f￠）についても，その第1成分の絶対値が1となるように標準化されている。 36）（8．91），参照。 37）脚注15）および図31，参照。 38）（2．4），参照。G＝がならば，この条件は自明の理となる。

(22)

香川大学経済学部研究年報19 ユタ79 …β2− とFg（ズ＊（≠））が，それぞれ1次独立であれば，すべてのか≡【舌わ孟i】に対して，次式が成立する。ス（の＝Ⅳ（ガ（￡））＋〟（亡）アg（ズ＊（f）），〝（￡）≦0 （7・82）ただし，〃（≠）は，【舌。，舌乙】で連続である。この証明は，つぎのようにしてなされ得る。まず最初に，3つの法線ベクトルス（亡），Ⅳ（ズ嘗（￡）），およびアg（脛（￡））が1次従属であることを帰諾法によって証明しよう。そこで，この主張が誤りであると仮定する。すなわち，いま，ある点二㌢＝ズ＊（￡′），（￡′∈【舌e，≠↓】）に．おいて，3つのベクトルス（孟′），Ⅳ（ズ／），およびFg（ズ′）が1次独立であると仮定しよう。そのとき，点ズ／における多様体エ（二㌢）をエ（二㌢）仝r。（ズ′）∩7’∬（ズン）nr∂￠（二㌢）（7・83）として定義すれば，点ズ／において，「つぎの条件をみたす2っのベクトルαおよびβを選ぶことが可能となる89）。 α∈rJ（ズ／）nr∫（二㌢）一ム（ズつス（￡′）・α＝Ⅳ（ズ′）・α＝0，アg（ズ′）および）（7・84） α＜。 β∈r。（二㌢）nr∂￠（ズ／）−エ（ズ′）ス（￡′）・β＝アダ（ズ′）・β＝0，Ⅳ（ズ／）・β＞〉（7・85）。ただし，（7．84），および（7．85）の右辺にあるマイナス記号（すなわち， “−〃）は，集合の意味に解すべきものとする。したがって，たとえば，rdn

T2−・Lは，TAnTEにおけるLの補集合（Complement）を意味するもので

ある。さらにまた，叙上のベクトルαおよびβの1次結合からなるベクトルを新たにでとし，これをつぎのように定義しよう。で仝￠α＋dβ ただし，￠およびdは，正数を表わすものとする。（7．86）このとき，（7．84）および（7・85）によって明らかなように，つぎの2っの不等式が成立する。 Fg（ズ／）・叩＜0 （7．87） 39）園32∼34ならびに（性質1）および（性質2），参照。

(23)

最適制御理論についてーβ♂− および Ⅳ（ズり・で＞0 （7・88）このうち，まず前者，すなわち（7．87）の不等式ほ，（7．86）によって定義されたベクトルでが，点ズ′において境界∂Gの按平面ア和に垂直な法線ベクトル Fg（ズ′）から少なくとも900以上開いていることを意味している40）。換言すれば，ベクトル等は，領域Gの内部に向かっており，したがって，また，それは，補助定理の仮定により，領域月＊の内部に向かっていることになる。つぎに後者，すなわち（7．88）の不等式ほ，ベクトルでが，点二㌢において領域β／∑ に向かっていることを意味している。これを言い換えれば，ある正数∂が存在して，0＜■￡≦∂をみたすすべての￡に対して，点ズ′＋叩が領域β／∑に属しているということである。しかしながら，（7．84）および（7．85）によって，ベクトル符は，r。（ズつに含まれている結果，二㌢＋叩は，乱（ズ／）の点であることになる。したがって，孔（ズ／）および丘【＊に含まれるすべての点二㌢＋叩ほ，￡＞0が十分に小さいかぎり，』（Ⅹ′）に含まれる点二㌢＋叩＋0（g）に対応することが判明する41〉。したがって，．点ズ／十叩がβ／∑に属しているということほ，十分小さいざ＞0に対して，点ズ′＋叩＋0（ど）が，∠（ズ′）およびβ／∑に属することを意味するものである。しかし，このことほ，「点ズ／の近傍』（ズ7）が，限界面∑に関してβ点を持ち得ない」という前節の結果42）と矛盾することになる。これによって，【補助定理て】の前半が証明されたわけである。す‥なわち，われわれほ，すべての時刻￡∈【f。，舌‘】において， elス（り＋￠2Ⅳ（ズ＊（り）＋￠るFg（題号（￡））＝0 （7・89）をみたす，すべてがゼロではない数￠ゎ（せ＝1，2，3）が存在する，と主張することができるのである。つぎに，すべての時刻￡∈【fβ，りに対して，（7・82）の関係が成立することを明らかにしよう。そのために，すでに導出した（7・80）および（7・81）の関係に注目して，ベクトルス（りの第1成分−すなわち，ス0（￡）−の値が，−1と 40）（3．39）および図24，参照。 41）このことは，変分方程式（7・65）によって定義される線形変換の性質に・より証明される。 42）本章，第2節，参照。

(24)

−β4 − _{香川大学経済学部研究年報19} Jタ7β なる場合と，ゼロとなる場合の2っに分けて，それぞれ検討を加えることにする。まず，【jo（り＝Tl】の場合をとりあげよう。いま，もしも％0（見場（舌））＝0 （7．90）とすれば，（7・77）の後半の関係より，ベクトルⅣ（ズ＊（￡））の最初の成分− すなわち，端（ヱ等（の）−の億はゼロとなる。すなわち，端（ズ＊（≠））＝0 （7．91）を得る。このとき，ベクトルFg（見場（￡））の最初の成分もゼロである結果48），（7・89）に含まれている3っのベクトル，ス（舌），Ⅳ（ヱア（￡）），およびFg（ズ＊（り）の最初の成分に注目するかぎり，ス（りの係数射もゼロでなければならなくなる0 しかしこのことは，Ⅳ（ズ＊（り）とF♂（ズ＊（り）が共線ベクトルであり？したがって，1次従嵐であることを意味するから，【補助定理7】の仮定と矛盾する。その結果，（7・90）の仮定が否定され，れ0（戌㌍（舌））≒0 （7．92）でなければならないことが判明する。したがって，また，（7．77）の前半の関係より，端（j誉（￡））＝−1 （7．93）であることを得る。さらに，この結果を，さきの（7．89）に代入して，ふたたび3つのベクトルの最初の成分に注目すれば， el＝・−￠2 （7．94）であることが明らかとなる。また，（7■89）において，戸甘（ズ＊（￡））ほ，われわれの仮定に・よりゼロ・ベクトルではないことから44），結局， el＝−e2キ0 であることを得る。したがって，〟（f）を〝（り＝一によって与えれば，ス（￡）＝一号Ⅳ（脛（り）一号朋（脛（り）（7．95）（7．96） 43）（7．5），参照。 44）本章，第1節の（仮定5），参照。

(25)

最適制御理論について・−β∂− ＝Ⅳ（ヱア（f））＋〝（￡）アダ（ズ嘗（り）（7・97）となり，（7．82）の関係式が成立することに．なる。また，〟（￡）の連続性ほ，3 つのベクトル，ス（り，Ⅳ（ズ＊（り），および即応㌢（り）の時間区間【亡e，りにおける連続性から直接導出される。つぎに，［ん（≠）＝Oiの場合を検討しよう。この場合にほ，（7・89）および（7．77）によって dlj（≠）＋d2彿（ズ＊（￡））十d8グg（ズ＊（￡））＝0 （7・98）をみたす，すべてがゼロではない数dゎ（宣＝1，2，3）が存在す−ることになる。そこで，この（7．98）に．含まれている3つのベクトル，ス（り，彿（ズ＊（り），および Fg（ズ＊（￡））の最初の成分に・注目すれば，

d2＝0

（7．99）またほ．，彿0（ズ＊（り）＝0 （7．100）が成立しなければならなくなる。しかし，もしも，この前者−すなわち，（7．99）−が成立しているものと考えれば，これは，ベクトルス（￡）とFg（ズ＊（f））が1次従属であることを意味する結果，【補助定理7】の仮定と矛盾することになる。したがって，この場合にほ， d2キ0 （7．101）でなければならず，その結果，後者−すなわち，（7．100）−の関係がつねに成立することが判明する。また，このことは，（7・77）の後半の関係より， Ⅳ（戊サ（￡））＝ん％（且等（≠）），ゐ＞0 （7．102）が成立することを意味するものである。さらに，［補助定理7】の仮定により，ベクトルⅣ（ズ＊（り）−したがって，彿（ズ＊（￡））−−とFg（ズ＊（り）が1次独立である結果， d．≒0 （7．103）でなければならなくなる。そこで，（7・98）の両辺を，このdlで割って変形すれば，ス（￡）＝一斑岬（￡））一貰Fg（脛（り）を得る。したがって，ゐ（りおよび〝（りを（7．104）

(26)

香川大学経済学部研究年報19 ーββ一ユタ79 d2 拍）＝・−・一石−

d

8 〝（￡）＝￣頂丁（7．105）および（7．106）によっで与えれば，（7．104）は，（7．102）を考慮することに．より．ス（り＝ゐ（の彿（ズ＊（り）＋β（舌）Fg（g＊（￡））＝一Ⅳ（戌ア（の）十〝（孟）Fg（ヱ？（り）（7．107）となり，結局，（7．82）の関係式が成立することになる。また，（7．104）の右辺の係数（−d2／dl）および（−dき／dl）−したがって−，また，ゐ（舌）および〝（り− の時間区瀾【￡e，￡￡】に・おける連続性は，3っの法線ベクトルス（≠），Ⅳ（ズ＊（￡）），およびFg（ズ＊（￡））の連続性と，ス（￡）と7g（見場（舌）），およびれ（ズ＊（り）と Fg（ズ＊（り）が1次独立であるという仮定から直接導出される。最後に，（7．82）の右辺の係数〝（孟）が非正であること，すなわち，〟（の≦0 （7．108）が成立することを明らかにしよう。そのために．，いま，点ズ＊（りの近傍∠（ズ＊（亡））に属する点属サ（の＋叩＋0（ ∈）∈∠（ズ＊（り），￡＞0 （7．109）に注目してみよう。ただし，ベクトルワほ，点ズ＊（りにおけるその近傍∠（ズ＊（孟））の接平面内のベクトル，すなわち，智∈rJ（j？（の）を表わすものとし，0（￡）は， 1iml腹立姐＝0 l→O g （7．110）（7．111）をみたすものとする。また，このベクトルワは，領域Gの内部に向かっている，すなわち，アg（J㌣（若））・甲く0 をみたすものとする。（7．112）さらにまた，【定理1】によって明らかなように．，点ズ＊（りの近傍∠（ズ＊（≠））

ほ，限界面∑に関してβ点を持ち得ないことから，（7．110）によって与え

られるベクトル甲は，限界面∑の接平面アユ（ズ＊（￡））に垂直な法線ベクトル

(27)

最適制御理論に．ついて・−β7− jV（ズ＊（≠））から，少なくとも900以上開いていなければならないことに．なる。すなわち， Ⅳ（ズ＊（f））・？≦0 （7．113）が，つねに成立しているはずである。しかし，点ズ＊（た）における近傍』（ズ＊（￡））の接平面rJ（g＊（の）に垂直な法線ベクトルは，ス（りによって−与えられることから，このベクトルス（のと（7．110）によって与えられるベクトル甲の内債をもとめれば，つねにゼロである，すなわち，ス（と）・？＝0 （7・114）が成立することになる。したがって，上武左辺のス（f）に・，（7・82）の関係式を代入すれば，ス（の・甲＝（．Ⅳ（ズ＊（￡））＋〝（￡）Fg（Ⅹ＊（≠）））・ワ＝Ⅳ（ズ＊（￡））・ワ＋〟（舌）Fg（g＊（￡））・？＝0 （7．115）となる。そして，この関係と（7・113）を同時に・考慮することによって（7・108）が導出され，その結果，【補助定理．7】のすぺてこの証明が完了したことになる。以上により，境界∂G上の3つの法線ベクトルーすなわち，Ⅳ（Ⅹ＊（の），ス（￡），および7g（ズ＊（舌））−がつねに同一・平面内に．あり，しかも任意の時刻￡∈［≠‘，まェ】に対して，（7・82）の関係をみたしていることが明らかにされた○ そこで，最後に，この関係を，図70によって例示しておこう。図70の（a）は，￡＝と8の場合−すなわち，最適トラジェクトリ鵬∴r＊が境界 ∂Gに入る点g＊（と8）一における3っの法線ベクトルの関係を示したものである。この場合，点ズ＊（￡β）の近傍∠（ズ＊（≠e））は，点ズ＊（≠￠）において限界面∑ と共通の按平面をもつことになり，したがって，また，ベクトルⅣ（g＊（≠8））とス（舌8）が一致することが示されている45）。つぎに，図70の（b）ほ，ま′＞￡8の場合48）− すなわち，境界∂G上にある最適トラジェクトリ・−r＊の部分に沿って，点ズ＊（まe）の近傍∠（ズ＊（fe））を移動させた場合一における3つの法線ベクトルの関係を示したものである。とく 45）この場合にあっても，（7‖82）の関係が成立していることはいうまでもない。 46）ただし，舌8≦舌′≦￡iをみたすものとする。

(28)

香川大学経済学部研究年報19 Jタ7ターββ− （a）￡＝feの場合（b）≠′＞￡eの場合図70．境界∂G上に．ある3つの法線ベクトルス（￡），Ⅳ（ズ＊（￡）），およびF♂（ズ＊（f））の関係に，この場合，修正された変分方程式によって変換された近傍∠（g＊（￡／））が，点，方＊（￡／），（￡′＞舌￠）においてその限界面∑と共通の接平面を持ってはいないことに注意すべきである。しかも，【定理11によって，点ズ＊（￡′）の近傍∠（ズ＊（￡′））に属する点は，すべて限界面∑に関してβ点を持ち得ないことから，3っの法線ベクトルス（￡／），Ⅳ（ズ＊（￡′）），およびFg（ズ＊（ま′））に関して（7．82）の関係が成立することが確証されるのである。 §4．限定された最大原理と跳躍条件以上の検討結果にもとづき，本節では，最適トラジェクトリ・−r＊が境界 ∂G上にある場合の最大原理の導出を試み，さらに，この最適トラジェクトリ・− r＊が境界∂Gに入る点ズ＊（￡e）および境界∂Gから出る点ズ＊（￡；）において，どのようなことが生ずるかを検討することに・しよう。まず最初に，限定された制御変数の集合Qの定義を想起してみよう。すでに述べたように，われわれほ，このQを（7・11）と（7・32）の条件が同時にみたされるものとして定義した結果，それほ，（7．11）によってのみ規定されるぴの部分集合となっている4−7）。とくに，この限定された制御変数の集合畠に属 47）すなわち，0⊂Uを意味するものである。

(29)

最適制御理論についてーβクーするすべての制御祝に対して，つぎの関係アg（Ⅹ＊（￡））・′（ズ嘗（舌），祉）＝0，∀祝∈Q （7・116）が成立することに注意しよう。その結果，前節で明らかにした【補助定理7】の（7．82）によって，（7．116）ほっつぎのように・専き換えられる。ス（の・′（ズ＊（￡），従）＝Ⅳ（ズ＊（￡））・′（g＊（の，祝），∀祝∈Q，∀は【fe，fェ】（7．117）さらに．また，点gから出発して制御祝によって形成されるトラジヱ．クトリ −・の方向′（考ル）および点∬に．おいてアユ（ズ）に垂直でしかも領域β／∑に向かう単位法線ベクトル彿（g）ほ，）グ∩∑上の点Ⅹに関して連続関数であることから，すでに．導出した【補助定理4］および【定理2］の内容は，ここで対象とする点g＊（f）∈∂Gに対しても同様に成立することになる。したがって，その前者−すなわち，【補助定理4】の内容…は，この場合 Ⅳ（ズ＊（￡））・′（Ⅹ＊（の，祝）≦0，∀祝∈打（7・118）を意味するものとなりヰ8），また，その後老−−すなわち，【定理2】の内容− は，この場合 Ⅳ（茸＊（豪））・′（Ⅹ＊（り，祝＊（￡））＝0 （7・119）を意味するものとなる49〉。その結果，（7・117）を用いて，さらにこの両者の関係を書き換えれば，結局，つぎのようになる。ス（￡）・∫（ズ＊（舌），祝）≦0，∀祝∈Q （7・120）およびス（f）・′（ズ＊（￡），γ＊（り）＝0 （7・121）しかし，限界面∑の正則な内点において成立した【補助定理41および【定理2】の内容を，この場合の結果−すなわち，（7・120）および（7・121）− と比較すれは，つぎの重要な違いのあることがわかる。 1小随伴方程式の変更【補助定理4】および［定理2】の内容をともに含む（3・89）における法線ベクトルス（￡）は，（3．85）によって規定される随伴方程式の解であるのに対して，（7．120）および（7．121）における法線ベクトルス（のは，（7・72）のよう 48）（3．37），参照。 49）（341）または（3い42），参照。

(30)

香川大学経済学部研究年報19 ー 70 岬 J97タに修正された随伴方程式の解である。 2．制御領域の限定限界面∑の正則な内点において成立した（3．89）では，制御〝が，状態変数ズとは無関係に与えられる制御領域打に含まれているのに対して，（7． 120）および（7．121）でほ，制御〟が，（7．11）と（7．32）の条件をともにみたす限定された制御変数の集合畠に．含まれている。とくに，この第2の点を考慮して，これまでの検討結果を要約するつぎの定

理を，限定された最大原理（RestrictedMaximumPrinciple）とよぶことに

しよう。【定理5】耽＊（≠），（亡0≦￡≦fl）を，タイプ3の問題50）に．おける最適制御，ズ＊（f），（舌0≦￡≦≠1）を，対応する最適トラジェクトリ・−・r＊上の点とし，さらに，すべてのは【￡e，り，（舌。≦￡e＜￡【≦￡1）においてズ＊（舌）∈∂Gをみたすものとする。このとき，つぎの条件をみたすゼロ（ベクトル）でない連続なべクトル関数ス（￡），（≠8≦孟≦￡‘）が存在する。（a）（i）ん（￡）＝定数≦0，（≠￠≦舌≦舌エ）（7．122）（ii）（ん（り，ス2（り，…り，ス花（の），（≠￠≦￡≦豪￡）は，つぎの方程式の解である51）。＝−ス ∂′（．ち祉） … （7・123） ∂ズただし， R仝（ア（ズ，祝），≠1（〟），￠2（祝），…，￠い（祝））＝（Fg（孝）・′（ろ祝），￠1（祝），≠2（祝），…，≠↓′（祝））（7・124）（器）￣1 ∼げ（考〝） y仝ス ∂祝￠を，それぞれ表わすものとする。（b）月てズ＊（舌），祝＊（≠），ス（り）＝Max月てズ＊（￡），〝，ス（舌）） u∈β 50）ただし，制御制約が（7いI6），状態制約が（7・17）に・よって与えられた狭義の問題をさしている。 51）（7．123）の特別な場合として，（7り72）を用いることもできる。また，（7．124）ほ，（7亜）に対応し，さらに，（7‖125）は，（768）に対応することに．注意せよ。

(31)

最適制御理論についてただし，

†l ．首（孝，〟，ス）仝ス・′（g，祝）＝∑ん差（ズ，祝）

t＝○ − 7J− （7・127）を表わすものとする。（c）ガ（Ⅹ＊（≠），㍑＊（f），ス（り）＝0 （7．128）この【定理5】の条件（b）および（c）ほ，（7・120）および（7・121）から直ちに．導かれる。また，条件（a）の（i）ほ，（7・81）の関係が成立する結果であり，その（ii）ほ，近傍』（ズ＊（f￠））の移動が許容制御によって行われるべく修正された随伴方程式（7小69）の結果であることに・留意すべきである。とくに，この［定理5】ほ，境界∂G上にある最適トラジヱ．クトリーr＊の部分がみたすべき必要条件を与えているということに注意する必要がある。しかし，−−・般に閉領域G内にある最適トラジ．ェクトリ・−・r＊のある部分ほ，領域 Gの境界∂G上に．あり，またそのある部分は，領域Gの内部にあると考え．られる。そこで，このような場合に一意的な最適トラジェクトリー・r＊を決めようとすれば，−・方ほ領域Gの境界上にあり，他方はその内部にあるような最適トラジェクトリーのたカきいに接合している2つの部分がみたすべき条件を吟味する必要がある。かかる兵庫をベクトル関数ス（りに関する跳躍条件（Jump COndition）とよび，最後に，この条件を吟味することに・しよう52）。まず，最適トラジェクトリ・−r＊が境界∂Gに入る点ズ＊（とβ）に注目しよう。いま，時刻≠e＞￠0とし，（≠￠・−0）に．よってぉの左極限値を表わすものとすれは，ズ＊（f￠−0）は，領域Gの内点となり58），したがって，また，われわれの仮定により，限界面∑の正則な内点となる。そこで，ス（￡￠−0）＝jV（ズ＊（才￠）），fg＞≠○ （7．129）をみたすように・随伴ベクトルス（￡8−0）を選ぶことにすれほ，（7・79）に・よって，ス（￡￠−0）＝ス（￡￠）（7．130）の関係を得る。このことは，随伴ベクトノ「ス（￡）が，境界∂Gに入る点ズ＊（￡e）において連続であることを意味するものである。 52）この点の詳細については，ボントリャ・−ギン他（関取智明訳）打殺適過程の数学的理論』，総合図書，（1967）の§36を参照せよ。 53）ズ＊（t‘−0）＝1imズ＊（￡e＋￡）を意味するものである。

(32)

香川大学経済学部研究年報19 − 72 − Jタ7タつぎに，最適トラジェ．クトリ・−r＊が境界∂Gから出る点ズ＊（￡【）に注目しよう。まえと同様に，時刻￡￡＜舌1とし，（古エ＋0）に・よ、つて￡lの右極限値を表わすものとすれば，ズ＊（い0）は，限界面∑ゐ正則な内点となっている54）。そこで，ス（f￡＋0）＝Ⅳ（ズ＊（￡‡）），ち＜￡1 （7．131）をみたすように随伴ベクトルス（亡エ＋0）を選ぶことに．すれば，すでに．導出した【補助定理7】の（7．82）によって，ス（ち＋0）＝ス（舌↓）−〃（￡Ⅰ）Fダ（ズ＊仏））（7．132）の関係を得る。このことほ，随伴ベクトルス（￡）が，境界∂Gから出る点ズ＊（￡￡）において不連続であることを意味するものである。したがって，−・般に．最適トラジェクトリ・−・r＊が境界∂Gから出る点において生ずる随伴ベクトル関数ス（￡）の不連続性は，［補助定理7］によ、つて明らかにした3っの法線ベクトルス（右），Ⅳ（ズ＊（￡）），およびFg（ヱア（≠））の関係−すなわち，（7．82）一によって明らかにされるのである。 §5．最大原理の導出前節に・おいて，われわれほ，境界∂G上にある最適トラジェクトリーr＊の部分−すなわち，g＊（≠）∈∂G，（￡￠≦￡≦￡−）−がみたすべき必要条件を，限定された最大原理とよび，その内容を，【定理5】として要約した。しかし，すでに指摘したとおり，閉領域G内にある最適トラジェクトリー・r＊は，その 1部を領域Gの内部にもつこともあり得るのである。このような問題に．対して最適トラジェクトリ・−r＊を求めようとすれば，その与えられた具体的状況をつぎの2っの場合に分けて考察する必要がある。・まず，その第1は，境界 ∂G上にある最適トラジェクトリ・−・r＊の部分−すなわち，ズ＊（の，（舌￠≦≠≦とェ） −を【定理5】によって導出することである。つぎに，その第2の課題ほ，境界∂G上からほなれている最適トラジェクトリ・−r＊の部分−すなわち，ズ嘗（舌），（≠0≦舌＜￡e，舌エ＜≠≦fl）−を導出することである。いうまでもなく，この後者の場合には，点ズ＊（￡），（孟0≦≠＜≠e，￡る＜≠≦￡1）がつねに限界面∑の正則な内点であることから，タイプ1の問題に対する最大原理．−すなわち， 54）ズ＊（￡‘十0）＝1imズ＊（￡【＋￡）を意味するものである。

(33)

最適制御理論について − 7♂− r定理3】−・またほ，タイプ2の問題に．対する最大原理−すなわち，【定理4】 −せ適用することが可能となる。しかし，このように，最適トラジェ．クトリ

ーr＊の1部が領域Gの内部にあり，また，他の1部がその境界∂G上にある

ような場合に．ほ，その両者が接合する条件を吟味することが必要となる。なぜなら，最適トラジェ．クトリく−r＊が，ある部分から他の部分へ移るところで，ベクトル関数ス（￡）が不連続になり得るからである。したがって，この跳躍条件は，点ズ＊（f）が境界上にある場合の最大原理と，点g＊（￡）が境界上からほなれている場合の最大原理を結び、つける役割をになっていることが明らかとなる。図71は，かかる状況を例示したものである。￣￣￣￣￣−￣￣￣￣￣‖￣￣￣￣／一￣￣二￣ズ■＊上土‘）r＊（t‘＜t≦tl） r＊（te≦t≦tJ r＊（t。≦tくte） Ⅹ（t。）

＼W

入（t。−−0）ニ入（t。） A（tl＋0）＝入（tLトJL（tl）Vg（X＊（tL）） − ■ l …＝ − 図71．最適トラジェクトリーr＊の区分と跳躍条件以上によって明らかなように，状態制約のある−・般的な最適制御問題に対して，まず2つの異なった最大原理−すなわち，【定理5】と，【定理3】または【定理4】のいずれか−・万一を適用し，つぎにその両名の関係を跳躍条件− すなわち，（7。130）および（7．132）一によって接合すれば，当該問題の最適トラジェクトリ・−r＊を一・患的に導出することが論理的には可能である。しかし，かかる手順を用いて実際問題を解明しようとすれば，きわめて煩雑で，しかも困難を伴なうことはいうまでもない。そこで，本節では，叙上の解明手順

(34)

香川大学経済学部研究年醜19 ーー 74 − Jタ7β を−・括し■た，より−「般的な最大原理の導出を試みることに．しよう。そのためには，修正された随伴方程式（7．72）がもつ重要な性質に．言及しておく必要がある。その性質とは（7・72）右辺のソ0が，すべての￡∈【亡8，㍍＝こ対して，【補助定理7】における（7・82）の右辺の係数〃（≠）と等しくなる，という関係である。すなわち， γ0（り＝〝（り，も≦￡≦≠￡（7．133）の関係が成立することを意味するものである。したが・つて，つぎに，この関係を検証することに．しよう。こ．こで，まず，われわれは，（7・118）および（7．119）の条件式と制御変数の集合打の定義式（7・16）によって，Ⅳ（鳶？（≠））・′（ズ＊（￡），な）が，（7．16）の制約をみたすすべての制御〟に関して，W＝祝＊（￡）のときその最大値をとる，と主張したことを想起する必要がある。ただし，この祝＊（舌）は，、（7．26）の関係をみたす制御であるものとする。そこで；かかる主張に対して周知の未定乗数法を適用すれば，つぎのように述べることができる。すなわち，孔′／∂祝を，ズ＝ズ＊（f）およびw＝祝＊（と）において評価した，つぎの行列関数皇！1、ウム ‥ バノも

一触妨

﹁．■−■﹂

∂祝1 ∂祝2 聖二L jム ∂祝1 ∂％2 ＿・吐− ∂祝＝ ⋮好（7．134）

紬 ∵畿

戸．亡． ∂髄1 ∂≠2 によって定義するとき，つぎの関係 dリ＝1 ￡I ∑みαF祝以祝＊（≠））＝Ⅳ（鞘））意をみたす，−・意のゼロでないベクトルみ＝（あ1，むゎ…，あ【・）（7．135）（7．136）が存在する，と。また，これと同じように，周知の未定乗数法を（7・120）および（7．121）に対して適用すれば，つぎの関係を得る。すなわち，