• 検索結果がありません。

最適制御理論について--経済・地域・都市計画の基礎理論として---香川大学学術情報リポジトリ

N/A
N/A
Protected

Academic year: 2021

シェア "最適制御理論について--経済・地域・都市計画の基礎理論として---香川大学学術情報リポジトリ"

Copied!
65
0
0

読み込み中.... (全文を見る)

全文

(1)

最適制御理論について1)

一経済・地域・都市計画の基礎理論として−

井 原 健 雄 Ⅰ.ほじめにⅠⅠ段通制御問題の振起と定式化による分塀ⅠⅠⅠ,タイプ 1の問題匿.対する最大原理ⅠⅤ.タイプ1の問題の応用 Ⅴ.タイプ2の 問題忙対する最大原理 ⅤⅠ.タイプ2の問題の応用 ⅤⅠⅠ.タイプ3の問 題に対する段大原理 ⅤⅠⅠⅠ.タイプ3の問題の応用ⅠⅩ結びに代えて ⅤⅠⅠ この章では,タイプ3の問題に対する最大原理が考察される。まず最初に, われわれの最適制御問題の分類にもとづき,タイプ3の問題の紹介とその定式 化が与えられる。ついで,状態制約の導入によって惹起される境界上の最適ト ラジェクトリ・一に/ついて検討が加えられ,さらに,3っの法線ベクトルの関係 が明らかにされる。以上の検討結果にもとづき,限定された許容制御の最大原 理と跳躍条件の具体的内容がそれぞれ明らかにされ,そして,最後に,それら を包括したタイプ3の問題に.対する最大原理が導出される。 §1一・問題の定式化 これまでにとりあげてきたシステムにおける許容制御〟は,状態変数ズとほ まったく独立に与えられている−すなわち,W∈こ仁一か,あるいはまた,状 態変数ズとある関係をもって与えられている−すなわち,祝(f)∈Ⅴ(ズ(り, 1)本稿は,見出しに.記した目次のうち,ⅤⅠⅠ.タイプ8の問題に.対する最大原理,ⅤⅠⅠⅠ. タイプ3の問題の応用,およびⅠⅩ..結び軋代えて,について言及したものである。な お,ⅠからⅠⅤまでの部分は,香川大学経済学部研究年報15(1975)に,また,Ⅴか らⅤⅠまでの部分は,香川大学経済学部研究年報16(1976)に.,それぞれ分けて所収 されている。また,谷川玲子さんには,椿事の労を煩わした。ここに記して,謝意を 衆明したい。

(2)

香川大学経済学部 研究年報19 Jβ7タ ー 42 − £)・一場合に.限定されていたが2),状態変数∬自体については,なんの制約も 与えられてはいなかった。しかし,問題によってはり そのシステ∴ムの状態を, 状態空間のある領域内に∴限定しておいた方がふさわしい場合もある。たとえ ば,異なる2地点間に介在するある領域(たとえば,沼地)を迂回して最短距 離で結ぶ径路を決定する問題とか,あるいはまた,ある都市の住宅政策を立案 する際に,その都市の総面積を上廻る住宅を建設することができないといった 条件をあらかじめ規定しておくことなどが,その例にあたる。 そこで,本章でほ,システムの状態ズ(f)が,つねに状態空間のある与えら れた閉領域(Closed region) lγ⊂居れ (7.1) 内に.限定されている場合の最適制御問題8)について考察することに.しよう。換 言すれば,初期多様体β0を起点として−,最終多様体β1を終点とするすべての 径路pのうち,叙上の閉領域lγのなかに.完全に含まれている径路のみを考察 の対象とするのである。したがって,許容径路上の任意の状態点∬(豪),(f。≦ ≠≦fl)は,つねにつぎの条件をみたすことに.なる。 ズ(舌)∈l坑∀£∈【fo,り (7.2) また,この状態領域Ⅳを,簡単化のため,次式に.よって規定することにし よう。 1γ仝(∬lダ(ざ)≦0) (7.3) ただし, ♂(ズ)ほ,g(ズ)=0の近傍で連続な2階偏導関数をもち,その勾配ベクト ル Fg(ズ)=(紬(ズ)/∂∬1,∂g(g)/∂∬ゎ…,∂g(ズ)/紬%)ほ,g(∬)=0をみ たす任意の点において,ゼロ・ベクトルにはならないものとする。 このとき, ダ(ズ)=0 (7.4) をみたす状態点ズの集合ほ,(7・3)に・よって,状態領域Ⅳの境界(Boundary) を定義することになる。そこで,この状態領域Ⅵ′の境界を∂Ⅳに.よって表わ 2)前者の場合を「タイプ1の問題」とよび,また,後者の場合を「タイプ2の問題」 とよんでいたことを想起せよ。(2」・31)および(232),参照。 3)これは「タイプ3の問題」とよばれる。(2.33),参照。

(3)

最適制御理論に.ついて 1−4β − すこ.とにしよう。図64は,かかる状態制約1γを伴なった状態空間(月舘)内に おける1つの径路pを例示したものである。 Ⅹ0 図64.状態制約のある状態空間(En)内の経路p すでに,われわれほ,−・般的な状態空間としてニ他次元のユ・・−クリッド空間 (β穐)を想定し,さらに,その空間内における状態の推移過程を評価するべく 評価基準を導入した。そして,この両者を分離することなく同時に考慮するこ とによって,その相互関連を明らかに・するため,≠次元の状態空間をさらに1 次元拡張し,その拡張された(れ・十1)次元空間内に形成されるトラジェ.クトリ −・に.注目した4〉。 したがって,ここでもまた,(7・3)によって規定される状態領域Ⅳを, (%+1)次元のユ・1−・クリッド空間(βれ十1)内に・おいて検討することにしよう。す なわち,いま,1つの変数(これをガ0とする)を測る方向として,新たに1 次元空間(ガ1)をとり,これと%次元の状態空間(βりとの直積集合を考えれ ば,点ズ=(ガ。,ズ)=(∬○,ガl,・・・,ガれ)の集合は,(彿+1)次元のユ・・−クリッド空 間(ガ症1)に拡張される。このとき,もとのシステムの状態ズは,拡張された 状態点ズ=(ガ0,ズ)の状態空間(ガ花)への射影となっている。 また,(7.3)における関数g(ズ)には,新しい変数∬0が明示的に含まれて 4)ⅠⅠ章,第2節の(29),参照ム

(4)

香川大学経済学部 研究年報19 ヱタ7∂ ー 44 −・・ ほいない結果,ズを(≠+1)次元のベクトルとするとき,〟(考)は, g(ズ)≡g(ズ) (7・5) として表わされる。したがって,(彿+1)次元のユ・・−クリッド空間(ガ机1)内に 形成される,霊。に平行な軸をもつ拡張された状態制約の領域をGで表わすこ とにすれば,このGは,つぎのように定義される。 G仝(ズIg(ズ)≦0) (7・6) いうまでもなく,ガ花への射影が許容径路になっているすべてのトラジごク トリ−を許容トラジェクトリ・−・とよぶことに.すれば,許容トラジ ェクトリ・一 は,すべて(7.6)に.よって定義される領域G内に含まれることになる。すな わち,許容トラジ宣.クトリー・上の点ズ(りは, ズ(£)∈G,∀£∈【と0,り (7・7:) をつねにみたすものとなっている。図65ほ,拡張された状態空間(屈か1)内に おける許容径路pとそのトラジェクトリ−・rを例示したものである。 図85拡張された状態空間(En+1)内の許容経路pとトラジェクトリ1−r とくにいま,最適トラジェクトリ・−・のうち,(7・6)によって定義される領域 Gの境界∂Gに含まれている部分についてのみ考察を限定することにしよう。

(5)

最適制御理論について ・−4J− このとき,境界∂Gは,図65より明らかなように.,ガ。軸と平行な軸をもった なめらかな円柱面(Cylindricalsurface)で, g(.方)=0 (7.8) に.よって定義され,また,

Fダ(ズ)仝(忍,各…・,怠)=(0,各…,老)

(7・9) は,境界∂Gのいかなる点においてもゼロ・べクレレにはならないものとす る。 つぎに,制御〝が状態変数ズとほ独立に与えられている,いわゆるタイプ 1の問題での制御制約を合わせ考えることにすれほ,われわれの制御制約ほ, つぎのように示される。 w∈打 (7.10) ただし, 打仝(叫如(〟)≦0,(α=1,2,…,∼)〉 (7・11) を表わすものとし,≠α(捉),および∂れ肋妬(α=1,2,…・,∼;た=1,2,…,仇) ほ,Ⅳの境界∂打の近傍で定義され,連続であるものとする。 かくして,われわれの解明すべきタイプ3の最適制御問題ほ.,つぎのように 定式化される。 タイプ3の問題(狭義の場合)さ) つぎの評価基準

†:ニム(ズ(£),祝(£))d亡

(7.12) を,以下の制約に従って最小にする制御祝(£),(£0≦£≦£1)を求めよ。 (i)状態方程式 史=爪牙,W) (ii)初期条件 ズ(亡。)∈β0(≠0) G揖 終端条件 ズ(£1)∈が(と1) (7.13) (7.14) (7.15)、 5)後・で,状態変数ズに依存する制御制約のある問題をとりあげるので,それと区別 するため,この問題に対して(狭義の場合)という注釈をつけておくことにする。

(6)

J97夕 香川大学経済学部 研究年報19 ・−−4β− 裾 制御制約 祝∈打仝(叫如(〟)≦0,(α=1,2,‥…,ヱ)〉 (Ⅴ)状態制約 ズ(£)∈lγ仝(ズ桓(ズ)≦0),∀£∈【£0,り ただし, ズ∈ガ殉,祝∈β仇,β0⊂ガの,β1⊂丘㍗,£0,孟1は,所与,または未知とする。 この場合,われわれは,以下に示す5つの仮定を設けることにする。 (仮定1) ム(∬,≠),鱗(ズ,祝)/蝕ゎ雛(ズ,W)/∂≠ゎ (宜=0,1,…・,%;∫=1,2,…‖,れ;た=1,2,…・,彿)

ほっ それぞれⅣ×打内で定義され,かつ達統である。ただし,Ⅳ,および

打は,町 および打を含むある開集合を表わすものとする。 (仮定2) 最適制御〟*(£),(£0≦≠≦fl)ほ,(㈲,および(Ⅴ)をみたす)許容制御のなか から選ばれるものとする。 (仮定3) β0,およびがは,それぞれ適当な次元をもった,なめらかな多様体であ る。 (仮定4) 九(従),∂ん(祝)/∂祝わ(α=1,2,…,∼;ん=1,2,…‖,仇)は,Uの境界∂打の近 傍で定義され,連続である。 (仮定5) g(ズ)ほ,g(ズ)=0の近傍で連続な2次偏導関数をもち,その勾配ベク トルFg(ズ)=(∂g(ズ)/紬1,∂g(ズ)/∂ガ2,…,∂g(ズ)/弛れ)は,g(ズ)=0をみた す任意の点において,ゼロ・ベクトルにはならないものとする。 これらの仮定により,叔上の問題をすでに導出した定理を用いた解明するこ とが可能となる。以下,この点を逐次明らかにしていこう。 §2.境界上の最適トラジェクトリー すでに,われわれは,最適制御理論についての基礎的理解を深めている。す なわち,まず,最大原理の導出にとって重要を意味をもつ限界面∑の定義を

(7)

最適制御理論について −−47−

与え,一また,その性質を【定理1】として記述した8)。つぎに,その限界面∑の正

則な内点に注目して,最適トラジェクトリ・−・r*上の点ズ*(£)がみたすべき性

質を【定理2】として要約し7),さらに,限界面∑に対する接平面アユ(且サ(£))

の移動をトラジェクトリー・方程式に対応する変分方程式笹よって規定し,ま

た,その按平面アユ(ズ*(亡))に垂直な法線ベクトル彿(ズ*(孟))の移動をその変

分方程式に対応する随伴方程式によって規定すること8)により,タイプ1の最

適制御問題に対する最大原理を,結局,【定理3】として導出したわけである9)。

その際,とくに盈要な点は,最適トラジェクトリ・−上の点g*(りが限界面

∑の正則な内点であるものと仮定して,その点属サ(の,およびその点の近傍

∠(ズ*(£))の変換を最適制御祝*(£′)に・よって試みている,ということにあっ

た。その結果,もとのトラジェクトリ・−方程式に対応する変分方程式によって

線形変換された新しい按平面,すなわち,

アユ(題号(£′))=A(£′,のアユ(ズ等(の) (7・18)

が,最適制御祝*(£′)によって変換された限界面∑上の点ズ*(£′)およびその

近傍d(ズ坤(£′))の同じ接平面になっている,すなわち,

r。(ズ*(f′))=アユ(ヱサ(≠′)) (7・19)

の関係が成立するという,重要な性質が導かれた10)。図66は,この関係を示

したものである11)。

したがって,われわれは,最適トラジェクトリt−・r*上のすべての点が(7・6)

で定義される状態制約の領域Gの内部に食まれている場合にのみ,【定理3】を

適用することができる点に注意すべきである。これを言い換えるならば,もし

も最適トラジェクトリ−・r*のある部分が,図65に示されるように,領域G

の境界∂G上にある場合には,与えられた問題に対して【定理3】を直接適用す

ることは許されず,それを修正する必要が生ずるのである。

なぜなら,まず第1に,境界∂G上にある最適トラジェクトリ・→r*の部分

6)HI章,第宰節,参照。 7)(S小42),参照。 8)ⅠⅠⅠ章,第3節,参照。 9)ⅠⅠⅠ章,第5節,参照。 10)ⅠⅠⅠ章,第4節の(3い83)および〔補助定理6〕,参照。 11)これは,図30と同じものである。

(8)

一J∂・− 香川大学経済学部 研究年報19 ヱ97β ∑ T∑(X*(t)) ∑ T∑(X*(t′)) 図68.点ズ*(£),その近傍∠(ズ*(£))および接平面アユ(ズ*(り)の変換 に∴ついてほ,限界面∑が領域Gの外部にある点に対しては定義されないこと から,点ズ*(舌)が限界面∑の正則な内点ではないこ.とになり,第2に,近傍 ∠(ズ*(の)の移動が状態制約(7・6)をみたす許容制御(7.10)によって一行わな ければならないからである。 そこで,境界∂G上にあるr*の部分に対して−,叔上の【定理.3】がどのよう に修正されるかを,つぎに考察することにしよう。 まず,最適制御祝*(りおよび解Ⅹ*(り,(舌0≦壬≦亡1)に対応する最適トラジェ クトリー・r*を想定しよう。さらに,≠0≦¢8<≠‘≦£1に対して, ズ*(£)∈∂G,∀£∈【舌e,ち】 (7.20) をみたすものとする。このとき,最適トラジェクトリ・−r*上の点ズ*(f8), およびX*(tl)を,境界に入る点(Enteringpoint)および境界から出る点 (Leavingpoint)とそれぞれ卓二ぶことにしよう。図67は,この最適トラジ ェクトリ・−・r*を,拡張された(耽+1)次元の状腰空間内における限界面∑上 において例示したものである。 つぎに,状態制約を鹿定する(7・6)の関数g(孝)の勾配ベクトルFg(ズ)12) と,(7・12)の被積分関数ム(ズ(£),祝(り)および状態方程式(7・13)の右辺の 関数′(ざ,祝)用)との内環をア(.ち牒)によって表わせば,このスカラ・一関数 12)/(7.9)に.対応する。 13)すなわち,カ(ズ,祝),(宜=1,2,い・l,れ)を意味するものである。

(9)

・−4クー 最適制御理論について 図67.拡張された状態空間(E刷)内め最適トラジユタトリ・−・r*

P(ズ,α)ほ,次式によって定義される14〉。

ク(ろ祝)仝Fg(ズ)・′(g,祝)

(7・21)

このとき,勾配ベクトルFg(孝)は,状態制約の境界∂馴こ垂直な方向ベク

トルを表わし15),また′(考祝)ほ,(7・13)の状態方程式に・よって,拡張された

状態空間内のトラジェクトリ1−・の方向を表わすことから,境界∂G上にある√*

の部分−すなわち,(7.20)をみたす点ズ嘗(£)一についてほ,つぎの関係が

成立することになる。 P(エア(£),祝*(£))=0,∀f∈【fe,££1 いま,ある時刻£′∈[£e,舌エ】において ズ*(舌′)∈∂G および 祝*(£′)∈∂ひ16) がともに成立しているものと仮定しよう。すなわち,その時刻ま′において (7.公) g(ズ*(孟′))=0 および 14)′仝(ム,′)=(ふム,…,.ん)である点に注意せよ。 15)図31,参照。 16)(7.11),参照。

(10)

香川大学経済学部 研究年報19 ■−∂り−・ ヱβ79 (7.26) 丸(従*(£′))=0,(α=1,2,…,り17) がともにみたされているものとする。 そのとき,つぎのベクトル関数

F%ア(鋤)仝(貰,芸,…,芸)

および

F%拍)仝(畿,各…,畿)

(7.㌘) (7.28) (α=1,2,…,ヱ′) から求められる,つぎの(∼′+1)個のベクトルーF祝P(考ル),F祝直(祝),…, F鮎≠古′(γ)−が,ズ=ズ*(£′)および朋美=別*(£′)に.おいて1次独立.であるとき, この点(戌誉,u*)ほ正則点(Regular point)と定義される18)。 以下,(彿+1)次元のユ・・−・クリッド空間内において,芽*(£)=ズ∈∂Gの近傍 〉〟が存在し,・その近傍ノダと最適トラジユタトリ−r*が乗っている限界面 ∑との共有点−すなわち,レグ∩∑をみたす点−が,すべて限界面∑の正 則点である場合にかぎって,すでに導出した【定理3】がどのように修正される T∑(ズ(t)) ∂G 囲88.境界∂G上の点ズ(£)における限界面∑の按平面アユ(g(£)) 17)ただし,∼′≦ほあり,α=∼′+1,∼′+・2,…,∼のとき,声(祉*(亡′))<0が成立するこ とを意味する。(5り86),(5.87),および(5‖88),参照。 18)ただし,爪‘P(ズ,祉)キ0である。

(11)

・−∂J−− 最適制御理論について

ベきかを検討することにしよう。いうまでもなく,この場合には,図68からも

明らかなように,すべての点ズ∈J〆∩∑に対して接平面アユ(耳)が定義可能

となり,また,アユ(ざ)は,g∈∂Gn∑に周しても定義可能となっている。

そこで,まず,境界∂Gに入る点j?(£。)の近傍d(ズ*(舌¢))の移動を考える

(Admissible control)でなければな (7.29) (7.30) (7.31) ということである。 とき,そのもとになる制御が許容制御 らない点に注意しよう。すなわち,制御 祝(り∈坊 ∀舌∈【fe,££】 に対応するトラジェ.クトリ・−・方程式19) 慮=′(考祝) の解g(豪)がi許容トラジ ェ.クトリー ズ(り∈G,∀£∈【舌。,fI】 を形成するものでなければならない20), したがって,(7.凱)の示す許容トラジェクトリ・−であるべき条件を保証する ため,つぎの条件を付加することに・しよう。 P(ズ(り,祝(£))=0,∀≠∈【f¢,り (7・32) なぜなら,まず,(7.21)に.よって与えられたスカラー・関数ア(考祝)の定義 に.より, 如(ズ(豪)) =Fg(g)・′(考祝)=タ(g(£),祝(£)) (7・33) d舌 となり,さらに(7.32)の追加条件式の成立を仮定すれは, g(ズ(の)=定数,∀f∈【f¢,≠‘】 (7・34) となる。また,境界∂Gに入る点ズ坤(≠。)の近傍∠(g*(fe))は限界面∑に含 まれており,その限界面∑は状態制約の領域Gに・含まれていることから, ∠(ズ準(f¢))⊂∑⊂G (7・35) となり,したがって,(7・6)より g(g(舌¢))≦0 (7・36) となる。かくして,(7.34)と(7。36)とを同時に考慮すれば,さきの条件(7・31) を導くことができ,その結果,先述したとおり,(7・32)の条件を付加すること 19)ただし,′(考従)=(ふ(ざ,祝),∫1(才,従),・り,ム(g,祝))である点に注意せよ。 20)すなわち,(7−6)に.よって定義される領域Gに食まれるということである。

(12)

香川大学経済学部 研究年報19 J夕7夕 ・−52− によって,許容トラジェクトリ・−・の形成が保証されることになるのである。 したがって, 境界∂Gに入る点ズ*(舌¢)の近傍∠(ズ*(舌8))の移動を可能にする 許容制御は,(7.11)と(7.32)の条件をと.もにみたす限定された制御変数の集

合(Res七ricted controIset)−これをE2で表わすことにする・rに属する

ものでなければならない。 とくに.この場合,限定された制御変数の集合Qほ,明らかに打の部分集合と なっており,しかもこのE2が,状態に依存する制御集合(State−dependent COntrOIset)となっている点に.注意する必要がある。なぜなら,この性質ほ, すでにわれわれがタイプ2の問題として検討した内容と棋似しており,したが って−,また,その理論的帰結を当該問題に対して適用することが可能となるか らである。 そこで,タイプ2の問題を解明した主要な論点を想起してみよう。この場 合, 制御祝(りに対する拘束が状態ズに関係していた結果,最適点ズ*(f)の 近傍∠(ズ*(り)を最適制御祝*(り∈乙ベガ(£))に・よって移動させることがつね にできるという保証はなかったのである。換言すれば,g(孟)≒見ゃ(舌)に対し ては,祝*(£)∈と尺ズ(舌))が許容制御であるか否かが不明であったのである。 したがって,最適点ズ*(りの近傍∠(j?(舌))が,つねに許容制御に・よって変 換されるように.,その制御を変更する必要が生じたわけである。ただし,そこで いう許容制御とは,制御〝(孟)が制御空間の固定された部分集合打に含まれる というのではなく,制御祝(ゎが状態ズに依存する所与の部分集合こぺズ(£)) に含まれることを意味するものであった21)。そこで,いま,あらためて,制御 祝(£),(舌0≦≠≦£1)が, w(£)∈ぴ(ズ(£)),∀£∈【f。,り (7・37) をみたすとき,その制御u(t)を許容制御(Admissible control)とよぶこと にしよう。ただし,ズ(£)ほ.祝=祝(≠),(£0≦f≦ら)に対するトラジェクトリ・一 方程式 21)しかし,われわれの取り扱ったタイプ2の問題が非フトーり■マス系であったため に,(5∩5)に.おけるUは,ズ(£)のほかに」も独立変数として含んでいたが,非オ■・− トノマス系をオ・−トノマス系に変換することが可儲である結果,その差異に重要な意 味があるわけではない。

(13)

一占∂− (7.38) (7.39) (7.40) 最適制御理論について 鬼=′(孝ル) の解であり,集合打(ズ(舌))22)は, P(考w)=0 および ん(祝)≦0,(α=1,2,‥l・,£) によって定義されるものとする28)。 つぎに,最適制御祉*(舌)と,これに対応する状態脛(£)が,(7・40)に・よっ て示される∼個の制約式のうち,ヱ′個で等号が成立しているものと想定しよう。 すなわち,もしも必要ならはその順序を入れ替えることによって,次式が成立 しているものと考えてみよう。 巌(祝*(り)=0,(α=1,2,…,∼′) (7・41) 巌(γ*(吉))<0,(α=£′+1,ヱ′+2,…,∼) (7・42) また,実際に拘束のきいている制約式の数(すなわち,∼′+・1)は,制御変数 の数(すなわち,肌)を上廻ることはなく,したがって, (7.43) ヱ/+1≦竹も とし,つぎの行列関数 ∂P ∂P ∂%1 ∂%2

姓 坐L

∂≠1 ∂%2 旦虹 姓 ∂≠1 ∂髄2 F≠ア(斉川) F祝¢1(祝)

軌⋮監

(7.44) F?↓≠£・(祝)

ほ,ズ=ズ*(£)および祝=眈*(ので最大のランクをもつものとしよう。すな

わち,点(ズ*,W*)が正則点であると仮定するのである。そのとき,われわれ

は,点ズ=ズ坤(£)の近傍』(ズ*(舌))を移動させる許容制御祝(孟)∈Ⅳ(ズ(≠))

を,つぎのようにして求めることができるのである。まず,彿次元の制御ベク

トル祝を,つぎの2っの部分に分けて考えよう。 22)したがって,この集合び(ズ(舌))は,前述の限定された制御変数の集合倉に対応す るものである。 23)(7.39)は,(7.32)に.,また,(7.40)は,(7・・16)にりそれぞれ対応する。

(14)

香川大学経済学部 研究年報19 −54 − J5仁7β (7・45) (7.46) (7・47) が仝(叫,祝2,…,≠Ⅰ′.1) 祝¢仝(≠㍗ヰわ祝=わ…,祝偶) すなわち, 祝=(祝¢,保つ として表わされる24〉。そこで,この制御ベクトルなのうち祝¢ほ,(7.44)のラ ンクが(∼′+1)であることから,(7.39)と(7.41)を連立させて解くことによ り,状態ベクトルズと残りの制御ベクトル祝αの各成分の関数として−・意的に 求められる。簡単化のため,記号Rに.よって R仝(ア,直,如,…,≠乙・) を表わすものと定義すれば,さきの(7.39)と(7.41)は, 月(ろ祝α,祝つ=0 と凄くことができる。 したがって,これらの記号を用いて,以上の議論をまとめれば, 月(考が,ぴ‥(.ち祝つ)=0 をみたす関数 混亡=こ声(∫,祉d) が存在する,ということである。 いま,祝¢=なα(f)を 祝α(≠)=(%*£′+2(孟),γ*叫(り,…,%*仇(り) (7・52) とおき,時刻ちK∴Ⅹ*(fe)の近傍∠(ズ*(とe))に属する点を起点として,制御 祝(f)=(w¢,眈つ (7.58) によって形成されるトラジェクトリー・に注目してみよう。ただし,(7.53)の 右辺の祝¢および従¢ほ,(7.51)および(7.52)に.よって,それぞれ, 祝e=こ吾(ズ(舌),従α(舌)) (7.54) および 祝α=従α(£) (7.55) で与えられるものとする。つぎに,さきのトラジェクトリ・一方程式(7.38)を この祝=祉(り,(≠e≦£≦fl)に.関して積分すれば, 24)(5.122),参照。

(15)

ー55− (7.56) 最適制御理論について ズ(f)=ズ*(り・十印(り+0(ちe),(fe≦≠≦と‘)

となる。ただし,上武右辺ので(£)ほ,つぎの変分方程式

=中たC

の解であり,また,上武右辺のおよびほ, (7.57)

畿畿・⋮︰畿

畿畿⋮畿

二∴∴⋮∴㍉

(7.58) (7.59)

艶畿…・頂監

で定義され,そのそれぞれを点(ズ*(り,祝*(£))において評価したものであ

る。さらに.,また,鬼eは,(エ′+1)次元のベクトルであり,それを,

(7.60) か=(帆,鹿e2,…・,机・.1) と表わせは,その第ん番目の成分は, ㌻∂こ戸た(考 (7.61) たe鳥仝∑ ズ=ズ*(£)で′ ∂勘 として与えられる。 そこで,さきの(7.50)に対して,(7・56)で与えられるⅩ=g(£)および

(7.52)で与えられるWα=祝α(£)を代入すれば,つぎの関係を得る0

濃中た¢=0

(7.62)

(16)

香川大学経済学部 研究年報19 J∂7β

⋮⋮翠恵薮

(7.64) ∂点‘・+1 ∂局£′+1 ∂屈Ⅰ・.1 ∂≠1 ∂%2 ∂町.1 で定義され,そのそれぞれを点(g*(り,祝*(≠))において評価したものである。 さらに,(7・62)をかについて解き,その結果をさきの(7.57)に代入すれ ば,状態制約を考慮して修正された変分方程式は, 認=[叢一叢(器) ̄1濃]ヮ となり,また,その解ほ, ヤ(≠)=A【ち舌加¢,(豪8≦藍≦と↓) (7.65) (7・66) をみたすあらたな線形変換を定義することになる25)。 したがって,境界∂G上にある最適トラジェクトリ・−r*の部分に沿って その近傍∠(ズ*(≠¢))を移動させる場合にほ,その近傍∠(詔(舌¢))の接平面 rJ(ズ*(舌e))の変換をこの新しい線形変換−すなわち,(7.66)一によって 行えばよいことになる。また,その接平面r。(ズ*(舌g))に垂直な法線ベクトル の変換については,この修正された変分方程式(7・65)に対応する随伴方程式, すなまっち, 25)(7165)は,(5,.126)に対応する。

(17)

−57− 最適制御理論に・ついて  ̄1 昔=−ス[甚一意(器)濃・]

の解ス(電)に従って行えばよいことになる26〉。簡単化のため,

ソ=(肘1,1湖)仝磁(器) ̄1

(7.67) (7.68) とお桝ゴ,修正された随伴方程式(7・67)は,つぎのように表わされる0 (7・69)

昔=一桜+償

これより明らかなように,もしも(7・39)および(7・40)によって規定される 制約条件が状態ガに・依存しない場合には,上式右辺の∂月/∂ズがゼロとなる結 果,(7・69) =一 (7・70) に帰着する27)。 しかし,(7.69)の右辺に・ある点が,さきの(7・48)に・よって定義されたも のであるかぎり,(7.63)の∂β〃ズほ,ゼロに・ほならず, ∂ア(ズ,従) ∂ア(ズ,W) ∂ア(ズ,祉) ∂ユ「。 ∂拍) ∂ガ○

aR _

− ̄ ̄ ち芳 j¢・・l_ガ ∂∬1 ∂P(ズ,祝) 旦麺と ∂打0 ∂ア(.ち祝) ∂∬1 ∂ガ0 0 0 (7.71) ︰:︰ 0 :◆︰・ 0 ︰︰・・ 0 26)(7り67)は,(5・127)に対応する。 27)すなわち,(7.70)は,(385)に対応する。

(18)

Ⅶ−5ぎー− 香川大学経済学部 研究年報19 Jタ7タ となる28〉。 その結果,修正された随伴方程式(7.69)は, =一 力。Fク(考〟) (7.72) ただし, FP(考ル)仝( ∂ク(旦那)∂ア(.ち牒) ∂∬0 ’ ∂ガ1, ∂ク(耳ル) )(7・73) ∂ガ乃 としで与えられることになる。 最後に,状態点ズサ(舌),(fe≦≠≦吏エ)が限界面∑の.正則な内点(Interior point)でほないことによって生ずる問題に言及しておこう。すでに,われわ れほ,限界面∑の重要な性質として,【定理1】を導出した29)すなわち,それ ほ,「ある与えられた限界面∑上に初期点をもつトラジェクトリ・−が,(そ れが最適であっても,最適でなくてこも)その限界面∑た関するβ点を持ち得 ない」ことを内容とするものであり,その意味で,この定理ほ,限界面∑の まさに限界的な性質を端的に・示すものであった。そこで,状態点ズ*(£)の近 傍d(g*(豪)),(£¢≦≠≦≠‘)に属する点は,すべて限界面∑上に初期点をもつ 許容トラジェクトリ一に含まれていることから,叙上の【定理1】によって, いずれもその限界面∑に・関してβ点を持ち得ないことが,まず明らかとな る。しかしながら,その状態点ズ*(り,(fe≦舌≦舌‘)ほ,仮定により境界∂G上 に属している,すなわち ズ*(舌)∈∂G,(fe≦£≦右上) (7.74) をつねにみたしていることから,その状態点ズ*(舌)ほ,限界面∑の正則な内 点ではないaO)。したがって,近傍∠(且坤(舌))の移動を修正された変分方程式 (7・65)に従って行った場合に,その変換された近傍∠(ズ*(≠))ともとの限界 面∑とが,最適制御従*(≠)によって変換された状態点ズ*(≠),(£e<£≦f£)に おいて−,共通の按平面を持つとは必ずしもいえなくなるのである81)。図69は, 28)∂R/∂ズは,(∼′+1)×(%+1)の行列関数である点に注意せよ。 29)ⅠⅠⅠ草,第2節,参照。 30)図67,参照。 31)すなわち,ⅠⅠⅠ章,第4節の〔補助定理6一〕が正則な内点を前提としている結果, ここでは妥当しないのである。

(19)

最適制御理調に・ついて −∂クー・ 図69、境界∂G上の点g*(£)における限界面∑と近傍∠(ズ*(≠)) この状況を例示している。 これを言い換えれば,境界∂Gに.入る点ズ*(舌。)について,その近傍∠(ズ* (£e))と限界面∑とが,共通の按平面をもっている,すなわち, r。(ズ*(£e))=アユ(Ⅹ*(≠¢)) (7・75) が成立しているとしても,すべての£∈【£‘,りに対して,(7・69)をみたす随伴 ベクトルス(£)が,点戊?(≠)における限界面∑の按平面アユ(ズ*(り)に垂直 である,とほ,主張し得なくなるのである。 §3.境界上の法線ベクトル 本節では,境界∂G上にある最適点ズ*(り,(fe≦£≦f£)に・注目して,その点 ズ*(りにおける限界面∑,その近傍』(g*(舌)),および境界∂Gに対する接平 面にそれぞれ垂直なべクトル相互の関係を明らかにしよう。なぜなら,境界 ∂G上にある最適点ズ*(り,(舌e≦£≦£g)に注目するとき,変分方程式(7・65) に従って変換された近傍∠(ズ*(り)の按平面rd(ズ*(£))と,限界面∑の按 平面アユ(ズ等(り)とが,必ずしも等しくなるとはかぎらないからである。 そこで,叔上の3つのベクトルを区別するため,つぎの記号を用いることに しよう。まず,限界面∑の正則な内点ズにおいてその按平面アユ(ズ)に垂直

(20)

香川大学経済学部 研究年報19 Jタ79 ーβ0− で,領域β/∑82)に向かう単位法線ベクトルを彿(孝)とする糊。この単位.法線 ベクトルがβ/∑に向かうということは,ある正数αが存在して,すべてのど (ただし,0<ど<α)に対して,点ズ+∈彿(耳)がβ/∑に含・まれることを意味 するものである。そこで,このベクトル彿(ズ)のガ0軸方向の成分を彿0(考)と すれば, 彿0(ズ)≦0 (7・76) となる。したがって,いま,点ズ∈、〃′∩∑において,限界面∑の按平面rヱ (耳)に.垂直なべクトルーすなわち,竹(孝)一について,その第1成分− すなわち,彿0(ズ)−の絶対値が1となるように・標準化した法線ベクトルを Ⅳ(Ⅹ)に.よって表わすことに・しよう。ただし,れd(ズ)がゼロのときは,もと のベクトル彿(g)の方向を変えないかぎり,彿(ズ)のノルムを自由に変更し 得るものとしよう。すなわち‥点ズ*(≠),(fβ≦£≦亡エ)における限界面∑の接 平面アユ(ズ*(り)に対して垂直な標準化された法線ベクトルjV(ズ*(り)は,つ ぎのように定義される。 れ0(X*)キ0⇒Ⅳ(ズ*)仝(−1,彿1(ズ*),彿2(ズ嘗),…,れ乃(ズサ)) 彿0(ズ*)=0⇒Ⅳ(ズ*)仝ゐれ(孝),ん>0 (7.77) ただし,んほ,任意の定数を表わすものとする。 つぎに,点ガ(舌),(£e≦f≦舌エ)における近傍∠(ズ*(り)の接平面rJ(ズ坤(り) に垂直な法線ベクトルは,ス(孟)によって与えられる。いうまでもなく,この ス(のは,修正された随伴方程式(7・69)の解ベクトルである。とくに,それを われわれの解明すべきタイプ3の問題抽に・即して述べれば,(7・69)の右辺の 月が(7.48)によって定義されている結果,この法線ベクトルス(りは,(7.72) の解ベクトルであるといえる。また,すでに述べたように,最適トラジェクト リ・−r*が境界∂Gに入る点ズ*(£e)においては,その近傍∠(ズ*(≠¢))と限界 32)(3.、29),参照。 33)かかる正則な内点 ズ=∬*(壬)+・A方∈、ノダn∑と,これに対応する法線ベクトル 彿(ズ)に注目すれば,法線ベクトル彿(ズ*(f))は,llム訓rOに.よって定義される。 また,彿(ズ)が単位ベクトルであるというのは,肋(ズ)l】=1をみたすべクレレを意 味するものである。 34)ただし,狭義の場合である。本草,第2節,参照。

(21)

最適制御理論について 面∑とが同一の接平面を共有する,すなわち, r。(j誉(£e))=アズ(ズ等(£¢)) −βユ ー (7.78) が成立する結果, ス(亡¢)=jV(ズ*(f¢)) (7.79) となるように,近傍∠(Ⅹ*(£8))の接平面に対する法線ベクトルス(亡e)を選ぶ ことが許されようさ5)。さらに■また,ガ0が修正された随伴方程式(7.72)のなか には明示的に入っていないことから,ここでもまた, ん(り=定数≦0,(舌。≦≠≦亡と) (7.80) であることが判明する8$)。したがって,さきの(7.77)と(7.79)とを同時に考 慮すれば,すべてのか≡払,りに対して, 彿○(∬*(£e))キ0=⇒ん(り=−1 彿。(g*(£¢))=0⇒ス。(舌)=0 ) (7・81) の関係が成立することになる。 最後に・,点g*(りにおける境界∂Gの按平面r∂¢(ズ*(孟))に対して垂直な 法線ベクトルは,グg(詔(と))によっで与えられる。このことは,(7.9)に.よ って定義された勾配ベクトルFg(孝)の幾何学的意味を想起されれば明らかで ある抑。 以上,3つの法線ベクトルーすなわち,Ⅳ(ズ*(£)),ス(り,およびアg(ズ* (舌))−相互の関係を,【補助定理7】として要約すれば,つぎのようになる。 【補助定理7】 r*を,ズ篭(舌),(舌。≦£≦ち)によって与えられる最適トラジェクトリ1− とし,時間区間【舌。,舌と】で,境界∂Gに食まれているものとする。このとき, 領域Gの内部に向かうベクトルが,同時に領域g*の内部に向かっている ならば88),ベクトルス(り,Ⅳ(ズ*(£)),およびFg(ズ*(り)は,1次従属 である。さらに,ベクトルス(りとFg(ズ坤(の),およびベクトルⅣ(ズ篭(り) 35)したがって,ス(f¢)についても,その第1成分の絶対値が1となるように標準化さ れている。 36)(8.91),参照。 37)脚注15)および図31,参照。 38)(2.4),参照。G=がならば,この条件は自明の理となる。

(22)

香川大学経済学部 研究年報19 ユタ79 …β2− とFg(ズ*(≠))が,それぞれ1次独立であれば,すべてのか≡【舌わ孟i】に対 して,次式が成立する。 ス(の=Ⅳ(ガ(£))+〟(亡)アg(ズ*(f)),〝(£)≦0 (7・82) ただし,〃(≠)は,【舌。,舌乙】で連続である。 この証明は,つぎのようにしてなされ得る。まず最初に,3つの法線ベクト ルス(亡),Ⅳ(ズ嘗(£)),およびアg(脛(£))が1次従属であることを帰諾法によ って証明しよう。そこで,この主張が誤りであると仮定する。すなわち,いま, ある点二㌢=ズ*(£′),(£′∈【舌e,≠↓】)に.おいて,3つのベクトルス(孟′),Ⅳ(ズ/), およびFg(ズ′)が1次独立であると仮定しよう。そのとき,点ズ/における多 様体エ(二㌢)を エ(二㌢)仝r。(ズ′)∩7’∬(ズン)nr∂¢(二㌢) (7・83) として定義すれば,点ズ/において,「つぎの条件をみたす2っのベクトルαお よびβを選ぶことが可能となる89)。 α∈rJ(ズ/)nr∫(二㌢)一ム(ズつ ス(£′)・α=Ⅳ(ズ′)・α=0,アg(ズ′) および ) (7・84) α<。 β∈r。(二㌢)nr∂¢(ズ/)−エ(ズ′) ス(£′)・β=アダ(ズ′)・β=0,Ⅳ(ズ/)・β> 〉 (7・85) 。 ただし,(7.84),および(7.85)の右辺にあるマイナス記号(すなわち, “−〃)は,集合の意味に解すべきものとする。したがって,たとえば,rdn

T2−・Lは,TAnTEにおけるLの補集合(Complement)を意味するもので

ある。 さらにまた,叙上のベクトルαおよびβの1次結合からなるベクトルを新た にでとし,これをつぎのように定義しよう。 で仝¢α+dβ ただし,¢およびdは,正数を表わすものとする。 (7.86) このとき,(7.84)および(7・85)によって明らかなように,つぎの2っの不 等式が成立する。 Fg(ズ/)・叩<0 (7.87) 39)園32∼34ならびに(性質1)および(性質2),参照。

(23)

最適制御理論について ーβ♂− および Ⅳ(ズり・で>0 (7・88) このうち,まず前者,すなわち(7.87)の不等式ほ,(7.86)によって定義され たベクトルでが,点ズ′において境界∂Gの按平面ア和に垂直な法線ベクトル Fg(ズ′)から少なくとも900以上開いていることを意味している40)。換言すれ ば,ベクトル等は,領域Gの内部に向かっており,したがって,また,それ は,補助定理の仮定により,領域月*の内部に向かっていることになる。つぎ に後者,すなわち(7.88)の不等式ほ,ベクトルでが,点二㌢において領域β/∑ に向かっていることを意味している。これを言い換えれば,ある正数∂が存在 して,0<■£≦∂をみたすすべての£に対して,点ズ′+叩が領域β/∑に属し ているということである。しかしながら,(7.84)および(7.85)によって,ベ クトル符は,r。(ズつに含まれている結果,二㌢+叩は,乱(ズ/)の点であるこ とになる。したがって,孔(ズ/)および丘【*に含まれるすべての点二㌢+叩ほ, £>0が十分に小さいかぎり,』(Ⅹ′)に含まれる点二㌢+叩+0(g)に対応するこ とが判明する41〉。したがって,.点ズ/十叩がβ/∑に属しているということほ, 十分小さいざ>0に対して,点ズ′+叩+0(ど)が,∠(ズ′)およびβ/∑に属す ることを意味するものである。しかし,このことほ,「点ズ/の近傍』(ズ7)が, 限界面∑に関してβ点を持ち得ない」という前節の結果42)と矛盾することに なる。これによって,【補助定理て】の前半が証明されたわけである。す‥なわち, われわれほ,すべての時刻£∈【f。,舌‘】において, elス(り+¢2Ⅳ(ズ*(り)+¢るFg(題号(£))=0 (7・89) をみたす,すべてがゼロではない数¢ゎ(せ=1,2,3)が存在する,と主張するこ とができるのである。 つぎに,すべての時刻£∈【fβ,りに対して,(7・82)の関係が成立することを 明らかにしよう。そのために,すでに導出した(7・80)および(7・81)の関係に 注目して,ベクトルス(りの第1成分−すなわち,ス0(£)−の値が,−1と 40)(3.39)および図24,参照。 41)このことは,変分方程式(7・65)によって定義される線形変換の性質に・より証明さ れる。 42)本章,第2節,参照。

(24)

−β4 − 香川大学経済学部 研究年報19 Jタ7β なる場合と,ゼロとなる場合の2っに分けて,それぞれ検討を加えることにす る。 まず,【jo(り=Tl】の場合をとりあげよう。いま,もしも %0(見場(舌))=0 (7.90) とすれば,(7・77)の後半の関係より,ベクトルⅣ(ズ*(£))の最初の成分− すなわち,端(ヱ等(の)−の億はゼロとなる。すなわち, 端(ズ*(≠))=0 (7.91) を得る。このとき,ベクトルFg(見場(£))の最初の成分もゼロである結果48), (7・89)に含まれている3っのベクトル,ス(舌),Ⅳ(ヱア(£)),およびFg(ズ*(り) の最初の成分に注目するかぎり,ス(りの係数射も ゼロでなければならなく なる0 しかしこのことは,Ⅳ(ズ*(り)とF♂(ズ*(り)が共線ベクトルであり? したがって,1次従嵐であることを意味するから,【補助定理7】の仮定と矛盾 する。その結果,(7・90)の仮定が否定され, れ0(戌㌍(舌))≒0 (7.92) でなければならないことが判明する。したがって,また,(7.77)の前半の関 係より, 端(j誉(£))=−1 (7.93) であることを得る。さらに,この結果を,さきの(7.89)に代入して,ふたた び3つのベクトルの最初の成分に注目すれば, el=・−¢2 (7.94) であることが明らかとなる。また,(7■89)において,戸甘(ズ*(£))ほ,われわ れの仮定に・よりゼロ・ベクトルではないことから44),結局, el=−e2キ0 であることを得る。したがって,〟(f)を 〝(り=一 によって与えれば, ス(£)=一号Ⅳ(脛(り)一号朋(脛(り) (7.95) (7.96) 43)(7.5),参照。 44)本章,第1節の(仮定5),参照。

(25)

最適制御理論について ・−β∂− =Ⅳ(ヱア(f))+〝(£)アダ(ズ嘗(り) (7・97) となり,(7.82)の関係式が成立することに.なる。また,〟(£)の連続性ほ,3 つのベクトル,ス(り,Ⅳ(ズ*(り),および即応㌢(り)の時間区間【亡e,りにお ける連続性から直接導出される。 つぎに,[ん(≠)=Oiの場合を検討しよう。この場合にほ,(7・89)および (7.77)によって dlj(≠)+d2彿(ズ*(£))十d8グg(ズ*(£))=0 (7・98) をみたす,すべてがゼロではない数dゎ(宣=1,2,3)が存在す−ることになる。そ こで,この(7.98)に.含まれている3つのベクトル,ス(り,彿(ズ*(り),および Fg(ズ*(£))の最初の成分に・注目すれば,

d2=0

(7.99) またほ., 彿0(ズ*(り)=0 (7.100) が成立しなければならなくなる。しかし,もしも,この前者−すなわち, (7.99)−が成立しているものと考えれば,これは,ベクトルス(£)とFg(ズ* (f))が1次従属であることを意味する結果,【補助定理7】の仮定と矛盾する ことになる。したがって,この場合にほ, d2キ0 (7.101) でなければならず,その結果,後者−すなわち,(7.100)−の関係がつね に成立することが判明する。また,このことは,(7・77)の後半の関係より, Ⅳ(戊サ(£))=ん%(且等(≠)),ゐ>0 (7.102) が成立することを意味するものである。さらに,[補助定理7】の仮定により, ベクトルⅣ(ズ*(り)−したがって,彿(ズ*(£))−−とFg(ズ*(り)が1次独立 である結果, d.≒0 (7.103) でなければならなくなる。そこで,(7・98)の両辺を,このdlで割って変形す れば, ス(£)=一斑岬(£))一貰Fg(脛(り) を得る。したがって,ゐ(りおよび〝(りを (7.104)

(26)

香川大学経済学部 研究年報19 ーββ一 ユタ79 d2 拍)=・−・一石−

d

8 〝(£)= ̄頂丁 (7.105) および (7.106) によっで与えれば,(7.104)は,(7.102)を考慮することに.より. ス(り=ゐ(の彿(ズ*(り)+β(舌)Fg(g*(£)) =一Ⅳ(戌ア(の)十〝(孟)Fg(ヱ?(り) (7.107) となり,結局,(7.82)の関係式が成立することになる。また,(7.104)の右辺の 係数(−d2/dl)および(−dき/dl)−したがって−,また,ゐ(舌)および〝(り− の時間区瀾【£e,££】に・おける連続性は,3っの法線ベクトルス(≠),Ⅳ(ズ*(£)), およびFg(ズ*(£))の連続性と,ス(£)と7g(見場(舌)),およびれ(ズ*(り)と Fg(ズ*(り)が1次独立であるという仮定から直接導出される。 最後に,(7.82)の右辺の係数〝(孟)が非正であること,すなわち, 〟(の≦0 (7.108) が成立することを明らかにしよう。そのために.,いま,点ズ*(りの近傍∠(ズ* (亡))に属する点 属サ(の+叩+0( ∈)∈∠(ズ*(り),£>0 (7.109) に注目してみよう。ただし,ベクトルワほ,点ズ*(りにおけるその近傍∠(ズ* (孟))の接平面内のベクトル,すなわち, 智∈rJ(j?(の) を表わすものとし,0(£)は, 1iml腹立姐=0 l→O g (7.110) (7.111) をみたすものとする。また,このベクトルワは,領域Gの内部に向かってい る,すなわち, アg(J㌣(若))・甲く0 をみたすものとする。 (7.112) さらにまた,【定理1】によって明らかなように.,点ズ*(りの近傍∠(ズ*(≠))

ほ,限界面∑に関してβ点を持ち得ないことから,(7.110)によって与え

られるベクトル甲は,限界面∑の接平面アユ(ズ*(£))に垂直な法線ベクトル

(27)

最適制御理論に.ついて ・−β7− jV(ズ*(≠))から,少なくとも900以上開いていなければならないことに.なる。 すなわち, Ⅳ(ズ*(f))・?≦0 (7.113) が,つねに成立しているはずである。 しかし,点ズ*(た)における近傍』(ズ*(£))の接平面rJ(g*(の)に垂直な 法線ベクトルは,ス(りによって−与えられることから,このベクトルス(のと (7.110)によって与えられるベクトル甲の内債をもとめれば,つねにゼロであ る,すなわち, ス(と)・?=0 (7・114) が成立することになる。したがって,上武左辺のス(f)に・,(7・82)の関係式を 代入すれば, ス(の・甲=(.Ⅳ(ズ*(£))+〝(£)Fg(Ⅹ*(≠)))・ワ =Ⅳ(ズ*(£))・ワ+〟(舌)Fg(g*(£))・? =0 (7.115) となる。そして,この関係と(7・113)を同時に・考慮することによって(7・108) が導出され,その結果,【補助定理.7】のすぺてこの証明が完了したことになる。 以上により,境界∂G上の3つの法線ベクトルーすなわち,Ⅳ(Ⅹ*(の), ス(£),および7g(ズ*(舌))−がつねに同一・平面内に.あり,しかも任意の時刻 £∈[≠‘,まェ】に対して,(7・82)の関係をみたしていることが明らかにされた○ そ こで,最後に,この関係を,図70によって例示しておこう。 図70の(a)は,£=と8の場合−すなわち,最適トラジェクトリ鵬∴r*が境界 ∂Gに入る点g*(と8)一における3っの法線ベクトルの関係を示したものであ る。この場合,点ズ*(£β)の近傍∠(ズ*(≠e))は,点ズ*(≠¢)において限界面∑ と共通の按平面をもつことになり,したがって,また,ベクトルⅣ(g*(≠8)) とス(舌8)が一致することが示されている45)。 つぎに,図70の(b)ほ,ま′>£8の場合48)− すなわち,境界∂G上にある最 適トラジェクトリ・−r*の部分に沿って,点ズ*(まe)の近傍∠(ズ*(fe))を移動 させた場合一における3つの法線ベクトルの関係を示したものである。とく 45)この場合にあっても,(7‖82)の関係が成立していることはいうまでもない。 46)ただし,舌8≦舌′≦£iをみたすものとする。

(28)

香川大学経済学部 研究年報19 Jタ7タ ーββ− (a)£=feの場合 (b)≠′>£eの場合 図70.境界∂G上に.ある3つの法線ベクトルス(£),Ⅳ(ズ*(£)),およびF♂(ズ*(f)) の関係 に,この場合,修正された変分方程式によって変換された近傍∠(g*(£/))が,点 ,方*(£/),(£′>舌¢)においてその限界面∑と共通の接平面を持ってはいないこと に注意すべきである。しかも,【定理11によって,点ズ*(£′)の近傍∠(ズ*(£′)) に属する点は,すべて限界面∑に関してβ点を持ち得ないことから,3っの 法線ベクトルス(£/),Ⅳ(ズ*(£′)),およびFg(ズ*(ま′))に関して(7.82)の関係 が成立することが確証されるのである。 §4.限定された最大原理と跳躍条件 以上の検討結果にもとづき,本節では,最適トラジェクトリ・−r*が境界 ∂G上にある場合の最大原理の導出を試み,さらに,この最適トラジェクトリ・− r*が境界∂Gに入る点ズ*(£e)および境界∂Gから出る点ズ*(£;)において, どのようなことが生ずるかを検討することに・しよう。 まず最初に,限定された制御変数の集合Qの定義を想起してみよう。すでに 述べたように,われわれほ,このQを(7・11)と(7・32)の条件が同時にみた されるものとして定義した結果,それほ,(7.11)によってのみ規定されるぴ の部分集合となっている4−7)。とくに,この限定された制御変数の集合畠に属 47)すなわち,0⊂Uを意味するものである。

(29)

最適制御理論について ーβクー するすべての制御祝に対して,つぎの関係 アg(Ⅹ*(£))・′(ズ嘗(舌),祉)=0,∀祝∈Q (7・116) が成立することに注意しよう。その結果,前節で明らかにした【補助定理7】の (7.82)によって,(7.116)ほっ つぎのように・専き換えられる。 ス(の・′(ズ*(£),従)=Ⅳ(ズ*(£))・′(g*(の,祝),∀祝∈Q,∀は【fe,fェ】 (7.117) さらに.また,点gから出発して制御祝によって形成されるトラジヱ.クトリ −・の方向′(考ル)および点∬に.おいてアユ(ズ)に垂直でしかも領域β/∑に 向かう単位法線ベクトル彿(g)ほ,)グ∩∑上の点Ⅹに関して連続関数であ ることから,すでに.導出した【補助定理4]および【定理2]の内容は,ここで対 象とする点g*(f)∈∂Gに対しても同様に成立することになる。したがって, その前者−すなわち,【補助定理4】の内容…は,この場合 Ⅳ(ズ*(£))・′(Ⅹ*(の,祝)≦0,∀祝∈打 (7・118) を意味するものとなりヰ8),また,その後老−−すなわち,【定理2】の内容− は,この場合 Ⅳ(茸*(豪))・′(Ⅹ*(り,祝*(£))=0 (7・119) を意味するものとなる49〉。その結果,(7・117)を用いて,さらにこの両者の関 係を書き換えれば,結局,つぎのようになる。 ス(£)・∫(ズ*(舌),祝)≦0,∀祝∈Q (7・120) および ス(f)・′(ズ*(£),γ*(り)=0 (7・121) しかし,限界面∑の正則な内点において成立した【補助定理41および【定 理2】の内容を,この場合の結果−すなわち,(7・120)および(7・121)− と比較すれは,つぎの重要な違いのあることがわかる。 1小 随伴方程式の変更 【補助定理4】および[定理2】の内容をともに含む(3・89)における法線ベ クトルス(£)は,(3.85)によって規定される随伴方程式の解であるのに対し て,(7.120)および(7.121)における法線ベクトルス(のは,(7・72)のよう 48)(3.37),参照。 49)(341)または(3い42),参照。

(30)

香川大学経済学部 研究年報19 ー 70 岬 J97タ に修正された随伴方程式の解である。 2.制御領域の限定 限界面∑の正則な内点において成立した(3.89)では,制御〝が,状態変 数ズとは無関係に与えられる制御領域打に含まれているのに対して,(7. 120)および(7.121)でほ,制御〟が,(7.11)と(7.32)の条件をともにみた す限定された制御変数の集合畠に.含まれている。 とくに,この第2の点を考慮して,これまでの検討結果を要約するつぎの定

理を,限定された最大原理(RestrictedMaximumPrinciple)とよぶことに

しよう。 【定理5】 耽*(≠),(亡0≦£≦fl)を,タイプ3の問題50)に.おける最適制御,ズ*(f), (舌0≦£≦≠1)を,対応する最適トラジェクトリ・−・r*上の点とし,さらに, すべてのは【£e,り,(舌。≦£e<£【≦£1)においてズ*(舌)∈∂Gをみたすもの とする。このとき,つぎの条件をみたすゼロ(ベクトル)でない連続なべ クトル関数ス(£),(≠8≦孟≦£‘)が存在する。 (a)(i)ん(£)=定数≦0,(≠¢≦舌≦舌エ) (7.122) (ii)(ん(り,ス2(り,…り,ス花(の),(≠¢≦£≦豪£)は,つぎの方程式の解であ る51)。 =−ス ∂′(.ち祉) … (7・123) ∂ズ ただし, R仝(ア(ズ,祝),≠1(〟),¢2(祝),…,¢い(祝)) =(Fg(孝)・′(ろ祝),¢1(祝),≠2(祝),…,≠↓′(祝)) (7・124) (器) ̄1 ∼げ(考〝) y仝ス ∂祝¢ を,それぞれ表わすものとする。 (b)月てズ*(舌),祝*(≠),ス(り)=Max月てズ*(£),〝,ス(舌)) u∈β 50)ただし,制御制約が(7いI6),状態制約が(7・17)に・よって与えられた狭義の問題 をさしている。 51)(7.123)の特別な場合として,(7り72)を用いることもできる。また,(7.124)ほ, (7亜)に対応し,さらに,(7‖125)は,(768)に対応することに.注意せよ。

(31)

最適制御理論について ただし,

†l .首(孝,〟,ス)仝ス・′(g,祝)=∑ん差(ズ,祝)

t=○ − 7J− (7・127) を表わすものとする。 (c)ガ(Ⅹ*(≠),㍑*(f),ス(り)=0 (7.128) この【定理5】の条件(b)および(c)ほ,(7・120)および(7・121)から直ちに.導 かれる。また,条件(a)の(i)ほ,(7・81)の関係が成立する結果であり,その (ii)ほ,近傍』(ズ*(f¢))の移動が許容制御によって行われるべく修正された随 伴方程式(7小69)の結果であることに・留意すべきである。 とくに,この[定理5】ほ,境界∂G上にある最適トラジヱ.クトリーr*の部 分がみたすべき必要条件を与えているということに注意する必要がある 。しか し,−−・般に閉領域G内にある最適トラジ.ェクトリ・−・r*のある部分ほ,領域 Gの境界∂G上に.あり,またそのある部分は,領域Gの内部にあると考え.ら れる。そこで,このような場合に一意的な最適トラジェクトリー・r*を決めよ うとすれば,−・方ほ領域Gの境界上にあり,他方はその内部にあるような最 適トラジェクトリーのたカきいに接合している2つの部分がみたすべき条件を吟 味する必要がある。かかる兵庫をベクトル関数ス(りに関する跳躍条件(Jump COndition)とよび,最後に,この条件を吟味することに・しよう52)。 まず,最適トラジェクトリ・−r*が境界∂Gに入る点ズ*(とβ)に注目しよう。 いま,時刻≠e>¢0とし,(≠¢・−0)に.よってぉの左極限値を表わすものとすれ は,ズ*(f¢−0)は,領域Gの内点となり58),したがって,また,われわれの 仮定により,限界面∑の正則な内点となる。そこで, ス(£¢−0)=jV(ズ*(才¢)),fg>≠○ (7.129) をみたすように・随伴ベクトルス(£8−0)を選ぶことにすれほ,(7・79)に・よって, ス(£¢−0)=ス(£¢) (7.130) の関係を得る。このことは,随伴ベクトノ「ス(£)が,境界∂Gに入る点ズ*(£e) において連続であることを意味するものである。 52)この点の詳細については,ボントリャ・−ギン他(関取智明訳)打殺適過程の数学的 理論』,総合図書,(1967)の§36を参照せよ。 53)ズ*(t‘−0)=1imズ*(£e+£)を意味するものである。

(32)

香川大学経済学部 研究年報19 − 72 − Jタ7タ つぎに,最適トラジェ.クトリ・−r*が境界∂Gから出る点ズ*(£【)に注目し よう。まえと同様に,時刻££<舌1とし,(古エ+0)に・よ、つて£lの右極限値を表わ すものとすれば,ズ*(い0)は,限界面∑ゐ正則な内点となっている54)。そ こで, ス(f£+0)=Ⅳ(ズ*(£‡)),ち<£1 (7.131) をみたすように随伴ベクトルス(亡エ+0)を選ぶことに.すれば,すでに.導出した 【補助定理7】の(7.82)によって, ス(ち+0)=ス(舌↓)−〃(£Ⅰ)Fダ(ズ*仏)) (7.132) の関係を得る。このことほ,随伴ベクトルス(£)が,境界∂Gから出る点ズ*(££) において不連続であることを意味するものである。したがって,−・般に.最適ト ラジェクトリ・−・r*が境界∂Gから出る点において生ずる随伴ベクトル関数 ス(£)の不連続性は,[補助定理7]によ、つて明らかにした3っの法線ベクトル ス(右),Ⅳ(ズ*(£)),およびFg(ヱア(≠))の関係−すなわち,(7.82)一によ って明らかにされるのである。 §5.最大原理の導出 前節に・おいて,われわれほ,境界∂G上にある最適トラジェクトリーr*の 部分−すなわち,g*(≠)∈∂G,(£¢≦£≦£−)−がみたすべき必要条件を,限 定された最大原理とよび,その内容を,【定理5】として要約した。しかし,す でに指摘したとおり,閉領域G内にある最適トラジェクトリー・r*は,その 1部を領域Gの内部にもつこともあり得るのである。このような問題に.対し て最適トラジェクトリ・−r*を求めようとすれば,その与えられた具体的状況 をつぎの2っの場合に分けて考察する必要がある。・まず,その第1は,境界 ∂G上にある最適トラジェクトリ・−・r*の部分−すなわち,ズ*(の,(舌¢≦≠≦とェ) −を【定理5】によって導出することである。つぎに,その第2の課題ほ, 境界∂G上からほなれている最適トラジェクトリ・−r*の部分−すなわち, ズ嘗(舌),(≠0≦舌<£e,舌エ<≠≦fl)−を導出することである。いうまでもなく, この後者の場合には,点ズ*(£),(孟0≦≠<≠e,£る<≠≦£1)がつねに限界面∑の 正則な内点であることから,タイプ1の問題に対する最大原理.−すなわち, 54)ズ*(£‘十0)=1imズ*(£【+£)を意味するものである。

(33)

最適制御理論について − 7♂− r定理3】−・またほ,タイプ2の問題に.対する最大原理−すなわち,【定理4】 −せ適用することが可能となる。しかし,このように,最適トラジェ.クトリ

ーr*の1部が領域Gの内部にあり,また,他の1部がその境界∂G上にある

ような場合に.ほ,その両者が接合する条件を吟味することが必要となる。なぜ なら,最適トラジェ.クトリく−r*が,ある部分から他の部分へ移るところで, ベクトル関数ス(£)が不連続になり得るからである。したがって,この跳躍条 件は,点ズ*(f)が境界上にある場合の最大原理と,点g*(£)が境界上からほ なれている場合の最大原理を結び、つける役割をになっていることが明らかとな る。図71は,かかる状況を例示したものである。  ̄ ̄ ̄ ̄ ̄− ̄ ̄ ̄ ̄ ̄‖ ̄ ̄ ̄ ̄ /一 ̄ ̄ 二 ̄ ズ■*上土‘)r*(t‘<t≦tl) r*(te≦t≦tJ r*(t。≦tくte) Ⅹ(t。)

\W

入(t。−−0)ニ入(t。) A(tl+0)=入(tLトJL(tl)Vg(X*(tL)) − ■ l …= − 図71.最適トラジェクトリーr*の区分と跳躍条件 以上によって明らかなように,状態制約のある−・般的な最適制御問題に対し て,まず2つの異なった最大原理−すなわち,【定理5】と,【定理3】または 【定理4】のいずれか−・万一を適用し,つぎにその両名の関係を跳躍条件− すなわち,(7。130)および(7.132)一によって接合すれば,当該問題の最適 トラジェクトリ・−r*を一・患的に導出することが論理的には可能である。しか し,かかる手順を用いて実際問題を解明しようとすれば,きわめて煩雑で,し かも困難を伴なうことはいうまでもない。そこで,本節では,叙上の解明手順

(34)

香川大学経済学部 研究年醜19 ーー 74 − Jタ7β を−・括し■た,より−「般的な最大原理の導出を試みることに.しよう。 そのためには,修正された随伴方程式(7.72)がもつ重要な性質に.言及して おく必要がある。その性質とは(7・72)右辺のソ0が,すべての£∈【亡8,㍍=こ対し て,【補助定理7】における(7・82)の右辺の係数〃(≠)と等しくなる,という関 係である。すなわち, γ0(り=〝(り,も≦£≦≠£ (7.133) の関係が成立することを意味するものである。したが・つて,つぎに,この関係 を検証することに.しよう。 こ.こで,まず,われわれは,(7・118)および(7.119)の条件式と制御変数の 集合打の定義式(7・16)によって,Ⅳ(鳶?(≠))・′(ズ*(£),な)が,(7.16)の制 約をみたすすべての制御〟に関して,W=祝*(£)のときその最大値をとる,と 主張したことを想起する必要がある。ただし,この祝*(舌)は,、(7.26)の関係 をみたす制御であるものとする。そこで;かかる主張に対して周知の未定乗数 法を適用すれば,つぎのように述べることができる。すなわち,孔′/∂祝を, ズ=ズ*(f)およびw=祝*(と)において評価した,つぎの行列関数 皇!1、ウム ‥ バノも

一触妨

﹁.■−■﹂

∂祝1 ∂祝2 聖二L jム ∂祝1 ∂%2 _・吐− ∂祝= ⋮好 (7.134)

紬 ∵畿

戸.亡 . ∂髄1 ∂≠2 によって定義するとき,つぎの関係 dリ=1 £I ∑みαF祝以祝*(≠))=Ⅳ(鞘))意 をみたす,−・意のゼロでないベクトル み=(あ1,むゎ…,あ【・) (7.135) (7.136) が存在する,と。 また,これと同じように,周知の未定乗数法を(7・120)および(7.121)に対 して適用すれば,つぎの関係を得る。すなわち,

参照

関連したドキュメント

成される観念であり,デカルトは感覚を最初に排除していたために,神の観念が外来的観

日頃から製造室内で行っていることを一般衛生管理計画 ①~⑩と重点 管理計画

[Nitanda&Suzuki: Fast Convergence Rates of Averaged Stochastic Gradient Descent under Neural Tangent Kernel Regime,

これは基礎論的研究に端を発しつつ、計算機科学寄りの論理学の中で発展してきたもので ある。広義の構成主義者は、哲学思想や基礎論的な立場に縛られず、それどころかいわゆ

Optimal stochastic approximation algorithms for strongly convex stochastic composite optimization I: A generic algorithmic framework.. SIAM Journal on Optimization,

 食品事業では、「収益認識に関する会計基準」等の適用に伴い、代理人として行われる取引について売上高を純

 

父親が入会されることも多くなっています。月に 1 回の頻度で、交流会を SEED テラスに