• 検索結果がありません。

最適制御理論について--経済・地域・都市計画の基礎理論として---香川大学学術情報リポジトリ

N/A
N/A
Protected

Academic year: 2021

シェア "最適制御理論について--経済・地域・都市計画の基礎理論として---香川大学学術情報リポジトリ"

Copied!
116
0
0

読み込み中.... (全文を見る)

全文

(1)

最適制御理論について1)

−…・経済・地域・都市計画の基礎理論として “

井 原 健 雄 Ⅰ.はじめ紅ⅠⅠ.最適制御問題の提起と定式化による分類ⅠⅠⅠ.タイプ 1の問題に対する最大原理ⅠⅤ.タイプ1の問題の応用Ⅴ.タイプ2の 問題に対する最大原理 ⅤⅠ.タイプ 2の問題の応用ⅤⅠⅠ.タイプ3の 問題に.対する最大原理ⅤⅠⅠⅠ.タイプ3の問題の応用ⅠⅩ.結び紅代えて I 1950年代の後半軋,ソビエトの数学者ボントリヤー・ギン,ポルチャンスキ ー,ガムクレリーゼ,ミレチエンコ等に・よって開拓された「最適制御理論」2) は,当初,工学的な物理過程(たとえば,月ロケットの誘導や,自動制御系の 設計など)にもっぱら応用されたものであった。しかし,その理論は,内容の 斬新さと広範な応用能力に・よって,さらに社会科学(とくに,経済・地域・都 市計画など)の分野にまで,数多くの応用例をみるに至っている。8) あるシステムの動的過程に.注目し,最適化問題を解く手法として,従来「変 分法」や「ダイナミック・プログラミング法.」が,よく用いられた。しかし, 古典的な変分法は,不等式体系を制約条件としてもつ,より−・般的な制御問題 1)筆者は,昭和49年度および50年度に,京都大学に於いて開講された,藤田昌久氏担 当の特別実験及び演習課目,「地域・都市計画法」を聴講する機会を得た。本稿は, そのときに得た貴患な経験をもとに.して,まとめあげたものである。同氏に対し,こ こ.紅記して謝意を表明したい。また,阿部文雄氏からほ,有益な助言を頂き,種本章 子さんに.は,清書の労を煩わした。合わせて,お礼を申し上げたい。 2)最適制御理論誕生の基礎となったのは,ソ連科学アカデミ・一会員レフ・セメノピッ チ・ボントリヤ−ギンを指導者とする数学者のグル−プによって,1956−61年紅成さ れた一・連の研究成果である。〔A〕8,参照。しかし,アメリカでも,ノイスクット, ヲサ−ルや,ベルマンを中心とする数学者たちに.よって,これに関係する藍要な成果 が得られている。また,フェリドバクムの研究成果もとくに.重要であり,彼はこの分 野の開拓者の1人に当然加えて然るべきであろう。 3)本稿の疲後に掲載している参考文献−これは,藤田昌久氏紅負う一参照。

(2)

香川大学経済学部 研究年報15 ユタ75 ・−J22− をその射程外に.おいている。したがって,オイラー・ラグランジュ方程式によ って解決し得る問題領域は,著しく限定されたものとなっている。4)また,ダ イナミック・プログラミ.ング法ほ,汎関数の連続微分可能性という強い仮定の もとで,その汎関数に㈲する偏微分方程式(すなわち,ベルマン方程式)を導 出する。しかし,この仮定は.,最も簡単な最適制御問題に.おいても,通常,み たされて∵いないから,実際,ダイナミック・プログラミング法を用いるこ・と ほ,根拠のないこととなる。したがって,ベルマンの考え方は,数学的な解と いうよりも,むしろ,探索の手段を与えるものと解すべきであろう。5) かくして,われわれの課題は,古典的な変分法に.比して,より一・般的な制御 制約のある問題をも処理し得て,しかもまた,ダイナミック・プログラミング 法に.比して,より厳密な論理的根拠をもち得る最適化の手法を考察することに なる。すなわち「■最適制御の立場から,より−・般的な最適化問題を,より厳密 に考えること」が,本稿の目的である。けだし,最大原理を用いるこ.とによっ

て,最適制御のみたすぺき必要条件が,数学的に明らかにされ,また,そのこ

とに.よって,遠大な構想をもって開拓された最大原理の理解を深めることにも なるからである。 ⅠⅠ この章で,明らかに.されることは,つぎのとおりである。まず,われわれ は,対象とする制御問題の一・般的性質と仮定を明らか紅する。ついで,状態空 間を拡張し,その空間内に‥おいて,最適トラ汐ェクトリ−を定義する。これら の−・般的考察をもとにして,システムの動的過程が,常微分方程式紅よ.って表 わされ,しかもまた,最適性の評価基準が積分形で表わされている場合に,考 察を限定サーる。そしで,最後に,最適制御問題の一・般的定式化と,制御制約の 差異に.もとづく,当該問題の分類が試みられる。 4)G.Hadley&M.C.Kemp;VariationalMethodsin Economics,North−・Ho− 11and,(1971),pp。238−279。変分法と最大原理との関連紅ついては,〔A〕1,pp.92 −95,〔A〕3,pp.186−192,〔A〕8,pp.250−267,などを参照。

5)R.Bellman;Dynamic Programming,Princeton University Press,(1957).

ダイナミック・プログラミソグ法と最大原理との関連については,〔A〕4,pp.17− 22,pp.209−250,〔A〕8,pp.70−74,などを参照。

(3)

最適制御理論について ーヱ2β− §1.問題の提起と仮定 いま,有限個の実変数肌,.方2,…,.方殉によって特性づけられる,あるシステ ムを考えることに.しよう。各実変数.ガ慮(去■=1,2,…,乃)が,時刻才の関数であ るとすれば,¢)任意の時刻fに.おけるこれらの変数の値は,その時刻濫.おける システムの状態を規定することになる。そこで,このレステムの状態を,〝次 元・ユ・−クリッド空間β苑内の点∬=(.方1,.方2,…,.方飽)と考えれば,この点の集 合によってつくられる空間を状態空間とよぶことができる。7) つぎに,こ.の状態の時間的な経過の過程ほ,あらかじめ決められた−・群の法 則のうちのひとつによって支配されるものと想定しよう。たとえば,それが常 微分方程式に.よって完全に表わされる場合もあれば,偏微分方程式によらなけ れば,表現し得ない場合もあろう。8)あるいは,また,そのような連続型では なく,差分方程式といった離散型によって規定される場合もあるであろう。9) ここでは,さしあたり,この一・群の法則(n)が,どのようなものである かを限定する必要はない。しかし,留意すべき点は,ある法則(γ)がきまれ ば,それに.応じて−,システムの状態が,状態空間内で径路(♪)に沿って動く, という関係である。そこで,この関係を明示的に表わせば,つぎのように.な る。 ♪=r(ダ), γ∈n (2.1) つまり,あらかじめ決められた−・群の法則(Q)のうち,そのいずれか1つ (γ)を選べば,それに・対応して,システムの状態の変化の態様が,状態空間 内における径路(♪)として体現するということである。 6)いうまでもなく,実変数.鵜を説明する変数として,時刻gに.限定する必要はない。 問題の状況に応じて,たとえば,都心からの距離とか,人口密度を取り上げても,何 ら−・般性を失なわない。 7)「相空間」とよはれることもある。 8)たと.えば,状態の説明変数として,時刻′のみを取り上げれは,常微分方程式に.よ ってレステムの挙動が支配されるが,さら紅,都心からの距離♂を同時に.考慮すれ ば,偏微分方程式に依存せぎるを得なくなるであろう。本稿では,順次,常微分方程 式によって挙動が支配されるシステムに,議論を絞ってゆくこと紅する。 9)離散塾の最大原理についてほ,〔B〕1,〔B〕2,などを参照。

(4)

香川大学経済学部 研究年報15 ユタ75 ・−J24−

つぎに,この径路に.注目しよう。いま,システムを時刻ヂ電において,ある

与えられた状態ズ(fo)=ズ0から,もうひとつの与えられた状態の集合β1内の

任意の1点へ,有限時間内で移す問題を考えてみよう。その場合,あらかじめ

決められた法則のなか紅は,当該システムを,状態ズ0から,状態ズ1∈針へ

移す法則もあれば,状態烹1年β1でおわる径路を生ぜしめる法則もあり得る。

そこで,この径路を図示すれば,つぎのように・なる。 図1.状態空間(Eり内の径路

つまり,あるシステムの状態をgOからズ1へ,あるいは,またズ0から

芽1へ移動させるのに.は,そのいずれを問わず,ある法則(r,〆)と,それに 対応する各径路(♪,〆)が関係する。 そこで,これらの数ある法則について−,何らかの形で評価をする必要が生じ

てこよう。そのために,われわれは,システムの挙動を支配する法則によって

ひき起こされる状態の時間的な推移過程に・,ある実数を一・意的軋対応させる規 則を考えることに.する。この規則,すなわち汎関数を,評価基準とよび,推移 過程に対応してきまる実数を,汎関数の値,あるいはコスト(Cost)とよぶこ とにする。10) すでに述べたとおり,ズ0からズ1へ,あるいは∬0から烹1への移動のコ ストは,法則rと,それに対応する径路♪に関係する。そこで,こ・の法則γに 10)ことでは,説明の便宜上,最短時間問題を考えると・とにする。したがって,汎関数 の値を「コスト」とよぶことが,許されよう。

(5)

最適制御理論について ーヱ25− 対応する評価基準をy(ズ0,ズ′;γ,♪)なる記号によって,明示的に・表わす ことに.しよう。ただし,ズrほ∬(わ・)の略記であり,ここでは,ズ1あるいは 烹ユを具体的紅表わすものとする。11) さて,われわれは,この評価基準に.もとづいて,最適な法則を定義すること ができる。すなわち,いま,法則γ*によって,初期の状態gOから径路♪* をたどって,ある最終状態gl*∈β1へ移され,しかもβ1に達する径路を生ず

る他のすべての法則とくらべて,評価基準の値(すなわち,コスりが最小に

なる,つまり y(gO,∬1*;γ*,♪*)≦γてズ0,gユ;γ,♪) ただし,すべてのγ∈n,gl∈β1 (2.2) が成立するとき,法則γ*を最適であると定義する。 もとより,∬0からβ1への移動は,最適な法則によることもあれば,最適 でない法則紅よつておこることもある。図2は,これを示している。 X¢ 図2‖ 状態空間(Eれ)内の最適径路(p*) そこ.で,便宜上,つぎのよう紅,状態空間に2つの部分集合を考えるこ・とに・ する。12) 1)その点から出発して与えられた最終状態の集合に.到達する径路が存在す るすべての点の集合β,すなわち 11)tfは,最終時刻(Finaltime)のことである。 12)〔A〕3,p.3.

(6)

香川大学経済学部 研究年報15 J975 ・−J26− β仝〈ズ0:g郎ズ0→β1) (2.3) 2)最適な法則に.もとづく径路が存在するすべての点の集合β*,すなわち β*全(∬0:g♪*;∬0−一斗♂り (2.4) そのとき,これら2つの集合は,仝状態空間に−・致することもあるが,−・・般 には,必ずしもそうなるとはかぎらない。18) また,いうまでもなく,初期状態と最終状態の集合に・対して,最適な法則が 1つ以上存在することも,当然あり得る。しかし,叙上の最適性の定義(2.2) から明らかなように,その場合でも,最小コストは一・意的にきまる。そこで, 与えられた最終状態の集合(軒)に対して,最小コストが初期状態(gO)のみ の関数に/なるこ.とを強張して,これを,つぎのように書くことに・する。 l仲(ズ0;β1)全y(∬0,ズ1*;㌢・*,♪*) ただし,すべてのγ* (2.5) さて,ここで,以下の議論−すなわら,最適性の原理一において,とく に重要な意味をもつ,2つの仮定を導入しよう。 まず,その第1は,法則の連結可能性14)とよぶべき仮定である。その内容 は,つぎのとおりである。すなわち,個々の法則把・よって生ずる径路を連結し たものは,それ自体,冬時間区間でこれらの法則に・一・致する1つの法則紅よっ て生ずる径路とみなす仮定である。いま,これを図3に示す,2つの法則紅つ いて考えてみよう。 まず,最初に,法則〆を時刻わからわまで適用することに・よって,システ ムの状態を初期状態ズ0から∬£へ移す場合乾生ずる径路をがとする。つぎ に,もう1つの法則れを時刻foJからわ/まで適用することに・よって,状態を ズiから最終状態ズ/へ移す場合に生ずる径路を動とする。そのとき,最初 の法則〆を時刻んからぁまで適用し,それに引き続いて,法則れを時刻才£ から≠一′(ただし,わ=才せ+≠名J−れJ)まで適用する態則を,連結された法則とみ 13)E*あるいはβが,かと一・致しない場合には,ごれらの集合は,境界を有すると と紅なる。 14)「制御の連結可能性」とよびかえても,その内容ほ不変である。

(7)

最適制御理論に.ついて r ・−J27−

図3い 法則の連結可能 性

なし,さら紅その法則紅よって,初期状態ズ0から最終状態ズrへ移す場合に 生ずる径路を♪(ただし,♪=〆∪か)とみなそうとするものである。15)これ をまとめれば,つぎのように.なる。 些担→ガ,γ£∈n 〆:∬0 ♪宜:ズ£ 壁土塑ヶ∬′, n ∈ ︼r r=rオ(≠0,g宜)∪デ‘(ん 星∬′ =⇒♪=〆∪♪乞:ズ0 γ∈n ただし,わ−れ=(≠豆−わ)+(f名ノーヂ0/) つぎに.,導入される算2の仮定は,評価の加法性である。これは,各法則に 対して与えられる汎関数,すなわち,評価基準の性質紅関する仮定であって, その内容は,つぎのとおりである。ある法則によって生ずる径路上の移動コス ト(すなわち,汎関数の値)は,つねに,加法性の条件をみたすというもので ある。これを,さきにあげた例にそくして考えれば,つぎのようになる。第 15)この場合,f軸紅沿った移動に.よって,法則の性質ほ,不変であると仮定されてい る。この仮足がみたされる場合を,「オ−トノマス系」(Autonomous system)とよ ぶ。〔A〕8,ppい16−18,参照。

(8)

香川大学経済学部 研究年報15 J975 −J2β− 1の仮定は,当該システムについて,状態をgOからgノまで径路♪に・沿っ て移動させる法則γ・が,じつは,ズ0から邸までを径路〆に.沿って移動させ, さらに.∬から∬′までを径路♪電に沿って移動させる各法則を連結したもの と同じであるという帰結をもたらす。ここでの仮定は,それ軋加えて,各径路 (がおよびか)に沿った移動コストの和16)が,全体としてみた径路(♪)の 移動コストにつねに.等しいとみなすこ.とに対応する。したがって,これを一・般 的に示せば,つぎのように.なる。17) y(ズ0,ズ/;γ,♪)=y(ズ0,g官;r,♪り+γ(∬£,ズ/−;γ,♪£) ただし,任意のガ∈♪,♪=〆∪♪名 (2.6) V 図4.評 価 の 加 法 性 16)ここでは,相異なる法則(7乞,γ官)紅ついて,その径路に.対する評価の加法性を考 ているが,逆に,同一・の法則(r)に対して,その時間的分割を試み,各分割ざれた 径路に対する評価の加法性を考える方が,より一・般的であろう。したがって,(2“6) は,評価の加法性についての−・般的な定義式と考えられる。 17)ただし,携y(刀,∬■:γ,♪官)=0を仮定する0

(9)

最適制御理論について ーJ29−− 図4は,この関係を図式化したものである。 ただし,簡単化のため,状態空間且穐を2次元平面で表わし,さら紅1つの 次元(縦軸方向)を加え,その次元に.よって,評価基準の累積値(γ)を表わ すことに.する。そのとき,評価の加法性は,全体の径路♪に属する任意の状 態j㍗について,つねに, γ1+γ2=γ の関係が成立することを意味している。 上記,2つの仮定は,いわゆる「最適性の原理」をみたし18),以下の議論で 対象とする,区分的に連続な導関数をもった常微分方程式によって表わされる 法則19)と積分形の評価基準叫に.対しては,明らかに成立する。 §2.状態空間の拡張とトラジェクトリー・ 前節において,われわれほ,−・般的な状態空間として邦次元の・ユークリッ ド空間(βれ)を考え,さらにその空間内匿おける状態の推移過程に対して評 価基準を導入した。そこで,本節では,その両者を分離することなく,同時に. 考慮するこ.とにより,・その相互関連を明らかにするために,これまでの状態空 間を拡張し,その拡張された空間内に・形成されるある曲線をトラジェクトリー (TI′a.ラectoI・y)として定義しよう。 いま,1つの変数(これを.鴛0とする)21)を測る方向として,新たに1次元 空間(ガ1)をとり,これと〝次元の状態空間(居れ)との直積集合を考えれば, 点ズ=(.ガ0,ズ)=(.方0,.方1,…,一方循)の集合は,(形+1)次元のユークリッド空 間(E佃1)に拡張される。このとき,もとのシステムの状態ズは,拡張され た状態点ズ=(胸,ズ)の状態空間(β花)への射影となる。図5は,こ.の関係 を示している。22) 18)「最適トラクエクトリ−のいかなる部分も,また最適トラジエクトリーである」と いう意味である。〔A〕8,p.18,参照。 19)本章,第3節,参照。 20)本章,算4節,参照。 21)評価基準の値,すなわち,コストを測る変数(y)紅対応する。 22)ただし,図中に示す状態ズ0において,・ガ0の値は,ゼロであると仮定する。

(10)

J975 香川大学経済学部 研究年報15 ーJ∂〃− .X/) 図5小 拡張された状態空間(Eが1) ある与えられた初期状態∬0に.対して,法則グを適用すれば,径路少が形 成されることは,すでに述べたとおりである。そこで径路♪が,初期状態ズ0 と法則γによって一決まることより,これをつぎのように・書くことにする。28) ♪=r(ズ0,γ), γ∈n (2.7) さて,このように拡張された状態空間(β刷)内に∴ねいて,つぎの(2.8) をみたす曲線(r)をトラ汐工クトリ−の定義としよう。 r全ば電:.芳0電+y(ズ㌔.ズ/;れ.如)=C,♪豆⊂♪) (2.8) ただし,♪は法則γに.よって生ずる径路でrの状態空間β花へ の射影である。また,ズ丁ほ.,∬1∈β1あるいは芽1(印1で,Cは ある定数である。 図6は,拡張された状態空間(β佃1)内に∴おける,ある1つのトラジ.ェク トリー・(r)を表わしている。 23)これは,さきの(2..)1とくらべて,径路♪が,初期状態■‰より生ずることを明示 的紅表わしている。

(11)

最適制御理論について 一Jβユー 図6.拡張された状態空間内に.おけるトラクエクトリー すでに.,われわれほ,最適な法則の定義を与えている。24)そこで,この最適 な法則に対応するトラジェクトリーせ,最適トラジェクトリーとよぴ,これを つぎのよう紅定義しよう。すなわち,最適な法則γ■*によって生ずる最適な径 路を♪*とすれば,最適トラ汐エクトリーは,(2.9)に、よって定義されるr* となる。 r*仝〈ズ宜:.方0官+Ⅴ(ズ㌔.ズ1*;7・*,動)=C,動⊂♪*〉 (2.9) この定義に.よれば,最適でない径路♪と最適な径路♪*とが−・致することは あり得るが,最適でないトラジエクトリー・rが最適トラジェクトリーr*に 一・致することはない。また,図6から,つぎのこ.とが明らかになる。すなわ ら,(2.8)右辺のCの値を変化させれば,それに応じて,トラジエクトリー の1径数族が形成され,それらほ,すべて加軸に平行で,状態空間属犯と径 路♪で交わる曲面上に.ならぶことに.なる。図6に示すように,径路♪が,与 えられた最終状態の集合β1内に.含まれるある状態でおわっていれば,その径 路♪に対応するトラジェクトリ−rは,すべて,拡張された状態空間(βか1) 24)(2..2),参照。

(12)

J975 香川大学経済学部 研究年報15 ーJ32− 内に‥おいて,集合針仝β1×〈.方0〉と直線ズ/で交わることに・なる。25)■ただし, 直線ズ′は,状態空間β花とズr=♪∩β1で交わり,.方0軸に・平行な直線を表わ すものとする。 叙上の議論は,(2.9)紅よって定義された最適トラ汐エクトリ−(r*)に ついても,妥当する。 最後に.,このパラメタ・−・(C)の値の決め方について,1つの示唆を与えて おこう。すでに.,仮定した評価の加法性より,状態∬からガまでの移動コ ストは,状態ズまでの移動のコストとは独立であると考え.られる。そこで, 状態ズセ.おける.方0の値を,それ以前の状態からズまで移動させるのに要す るコストと考えることが許されよう。その場合には,さきのCを状態ガへの 移動の総コストと考えることができる。 §3.状態方程式の規定と許容制御 さて,ここで,当該システムの態様を規定する法則を,特定のものに限定し て,考察を進めることにしよう。 いま,状態ズが時刻才の関数として,つぎの常微分方程式をみたサーシステ ムを考えること軋する。

客=・′廟,・方2,…い,・方彿,仇,〝2,…,〝仇),た1,2,・・・,乃

(2.10) ただし,机,〝2,…,玖帆は,制御変数とよばれ,∽次元・ユL−クリ ッド空間(βm)内に点〟をきめるものとする。 (2.10)は,状態ズの時間的推移過程を明らかに・している意味において, 状態方程式呵とよぶことができる。そして,ベクトル〟は,われわれが,制御 (Contr01)し得るという意味で,御制ベクトル,あるいは,制御とよぶことに する。

25)伊仝β1×(.方0)ほ,伊が♂1と〈・方0〉 との直積集合として定義されるという意味であ

り,幾何学的にほ,β1上で∬0軸紅平行につくられる仙ScI・een,’を表わすこと紅な る。 26)「運動方程式」とよばれることもある。たとえば,〔A〕4,pp8−11,参周。

(13)

最適制御理論に.ついて ・−・Jββ−

そこ.で,この制御について,さらに説明を補足することにしよう。まず,その

算1は,制御領域という概念である。−・般に,制御変数仇,〝2,…,‰朋,点

〟=(仇,〝2,…,〝m)が,あらかじめ与えられた椚次元空間内の集合び紅属

する値のみを各時刻(才)にとる,時刻≠の関数と考えられる。言い換えれば,

任意の時刻≠に対して,封(≠)∈ぴをみたす制御Ⅶ(才)だけを考えればよいこ・と

になる。・そこ.で,との集合びを,制御領域とよび,わわれわれが以下で考察

の対象とする数学的な定義のなかに.含めることにする。27)すなわち,あるシ

ステムを数学的にとらえるため紅は,すでに述べた状態方程式(2.10)に・加え

て,制御領域(ぴ)を,ともに指定しなければならないものと考えるわけであ

る。

っぎに.,ここでの制御(〟)と,すでに与えた法則(γ)との関連について言

及しよう。そのために,いま制御領域びに属する制御〟を,ある時間的な閉区

間〔わ,行〕に.わたって,時刻≠の関数として与えてみよう。そのとき,

〟=〟(わ,わ≦才≦才1 (2.11)

として,αの値が求められる。そこで,この求められたαの値を,さきの状態

方程式(2.10)右辺の〝1,〝2,…,〝肌に代入すれば,状態方程式(2.10)は,

時刻fと状態変数.方1,.方2,・・u,∬花のみの関数として.与えられる。すなわち,

g′(ズニわ≦≧差(ち〟(わ) (2.12) と定義すれば,(2.10)は,

一審一=gプ(旦→),≠0≦優1,・何,2・…,兜

(2・13)

として表わされることになる。したがって,制御αを,ある区間〔fo,行〕に

わたって,時刻才の関数として与えることは,その区間におけるシステムの動

的な態様を支配する法則をきめるととと同じことになる。 27)制御領域びは,多少なりとも,幾何学的な特徴をもつ。なぜなら,対象とする制 御部分の構造に.よって−は,制御変数鋸1,〝2,…,彷机の間に.,◎(〝1,〝2,…αm)=0なる等 式関係が成立することもあれば,野て〝1,〝2,l…〟m)≦0で表わされる不等式関係が成立 することもあり得るからである。

(14)

香川大学経済学部 研究年報15 J975 −ヱβぜ− 最後に.,制御の特性として与えられる,きわめて重要な仮定を明らかにして おこう。そ・れは,われわれが,以下に・おいて考察の対象とする制御を,つねに 連続的なものに限る必要はなく,さらに条件をゆるめて,任意の区分的に連続 な制御であってもよいとする仮定である。すなわち,有限個の連続な部分から なる制御であっても許容されるわけである。 このような制御ほ,われわれの理論を実際に・応用する場合,とくに重要な意 味をもつ。そこで,この仮定を,より正確に述べでおこう。すなわち,制御領 域び内に.値をもつ関数α(才)は,第1種の不連続を示す有限個の時刻だけを除 けば,考えているすべての‖こ対して\連続であるとき,区分的に連続であると いう。ただし,算1種の不連続とは,各不連続点Tで有限な左極限と右極限 (2.14) 〟(r・−0)=lim〟(わ 8・・→て 乙<r 〝(T+0)=limα(才) ‘・・→て 〔>r (2.15) が存在することを意味する。28) 図7は,区分的紅連続な制御の例を示している。すなわち,時刻Tlと丁2で, 制御〝(≠)は,不連続となっている。 しかし,これらの不連続点における値は,以下の議論でなんら本質的な役割 を果すものではない。ただ,そのような場合でも,制御〟(f)が,才の全区間 −すなわち〔fo,れ〕の全体−で定義されていることを保証するために, 各不連続点の植を,便宜上,つぎのように定義しておこう。すなわち,才=丁官 で制御α(f)が不連続であるとき, 〟(丁乞)=〝(丁宜+0) (2.16) と定義する。29)さらに,α(f)は,与えられた区間の両端,すなわち,才=foと 訪)〔A〕4,pp.14−15,参照。 29)不連続点丁乞における制御〟(≠)の値を,必ずしも右極限の値に等しぐする必要は ない。たとえば,左極限の値〟(f)=〟(丁£−・0)で定義しているものとして,〔A〕3, p.14がある。

(15)

最適制御理論について ーJβ∂− 図7‖ 区分的に.連続な制御 才=わに‥おいて−も連続であると仮定する。いうまでもなく,こ.れらの仮定は, さきの状態方程式(2.10)の解に・は,なんらの影響をも及ばさない。したがっ で,われわれは,制御儀域ひに属し,かつまた,そ・れが所与の区間〔才0,り の両端で連続であるすべての区分的に連続な関数〝(才)を,許容制御(Admis− sible control)とよぶことにする。

でほ,なにゆえに,われわれが制御を考える場合,それを連続的なもののみ

に限定せず,区分的に連続的なものをも含めて考える必要があるのであろう か。それは,最適制御が原則として不連続なものだからである 。30)たとえば, いま,図8に.2つの半直線,すなわち,実線部で示される不連続関数が最適制 御であると仮定しよう。 この場合,その不連続な関数を“なめらか”にすることにより,この関数を 近似する連続な関数,すなわち,点線部分を得ることは,できるであろう。しか し,それよりも,さらに一層急な勾配をもつ連続関数を選ぶことができ,その 30)すなわち,瞬間的な跳躍での切換え(Switch)をもつのが一般的だからである。

(16)

J,975 香川大学経済学部 研究年報15 u(t) ・−J∂6− 0 ′l ′J ′I ′▲ ■ ′ ′ ー′ ノ l −・・・・・+ 〉 t 図8.不連続制御と連続制御 方が,最適制御に.一・層近くなる。それゆえ,“なめらか”な部分で不連続部分 を近似する連続関数のなかに.は,最適制御が存在しないことに.なる。 要するに,区分的に連続な制御を考える利点は,算1紅,最適制御問題の十 分広範囲な実例紅対して,数学的に正確な解を与え得ること,第2に.,技術的 に.そ・れを実現するうえで,十分に明瞭,かつ便利であることに求められる。31) §4.騎分形の評価基準 前節では,システムの動的過程を規定する法則を,常微分方程式という特定 の枠組を設定することに.よって1限定的に.考察した。それに引き続いて,本節 では,システムの動的過程に.,あるコストを結びつける規則(すなわち,汎関 数)についても,やはりこれを特定化することに.して,限定的考察を加えるこ とにしよう。 われわれの状態方程式は,(2.10)に示す1階の連立常微分方程式に.よって, 31)〔A〕4,p.16,参鷹。

(17)

最適制御理論について −ヱβ7− 完全に記述し得るものと仮定した。これを,ベクトル表示すれば,つぎのよう iこなる。

認=./7(ズ(f),〟(机 ノ=1,2,‥・1・,〝

(2・17) その場合,〟(g),わ≦才≦flは,システムの状態を,与えられた初期状態 ズ(才0)=ズ0から,与えられた最終状態の集合β1内の点g(わ)=ズ1∈β1へ,ある

いは,その他の状態ズ(り=茸1年♂1へ移す制御であると考える。

そこで,こ.の常微分方程式(2.17)に.よって表わされるシステムの動的過程 紅対応する1つの評価基準(汎関数)として,つぎの積分形で表わされるもの を,以下で取り扱うことにする。82) (2・18)

y(ズ0,ズ1;ダ,♪)=伊(ズ(γ),〟(丁))dT

こ.の考え方を,さらに.敷街すれば,あるシステムについて,任意の状態 ∬(≠1)へ移動させるときの汎関数の値(すなわち,コスト)は,

Ⅴ(ガ,ガ;γ,少名)=,J;ゾ。(g(丁)・α(丁))dT

として,与えられる。 そこで,いま,変数.机を,次式に.よって定義する。

・方0(わり:1・′0(ズ(T),α(丁))dT=C

ただし,Cは定数パラメタ−である。38) (2.19) (2.20) その結果,(2.20)より,われわれは,つぎの微分方程式を得ることができ, これを,さきの状態方程式(2.17)と一・括して,取り扱うことが可能となる。 32)いうまでもなく,ノも(ズ(丁),α(T))ほ,丁に関して横分可能性の条件をみたす,ある 所与の関数である。 33)本章,第2節の図6,参照。

(18)

∫975■ 香川大学経済学部 研究年報15 −Jβg− 一=ノ0(∬(f),〟(f)) (2.21) さて,ここで,状態方程式(2.17)の解の性質に.ついて,検討しておこう。 そのために,まず,われわれは,(2.17)に関して,関数メーク(考〟),および, a/:タ(考加)/∂.方g,(f,ブ=1,2,・…,乃)がβ氾+勒内で定義され,叫かつ連続であ ると仮定する。そのとき,許容制御の関数$5)α(f),fo≦才≦≠1と,f=才0に・おける 初期条件ズ(れ)=gOが与えられると,(2.17)の解が山意的にきまる−すな わち,≠の閉区間〔れ,行〕に.わたって,当該システムのたどる径路が決定さ れる−場合がある。ただし,その場合,この径路がすべてのは〔ね,れ〕鱒 ついて定義される必要がある。 つぎに,との点を補足しておこ.う。われわれの考察する許容制御祝(f)は, 区分的に連続である仮定をみたしている。そこで,こ.の関数〝1(わ,〝2(才),, 鋸耽(わの少なくともどれか1つが不連続となるfの値を,Tl,丁2,,Tたとしよ う。そのとき,この制御関数〝(′)が,状態方程式(2.17)の右辺に・代入さ れたものとして,この乃次元連立常微分方程式に.ついて,不等式れ≦f≦Tlを みたす=町対応する状態変数ズ(f)の値を,考えることに.する。関数〟(f)は, れ≦才≦Tlで連続であるから,関数ノ■グ揉〟)および,その偏導関数∂ノニプ(考 α)/∂.方£は変数考 才のすぺてについて連続である。したがって,≠0≦才<Tlの とき,(2.17)に.対して−,「微分方程式系の解の存在と一・意性に関する定理」36) が適用され,区間わ≦才<丁(ただし,丁<Tl)に.対して,初期条件∬(≠0)=ガ をみたす解,∬(f)=(一方1(≠),.方2(才),…,.方乃(′))が−・意的に・定義されることに なる。しかし,その場合でも,解g(f)を,区間fo≦f≦Tl全体に.延長できる とほ必ずしもかぎらない。なぜなら,与えられる問題の状況によっては,その 解がTlよりも小さい=こ対して,無限大に発散してしまう場合もあり得るか らである。(図9,参照) そこで, この解ズ(わが,区間≠0≦才≦Tl全体で定義され,有限個の確定し 34)−▲般紅,状態空間をj㌍,制御領域をβmと想定しているためである。 35)本章,第3節で与えた許容制御の定義,参照。 36)Ⅲ章,第3節,参照。

(19)

−ヱβ9− 最適制御理論について た極限値 (2.22) ∬(Tl)仝1imズ(≠) ‘→rl

が存在すると仮定しよう◇そうすれば,解ズ(わは,区周れ≦才≦Tl全体で定

\ 義され,しかもその区間全体で連続となる○(図10,参照)

図10..解Ⅹ(t)が区間≠0≦t≦Tlで定義される場合

(20)

J975 香川大学経済学部 研究年報15 ーヱ4クー・ つぎに,こ.の有限確定値∬(Tl)を初期値として−,常微分方程式(2.17)を, 区間Tl≦f<丁2で考える。もとより,こ.の場合に.も,叙上の「常微分方程式に 関する解の存在と−・悪性」の定理が適用され,ある区間Tl≦f<丁/(ただし, でJ≦丁2)内で初期値∬(れ)をもつ解が定義される。3りこのとき得られる解∬(才) は,f=で1でも連続となり,したがって,それが定義されるすべての区間≠0≦ ヂ<TJで連続となる。図11は.,そ・れを例示している。 × 図11。.制御n(t)に対応する解Ⅹ(t)の接続 こ.こでも,また,その解ズ(わが,区間ヂ0≦才≦丁2全体で定義され,才をT2 に近づけたとき,一その極限値として, ズ(丁2)全1im∬(わ £一丁2 (2.23)

が存在すると仮定すれば,そのとき得られる解ズ(のは,区間≠0≦≠≦r2全

体で定義され,また連続となる。以下,同様の手順を経て,(2・17)の解を,

37)このことは,区間・rl≦チ<丁2に・おいて,制御関数〟(≠)が,〃(Tl)全比(Tl+0)紅よ って,連続であることから可能となる。(2い16),参照。

(21)

最適制御理論に.ついて ーJ尋ヱ− ヂ0≦f≦glの全区間紅あたって延長することが可能となる。このよう犯して, 構成される関数ズ(わを,われわれは,初期条件∬(≠0)=ズ0での,制御〟(才) に対応する(2.17)の解とよぷこ.とに.する。したがって,新郷α(わぬ蘭応す る,初期条件ズ(わ)=∬0をみたす常微分方程式(2.17)の解が,区間≠0≦≠≦ flの全体で定義され,時刻flにズ(fl)=ズ1を通る88)ならば,許容制御〟(f), (わ≦≠≦わ)が,システムの状態を初期状態ズ0からズ1へ(状態方程式(2.17) によって)移すとよぶことにする。89) 図12は,α(f)に艮寸応する解∬(わの構成の仕方を例示して1、る。 X 図12..制御u(t)に対応する解Ⅹ(t)の構成 つぎに,積分形の評価基準より導出される微分方程式(2.21)を,(2.17) と同じ枠組のなか払おいて,それらを同時に考察することにしよう。方程式 (2.21)および,(2.17)を同時に合わせ考えれば,つぎの(〝+1)次の1階 38)これを,f=ヂ1における「終端条件」とよぷ。 39)ただし,(2り17)紅おける状態連続の成分ノ:′(∬(り,む(り)紅は,時刻fが陽の形で 含まれていない。それゆえ,初期時刻の値を,任意紅蓮ぶことができる。これは,制 御〝(り,f。≦≠≦fl紅よって,システムの状態が,ズbからズ1へ移されるならば, 制御以(ト∠り,≠○+』′≦f≦≠1+』≠も,また,システムの状態をズ0からズ1へ移すこ とを意味し,いわゆる「オ・−トノマス系」に.当たっている。脚注15),参照。

(22)

香川大学経済学部 研究年報15 ーヱ42一・ ∫タ75 連立常微分方程式が求められる。 =.′0(g(わ,〟(わ)

認識(御),α(机ブ鴇2,・・・,形

(2.24) そのとき,得られる解によって,拡張された状態空間(点机1)内に,トラジ ,エクトリーが定義される。われわれは,このトラジェクトリー方程式を,つぎ のように.,ベクトル表示してノおこう。4の

=′(ズ(わ,〟(わ)

ただし,r(ズ(才),α(わ)=げ0(ズ(り,α(才)), ノ■1(ズ(わ,〟(f)),・・・,ノ㌶(g(≠),捉(f))〕Jを 表わすものとする。 (2.25) さて,ここで,関数./ニグ(ち〟)および,∂ノニ7(ろα)/∂.方名,(オ,.タ=1,2,…,形) に・対して,すでに・与えた同じ仮定を,関数ノも(ズ,α)および,∂ノ■0(考り/∂・方官, (古=1,2,・‥,〝)に対しても与えることにしよう。すなわち,関数一′0(考〟)お よび,その導関数∂ノ’0(ズニ〃)/∂.芳名,(Z=1,2,・・・,乃)も,属㌣欄内で定義され, 連続であると仮定する。そうすれば,許容制御関数α(f),(ん≦≠≦≠1)と,g=′0 における初期条件が与えられれば,(2.25)は,区間才0≦ヂ≦≠1に対して,連続 な解, ズ(わ全ぶ(f;れ,gO),才0≦才≦才1 (2.26) が−・恵的に求められる。41) 以上の考察に.より,われわれは,いわゆる「最短時間問題」を,つぎのよう 40)Ⅹは,.方。を含む(〝+1)次元ベタりレ,ズは,ガ。を含まない形次元ベクトルで あることに注意せよ。 41)ただし,ここ.でも,制御〟(≠)が,区間fo≦ど≦flの全域で定義される場合紅限ら れる。脚注38),参照。

(23)

最適制御理論について −JJ3− に正確に述べることができる。すなわち,それは,あるシステムの状態を,与 えられた初期状態ズゎから,あらかじめ与えられている最終状態ズ1へ移すよ うに∴作用するすべての許容制御捉(わ,(れ≦f≦ヂ1)のうちで,この移行が最短 時間で行なわれるものを求める問題である。42)そのとき,積分(2.18)を最小 にする制御〟(≠)を最適制海とよび,それをα*(わで表わすこと紅する。さら に.,その最適制御〟*(わに.対応する(2.お)の解を,最適トラジェクトリー とよび,それをズ*(才)で表わすこ.とにする。 §5.最適制御問題の定式化とその分類 以上,われわれほ,最適制御問題の−・般的特徴を明確化するため,まず,第 1節および第2節でその基本的な仮定として,2つの条件,すなわち,(i)法 則(制御)の連結可能性と,(ii)評価の加法性,を明らかにした。ついで,算 3節および第4節で,その2つの条件をみたす範囲のなかで,状態方程式およ びそれ紅対応する評価基準の特定化を試みた。すなわち,発3節では,システ ムの動的過程を示す状態方程式が,常微分方程式によって完全町規定される場 合について考察した。そして,第4節では,その動的過程を評価する手段とし て,いわゆる評価基準(すなわち,汎関数)が積分形によって表現される場合 に.ついて考察した。 いまや,われわれは,このように・して特定化された最適制御問題のなかで, −・般的定式化を求める段階に立ち至・つている。そこで,本節でほ,この最適制 御問題の定式化とその分類に・ついて検討を進めていくこ.とにしよう。最適制御 問題の−・般形は,つぎのように㌧定式化できる。 最適制御問題(一・般形) つぎの評価基準

樟0(抑,α(桝

(2.27) を,以下の制約に従って最小にする制御〟(才),ん≦才≦わを求めよ。 (i)状態方程式 ズ=./てズ,α) (2.28) 42)〔A〕4,p.15,参照。

(24)

J975 香川大学経済学部 研究年報15 −ヱメイー (ii)初期条件 ズ(才0)∈β0 (iii)終端条件 ズ(わ)∈β1 (iv)制御制約 〟∈ぴ または, (ズ,α)∈y または, ∫∈††′ (2.29) (2.30) (2.31) (2.32) (2.33) ただし, ′。および./■は,目的関数および状態方程式の関数を表わし,所与とす る。 β0およびβ1は,初期状態および最終状態の集合を表わし,所与とする0 〝,yおよびⅣは,制御領域,制御・状態領域および状態領域を表わ し,所与とする。 f。およぴわは,初期時刻および最終時刻を表わし,所与または未知と 仮定する。 この定式化に.とって留意すべき点は,(iv)に示した制御制約にある。そこに・ は,3つのケースが分類表示されている。そこで,つぎに,この各々の場合に・ ついて,順次検討を加えていくことにしよう。 まず,その第1は,(2.31)に.よって,制御が与えられている場合について である。これは,制御αが他の変数(たとえ.ば,状態変数ズ)とは無関係に・ 与えられる,いわば独立した制御制約を意味する。したがって,いま,簡単化 のため,2つの制御〝1および〝2を想定し,その各々がつぎに・示す範囲

(25)

最適制御理論について −J4∂− α電≦〝豆≦βせ, ダ=1,2 (2.34) のなかで,任意に.変化し得る場合ほ,このケ−スにあたり,そのときの制御領 域びは,図13の斜線部分で示される。以後,このような問題を,「タイプ1の 問題」とよぶことにする。 図13.制 御 領 域 U つぎに,制御制約が,(2.32)に・よって与えられる場合について検討しよう。 この場合,制御〟は,状態変数ズと関係して与えられるので,状態変数ズか ら独立したものとして,制御αを考えるこ.とは,もはや許されない。その1 例として,制御変数勘と状態変数.ガブとの間に,つぎの線形不等式, .勘<α+β〟‘ (2.35) が成立するものと仮定しよう。そのとき,制御・状態領域Ⅴは,図14の斜線

(26)

J975 香川大学経済学部 研究年報15 −ヱ46−・ 部分のように示される。このように,制御制約が(2.32)で与えられる問題を, 「タイプ2の問題」とよ.ぶこ.とにする。43) う uj 図14.制御・状態領域Ⅴ 最後に.,制御制約が,(2.33)によって与えられる場合について険討しよう。 これは,状態変数ズのみ叔二関する制約であり,その意味で,制御制約とよぶ よりも,むしろ状態制約とよぶぺきであろう。しかし,われわれは,あくまで も,制御変数〝を直接操作することによって,間接的に.,状態ズを変化させ る44)のであるから,こ.の場合を,広義の制御制約とよぶことも,また許されよ 43)この場合,制御制約が,さきのタイプ1を含んでいてもよい。なぜなら,タイプ1 の制約は,タイプ2の制約に.含まれる,1つの特殊ケースと考えられるからである。 亜)A地点からB地点へ,自動車を利用して最短時間で走行しようとするとき,その中 間地点に,地形上,通行禁止の区域がある場合を想定せよ。

(27)

ーヱ47− 最適制御理論について う。いま,状態変数.ガ£と.ガタに関して,次式 (.方せ−2)2+(∬グー1)2≧2 (2・36)

をみたす状態制約肝は,図15の斜線部分のようになる。そして,広義の制御

制約(すなわち,状態制約)が(2.33)で与えられる問題を,われわれは,「タ Ⅹ∫ 図15り 状 態 制 約 W

イブ3の問題」とよぶことにする。45)

ⅠⅠⅠ

この章では,タイプ1の問題に.対する最大原理が考察される。まず最初に・・

われわれが,前章の最後で与えた最適制御問題の分類に・もとづき,タイプ1の

問題が定式化される。ついで,最大原理を導出する準備として,限界面の定義と

その幾つかの重要な性質が明らかに.される。さらに.,状態方程式と密接な関係

をもつ,線形微分方程式の解の性質が明らかにされ,それに対応する変分方程

式と,随伴方程式の検討が加えられる。以上の準備段階を経たうえで,前章の

45)この場合も,制御制約として,タイプ1,またほタイプ2を含んでいてもよい0な ぉ,われわれの問題意識とほ幾分異なった視角にもとづく,最適制御問題の分類化も, 当然可能である。この点について−ほ,たとえば,〔A〕1,ppい26−28,参照○

(28)

Jタ75 香川大学経済学部 研究年報15 1−J4β− 最後で定式化したタイプ1の問題に対する最大原理の導出とその証明が与えら れる。そして,最後軋,最大原理で重要な意味をもつ法線ベクトルのみたすべ き条件として,横断条件が指摘され,その内容が終端点および初期点につい て,それぞれ検討される。 §1.問題の定式化 タイプ1の問題は,つぎのように・定式化できる。 タイプ1の問題 つぎの評価基準

†;ニ′0(糊,〝(榊

(3.1) を,以下の制約に従って最小にする制御〝(わ,(れ≦≠≦わ)を求めよ。 (i)状態方程式 (3.2) ズ=ノて考〝) (ii)初期条件 ズ(≠0)=ガ (iii)終端条件 ズ(わ)∈β1 (iv)制御制約 α∈ぴ (3.3) (3.4) (3.5) ただし, ズ∈茸\封∈β勒 β1⊂β乃,ぴ⊂居座 才0は所与,わは未知とする。 いま,ズ=(.ガ1,.方2,…,.方乃)とおき,.芳0(≠)をつぎのように定義しよう。

(29)

最適制御理論に.ついて

・方0(糎付’0(ズ(丁),〟(湘・

その結果,つぎの微分方程式が,上式より,直ちに・導出される。

.方0=ノ■0(g(わ,捉(t))

ーヱ49・− (3.6) (3.7) ただし,.机(れ)=0と仮定する。46) ・そ・こで,タイプ1の問題を番きかえるために,この.方0(才)を目的関数とし, そ・れに対応して状態空間且花を拡張すれば,さきの状態方程式(3.2)ほ,つぎ のように.変形される。すなわち,ズ全(胸,ズ)=(.方0,ズ1,・‥,.方れ)∈β雨1,′ 全(ノ恥ノー)=(ノ0,ノ■1,…,ん)と定義すれば,拡張された状態空間属佃1に・お

ける状態方程式は,Ⅹ=r(g,〟)として表わされ,47)したがって,タイプ1

の問題ほ,つぎのように書きかえられる。 すなわち, つぎの目的関数 (3.8) 方0(f/) を,以下の制約のもとで,最小化せよ。 (i)状態制約

Ⅹ=r(ズ,〟)

(ii)初期条件 ズ(才0)=(0,gO) (iii)終端条件 ズ(f/)∈∂1 (3.9) (3.10) (3.11) 46)Ⅱ章,第4節,参照。ここで,fノ−f。はあらかじめ決められていないから,所与の んに対して−≠′・の偲は,各制御ごとに異なっているかもしれない。しかし,最適制御 〟*(f)に対するf./の値を≠1*,最終状態をズ1*∈β1とすれば,∬0の初期値は,積分 形の評価基準(3い1)の値を決めるの紅無関係となるから,∬。(fo)=0と選んでもさし つかえ.ないこと紅なる。すなわち,祝*(≠)は,.方0(f./)の値を最小紅するものとなる。 47)Ⅱ章,第4節,(2い24),参照。

(30)

香川大学経済学部 研究年報15 ∫975 −J∂〃− (iv)制御制約 〟∈ぴ (3.12) ただし, @1=β1×〈∬0〉⊂β花×且1 を表わすものとする。48) 以上の変形に.より,われわれは,当初の評価基準(3.1)を,拡張した状態 方程式の1つに.含めている結果,目的関数の値.方0(わ)が当該システムに.直接 影響を与えないように.,タイプ1の問題を定式化したこ.とに・なる。 §2.限界面の定義とその性質 本節では,最大原理の導出に・とって重要な意味をもつ,限界面の定義を与 え,ついで,その性質を,定理の形でまとめることにしよう。49) すでに,われわれは,最適性の定義50)を与え,その定義によれば,最小コス トは一・意的にきまることを明らかにした。さらに,その最小コストは,与えら れた最終状態の集合(β1)に対して,初期状態(ズb)のみの関数になることを 強張して, Ⅴ*(gO;♂1)全町ズ0,ズ1*;γ*,♪*) (3.13) と表わすこ.とに.した。51)ここで,再度,この最小コストy*(gO;β1)に注意 を払うことにしよう。 いうまでもなく,y*(ズ0;β1)は,最適な法則紅もとづく径路が存在するす べての点の集合(が)内紅.対して,定義される。52)そこ∴で,Cを定数パラメ タ−とするとき,つぎの方程式 48)伊の幾何学的形状に・ついて−は,Ⅱ章,第2節の図6,参照。 49)限界面の概念を用いないで,最大原理を導出するの紅,位相幾何学的な方法があ る。たとえば,〔A〕8,参照。しかし,限界面の導入が,複雑な問題を単純化し,幾 何学的思考を与える意味で,より説得的である点を考慮して,太稿では,ライトマン 〔A〕3 の方法濫・もとづき,順次検討を加えていくことにする。 50)Ⅱ章,第1節,(2小2),参鳳。 51)Ⅱ章,第1節,(2・5),参照。 52)Ⅱ茸,第1節,(2・4),参凰。すなわち,ズ∈β*を意味する。

(31)

ーJ5J− 最適制御理論について .方0+・Ⅴ*(ズ;β1)=C (3.14) ほ,(ガ+1)次元の、ユークリッド空間(βか1)内に1つの曲面(∑)を形成す る。言い換えるならば,この曲面∑は,がの点と1対1に・対応する点からな る曲面である。さらに.,(3.14)ほ,つぎの等式 γ*(ズ;β1)=C (3.15) が成立する面をぶとすれば,その面上で.方0の値をゼロとする。58)図16は,あ る特定のCの値に.対して,∑およびgを示したものである。 図16.限界面(∑)と最適等コスト面(S) つぎに,パラメタ−の値を変化させれば,それに応じて−,(3.14)より,ど*仝 β*×〈.方0〉内払曲面の1径数族(∑〉が形成され,また,(3.15)により,且*内 に同じく曲面の1径数族(ぶ〉が形成されることになる。そこ/で,これらの面 群を,それぞれ,限界面および最適等コスト面とよぶことにする。 すなわち,ある定数パラメタ−Cに対する限界面は,次式に・よって定義さ 53)ただし,Ⅴ*(ズ;β1)が∬と無関係な場合には,γ*(g;♂1)は,つね紅ゼロとなり, この場合,∫の定義はできなくなる。

(32)

J975 香川大学経済学部 研究年報15 一」5才一 れる。瑚 ∑。=ば=(.仇,ズ)仁方。=C−y*(ズ;β1),ズ∈が) (3.16) また,このCに.対応する最適等コスト面ほ,次式に.よって定義される。 ぶ。=〈∬lV*(ズ;β1)=C,ズ∈β花〉 (3.17) これらの定義により.幾つかの重要な性質が明らかにされる。まず,ある1 つの最適等コスト面ぶに.属する点(ズ0∈∫)を初期状態として,その点より, 与えられた最終状態の集合β1へレステ∵ムの状態を移すのに.は,Lつねに同じ最 小コストCを必要とすることが判明する。55)っぎに.,最終状態の集合βlの部 分集合で,最適径路の終端点の集合をβとすれば,すでに与えた評価の加法性 の仮定5の紅より,すべての点ズ∈βに対して,Ⅴ*(ズ;β1)=0となる。さら に・,また,β1と一度しか交わらない径路について最適性を定義すれば,直ち に・♂=針となることが判明する。57) 以下,この限界面について,その性質を,トラジエクトリ−との関連で順次 検討し,その結果を,定理の形でまとめること紅する。 まず,最初に,与えられた最終状態の集合伊内の点ズ1でおわる最適トラ ジェクトリ−・r*に.注目しよう。58)こ.れを,すで軋与えたわれわれの定義59)に したがって表示すれば,つぎのようになる。 r*∴方0乞=C−y(ズ官,ズ1*;γ*,か) (3.18) さらに・,これと同じ最終状態の集合@1内の点ズ1を通る限界面∑は,次 式によって示される。60) 54)ある1つの定数パラメターCに対応する限界面の定義として,Cなる添字を∑に 与える。つぎの(3.17)の定義式にンついても同様の取り扱い方をする。しかし,記号 の煩雑化をさけるため,以下,自明な場合紅は,この添字を省略することにする。 55)「最適等コスト面」の呼称は,この性質に由来する。 56)Ⅱ章,算1節,参周。 57)〔A〕3,p.7,AthanS,M.&Falb,Pリ,砧OptimalControl”,p・286,参照。 58)Ⅱ章,算2節の図6,参照。 59)Ⅱ茸,第2節,(2.9),参照。 60)本章,第2節の図16,参照。

(33)

ーJ5∂− 最適制御理論について ∑∴方。=C−y*(ガ;β1) (3.19) そこで,まず,この両者の関係を,つぎの〔補助定理1〕として述べること にしよう。81) 〔補助定理1〕 集合伊内の点ズ1でおわる最適トラジ.コクトリーは,その点ズ1を通 る限界面(∑)上にある。 これを証明するには,ズ0から針への最適径路(♪*)上のすべての点 ズ£∈♪*に対して,その点に・おける最適トラジェクトリr*上の∬0官の値と, 限界面∑上の.ガ0の値とが,−激すること,すなわら, (3.20)

γ(ズ慮,∬1*;γ*,か)=四(ズ名;β1),動⊂♪*

が成立することを示せば,十分である。 そこで,帰謬法を用いて,(3.20)が成立することを証明しよう。そのため に,つぎの図17に示す2つの異なった径路(すなわち,♪乞とか*)を想定す る。 XO 図17.2つの仮想径路(れと如*) すでに述べたように,初期状態ズ0から最終状態β1への移行にともなう最 61)以下に示す補助定理の導出は,〔A〕3,pp・7−12,に負う。

(34)

Jタ75 香川大学経済学部 研究年報15 ーJ54− 小コストy*(ズ0;β1)は,「評価の加法性」の仮定62)によって,その最適径路 ♪*を任意の2つの部分径路(〆および動)に.分割したときの各径路に対応す るコストの和として示される。すなわち,任意のガ∈♪*に対して, Ⅴ*(ガ0;β1)仝Ⅴ(ズ0,∬1*;γ*,♪*:) =γ(gO,ガ;γ*,が)+Ⅴ(g名,gl*;グ・*,動) ただし,♪*=〆∪動,ズ1*=♪*∩β1 (3.21) が成立することを意味する。 さて,帰謬法の手順にしたがって,(3.20)の成立を否定してみよう。サーな わち,つぎの不等式, γ詠(ガ;β1)会y(ズ盲,羞1*;γす*,動*) <y(ガ,gl*;㌢・*,動) (3.22) をみたす,状態ガから,最終状態β1への移動に対する最適な法則れ*が存 在すると仮定しよう。したがって,か*は,その仮定した最適法則㌢・名*に対応 する径路を表わし,羞1*=♪豆*∩β1を表わすものとする。 このとき,当該システムの状態を,まず,初期状態∬0からガまでを法則 r*によって(すなわち,径路〆に.沿って)移動させることが可能となる。 かかる法則(γ)に.対して,再び評価の加法性の仮定を適用すれば,つぎの関 係, y(ズ0,羞1*:γ,♪)=Ⅴ(ズ0,ズi;γ・*,が) +y(ガ,あ1*;γ£*,動*) (3.23) が成立する。ただし,タ■は,ズ0からJ㍗まではr*,ズせからあ1*まではグ■名* を用いる法則を表わし,また,♪=〆∪動*を表わすものとする。 かかる法則rが,許容される法則であるこ.とは,すで紅仮定した「法則(制 御)の連結可能性」63)によって,明らかである。 それゆえ,許容される2つの法則(グ■およぴr*)に関して,つぎの不等式 62)Ⅱ茸,第1節,参照。 63)Ⅱ章,寛1節,および第3節,参照。

(35)

最適制御理論について.■ −・J∂5− y(∬0,.右1*;′・,♪)くy(ズ0,ズ1*;γ*,♪*) (3.24) が成立することに.なり,その結果,γ*が最適な法則であるとした最初の仮定8ま) と矛盾する。したがって,(3.20)の等式が成立することが,証明された。65) さらに,限界面の性質を,敷術して述べることにしよう。すでに.,われわれ は,定数パラメターであるCの値を変化させれば,それに㌧応じて,(3.14)よ り,∂*全β*×〈.芳0)内に.異なった限界面の1径数族が形成されることを指摘し た。そこで,と.れらの限界面相互の関係を明らかにサーるため,いま,2つの相

異なったCの値(これをCユ,C2とする)に対応する2つの限界面(これを

∑。1,∑e2とする)をとりあげよう。・それらは,すでに与え.た限界面の定義式 (3.16)紅よって,つぎのように表わされる。 ∑。1:.ガ。1=Cl−y*(ズ;β1) (3.25) ∑紹:α02=C2−y*(∬;β1) (3.26) i ただし,ここでは,両者の比較のため,同じ状態ズを最適径路が存在する 状態空間(β*)内に.とり,その状態ズに対する各限界面(∑。1および∑e2)上 の一方0の値を,.机1および伽で与えている。そのとき,(3.茄)と(3.芦6)よ り容易に.わかるように.,β*に.属する任意の状態ズについて, (3.27) .ガ01−.方02=Cl−C2 なる関係式が成立する。こ.のことは,Cの値を変化させれば,それに・対応する 限界面は,.ガ0軸上に沿って平行移動し,これらの各限界面は,決して交わら ないことを意味している。88)これらの限界面族の1部を図解したのが,つぎの 図18である。 限界面についてのこの性質と,さきの〔補助定理1〕とから,つぎの結果が 64)本章,第2節,(3、21),参照。 65)このこ.とは,「■与えられた最終状態の集合への最適径路の任意の部分は,それ自体, 同じ集合への最適径路になっている」という,いわゆるベルマンの最適性の原理を意 味する。ベルマン,前掲審,参照。 66)Cl,C2の与え方は,全く任意であるから,(3小27)の関係を,限界面族(∑〉全体に 言及せしめ得る。

(36)

香川大学経済学部 研究年報15 J97∂ ーヱ∂6− 図18小 限 界 面 族(∑〉 得られる。 〔補助定理2〕 ある限界面∑上紅1点をもつ最適トラジェクトリーr*は,完全紅同一 の限界面∑上に乗っている。すなわち,限界面∑ほ,すべての最適トラジ ェクトリ−の軌跡である。 つぎに,新しい記号を導入しよう。いま,1つの限界面∑が与えられると, この限界面に.よって,拡張された状態空間の部分集合ど*仝β*×〈∬0〉は,2つ の互い把.索な領域67)に.分離されることが可能である。そこで,これらの領域 を,それぞれ,A/∑(‘‘above,’∑)およびB/∑(‘‘below”∑)とよぶこと紅す る。そのとき,定数パラメタ・−・C紅対応する限界面∑に対して,A/∑および β/∑は,それぞれ,つぎのように定義される。 A/∑会ば:.方0>C−y*(ズ;β1)) (3.28) β/∑全ば∴ガ0くC−y*(g;β1)〉 (3.29) さらに,いま,ある状態点Ⅹが,A/∑の領域にあれば,68)・その状態点ズ 67)共通点をもたない領域を,互い紅素な領域であると定義する。 68)Ⅹ∈A/∑ を意味する。

(37)

・−J∂7− 最適制御理論に.ついて を限界面∑に関してA点であるとよび,β/∑の領域にあれば,89)その状態点 ズを限界面∑に.関してβ点であるとよぶことに・する。図19は,これを図示し ている。 図19‖ 限界面∑に関するA点とB点 つぎに.,あるCの値に対応する限界面∑と,その面上の点ズ∈∑に注目し ょう。その点ズのβ弗への射影をgとし,点ズから出て,最終状態の集合 伊全β1×〈.方0〉内の点ズ1に.達する最適でないトラジェクトリ−をrとし,そ のrに対応するCの値がC/であると考える。そのとき,限界面および最適で ないトラジェクトリL−は,それぞれ,次式によって示される。 方。+y*(ズ;β1)=C (3・30) 方。+・Ⅵ牒ニズ1;㌢・,♪)=C′ (3・31) ただし,γほ,径路♪(すなわち,√のβ花への射影)を生ずる最適でない 法則を表まっすものとする。 (3.31)より(3.30)を差し引けば,次式を得る。 (3.32) y(ズ,ズ1;γ・,♪)−y*(ズ;β1)=C/−C 69)Ⅹ∈β/∑を意味する。

(38)

香川大学経済学部 研究年報15 r97∂ −J∂β− また,法則γが最適でないことから,上式左辺は正となり,したがって, C/−・C>0 (3.33) となる。すなわち,ある限界面から出て,集合伊に潜する最適でないトラジ ェクトリーrは,∂1に..おいて,その限界面∑に関してA点で交わることに・ なる。 ここ.で得た結果と,さきの〔補助定理2〕とをまとめれば,つぎの結論が導 かれる。 〔補助定理3〕 与えられた限界面∑上の点から出て,伊へその限界面∑に関してβ点 で到達するトラジェクトリL−は,存在しない。 〔補助定理3〕の内容は,最終到達点のみを問題としており,それに至る途 中の過程については,なんら言及していない。したがって,つぎに・,この点を 検討するこ.と紅しよう。 その準備として,いま,Cl紅対応する限界面∑elに注目し,この限界面上 の点ズから出る最適でないトラジェクトリ−rを考えよう。さらに,また, このトラジェクトリ一上の点,たとえばⅩJが,さきの限界面∑。1に関してβ 点であったとして,この点Ⅹ/を通る限界面を∑c2と仮定する。そのとき,こ の限界面∑。2に対応するCの値をC2とすれば,すでに明らかにしたとおり,70) つぎの不等式, Cl>C2 (3.34) が成立する。すなわち,伊に膚する最終状態の点(C2,∬1)は,限界面∑¢1に・ 関してβ点であることがわかる。そこで,図20に示すような,ズからズ′まで は,最適でないトラジェクトリL−rの部分をたどり,さらに・,ズ/から伊ま では,最適なトラジェクトリーーr*(すなわち,限界面∑¢2上)71)をたどる1 つのトラジ.ェクトリーーを考えてみよう。 70)本章,算2節,(3‖27),参照。 71)〔補助定理2〕による。

(39)

最適制御理論について −ヱ∂9− 図20.XよりⅩ′を径て−(C2,Ⅹ1)へ至るトラクエクトリー この場合,〔補助定理2〕に.よって,ズ/から出る最適トラジェクトリ−√* ほ,その限界面∑c2上に完全に乗っていると.とがわかり,したがって,伊と は,Clに・対応する限界面∑clに関してβ点で交わることになる。他方,〔補助 定理3〕によって,Clに・対応する限界面∑。1上の点(すなわち,Ⅹ)から出 て,その限界面∑clに・関してβ点で伊と交わるトラジェクトリ−は,存在し ないことがすでに明らかに.されている。 したがって,この両者の性質を合わせ考えるならば,ある限界面∑。1上の点 から出るトラジェクトリ−は,(それが最適であっても,最適でなくても),そ の限界面∑elに関して決してβ点を持ち得ないことが判明する。この限界面 把関する重要な結論を,つぎの〔定理1〕としてまとめておこう。 〔定理1〕 ある与えられた限界面∑上に初期点をもつトラジェクトリ−は,(それ が最適であっても,最適でなぐても)その限界面∑に関するβ点を持ち 得ない。 この定理は,限界面∑の限界的な性質を端的に示している。なぜなら,あ る1つの限界面ほ,その限界面から出るすべてのトラジェクトリ−を含む領域

参照

関連したドキュメント

「原因論」にはプロクロスのような綴密で洗練きれた哲学的理論とは程遠い点も確かに

を軌道にのせることができた。最後の2年間 では,本学が他大学に比して遅々としていた

成される観念であり,デカルトは感覚を最初に排除していたために,神の観念が外来的観

[Nitanda&Suzuki: Fast Convergence Rates of Averaged Stochastic Gradient Descent under Neural Tangent Kernel Regime,

これは基礎論的研究に端を発しつつ、計算機科学寄りの論理学の中で発展してきたもので ある。広義の構成主義者は、哲学思想や基礎論的な立場に縛られず、それどころかいわゆ

Optimal stochastic approximation algorithms for strongly convex stochastic composite optimization I: A generic algorithmic framework.. SIAM Journal on Optimization,

 食品事業では、「収益認識に関する会計基準」等の適用に伴い、代理人として行われる取引について売上高を純