逐次近似評価法の収束の証明

(1)

逐次近似評価法の収束の証明

（昭和47年10月20日原稿受理）

電気工学教室伊藤輝生

Convergence Proof of the Numerical Method of Successive

Approximation of Performance Indecies

by Te斑o ITOH

桓甑spapeピ， c◎nveτgence◎パheΩume驚ica1 meth◎d◎f successive apPτ◇ximati◎n of performance indecies is proved， which solves optimal control problems of discrete line雛system§with bou且ded c◎ntど砲eピ餓d袈ad影aticρerf◎宮mance i垣ecies、

；に：限：操麓＿＿＿一巳i馳⑤

解法として，逐次近似評価法を提案した％そこ N−・

において，嚇解への糠の証明を省略したの α・＝、．。蕊ば φz−℃φε堪翻

で，あらためて，本論文において証明することに δがクロネッカのデルタ関数みエ

する。 b④：Σφ℃φ伺d

ゴ＝

2．文献〔1〕の結果である。また（4）式をDP法により表現すれ文献〔1〕において導出された結果についてま

ば，残り N一為＋1段最適評価が

とめておく。系および評価が W舟＋・一躍゜（＋1）P°（N− ＋1）〆＋1）

允（〃十1）＝φκ（の十山（の，〃＝0，…，1V−1

①

一ト2Lo（ハ「一ゐ十1）欝o（是十1）十κo（N一ゐ十1）

（6）

N であらわされるとき，ゐ段の最適操作量は

み＝恩ぱ（為）ρw（の＋λ（牛1））2〕（2）。・（鳶）一、at｛∂・（N喝躍燗＋θ・（N一為）｝

であるとき，与えられた初期値淘（0）＝卯。に対（7）

◎，…，2V−1を求める問題の解は， Kuhn・Tucker

の条件よりパ個の連立躍式（8）

となり，残り1V一為段評価は，

・・（）一・at［（一・／・・）｛，怠、・〃（ノ）撫一κW・（N一力）ヅ（〃）

⇒］・∫一・・…−4）靭（十2LO（ハr一ゐ）席o（〃）十1ζo（2V一ゐ∧τ一鳶）＝φア（Ω十Po（2V一丘十1））φ）（9）

の解として与えられる。ここで，一（1−1α［βo（1V一ゐ）エo（〃）

(2)

124

＋θ・（2V一為）］Dγ。（N一為）β゜ノ（N一のβ§（N一為）以上の関係を利用した数値計算アルガズムは L・（N−〃）＝L・（2V一百）φ つぎのようである。（10）式中のα［β゜（1V−〃）

＿γ・（1V一鳶）｛二θo（1V一力）＋α［β。（1V一め躍。（の ×ダ（め＋θ℃V一力）］の代りに・

十θo（ハr・一の仁一1αμ〕o（N一のκo（為）ノピ 1α心兎1≦1，ゐ＝4，…，2V−1 （15）

＋θ゜（1v−〃）］Dβ゜（N一め、を満足するα悟為を代入し， P（o）−o， L（o）−o，

X°（』V一為㍉＝K◎（2V一力十1） κ（◎）＝◎，を与えて，（8）（1◎）式の繰返し関係 …γ゜（1V− ）（（θ゜（2V− ））2 を用いれば，β（2V一ノ），θ（1V一ノ），ノー1，…，1V−1，

一減玖N一為）躍§（カ）＋θ゜（N一力川［1 一が，α｝，…・α・一・一・の関数として・また埠）・

十（θo（2V一））2］一α［βo（1V− ） o（） α1，…，αN．1，の関数としてあらわされるから，

＋θ§ρV一為）］θ奪（2V の）（1◎）（8）（1◎）式のような最適繰返し関係は，

α同一

専o1］⑰ま∵α［㌘：竺（彦）十θ（ハ／一一ゑ）］，N−1 （16）

となる。また（9）式は，もともと ∧同

、．、一γ・（2V一克）｛が（ゐ）−8・（N一拠ゐ）恥＝恩｛輪一α［β（N カ）κ（カ）÷θ（醐］）2 ＿θ・（2V−〃））・裾・ P＊（N−〃）卯・（の一〇（17）

＋2L＊（ハr一力）κo（〃）十κ＊（∧r一力）（12）を満足する場合であることがわかる。したがってここで，p㌣N＿の，が（1v＿旬，κ＊（N＿めはこれに着目すれば

（10）式において，α［・］−0とおじ・た式， α −0・ゴー1・…・N一た（18）

を変形したもので，この評価，すなわち，残りとおいたとき，

霊：適顯｛叢ご1ヒ1㌦一慧∵一力）＋θ（㍑2

による微係数は，

∂允（〃）／∂μ（∫）＝φ・一伺∂ （13）が与えられた場合に

であることとを舗すれば（・・）式を斑・（為）に α・一α夙…・N一相（2°）

よって微分することにより得られることになり，み一・（21）

∂恥／∂欝・（ゐ）＿＿2γ・（N＿ヵ）｛μ・（〃）を得る方法について提案していたが，以下におい＿β・（』V＿旬澱（ゐ）＿θ・（2V＿ゐ）｝β・（N＿〃）て，あらためて証明付で述べる。

＋2P＊（N一ゐ）席o（ゐ）十2L＊（1V−〃）（14） 3．逐次近似評価法の証明

となる。すなわち・（7）式により髭゜（カ）は・が（のまず，（18）（19）式が与えられたとすれば，

の関数としてあらわされているが・Kuh距Tuck i8）（・・）式の繰返し関係に（・8）式を代入して

・・の条件より・・奪㈲は固定して導びいてよい得られる曙以後の近似評価

鑑謬鷲慧書選蕊；こあ輪一ぱ（脚噸力）（22）

ときは，（、3）式の第頂，したがって，（・2）式に対して・畷から −1段までの畷過程の

の第噸は，。ω，∫一ぴ…，＋・，の微願に何髄敵以後真の髄解と区別するため・近似の擁も戟ないから，（・・）式において，評価噛する髄鰍呼ぶことにする）カミ牡ら

α［β・（N一丘）轟）＋θ・（ル〃）］の値は，（・・）式れていることを意味している・つぎに，

の定義によれば，◎であるが，実際には，0から α［・8（N一旬工（明

1（または，0から一1）の任意の値でよい。（θ（」V一鳶）は，（18）式のもとでは0）の値によ

(3)

125

って，（2◎）（21）式を得ることができることを証ができる。すなわち，

明しよう。 β（2V一ノ）允（戊）十θGV一ノ）＝1

G）α［8（ハ「一々）淘（初＝0のとき。この場合（または，βσV一ノ）灘（ノ）＋θ（N一ノ）＝−1）

は，αぽ一〇とおいていたから，何の変更もなの状態では，他の操作量とは無関係にα相の値

く，人＝0である。を変化できるから，B（N一ノ）κ（ノ）十θ（2V−一ノ）カミ（ii）α［β（N一旬w（丘）］−1のとき。この場合 1（または一1）を切るようなαNヰの値をαきづ

には，砕．々を0から1に変化させる必要があと書くことにすれば，ακ．，ゼー1，…，〃−1を固るがそれにともなって，残り2V一為段近似評価定したまま，

が，（8）（10）式よりあきらかに， αN．々＝⇒．鳶＋ε，ε＞0，（25）

κ （旬P＊σV 旬工（助とおけば，仮定により

→灘ﾖP＊（N一顕）輪、≒α［β（N一鋤ω＋θ（N一ノ）］（26）

刊α祠γ（2v−〃）（s嬉n（α。．∂一β（N一為）κ（烏））2

であるから，みコ≒0である。しかし，

（23）

．8（2V一ノ）斑（ノ）＋θ（N一ノ）はαぽの連続関数でと変化するから，いままでの近似評価に対する最あるから，（25）式のα脳烏に対して

三竺蕊；鷲㌶織㌶β（ハr一ノ）允（ゾ）十θ（∧↑一ノ）＝1（または一1）＋δ（ε）（27）

合を想定すれば，晦4が1に到達するまで，

1inδ（の一〇（28）

α［β（2V一ノ）灘（ノ）十θ（1V−」）］，ノ＝1，…，カー1 ε→o

（24）であるから，εを充分小さく選ぶことにより，

の値が変化しなけれぱぴ◎を得る．一般に， αwの値の変化の影響を臆四・さくでき・し

α ．、の変化に対して，α｛β（1V−〃）κ（鳶）］の値たがって・充分小さなεに対しては変化しない。なぜなら，もし，変化すると仮砲一テα［刀（2v−」）允（ノ）＋θ（N ノ）］

定すれば，ある αル、に対して，最初の関係と変化させれば，」村一〇の関係を保つことがで丑（N一めκ（ゑ）＞1カミβ（ハ↑一ゐ）漏（旬一1となるこきることがわかる。また碗一為を◎から1までとになる。（14）式の説明において述べたように，変化させる間に・1回以上および同時に2個以上 0段から為一1段まで最適関係が成立している状の□1≦ヌ≦是一駕について・β（2v一ノ）κ（ノ）＋

態では，B（2V一めMの一1ならば，0からカー−1 θ（N一ノ）の値が1（または一1）を切る場合に段までの操作量に，砺．鳶は何の影響も与えないも，各」に対して・その都度同様の操作をほど

から，α共克の値とは無関係に，刀（1V一めエ（旬一こすことにより・」ぽ＝0を保持しつつ碗一髭の 1でなければならず，αN．為一〇においてβ（1V−〃）値を1まで到達できることになり・九一〇を得る κ（の＞1という仮定に，矛盾する。したがってことがわかる。

αN．花の最適値は，この場合はつねに1である。（iii）α［β（1V− ）w（）］一一1のとき。この場つぎに，α祈鳶を◎から1に変化させるとき，合は，（ii）の場合において・碗一・の値を0から

（24）式の少くとも1個以上のノについて値が変一1まで変化させる以外は（ii）とまったく同様化すると仮定しよう。すなわち，あるノについである。

て，最初にβ（1V一ノ）κ（ノ）＋θ（2V−−」）が1（またさて，ある蹄一・に対して，β（2V一ノ）灘（ノ）＋

は一1）を切る（必ず切るということにっい θ（1V一ノ）の値が1となったとき，この値が必ず

ては，後述する）とすれば，そのときの砺鴫の 1を切ることについて示せば，収束の証明が完成

値に固定したまま，砕つの値を変化後のα［β（N することになる・そのために・近似評価に対するづ）エ（ノ）十θ（N−」）］の値に一致させれば，◎段最適解の性質について検討してみる・

から〃一一1段までの最適関係九．、＝0を保つこと α ＝0，〆＝1，…，1V−〃＋1 （29）

(4)

126

と仮定することは，残りN一為＋1段評価を，で変化させることを考えれば，

部（〃＋1）P＊（N一屏了）躍（鳶＋1）／㌫→／〜㌫＋δ／示：（3γ）

と近似することであるから・評価は・と変化したとき，躍（ノ）の変分を勘（ノ）と書けば，

み＋1＝〃ほ＋1）P＊（1V一ゐ＋1）M〃十1）（旦4）式より，αN．ヵ≧0を考慮して，

ゑキエ

＋Σ｛灘（ノ）ρκ（ノ）＋λ（〃（プー1））2｝（30） δ （ゐ）

となる∴旗一δ〆㌫一δ／㌫卜（1／α競）｛§砺・（ノ）

吉三慧罐；允（ゐ）（31）＋毎｝］＋（ト／㌫）卜（・侮）§醐ノ）］

（38）

と近似すれば，（3◎）式は，

酬α・一・1γ（1v−〃）｛、ign（αばとなり，さらにδ （り・ゴ＝q ・ −Lは・（33）

式より，形式的に，

一β（1v一の灘（為））2暢（〃）P＊（N一ゐ）斑（為）

噺〆⑭躍（ノ）＋λ（・（月））つ（32） δ・の一d・a脚）］・［（一㈲隠醐ノ）

となり・（23）式と剛近似織を得ることカ・わ＋・W）｝｝∫一砥…・丘一L（39）

かる（（32）式の第2項までが，残り1V一力段の

方程式として（4）式の形で表現すれば，文献〔1〕

と同様にして，と書くことができるから・（39＞式の解は・形式的に

・（の一・at［（一・／・・）｛，具、仇・・（プ）㌻δ。（。）］

ニ

袖＋砺・（カ）｝1鳳…・為一・（33） Lδ。（鳶一・）二

の近似評価に対する髄解が得られているという（42）

（1／αガ）Σ角μ（」）抽，＋αほ況（の

＝β（N一りw（τ）十θ（1V−∫）全ω（∫）（36）．．

なる関係で紺ればならない．つ甑輪、の＋D・at回α≡㌔三D・at［ω］

：㌔ ζ7克＿2丘＿1

単調な変化悶して・姻も単調姪化をする σ脚。輪、∴◎

（43）ことを示す。簡単のため，、α ．．為を0から1ま

(5)

ぱ

となる。これを（38）式に代入すれば，おいて

懐霊蹴㌔副ω（卿 ω（も）（（△《・㎞）隠｝（ノ）

D・at［ω㈲一1（・一ω（〃））δ／㌫（39）＋ぴ＋α嬢・（ゐ）｝）

α々一［αo々… α鳶＿1々P＝［αヵo…・α姑＿1］（40）＝1 （44）

となる。あきらかに（39）式の分母は正であり・となるとする（ω（ち）一一1となる場合も同様）。

ω（ん）（一β（1V−〃）κ（））は・前述のように0≦ 簡単のため，αぷくα輻舟となるα ．．たに対して鞠づ≦1を満足する碗．滝に対して，1を切るこは，

とはないからL互子も定符号である・よって・ ωω＜・（45）

（39）式は／輪の一醸化悶して・δ姻であると仮定しておく．（33）式から（39）式をが単調に変化すること蛎している・いま・㍗導びいたの胴膀妨で（33）式の輪求め

を0から1へ連続的に変化させた場合，あるκ。，

れば，

0≦ち≦カー1，に対して，最初に，砕．。＝α寿一、に

匡：1∵一回一回1：ピ1∵＋「li：：：∵㈲

と書くことができるから，（46）式を（幽）式のω（∫。）の式に代入すれば，

ω（∫。）＝∫（dsat［ω（の］，∫＝・0，…，為〜1）＋9（dsat｛ω（∫）］，∫＝0，…，々−1）〃（ゐ）

＋（一1／α嫡）｛ぶ…α［ω（）］｝（47）

一一… 一一…8…駒僻）一回

劇岨L坤…・一㎞）｛㌦…‖…㌫1ぴ一回［馴㈲

となる。（47）〜（49）式からあきらかなように，一一

dsat【ω（り］（＝dsat［刀（1V−∫）エ＠）＋θ（N一ξ）D，で1を切らないとすれば，∫（・），9（・）の値が一定ゴ＝0，…，〃−1，の値が変化しない限り，∫（・）9（・）であり，α ．尾の増大とともに，やはり単調に変の値は変化せず，α｛ω⑦1，∫一◎，…，カー1も変化化するはずであるから，ω（紛が1を切らないとしない。このような場合には，（47）式はμ（〃）のいう仮定に矛盾する。よって，砺輔を0から単線形関数であり，吟づとともにμ（幼が単調に調に増大していくとき，最初に1（または一一1）に変化するから，ω（∫。）もαN．ヵとともに単調に変到達するω（∫。），1≦ 。≦〃−1，は必ず1（または化することがわかる。仮定により，αル，〈α翫、 −1）を切ることがわかる。証明終り。

に対しては，ωσ，）は1より小で，αぽの増大と以上の収束の証明からあきらかなように，例えともに1に到達するから，もちろん9（・）≒0でば，β（1V−〃）允（〃）＞1のときには，αN−・を」ぽある。（47）式の第3項がα［ω（も）］を含まない一〇を満足させつつ1に到達させればよいから，

ことに注意して，もし，ω（召0）の値が鋤．戸麟．、，具体的な計算アルゴリズムとしては，つぎのよう

(6)

128

にすればよい。が得られることから，有限回でみ．、一◎を得るこ αM＝0に対して・み一・＝0が得られている状とがわかる。すなわち，有限回で（i）の状態にな態を，αL．、．…α矩＝，と書くことにすれば，るから，この過程を通る繰返し番号を

（a）α・一・＝1とおき，』°が得られるか 1＜∫、＜…＜∫。〈・・．（58）

どうか調べる。すなわち，碗．鳶一1とすれぽとおけば，

㌫㌫㍊㌶㌘讃㌔ α編く臨ぐ一くα誌〈…（59）

1≦r≦〃−1，に対して，α［ωσ）］の値が変化しとなり・最終的に

た場合，それらの値をα輻、，…，α輻肩、，と書く αム＝1 （60）

ことにすれば，これらの値が」已一〇を与える解となることがわかる。すなわち，文献〔1〕の計であれば，やはり」』−0の収束を得る。算アルゴリズムの収束が証明された。

（b）（a）のようにαぷ＝1に対して」桓＝0

の解が得られない場合には，初回のみ， 4 むすび

α撫＿◎，αム、、＿1 （5◎）制限付操作量線形系の二次評価に対する最適制とおき，一般に御問題の数値解法としては，種々の勾配法2）3＞が嶋一（αLi。＋αも。、）／2 （51）適用されまたは適嗣能であるカ㍉ここで示した逐次近似評価法の特長は，解が

として，（a）の場合と同様にして，み。1＝0が得

られるかどうか柵べる。そして， μ（ゐ）＝sat［β（N喝工（々）＋θ（N一為）］

（i）ふ⇒が得られた場合。（61）

嬬一嶋，端司（52）の形の帰還形で与え猟勾配部よる方法のよ

α温一αよ・uα㌫一α粍（53）れる。

とおいて，（51）式にもどる。この操作により

参考文献 αも抽くα慧。＜α急。．（54）

および 1）の熱鷲罐莫㌶豊鰹讐繁

αLln＜α吉＿力くαLax （55） 2） Kishi・民H・：◎n Line C◎mp磁er Co磁mI Techniques and Their Application to Re−entry （麟一が初めて・ω（∫o），1≦∫o≦〃−1，が1を Aemspace Veh輌cle Cont，◎1． Advanc￠s輌n C◇滋．

切るαN一鳶の値）「01Systems・C・T・Le皿des（ed）， Academic が保証されるから・」⊇返し後 3）P簑灘9∵L、Th。 G，。d｛。。， p，。j。，ti。n M←

1α㌍仁一αカ＿々｜＜1／2z榊1 （56） thod for Non−1inear Pmgramming， Part I一

なる関係がなりたち，嚇当に大きくなれぱ㌫蒜砿⊇S巡」° い一ぷ／

逐次近似評価法の収束の証明