• 検索結果がありません。

電気通信大学大学院 情報理工学研究科 博士

N/A
N/A
Protected

Academic year: 2021

シェア "電気通信大学大学院 情報理工学研究科 博士"

Copied!
94
0
0

読み込み中.... (全文を見る)

全文

(1)

入力状態安定性を保証する量子化入力による 宇宙機のモデル予測制御

淺川 岳也

電気通信大学大学院 情報理工学研究科 博士

(

工学

)

の学位申請論文

2015

3

(2)

入力状態安定性を保証する量子化入力による 宇宙機のモデル予測制御

論文審査委員

主査 木田 隆 教授 委員 田中 一男 教授 委員 新 誠一 教授 委員 明 愛国 教授 委員 樋口 幸治 准教授

(3)

著作権所有者 淺川 岳也

2015

(4)

Thisdotoralthesisstudiesamodelpreditiveontrol(MPC)oflinearsystemsdriven

by quantized ontrol inputs. We formulate the problem as an integer quadrati pro-

grammingproblem,andnewlyderiveonditionsfortheterminalostwhihisobtained

by solving linear matrix inequalities (LMI) so as to ensure the losed-loop stability.

Some numerialandexperimentalstudiesare performedtoverifythe proposedMPC.

InChapter1,werstgivestudyobjetivesandproblemdesriptions. Chapter2derive

aLMIonditionforahievingthelosed-loopstabilityoflineartimeinvariantsystems

(LTI) both for ontinuous ontrol inputs by reation wheels (RW) and on-off ontrol

inputsbyreationontrolsystems(RCS).ByusingthesolutionofLMIastheterminal

ostmatrixinoptimizationproblems,itisshownthatthelosed-loopsystemisasymp-

totiallystable(AS)forontinuousvalueinputsandtheonditionisageneralizationof

the well-knownonditionsderivedbyaRiatiequation. In theaseofon-offinputs,

it is also shown that the losed-loopsystem results in the Input-State-Stability (ISS)

ratherthanAS.Additionallywealsoshowthatitanbegeneralizedtothemulti-stage

quantizedinputase.Asanumerialstudy,weapplyMPCtospaeraftattitudeontrol

problemandomparetheontrolperformanefor ontrolinputsofontinuous,on-off

andtheirombinationandshowtheeffetivenessoftheombineduseofRCSandRW

frombothaspetsofagilityandauray. Wealsoshowtheeffetivenessofproposed

MPC underthestateonstraintbyapplyingtothespaeraftformationightproblem

withollisionavoidaneability.InChapter3,weextendtheresultintwoways. Firstis

theextensiontolinearparametervaryingspaeraft(LPV)andderivetheLMIterminal

ost onditions in order to ensure the losed-loopISS. Other is the robust stabilizing

MPC against dynami model errors. We then perform some experimental results for

LTI, LPVand robust MPCusing asingle-axisair stageand examinetheimplementa-

tionoftheon-linealgorithms.Chapter5isforonlusionsandperspetives. Thebasi

fatsaresummarizedintheAppendies.

(5)

概要

本研究は,宇宙機の大角度姿勢変更によく用いられるスラスタ・クラスタ(RCS) による最適制御を目的としている.RCSは,角運動量の交換装置であり連続値制 御入力を発生するリアクションホイール(RW)に比べて発生できるトルクが大き いという長所をもつ反面,オンオフの2値となるトルクのみを生成する非線形アク チュエータであることが最適制御設計を困難としてきた.そこで,ここでは整数 二次計画問題の解法によるモデル予測制御の適用を考え,入力状態安定性(ISS) を達成するアルゴリズムを構築する.そして,数値シミュレーションおよび実験 でその有効性を示す.各章の構成は以下となっている.

まず1章で研究目的・問題設定の記述を行い,2章で線形時不変(LTI)の宇宙機 を対象にして,RWによる連続値入力,RCSによるオンオフ入力の双方について 閉ループ系を安定とする終端拘束行列が満たすべき条件を線形行列不等式(LMI) として導出する.このうち連続値入力の条件は従来の漸近安定となるためのリカッ チ方程式条件を包含する一般化された条件であること,オンオフ入力の場合は漸 近安定ではなくISS条件であることを示す.そして,RWとRCSの組み合わせ使 用によって,宇宙機の高速かつ漸近安定な大角度姿勢変更が可能となることを数 値例を用いて検証する.さらに得られた結果は多段の量子化入力に拡張できるこ とを示す.また衝突回避機能をもつ軌道上フォーメーションのような宇宙システ ムへの適用結果を述べる.

3章では,これらの結果を宇宙機がパラメータ変動を持つ線形パラメータ変動

(LPV)系である場合に拡張して,やはり端点モデルに対する連立LMIから求めた 共通解を終端拘束に用いることでISSを保証できる事を示す.更に動的なモデル 誤差に対してロバスト安定なモデル予測制御則を提案する.これらの結果を用い ることによって,宇宙機本体に対して回転する大型柔軟な太陽電池パネルなどを もつ現実的な宇宙機の量子化入力によるモデル予測制御が可能となる.大型人工

衛星ETS-VIIIの数値例を用いてその有効性を示す.

4章では,静空気圧で浮上させた1軸回転自由度を持つエアステージの実験装置 を用いた上述のオンオフ入力によるLTI,LPVおよびロバストモデル予測制御の 実験結果を報告する.実験の目的は,モデル予測制御のオンライン最適化計算を 市販の計算機に実装可能であるかを検証することであり,いずれの場合にも妥当 なサンプリング周期で実現できることを明らかにする.

5章は,結論と課題であり,宇宙システムのオンオフ制御に対する展望,宇宙開 発以外の分野への応用可能性について述べる.最後に,宇宙機の運動方程式,入 力状態安定性など基礎的な事実を付録に一括してまとめる.

(6)

目 次

第1章 序論 3

1.1 研究背景

. . . .

3

1.2 研究目的

. . . .

7

1.3 問題設定

. . . .

7

1.3.1 剛体衛星

. . . .

7

1.3.2 パラメータ変動を有する柔軟衛星

. . . .

8

1.3.3 柔軟衛星

. . . .

9

1.4 主な記号

. . . .

10

第2章 モデル予測制御 11 2.1 はじめに

. . . .

11

2.2 概要

. . . .

11

2.3 モデル予測制御の安定性

. . . .

13

2.4 モデル予測制御のアルゴリズム

. . . .

17

2.5 数値シミュレーション

. . . .

18

2.5.1 剛体宇宙機の姿勢制御(RW+RCS)

. . . .

18

2.5.2 剛体宇宙機に対する3値量子化(オンオフ)と

n

値量子化に よる制御

. . . .

29

2.5.3 フォーメーションフライト

. . . .

38

2.6 まとめ

. . . .

43

第3章 設計方法の展開 44 3.1 はじめに

. . . .

44

3.2 線形パラメータ変動(LPV)システム

. . . .

44

3.2.1 予測状態軌道

. . . .

45

3.2.2 アルゴリズム

. . . .

46

3.3 高次振動モードに対するロバスト安定化

. . . .

47

3.3.1 アルゴリズム

. . . .

49

3.4 数値シミュレーション

. . . .

50

3.4.1 ソーラーパネルの回転を考慮した宇宙機のLPVモデル

. . .

50

3.4.2 柔軟構造物を有する宇宙機モデル

. . . .

55

3.5 まとめ

. . . .

58

(7)

第4章 地上実験 59

4.1 はじめに

. . . .

59

4.2 剛体LPVモデル

. . . .

59

4.2.1 数値モデル

. . . .

59

4.2.2 実験結果

. . . .

60

4.3 柔軟構造モデル

. . . .

64

4.3.1 数値モデル

. . . .

64

4.3.2 実験結果

. . . .

64

4.4 まとめ

. . . .

74

第5章 結論と課題 75 5.1 結論

. . . .

75

5.2 今後の課題

. . . .

77

付録A 離散時間信号に対する数学的基礎 78 A.1

L 2

ノルム

. . . .

78

A.2 パーセバルの定理

. . . .

78

付録B 宇宙機のダイナミクス 79 B.1 姿勢運動

. . . .

79

B.2 軌道運動

. . . .

80

付録C 入力状態安定性 81 C.1 入力状態安定性(ISS)

. . . .

81 付録D 終端状態制約集合

X f

の数値的評価 82

(8)

1

章 序論

1.1

研究背景

近年では,民間や大学で開発された小型衛星をピギーバック

1

で打ち上げるな ど,宇宙機開発はより身近なものになっている.一方で大型宇宙機によるミッショ ンはますます大規模なものになっている,例えば,既にJAXAが開発運用中の通信 衛星ETS-VIII(Fig.1.1)は3[ton℄の大型衛星であり,また現在計画中の天文観測衛 星ASTRO-H(Fig.1.2)は質量2.4[ton℄,望遠鏡進展後,全長14mにも及ぶ大型のX

線天文衛星となる予定である.これは日本の有する天文衛星では最大クラスであ る.またNASAが開発中のジェイムズ・ウェッブ宇宙望遠鏡(JWST,Fig.1.3)は,

質量6.2[ton℄になる見込みで,ハッブル宇宙宇宙望遠鏡が11[ton℄に対して小型化

したことになるが,そのミッション要求からJWSTはより遠い軌道に投入され,そ の基線距離を考えるとこれもまた大型の宇宙機と言える.このような天文衛星は 観測のために指向方向を自在に変更することが求められ,指向方向への制御精度 は観測の性能に直接影響し,目標方向の指向の速さも同時に必要である.そのた めこれらの大型衛星の三軸姿勢制御の設計は,ミッションの達成に非常に大きく 影響するものである.

こうした宇宙機の大型化や構造の複雑化に伴って,三軸姿勢制御にはますます大 きい課題が与えられている.まず,大型化に伴う構造振動制御が重要である.制御 性能に大きな影響を及ぼす低周波数帯域に,宇宙機の構造から生じる弾性振動の 周波数が近づきスピルオーバー不安定と呼ばれる,制御器と構造振動の干渉によ る不安定さが発生することがよく知られている[1,2℄.これらを回避する制御系設 計手法には,線形二次レギュレータ(LQR)に周波数遮断フィルターを用いて,弾 性振動周波数が励起されにくくすることで安定性を確保する方法[3,4℄や,力学系 の二階行列微分方程式の特性に着目して, 制御器を設計するDiretVeloityDiret

Feedbak(DVDFB)を用いる方法[5,6℄,または周波数特性を考慮することができる

H ∞

制御による制御系設計[7℄などが検討されてきた.次に,上記の制御系設計で は直接対応できないが大型宇宙機では容易に発生しうる入力飽和やアクチュエー タの特性の考慮,すなわち制御入力量に対する制約も重要な要素である.

宇宙機のアクチュエータは主に内力アクチュエータと外力アクチュエータに区 分される.内力アクチュエータは例えば,リアクションホイール(RW)やコント

(9)

ロールモーメンタムジャイロ(CMG)などの回転体を有するアクチュエータがそれ にあたる.ここでリアクションホイールは,この回転体と宇宙機の角運動量交換 によってトルクを生成するもので,姿勢安定化や姿勢制御を行うことができるが,

問題点として衛星の大きさに対して比較的小さいレンジのトルク(数十[mNm℄や

数[Nm℄)しか生成できないことや,回転体の有する角運動量が飽和した場合には

外力アクチュエータにより角運動量を宇宙機の外に放出するアンローディングが 必要となることがあげられる.また外力アクチュエータにおいて主に用いられる スラスタは,高圧のガスやイオンを高速で噴射し推力を得るアクチュエータであ る.多くの場合スラスタはクラスター状に集められてリアクションコントロールシ

ステム(RCS)として衛星に搭載される.スラスタはアンローディングで使用され

ることや軌道変更にも用いられていることから分かるように,内力アクチュエー タに比べて大きなトルク(数[Nm℄や数十[Nm℄クラス)を生成することが可能であ る.一方で,推薬弁の開閉が直接的な操作量となるためオンオフ信号によって所 望の制御入力を実現しなくてはならない.そのためこのオンオフ特性から擬似的 に連続的なトルクを得るために,PulseWidthModulation(PWM)を行って線形制御 則と組み合わせて実装する方法が広く用いられている[1℄.しかしこの方法では,

制御性能と安定性を厳密に保証することは困難となるといった問題がある.

このように,近年求められている姿勢制御系の設計には様々な要素を複合的に 考慮しなくてはならず,柔軟に設計仕様を組み込むことができる制御系設計が求 められている.そこで本論文では,上記のさまざまな問題を近年注目されている モデル予測制御[8,9℄を用いて解決することを目的とする.モデル予測制御は,理 論的には最適制御問題[10℄をもとにしていて,制御系設計がしやすいという利点 がある.また近年では,線形システムのみに限らず非線形システムやハイブリッ トシステムを対象とする理論研究[11,12℄[13℄が進んでいる.それらの結果を受け て,衛星の姿勢制御[14, 15,16℄やフォーメーションフライト[17, 18℄などの宇宙 システムを対象とした問題についても盛んに研究されている.

オンオフ入力を必要とするシステムに対するモデル予測制御は前述の[14,15,16℄

や,宇宙機以外の分野では自動車の電空クラッチアクチュエータを対象とした文献

[19℄,同様に自動車の暖房を対象とした研究[20℄がある.文献[14℄では,モデル 予測制御の一つであるExpliitModelPreditiveControl[21℄を用いて制御系を構築 し,剛体衛星の姿勢制御問題に適用している.この文献では,実際のRCSへの信 号は不感帯を有するBang-Bangモデュレーションによる近似を行っており,PWM

を用いて実装する手法と同様に安定性や制御性能に劣化が生じる可能性がある.一

方,文献[15℄の手法はExpliitMPCを用いて入力変動分に対する制約を与えるこ

とで,

{−1, 0, 1}

の3値のオンオフ入力を直接の制御入力として,RCSを用いた剛 体衛星の姿勢制御問題を取り扱っている.これらの方法は実装する上で,計算負 荷が小さくできる点で優れている.しかしながら,安定性についてはまだ十分に 議論がなされていない.そこで本研究では,安定性についての議論も含めて3値 のオンオフ入力を直接の制御入力とするオンオフモデル予測制御を考える.

(10)
(11)

Fig1.3:ImageofJamesWebbSpaeTelesope(C)NASA

(12)

1.2

研究目的

本研究の目的を次のように設定する.

1. リアクションコントロールシステムを主たるアクチュエータとして高速姿勢 マヌーバを実現する.

2. そのモデル予測制御系の構築法と安定性を明らかにする.

3. LPVモデルや柔軟構造物を有する宇宙機モデルについても安定性を保証した 制御系を構築する.

4. 地上実験を用いて,オンライン計算や制御器の実装が有効であるかを確認 する.

1.3

問題設定

本論文では,次の3つのモデルに対する制御系設計を通じて,宇宙機の姿勢制 御問題に取り組む.まず第2章では剛体衛星の姿勢制御問題を考える, これは3

値の離散入力によるオンオフモデル予測制御をもっとも簡単なモデルに適用して,

その有効性や安定性について議論するためである.

次に,第3章で線形パラメータ変動システムとなる柔軟衛星の姿勢制御問題に 拡張する.実際の宇宙機は軌道上でソーラーパネルを太陽方向に指向させること が多く,その結果としてモデルのダイナミクスの変動が生じる.更に柔軟構造物 の振動を考慮して,モデル低次元化とそれに伴う残余モードに対するロバスト安 定化問題を併せて検討する.また第4章では第3章で得られた結果をもとに地上 実験を行い,提案手法の有効性とオンライン計算アルゴリズムの実装可能性を確 認する.

1.3.1

剛体衛星

軌道上の剛体衛星の運動方程式として平衡点近傍で線形化した次式を考える.

J p ¨ = Lu

(1.1)

ここで,

p ∈ R 3

はロール,ピッチ,ヨーを含む角度ベクトルであるものとし,

J

は 慣性モーメント行列,

L

は制御入力

u ∈ R 3

の係数行列である.本研究のモデル予 測制御は離散時間システムを扱うため,上記の式を零次ホールドを仮定して一定 時間サンプリング間隔で離散化し,次式を得る.

x(k + 1) = F x(k) + Eu(k)

(13)

この時,状態量は

x ∈ R 6

であり,制御入力

u ∈ R 3

としてリアクションホイール

(RW)とリアクションコントロールシステム(RCS)の2種類のアクチュエータを想 定する.したがって,制御入力

u(k)

u = u rcs + u rw

(1.3)

となり,それぞれのアクチュエータの合力で表現され,それらの制約は,

u rcs : {−1, 0, 1} ∈ Z 3

(1.4)

u rw : u {rw,min} ≤ u rw ≤ u {rw,max} ∈ R 3

(1.5)

で与えられる.ここで,

u {rw,min}

u {rw,max}

はリアクションホイールの最大最小 出力を表す.

1.3.2

パラメータ変動を有する柔軟衛星

宇宙機が持つ太陽電池パネルは,常に太陽方向を指向するように宇宙機の軌道周 回に同期して回転する.その結果,システムは次の非拘束モードモデル(付録B.1)

で記述される線形パラメータ変動モデルとなる.

ξ ¨ + Λ(θ) ˙ ξ + Σ(θ)ξ = Γ(θ)u

(1.6)

ここで,

ξ ∈ R n

は剛体および弾性振動のモード座標,

Λ(θ) ≥ 0

はモード減衰項で あり,

Σ(θ) ≥ 0

はモード剛性項,そして

Γ(θ) ∈ R n×m

は入力係数行列である.

上記のダイナミクスを離散型LPVシステムに変換した次のシステムについて考 える.

x (k + 1) = F (θ k )x (k) + E(θ k )u(k)

(1.7) ここで,

x ∈ R 2n

は状態変数,

u ∈ R m

は制御入力,

θ k ∈ θ

k

ステップにおける 既知の変動パラメータである.そして,

(F (θ k ), E(θ k ))

はすべての

θ k

において可制 御であり,

F (θ k )

,

E(θ k )

はいずれも有界で,端点数

p

のポリトープ表現を用いて,

つぎの表記が可能であると仮定する.

F (θ k ) =

p

X

i=1

ρ i (θ k )F i , E(θ k ) =

p

X

i=1

ρ i (θ k )E i

(1.8)

ここで,スカラ関数

ρ i (θ k )

p

X

i=1

ρ i (θ k ) = 1, ρ i (θ k ) ≥ 0 ∀i

(1.9)

を満たす.またこの問題ではRCSのみの使用を考えることとして,制御入力

u(k)

の入力制約集合

Υ

u ∈ Υ = {−1, 0, 1} m ⊂ Z m

(1.10)

であるとする.

(14)

1.3.3

柔軟衛星

柔軟構造物を有する宇宙機は,多くの場合数値計算をもとに非拘束モードモデ ルが得られる.

ξ ¨ + Λ ˙ ξ + Σξ = Γu

(1.11)

ここで,

ξ ∈ R n c

は剛体および弾性振動のモード座標.

Σ ≥ 0

はモード剛性項,

Λ ≥ 0

はモード減衰項であり,そして

Γ ∈ R n×m

は入力係数行列である.

通常,モード次数

n c

は非常に大きいので制御系設計には,低次元化モデルを用 いる.これを離散型システムに変換した状態方程式

x(k + 1) = F x(k) + Eu(k) + w

y(k) = Hx(k)

(1.12)

について考えるものとする.この時,状態量

x ∈ R 2n c

であり(

n c < n

)

w ∈ R n c

は低次元化した際のモデル誤差を主とする外乱である.RCSにより生じる制御入 力

u(k) ∈ R m

は,次の入力制約集合

Υ

u ∈ Υ = {−1, 0, 1} m ⊂ Z m

(1.13)

を持つものとする.

(15)

1.4

主な記号

R , R n

:実数及び

n

次の実数ベクトル.

R n×n

:

n × n

次元の実数行列.

R ≥0

:非負の実数.

Z , Z n

:整数及び

n

次の整数ベクトル.

Z +

:正の整数.

R n 7→ R

:

R n

から

R

への写像.

M > 0

:行列

M

は正定行列である.

M ≥ 0

:行列

M

は半正定行列である.

M > N

:行列

M

N

について

M − N > 0

が成り立つ.

M ≥ N

:行列

M

N

について

M − N ≥ 0

が成り立つ.

I n

:

n × n

次元の単位行列.

|x|

:

x

のユークリッドノルム.

kM k

:

M

の誘導ノルム.

|x| 2 M

:

|x| 2 M = x T Mx

λ max (M )

:

M

の最大固有値.

σ max (M ), σ min (M )

:

M

の最大特異値,最小特異値.

(16)

2

章 モデル予測制御

2.1

はじめに

本章では,離散LTIシステムを対象とした3値量子化入力(オンオフ)によって制 御する新しいモデル予測制御手法を提案する.概要では,これまでの連続値入力 によるMPCにも共通する最適化問題の定式化を行う.その後,提案手法が入力状

態安定(ISS)を保証することを示す.数値シミュレーションでは,連続入力(RW)

とオンオフ入力(RCS)を併用した場合の性能について,また,

n

値量子化入力の 最適化問題に拡張できることを示す.最後に,状態制約が容易に扱えることを利 用したフォーメーションフライト問題への適用結果を示す.

2.2

概要

以下の線形離散時間時不変システムについて考えるものとする.

x(k + 1) = f(x(k), u(k)) = F x(k) + Eu(k)

(2.1)

ここで

x(k) ∈ R n

u(k) ∈ R m

はそれぞれ時刻

k

における状態量ベクトル, 制御 入力ベクトルであり,

(F, E)

は可制御であるとする.モデル予測制御の概要は一 般に以下のようになる.

まず,現在の時刻

k

における状態量

x(k)

をもとに

x(k + 1)

から

x(k + N )

への

N

ステップ先までの予測状態軌道

X (k) = [x(k + 1) T , . . . , x(k + N ) T ] T

を構成す る.ここで,

N

は予測ステップ数である.同様に対応する制御入力列に関しては 時刻

k

から

k + N − 1

まで考え,U

(k) = [u(k) T , . . . , u(k + N − 1) T ] T

と記述する.

そして,X

(k)

U (k)

に対してある評価関数

V ( X (k), U (k))

の各サンプリング時間 ごとの最適化を行い,得られた入力列

U o (k) = [u o (k) T , . . . , u o (k + N − 1) T ] T

のう ち,ステップ

k

時点の入力列をシステムに印可する(すなわち,

u(k) T = u o (k) T

と する).これをステップ毎に繰り返す.

予測状態軌道

X (k)

は,システムが離散線形である場合には,次の方法で簡単に 求めることができる.まず,式(2.1)のシステムに対して,現在の状態量

x(k)

から 予測状態軌道

X (k)

は,

X (k) = F x(k) + EU (k)

(17)

となる.ここで,それぞれの係数行列

F,E

は,

F =

 F 1 F 2

.

.

.

F N

 , E =

F 0 E 0 . . . 0 F 1 E F 0 E 0

...

.

.

.

.

.

. .

.

.

0

F N −1 E . . . F 1 E F 0 E

(2.3)

である.次に評価関数は二次形式評価関数として

X (k)

U (k)

から,

V N (x(k), U (k)) = X (k) T Q X (k) + U (k) T R U (k)

=

k+N−1

X

i=k+1

x(i) T Qx(i) + u(i − 1) T Ru(i − 1) +x(k + N ) T P x(k + N )

(2.4)

と構成するものとする.ここで,

Q = diag(Q, . . . , Q, P ) ∈ R nN×nN

は正定対称行 列であり,

R = diag(R, . . . , R, 0) ∈ R mN×mN

は半正定対称行列である.式(2.4)の 状態量と入力の重み行列

Q, R

は設計パラメータであり,一般的な無限時間線形二 次形式レギュレーション問題(LQR)と同様に,

Q

を大きくすることで制御性能が 向上し,

R

を大きくすることで,制御入力を抑える効果がある.また,終端評価行 列

P

は,閉ループシステムの安定性保証に関わる[9,22℄.例えば参考文献[22℄で は,離散時間代数リカッチ方程式の解を終端評価

P

とすることで,有限時間

N

ス テップまでを評価関数とする式(2.4)が入力制約のない場合において,無限ステッ プまでを評価する評価関数の最適解と等しくなることを利用して,閉ループ安定 性を保証する手法が示されている.本論文でも,有限時間

N

ステップ先までを最 適化するこで,システムの平衡点を安定化することを考える.行列

P

の具体的な 設計方法は2.3節に示す.

ここでは,本論文のオンオフモデル予測制御の最適化問題を導く.評価関数(2.4)

の1行目に,予測状態軌道(2.2)を代入し,

V N (x(k), U (k)) = X (k) T Q X (k) + U (k) T R U (k)

= ( F x(k) + EU (k)) T Q( F x(k) + EU (k)) + U (k) T R U (k)

= ǫ T Qǫ + 2ǫ T Q EU (k) + U (k) T ( E T Q E + R) U (k)

を得る.ここで,予測状態軌道のうち定数となる項

F x(k)

ǫ

とおいた.以上より,

この評価関数の制御入力

U

による最適化は

T Q EU (k) + U (k) T ( E T Q E + R) U (k)

についてのみ考えればよいことがわかる.

よって,本論文で用いる最適化問題は,

min U { U (k) T Φ U (k) + φ T U (k)}

s.t.

x : x(k) ∈ Ξ, ∀k u : u(k) ∈ Υ, ∀k

U : [u(k) T , . . . , u(k + N − 1) T ] T

(2.5)

(18)

である.ただし,

Φ = E T Q E + R φ = 2( F x(k)) T Q E

とした.この最適化問題の評価関数が凸であるための条件は

Φ = Φ T ≥ 0

のとき である.

2.3

モデル予測制御の安定性

ここで,オンオフ入力で制御されるLTIシステム(2.1)の入力状態安定(ISS)条 件を導出する.入力状態安定の概念は,E.D.Sontagによって導入された安定条件

[23, 24,25℄で,リヤプノフ安定性の枠組みをもとに, 外乱入力による非線形性を 許す安定条件となっている.そのため非線形制御問題の安定解析に対する有用な ツールとしてよく用いられている.更に,JiangとWangによって離散時間システ ムに拡張された[26℄ことによって,非線形モデル予測制御やロバストモデル予測 制御の安定性解析にも利用されている[27,28℄.

モデル予測制御を用いる際の準備として,まず終端状態量

x(k + N )

と終端制御 入力

u(k + N − 1)

をそれぞれ

x N

u N

として,以下の仮定をおく[29,30℄. 仮定1

[A1℄

0 ∈ X f ⊂ Ξ

かつ

X f

は閉集合

[A2℄

u N (x N ) ∈ Υ, ∀x N ∈ X f

[A3℄

f(x N , u N ) ∈ X f , ∀x N ∈ X f

ここで,

X f

は終端制約集合を,

f (x N , u N )

はシステムのダイナミクス(2.1)を表 す.仮定1は,終端状態量

x N

X f

の中にあるとき,

x N

は状態制約集合

Ξ

を満足 し,それに対応する終端制御入力

u N (x N )

は入力状態集合

Υ

を満足すること,そ して,

X f

は不変集合であることを意味する.

この仮定のもとで,つぎの補題が得られる.

補題1 モデル予測制御の評価関数(2.4)をISS–リアプノフ関数の候補とする.仮 定1のもとで,クラス

K

関数

α 3

およびクラス

K

関数

σ

が存在して,次の不等式

F (x N ) + L(x N , u N ) ≤ −α 3 (|x N |) + σ(|µ|), ∀x N ∈ X f

(2.6)

を満足する時,閉ループシステムの原点は入力状態安定となる.ここで,終端評 価の差分

F (x N )

と状態量と入力の増分

L(x N , u N )

は,それぞれ

F (x N ) = |x N+1 | 2 P − |x N | 2 P

L(x N , u N ) = |x N | 2 Q + |u N | 2 R

(2.7)

(19)

証明1 最適状態軌道

X o (k)

とその最適入力列

U o (k)

X o (k) = {x o (k + 1) T , x o (k + 2) T , . . . , x o (k + N ) T } T U o (k) = {u o (k) T , u o (k + 1) T , . . . , u o (k + N − 1) T } T

と与えられるとすると,1ステップ先の軌道は

X (k +1) = {x o (k +2) T , . . . , x o (k +N ) T , x(k +N +1) T } T U (k +1) = {u o (k +1) T , . . . , u o (k +N −1) T , u(k+N ) T } T

となり,その評価関数は現在の評価関数の値

V ( X o (k), U o (k))

を用いて,

V ( X (k +1), U (k +1)) = V ( X o (k), U o (k))

− |x o (k +1)| 2 Q −|u o (k)| 2 R −|x o (k +N)| 2 P

(2.8)

+ |x o (k +N )| 2 Q +|u o (k +N −1)| 2 R +|x(k +N +1)| 2 P

と記述することができる.ここで,リアプノフの安定定理と同様に,1ステップに おける評価関数の差分を

∆V

として

∆V = V ( X (k + 1), U (k + 1)) − V ( X o (k), U o (k))

(2.9)

とおく.式(2.7)を用いて式(2.8)は

∆V + L(x o (k +1),u o (k)) = F (x o (k +N))+ L(x o (k+N ),u o (k +N −1))

(2.10)

と書ける.式(2.10)の状態変数

x o (k + N )

と入力

u o (k + N − 1)

x N

u N

とお くと,式(2.10)中の

L(x o (k + 1), u o (k))

が非負であることから

∆V ≤ F (x N ) + L(x N , u N ), ∀x N ∈ X f

(2.11)

が得られる.したがって,もしクラス

K

関数

α 3

およびクラス

K

関数

σ

が存在し て,式(2.6)を満足するならば,

V N (x(k), u(k))

はISS-リアプノフ関数となり,ISS

に関する定理3(付録C)より閉ループシステムの原点は入力状態安定となる.

この補題を用いて,次の定理を得る.

定理1 状態量と入力の重み行列をそれぞれ

Q > 0

R ≥ 0

とし,終端制御入力を定 数ゲイン入力

Kx N

と補償入力

ν

から次式のように構成されているとする.

u N (x N ) = Kx N + ν

(2.12)

仮定1のもとで,あるスカラー値

γ > 0

が存在して,終端評価行列

P

が条件

S T P S − P + Q + K T RK ≤ −γI n , ∀x N ∈ X f , u N (x N ) ∈ Υ

(2.13)

(20)

x N

-1 1 0 u

X

x

sat

N

K v

Fig2.1:On-offinput

x N

0 u

X

x

sat

N

K

v

1

-1

Fig2.2:

n

quantizationinput

を満たすとき,最適化問題(2.5)を解くオンオフモデル予測制御からなる閉ループ システムはISSとなる.

ここで

X f ⊆ {x| |K i x| ≤ 1 ∀i}

であり,

S

は,

S = F + EK, |λ max (S)| < 1

(2.14)

である.

証明2 まずモデル予測制御の評価関数(2.4)がISS–リアプノフ関数の候補である と仮定し,補題1を用いて安定性を示す.式(2.6)の左辺は,

F (x N ) + L(x N , u N ) = x T N +1 P x N +1 −x T N P x N + x T N Qx N +u T N Ru N

. (2.15)

ここで終端状態量

x N

が終端状態制約集合

X f

を満たし,終端制御入力

u N

が入力 制約集合

Υ

を満たすとき,補償入力

ν

のすべての要素

ν i

を式(2.12)より以下の範 囲で選ぶことができる(Fig.2.1).

ν i ∈ {ν i | |ν i | ≤ 1}

(2.16)

したがって,式(2.15)は,式(3.4),(2.12),(2.14)より,

(2.15) = x T N (S T P S − P + Q + K T RK )x N + F

(2.17)

を満たす.ただし

F

は,

F = 2ν T (E T P S + RK)x N + ν T (E T P E +R)ν

(2.18)

(21)

である.終端評価行列

P

がLMI(2.13)を満たすとき,以下の不等式が成り立つ.

(2.17) ≤ −γx T N x N + F

≤ −γ|x N | 2 +(kEk 2 kP k+kRk)|ν| 2 + 2(kEkkP kkSk + kRkkKk)|ν||x N |

(2.19) ここで式(2.19)の右辺に非負の

(|x N |/z −z(kEkkP kkSk + kRkkK k)|ν|) 2 ≥ 0

を加えると,

(2.19) ≤ −γ|x N | 2 + |x N | 2 /z 2

+ z 2 (kEkkP kkSk + kRkkK k) 2 |ν| 2 + (kEk 2 kP k + kRk)|ν| 2

(2.20) が得られる.したがって式(2.15)は

F (x N ) + L(x N , u N )≤ −α 3 (|x N |) + σ(|ν|)

(2.21) を満たす.ここで,

α 3 ( |x N | )=(γ − 1/z 2 )|x N | 2

σ( |ν| )=( z 2 (kEkkP kkSk + kRkkKk) 2 +kEk 2 kP k + kRk )|ν| 2

である.明らかに

γ > 1/z 2 > 0

を満たす任意のスカラ変数

z

に対して,

α 3 (|x N |)

はクラス

K

関数であり,

σ(|ν|)

はクラス

K

関数である.したがって評価関数

V N

はISS–リアプノフ関数であり,補題1より閉ループシステムはISSである.また,

終端制御則に

u N (x N ) = Kx N + ν

を用いた評価関数

V N (x(k), U (k))

と最適オンオ フモデル予測制御の評価関数

V N (x(k), U o (k))

を比較すると,最適性より

V N (x(k), U (k)) ≥ V N (x(k), U o (k)), ∀k ∈ Z +

(2.22)

となることは明らかである.したがって最適化問題 (2.5)を解く最適オンオフモデ

ル予測制御もまたISSを保証する.

これより連続値入力の場合の次の安定条件が得られる.

系1 連 続 値 入 力 が 実 現 で き る と き は ,

ν = 0

と す る こ と が で き ,そ れ に 伴って

式(2.6)中の

σ = 0

となる.その結果,閉ループシステムは漸近安定となる.

従って,もし終端評価

x T N P x N

にLMI(2.13)を満たす

P

を用いるならば,閉ルー プシステムはRCSに対して入力状態安定となり,RWに対しては漸近安定となる.

両方のアクチュエータを用いる場合には,RCSの使用によってISS領域に到達し,

その後,RWの働きによって漸近安定となると推測できる.連続値入力が扱える

RWのみでの制御の場合,漸近安定性を保証する終端評価の候補として代数リカッ チ方程式の解

P

を用いる手法が良く知られている[9,31℄. この手法の漸近安定性

も式(2.6)を用いることで次のように証明できる.

(22)

系2 評価パラメータを

Q, R > 0

と仮定する,この時,仮定1のもとで,終端評価 行列

P

が代数リカッチ方程式(DARE)

F T P F − P + Q − F T P E(E T P E + R) −1 E T P F = 0

(2.23) を満たすとき,閉ループシステムの原点は漸近安定となる.

証明3 終端制御則を

u N (x N ) = Kx N

とする,ここで

K = (E T P E + R) −1 E T P F

式(2.13)へ代入すると,次式を得る.

x T N (F T P F −P +Q−F T P E(E T P E+R) −1 E T P F )x N = 0, ∀x N ∈ X ¯ sat ⊆ X f .

(2.24) ここで,

X ¯ sat = {x ∈ R n |u min ≤ u N (x) ≤ u max }

は入力制約に違反しない状態制約

集合である.

このDARE(2.23)の解

P

は証明から明らかなように,LMI(2.13)を満たす解に包 含される.したがって,LMI条件(2.13)が,MPCの終端評価の設計においてより 柔軟性があるといえる.

系3 式(2.12)について,

n

値量子化入力の時(Fig.2.2),3値量子化(オンオフ)入力 と比べて

ν

は明らかに同じか,より小さくすることができる.

2.4

モデル予測制御のアルゴリズム

提案するモデル予測制御のアルゴリズムをまとめて示す.

オフライン設計:

R 1.

評価関数中の任意の設計パラメータ行列

Q, R > 0

を設定する.

R 2. F + EK

のスペクトル半径を1以下とするゲイン

K

を設定する

1

R 3.

LMI(2.13)を解くことで終端評価行列

P

を得る.

R 4.

予測ステップ数に対応する拡大設計パラメータ行列

Q, R

を構成する.

オンライン最適化:

S 1.

予測ステップ

N

先までの予測状態軌道

X

(2.3)を計算する.

S 2.

現在の状態量

x(k) ˆ

を取得し,最適化問題(2.5)を解く.

S 3.

最適化し得られた入力列

U o

のうち最初のステップをシステムの入力

u(k)

と して加える.

S 4. S 1

に戻る.

1

ゲイン

K

をできる限り小さく設定することで終端状態制約集合

X ¯ f

を大きくすることができ,

(23)

2.5

数値シミュレーション

2.5.1

剛体宇宙機の姿勢制御

(RW+RCS)

剛体衛星の姿勢運動は次の運動方程式で表せる.

J p ¨ = Lu

(2.25)

ここでは慣性モーメント行列

J ∈ R 3×3

のみを考え,減衰項

D

や剛性項

K

は存在 しないものとする.

p ∈ R 3

はロール,ピッチ,ヨー角度を含むベクトル,

L

は入 力係数行列である.

このモデルに対し,Table2.1をシミュレーションパラメータとして,3ケースに 分けて数値シミュレーションを行いオンオフモデル予測制御の有効性を検証する.

数値シミュレーションはYALMIP[32℄とMPTtoolbox[33℄を用いてMatlab環境上 で実行した.

ケース1(終端評価行列

P

の比較):

ま ず,RW の み を 用 い た 連 続 値 入 力 の MPC 問 題 を 考 え ,終 端 評 価 行 列

P

を 式(2.13)のLMIより求めた場合と,従来手法である式 (2.23)のDAREの解を用い た場合を比較する.Fig.2.3はロール角の1[deg℄のステップ応答とそれに伴う入力 応答を示す.他の軸については目標角度は全て零を設定している.またこの時の 姿勢誤差のノルムをFig.2.4に示す.両方のMPCにおいて目標角度に収束し漸近 安定となっていることが確認できる.また他軸との力学的カップリングについて は無視できるものであることもわかる.しかしながら,DAREを用いたMPCの方 の応答は振動的であり入力飽和が度々生じていることが確認できる,また結果的 には両者の整定時間は同様になっていることも分かる.これは,DAREの一意の 解が入力制約に対して十分大きくないことに起因し,終端評価が小さく見積もら れているためである.これに対しLMI(2.13)より得られた終端評価はゲイン行列

K

を小さく見積もることで,終端評価行列

P

をより大きく設定することができる.

結果的にLMIをもとにしたMPCのほうがDAREをもとにしたMPCよりも設計 に対して柔軟性を持ち優れた結果となることを示した.

ケース2(アクチュエータの組合せ,ステップ応答):

ケース1ではRWのみでの制御に関して2つの異なる終端評価を用いてモデル 予測制御を行った.ケース2では,ロール角に対する1[deg℄へのステップ応答につ いて,RCSのみを用いた場合,RCSとRWを併用した場合について,そしてRW

のみを用いた前回の結果Fig.2.3(LMI)を比較し,それぞれのアクチュエータの組 み合わせに着目し制御性能の比較を行う.Fig.2.5の姿勢角及び入力応答結果から,

(24)

RCSを用いた姿勢マヌーバのみが入力状態安定(ISS)となっていること,またRW

単体での姿勢マヌーバは漸近安定とはなるがRCSに比べて,応答が遅く望ましい 性能が得られないことが確認できる.ISS安定となるRCSのロール角姿勢誤差は

約0.05[deg℄であった.RCSとRWを併用した場合のみ両者のアクチュエータ特性

を活かし,応答が速く,かつ漸近安定となっていることが確認できた.Fig.2.6に は制御性能の評価として姿勢誤差のノルムを示す.Fig.2.7にはそれぞれの入力量 について図示した.RCSは最初に10[se℄ほど作動し,状態量を安定領域近傍に 移動させ,それ以降はRWのみでシステムを漸近安定としていることが確認でき

る.Fig.2.8にはMatlab環境下ではあるが各ステップでの最適化時間を示す.明ら

かにサンプリング周期1[se℄以内で最適化計算が収まっていることがわかる.

ケース3(アクチュエータの組合せ,高速スイッチングマヌーバ):

最後に今まで提案したMPC(RW,RCS,RW+RCS)を用いて,ロール角度を目標角 度0[deg℄と10[deg℄とし,100秒周期毎に反復するスイッチングマヌーバ問題を考 える.ただし,ピッチ角,ヨー角については初期0[deg℄を維持することを制御目 標とする.明らかに,RWのみで制御しようとする場合,繰り返し指令に対して 応答が遅いために追従できていないこと,RCSのみでの制御の場合は追従はする が偏差が残ってしまうことがFig.2.9から確認できる.このことは角度誤差に関す るFig.2.10からも確認することができる.RCSとRWを併用した際のそれぞれの 入力はFig.2.11に示す.これらの結果から全ての要求を満たしているのはRCSと

RWを併用する場合のみである.

(25)

Parameter Parametervalue

Inertia

J [kgm 2 ]

6.0701 −0.0163 −0.0974

−0.0163 6.9443 0.0119

−0.0974 0.0119 8.9646

 × 10 4

Preditionsteps

N

10

Samplingtime

[sec]

1

RCSoutput

[Nm]

100

RWoutput

[Nm]

0.04

Stageostmatrix

Q

=10E-1

I n

,

R

=10E-3

I m

Case1: Comparisonofterminalostmatrix(3000[se℄)

Initialangle

[deg]

[0,0,0℄

Targetangle

[deg]

[1,0,0℄

Case2: Attitudestepmaneuver(300[se℄)

Initialangle

[deg]

[0,0,0℄

Targetangle

[deg]

[1,0,0℄

Case3: Swithingmaneuver(300[se℄)

Initialangle

[deg]

[0,0,0℄

Targetangle

[deg]

[10,0,0℄(100[se℄)

[0,0,0℄(200[se℄)

[10,0,0℄(300[se℄)

(26)

0 500 1000 1500 2000 2500 3000

−1

−0.5 0 0.5 1 1.5 2

Time[sec]

A ngl es [de g]

0 1000 2000 3000

−0.05 0 0.05

Time[sec]

Input s[N m ]

Fig2.3:Responsesofattitude(top)andontrolinput(bottom): DARE(—–),LMI(—–)

(27)

0 500 1000 1500 2000 2500 3000 0

0.2 0.4 0.6 0.8 1

Time[sec]

N orm of e rror

Fig2.4:Normsofattitudeerror: DARE(—–),LMI(—–)

(28)

0 50 100 150 200 250 300

−0.2 0 0.2

RW

0 50 100 150 200 250 300

0 0.5 1

RCS

0 50 100 150 200 250 300

0 0.5 1

Time[sec]

RW + RCS

0 100 200 300

−0.05 0 0.05

RW

0 100 200 300

−100 0 100

RCS

0 100 200 300

−100 0 100

Time[sec]

RW + RCS

Fig2.5:Responsesofattitude(top)andontrolinput(bottom):x(—–),y(---),z(

·

–

·

–

·

)

(29)

0 50 100 150 200 250 300 0

0.2 0.4 0.6 0.8 1 1.2

Time[sec]

N orm of e rror

Fig2.6:Normsofattitudeerror: RW(—–),RCS(---),RW+RCS(

·

–

·

–

·

)

(30)

0 100 200 300

−100 0 100

RCS

0 100 200 300

−0.05 0 0.05

RW

Time[sec]

Fig2.7:ControlinputsofRCS(top)andRW(bottom):x(—–),y(---),z(

·

–

·

–

·

)

0 50 100 150 200 250 300

0 0.1 0.2 0.3 0.4 0.5

Time[sec]

Com put at ion t im e[s ec ]

· · ·

(31)

0 50 100 150 200 250 300

−0.2 0 0.2

RW

0 50 100 150 200 250 300

0 5 10

RCS

0 50 100 150 200 250 300

0 5 10

Time[sec]

RW + RCS

0 100 200 300

−0.05 0 0.05

RW

0 100 200 300

−100 0 100

RCS

0 100 200 300

−100 0 100

Time[sec]

RW + RCS

Fig2.9:Attituderesponses(top)andontrolinputs(bottom):x(—–),y(---),z(

·

–

·

–

·

)

(32)

0 50 100 150 200 250 300 0

0.2 0.4 0.6 0.8 1 1.2

Time[sec]

N orm of e rror

Fig2.10:Normsofattitudeerror:RW(—–),RCS(---),RW+RCS(

·

–

·

–

·

)

(33)

0 100 200 300

−100 0 100

RCS

0 100 200 300

−0.05 0 0.05

RW

Time[sec]

Fig2.11:ControlinputsofRCS(top)andRW(bottom):x(—–),y(---),z(

·

–

·

–

·

)

(34)

2.5.2

剛体宇宙機に対する

3

値量子化

(

オンオフ

)

と n 値量子化によ る制御

前節で求めた系3を剛体宇宙機の姿勢制御問題へ適用し,3値量子化(オンオフ)

入力と

n

値量子化入力を比較して効果を確認する.

量子化入力

ここでは,制御アクチュエータが正負方向の

n

値量子化(Fig.2.2)出力が可能な スラスタの組として考える.すなわち,

u i = α

β u max , α = 0, ±1, . . . , ±β

(2.26) こ こ で ,

α/β

は ス ラ ス タ の 噴 射 の デュー ティ比 を 表 す.

β = 1

の と き

u

は 不 感 帯を持つオンオフ制御となる. それ以外の時は,

u max

に関して

β

段階の入力に 分割される階段値入力となる. ただし

β

は正の整数である.これを入力制約集合

Υ = {u i |u i = α β u max , α = 0, ±1, . . . , ±β}

とすると,最適化問題は次の整数二次計 画問題に書き直すことができる.

min U { U (k) T Φ U (k) + φ T U (k)}

s.t.

x : x(k) ∈ Ξ, ∀k

u : u(k) ∈ {−β, −β + 1, . . . , 0, . . . , β − 1, β} m ⊆ Υ, ∀k U : [u(k) T , . . . , u(k + N − 1) T ] T

(2.27)

ここで,

Φ = (u max /β) 2 E T Q E + R φ = 2( F x(k)) T Q E u max

シミュレーションモデル

剛体衛星問題を簡略化して次の数学モデルを得る.

J p ¨ = Lu

(2.28)

ここで,

p ∈ R 3

はロール,ピッチ,ヨー角度を含むベクトル,

L

は入力係数行列 である.上記の式を一定時間サンプリング間隔で離散化し,次式を得る.

x(k + 1) = F x(k) + Eu(k)

y(k) = Hx(k)

(2.29)

(35)

ケース1(状態フィードバック)

最適化問題(2.27)に基づく,状態フィードバックによるモデル予測制御のシミュ レーション結果を示す.アクチュエータの特性は,式(2.26)に従うものとし,3値量 子化(オンオフ)制御

(β = 1)

n

値量子化制御

(β = 10)

の場合を考える.また,比較 のために決定変数に連続値をとり,

(β = 10)

の分解能で整数丸めを行うモデル予測

制御(PWM)の結果も併せて示す.全ての制御則で制御サンプリング周波数は1Hz

とし,予測ステップ数はN=10とする.評価関数の重み行列は,

Q = I 6 , R = 0.1×I 3

とした.

Fig.2.12,Fig.2.13にロール角を10[deg℄姿勢変更した際の応答を示す.それぞ れ上から順に,ロール,ピッチ,ヨーの角度と制御トルクである.またTable.2.2,

Table.2.3にはそれぞれ,サンプリング周波数を1Hzに固定し予測ステップ数を変

化させた場合と,予測ステップ数を固定しサンプリング周波数を変化させた場合 の

t f = 100[sec]

x(t f )

のノルムを示す.漸近安定ではないが原点を含む領域に 留まっていることがわかる.各ステップにおける評価関数の最小値の時間応答を

Fig.2.14に,オンライン最適化に要する計算時間をFig.2.15に示す.

n

値量子化制 御がオンオフ制御より高性能であること,Matlab使用での結果であるが,オンラ イン計算時間はサンプリング周期1[se℄以内に収まっていることがわかる.また,

(β = 10)

とPWMを角度精度について比較すると,本手法のオンオフ値を用いて

直接最適化するモデル予測制御の方が制御性能が高いことが確認できる.

ケース2(出力フィードバック)

次に角度のみが観測できる場合を仮定し,出力フィードバックによるモデル予 測制御のシミュレーション結果を示す.出力フィードバックを実現するために,

ˆ

x(k + 1) = F x(k) + ˆ Eu + G(y − H x(k)) ˆ

(2.30)

で表される状態オブザーバを用いる.ここで

G

はオブザーバゲインである.ケー ス1と同条件での結果をFig.2.16からFig.2.19に示す.オンライン計算時間が増加 していること以外は,ケース1とほぼ同様の結果である.

(36)

PreditionStep(N)

β = 1

:

kx(t f )k 2 β = 10

:

kx(t f )k 2

PWM:

kx(t f )k 2

1

10.1E+1 6.46E+0 6.55E+0

3

14.9E−2 1.84E−2 4.12E−2

5

14.9E−2 1.84E−2 4.50E−2

10

14.9E−2 1.84E−2 4.50E−2

15

14.9E−2 1.84E−2 3.68E−2

Table2.3:DiffereneofsamplingfrequenywithN=10

Samplingfrequeny[Hz℄

β = 1

:

kx(t f )k 2 β = 10

:

kx(t f )k 2

PWM:

kx(t f )k 2

1

14.9E−2 1.84E−2 4.50E−2

2

3.13E−2 9.76E−3 8.77E−3

5

3.83E−2 5.85E−3 9.01E−3

10

2.54E−2 8.73E−4 5.73E−3

(37)

0 20 40 60 80 100

−5 0 5 10

Time[sec]

Roll angle[deg]

β=1 β =10 PWM

0 20 40 60 80 100

−0.025

−0.02

−0.015

−0.01

−0.005 0 0.005 0.01

Time[sec]

Pitch angle[deg]

β =1 β =10 PWM

0 20 40 60 80 100

−0.02

−0.01 0 0.01 0.02 0.03 0.04 0.05

Time[sec]

Yaw angle[deg]

β =1 β=10 PWM

Fig2.12:Responseofattitudeangles(ase1)

(38)

0 20 40 60 80 100

−150

−100

−50 0 50 100 150

Time[sec]

Torque[Nm]

β=1 β =10 PWM

0 20 40 60 80 100

−150

−100

−50 0 50 100 150

Time[sec]

Torque[Nm]

β =1 β =10 PWM

0 20 40 60 80 100

−150

−100

−50 0 50 100 150

Time[sec]

Torque[Nm]

β =1 β=10 PWM

Fig2.13:Responseofinputtorques(ase1)

(39)

0 20 40 60 80 100 0

0.5 1 1.5

2 x 10 4

Time[sec]

Minimum cost

β=1 β=10

Fig2.14:Timehistoryofminimumost(ase1)

0 20 40 60 80 100

0 0.1 0.2 0.3 0.4 0.5

Time[sec]

Computation time[sec]

β =1 β=10 PWM

Fig2.15:Computationtime(ase1)

(40)

0 20 40 60 80 100

−2 0 2 4 6 8 10

Time[sec]

Roll angle[deg]

β=1 β =10 PWM

0 20 40 60 80 100

−0.025

−0.02

−0.015

−0.01

−0.005 0 0.005 0.01

Time[sec]

Pitch angle[deg]

β =1 β =10 PWM

0 20 40 60 80 100

−0.02

−0.01 0 0.01 0.02 0.03 0.04 0.05

Time[sec]

Yaw angle[deg]

β =1 β=10 PWM

Fig2.16:Responseofattitudeangles(ase2)

(41)

0 20 40 60 80 100

−150

−100

−50 0 50 100 150

Time[sec]

Torque[Nm]

β=1 β =10 PWM

0 20 40 60 80 100

−150

−100

−50 0 50 100 150

Time[sec]

Torque[Nm]

β =1 β =10 PWM

0 20 40 60 80 100

−150

−100

−50 0 50 100 150

Time[sec]

Torque[Nm]

β =1 β=10 PWM

Fig2.17:Responseofinputtorques(ase2)

(42)

0 20 40 60 80 100 0

2 4 6 8 10 x 10 4

Time[sec]

Minimum cost

β=1 β=10

Fig2.18:Timehistoryofminimumost(ase2)

0 20 40 60 80 100

0 0.1 0.2 0.3 0.4

Time[sec]

Computation time[sec]

β=1 β=10 PWM

Fig2.19:Computationtime(ase2)

(43)

2.5.3

フォーメーションフライト

オンオフ入力を用いたMPCのもう一つの応用例として,複数機の人工衛星の フォーメーションフライト問題を考える.ここでは衝突回避則を状態制約として 与えてシミュレーションを行う.

複数機の運動方程式

まず,円軌道の1機の人工衛星の運動はCWH方程式(付録B.2)により次の状態 方程式で記述できる.

 

 

˙ x =

"

0 3 I 3

−K −G

# x +

"

0 3

I 3

# u y = x

(2.31)

ここで,

x = [p T , p ˙ T ] T

であり,

p ∈ R 3

は相対位置ベクトル,

p x

は軌道面に対する 接線方向,

p y

は法線方向,

p z

は地心方向である.また

G, K

G =

0 0 −2n v

0 0 0

2n v 0 0

 , K =

0 0 0

0 n 2 v 0 0 0 −3n 2 v

 .

n v

は軌道角速度である.状態方程式(2.31)は次式のように複数機のフォーメーショ ンフライトのモデルに拡張することができる.

(

˙

x m = I s ⊗

"

0 3 I 3

−K −G

#

x m + 1 s

"

0 3

I 3

#

u m

(2.32)

ここで,

はクロネッカー積を示し, 添え字

s

は宇宙機の個数である,

x m ∈ R 6s

u m ∈ R 3s

はそれぞれ拡張した状態ベクトル及び入力ベクトルである.モデル予 測制御ではこの状態方程式(2.32)を一定サンプリング周期の離散時間モデルに変 換し,離散状態方程式(2.1)に変換して使用する.

衝突回避則

次に,衝突回避則の導入のために,まず2機の衛星に対する立方体状の安全領 域を考える.

p l

p lm

はそれぞれ2機の位置ベクトルを表し,

or

条件を用いて次 の条件を得る.

|p l x − p lm x | ≥ σ x or |p l y − p lm y | ≥ σ y or |p l z − p lm z | ≥ σ z

(2.33)

(44)

バイナリー変数

δ i

と十分大きい正の実数

M

を導入して,

or

条件を

and

条件へと 書き直して次の条件が成り立つ[34℄.

p l x − p lm x ≥ σ x − Mδ 1

p lm x − p l x ≥ σ x − Mδ 2

p l y − p lm y ≥ σ y − Mδ 3 p lm y − p l y ≥ σ y − Mδ 4

p l z − p lm z ≥ σ z − Mδ 5

p lm z − p l z ≥ σ z − Mδ 6

6

X

i=1

δ i ≤ 5

(2.34)

この

and

条件を行列形式の不等式としてまとめると

Lx ≥ s − MI 6 d , 1 T 6 d ≤ 5

(2.35)

となる.ここで

L

は位置ベクトル

p l

p lm

の組み合わせを与える行列で,

s

σ {x,y,z}

に関するベクトルである.また

d

はバイナリ変数の組をなすベクトルである.従っ て式(1.4)と式(2.35)は最適化変数

u(k)

に対する拘束となる. これらの結果から,

式(2.34)を予測ステップ数

N

分拡大することによって最適化問題は次の形でまと

められる.

min U , D { U (k) T Φ U (k) + φ T U (k)}

s.t.

x : x(k + 1) = F x(k) + Eu(k) U : u(k), u(k + 1), . . . , u(k + N − 1) u i : u i ∈ {−1, 0, 1}

D : L { F x(k) + EU (k)} ≥ S − MD ( 1 N ⊗ I n p ⊗ 1 6 T ) D ≤ 1 n p N ⊗ 5

(2.36)

ここで,

Φ = E T Q E + R

φ T = 2( F x(k) − X r ) T Q E

とおいた.また,

n p

は組み合 わせ数.係数行列

L , M

と拡大ベクトル

S

はそれぞれ,

L =

 L 1

L 2

.

.

.

L N

, M = diag(MI 6n p , . . . , MI 6n p ) ∈ R 6n p N×6n p N , S =

 s 1 s 2

.

.

.

s N

(2.37)

となり,

L 1 , . . . , L N

および

s 1 , . . . , s N

は各ステップ毎の制約を表し,Dはバイナ リー変数組である.

(45)

−20 0

20 −20 0 20

−1

−0.5 0 0.5 1

X−axis Z−axis

Y−axis

S1 S2

Fig2.20:3-Dplotofresponses

2機の宇宙機のフォーメーションフライト

数値シミュレーションでは, 式(2.32)に従う2機(S1とS2)の宇宙機のフォー メーションフライトを考える.

数値モデルのパラメータとして

µ = 3.986 × 10 14 [m 3 /s 2 ]

,円軌道半径を

r = 7000

[km℄,入力の最大値を

0.02

[N/kg℄として,システムは零次ホールドサンプリング として

1

[se℄周期で離散化したモデルを用いる.

評価関数のパラメータは

N = 10

Q= I n

R = 0.01I m

に設定した.衝突回避の 安全領域

σ

は3方向全てに対して1[m℄とした.それぞれの衛星の初期位置は衛 星 1(S1),衛星2(S2)に対してそれぞれ

[−10, 0, −10]

[−10, 0, 10]

[m℄を設定し,

目標位置はそれぞれ

[10, 0, 10]

[10, 0, −10]

[m℄とする制御を行う.この問題設定 ではS1とS2の位置は軌道平面上で交わることになるため, 衝突回避を要する問 題である.

Figs.2.20-2.21はそれぞれの衛星の軌道を表す.Fig.2.23はそれぞれの衛星の目 標位置との差をノルムを用いて評価する.Fig.2.20とFig.2.23の結果から,衝突 回避を達成し目標位置近傍に収束させることができたことがわかる.Fig. 2.22で は全ての衛星のスラスターが目標位置近傍においても噴射を続けていることが確 認できるが,このフォーメーションシステムは入力制約と安定性を満たしている.

Fig 2.1: On-off input
Fig 2.3: Responses of attitude (top) and ontrol input (bottom): DARE(—–), LMI(—–)
Fig 2.5: Responses of attitude (top) and ontrol input (bottom): x(—–), y(- - -), z( · – · – · )
Fig 2.9: Attitude responses (top) and ontrol inputs (bottom): x(—–), y(- - -), z( · – · – · )
+7

参照

関連したドキュメント

2.8 Effect of drawing ratio on (a) yield strength and (b) reduction of area of 43C-A and 43C-B samples after spheroidizing annealing at 958 K for 5 h.. 2.9 Effect of annealing

Devil River Practical useIndustrialization Death Valley Darwinian Sea Pilot program Societal implementation Darwinian Sea Death Valley Devil River make the exit of the

We first executed a propane oxidation reaction and a CO oxidation reaction to test the catalytic activity to confirm whether the catalysis is different for particles of

Naohisa NAGAYA, Masashi YOSHIDZUMI, Maki SUGIMOTO, Hideaki NII, Taro MAEDA, Michiteru KITAZAKI and Masahiko INAMI: Gravity Jockey: A Novel Music Experience

For three data center storage disaster recovery system, we provide a control mechanism that virtually builds a replication while data on storage in the.. production data

本論文で目標とする IPsec 通信の概念を図 5-1 に示す。図 5-1 では Home LAN1 内に IPsec 機器が三つあり、それぞれが外部からの IPsec

Laprie, B.Randell, and Landwehr, “Basic Concepts and Taxonomy of Dependable and Secure Computing”, IEEE Trans.on Dependable and Secure Computing, vol.1, No.1, Jan.-Mar.. 第 6

㻜 㻝㻜 㻞㻜 㻟㻜 㻠㻜 㻡㻜 㻢㻜 㻣㻜 㻤㻜