知的制御システム まとめ
安信誠二
筑波大学大学院 システム情報工学研究科
ICS10-2
知的制御は,
•環境の悪さ,変化に強い
•人間にやさしい
–「制御システムは,
強くなければ存在できない
優しくなければ,存在する価値が無い」
(安信)従来制御システムと計算機の処理
状態偏差 制御指令
u
状態
X
制御目的 線形モデルコントローラ 制御対象
目標値
X M Δ X
u= K1*Δx1 + K2*Δx2
設計(最適制御,極配置,・・)
係数:K
X=AX+Bu
・
Φ=∫
(Δx2+u2)dt
⇒ minコントローラの処理
状態偏差ΔXから,制御指令uを計算
計算機:0.01秒毎に予め決められた処理を実行
A/D変換+乗算・加算+D/A変換
(100MHz: 100万演算/0.01秒)
ICS10-4
知的制御システムと計算機の処理
制御指令
u
状態
X
制御目的知的
コントローラ
制御対象
制御・運転知識
制御・運転経験
知識の定式化
知的コントローラの処理
知識に基づき,学習して制御指令uを推論する
計算機:0.01秒毎に制御知識を元に,知的処理を実行
・予め決められてはいない状況に対処
・人間と協調した処理
(100MHz: 100万演算/0.01秒)
知的制御の課題
• 知的制御の定義
• 知的制御で独自の機能
• 知的制御のツール
• 知的制御システムの構成
• 知的制御の評価法
ICS10-6
知的制御の背景
制御の基本概念
「制御とは、与えられた目的に適合するように 対象に所要の操作を加えること」
従来の制御手法は、良定義、良構造問題に対して硬い論理を駆使して明 快な解を与える
実システムは、情報が部分的・不確定・不完全、環境が変化し悪 定義,悪構造問題
ー> 自律的に適応・学習的に機能する制御戦略が必要
(モデルベース)対象のモデル(非線型、不確かさ)をベースとする
非線型制御理論、ロバスト制御理論, …(技術者の知恵)(ヒューリスティック・ベース)人間の持つ知的な情報処理機能を工学的・技術的に
実現ファジィ、ニューラルネット、遺伝的アルゴリズム, (運転者の知恵)
知的制御を構成する制御技術の位置付け
制御対象の知識 豊富
貧弱
定性 的
・多 目 定量 的
・単 一
制 御 目 的
PID制御 状態評価ファジィ制御
ニューラルネット 遺伝子アルゴリズム
モデルベース制御 ロバスト
適応 学習
モデルベース(予見)
ファジィ制御
ヒューリスティック ベース制御
ICS10-8
ロバスト制御
• 実システム(制御対象)のモデルに残る不確かさを許容し 制御系を構築
(1)不確かさを抑制=設計用モデルは精密 適応・学習によりノミナルモデルに帰着
(2)制御目的の定量性(制御性能)の劣化を許容=設計用 モデルに不確かさを組込む
知的制御の基礎技術
ファジィ制御
• 熟練オペレータが持つ 部分的知識(制御則) を ファジィ推論で計算機化
あいま いな制御目的と定性的な制御対象の構造 を「知識」として記述する
遺伝的アルゴリズム(GA)
• 生物の遺伝子情報による集団進化過程を工学的に模擬 した組み合せ最適化法
• ニューロと同様に試行と評価の繰り返し
• ニューロは,ネットワークの結合係数
GAは,遺伝子を変化
ICS10-10
ニュール・ネット制御
• ニューラル・ネットの持つ学習、汎化、自己 組織 能力を利用し、未知の制御対象に対して適応・
学習的に制御則を獲得
知的制御とは
• 「変化する環境の中で,目的を達成するために必要な戦 略を立てて実行する能力を与える制御」
• システムが変化する環境に適応するため
– 論理的試行,判断,計画,戦略を立てる能力 – 自己と環境を同定できる能力
– 過去の知識や情報を蓄積する能力 – 環境に適応できる動作をする能力
• 狭義の知的制御は,どれかの能力を持つ
知的制御システムの構造
• 「記号知識レベル」 戦略・目標を与えるレベル
• 「ルールレベル」 環境変化に応じて協調し,目標達成のための制御 方策を与えるレベル
• 「技能レベル」 与えられた制御方策を実行するレベル
対象システム Skill Base 指令決定
Rule Base Knowledge Base
観測値 制御指令
制御方策・タスク
認識 協調・選択
同定 計画
状態把握
記号,言葉
数値
戦略・目標
信号,マーク
知的制御ついて
知 的 制 御 シ ス テ ム 研 究 室 知 的 制 御 シ ス テ ム 研 究 室
システム情報工学研究科 知能機能システム専攻
u高性能化するコンピュータを用いた,柔軟な制御 u人間の考え方を組み込み,協調や支援に適用 u対象を観察し,教わりながら,考え,間違えながら
熟達していく知的な運転制御を実現
研究テーマ
知的制御
l制御知識に基づき,学習して制御指令 ( 支援情報,動作指令)を推論
lソフト・コンピューティング処理
l予め決められてはいない状況に対処
l人間と協調し,優しく分かり易い処理 xin
yout
y
x
言語経験則から 優 しい運転・制御を実行
ファジィ推論
制御目的 制御・運転経験
知的制御器
知識の定式化
制御指令 制御対象
状態
制御・運転知識
Do ブレーキ,if速度が速い
Do アクセル, if速度が遅い
仙台地下鉄は,1987年より,
知的(予見ファジィ)制御で自動運転
(東京都大江戸線なども)
ファジィ集合 0.3
速度 遅い 1.0
0.0
μ
人間の言葉の曖 昧さを定量化
非線形システムの知的制御 知的自動運転システム 走行支援情報提供システム
操作者へ優しい人間と協調した支援を実現
・曖昧な人間操作をファジィ集合により表現
・直観的な音声、力覚指示により支援 非線形性に対応できる柔軟な制御方式の提案
・制御対象の状態に応じて順モデルを再構築
・人間のように学習し、制御知識を獲得
人に優しい自動運転システムを構築
・動的環境下において人間のような柔軟な運 転
・人間の運転を模擬し、知識を獲得
【URL】http://www.ics.iit.tsukuba.ac.jp
【実験室】3M409
【教授】 安信誠二
背景:
実システムの多くが非線形な特性を持つ モデル化、制御が困難
非線形システムの知的制御プロジェクト
筑波大学大学院 システム情報工学研究科 知能機能システム専攻
知的制御システム研究室
【URL】http://www.ics.esys.tsukuba.ac.jp
【実験室】 3M409
状態依存型システムの知的制御
○アクチュエータの知的制御
・McKibben型アクチュエータを利用したリフト装置
u
(state)
f x
X
X x= f
u
現在状態における 順モデルの切り出し
特性変化に適応した制御システム
○パラメータ変動を有する球体浮上装置へ適用
球体浮上装置へ適用 人間による制御システムを模擬
状態 制御指令
モデル
非線形 システム 目的:
知識 制御部
・ 非線形システムのモデルをうまく表現
・ 人間の知識を利用した知的制御
・ 人間のように考え、学習する制御
非線形性に対応できる柔軟な制御方式の提案
非線形システムの 特性を考慮
制御則や 人間の知識を利用
・高機能アクチュエータへの適応
各設定値における
アクチュエータのモデルを構築 角度
弾性力
強化学習を用いた制御 多次元状態空間を有する対象の
制御指 令, u 状
態
制御則
コ ン トロ ーラ
(P D制御)
補助目標設定部 強化学習
部
補助 目標 値、Δx xω
x v Θω 学習部
制 御部 目 標設 定部
報酬設定部 Θ
報酬 外的要因
θ
l
u x
対象システム 補助目標の知識
学習制御システム
倒立振子へ適用
○制約考慮型学習制御系の提案と倒立振り子への適 用
-人間の運転を模擬-
u状況監視(障害物との接触等)
u車両特性を考慮した目標設定 u将来状態を予見し運転操作を選択
背景
四輪車の動特性はノンホロノミック
舵角φ,速度vで,位置(x, y),方向θを制御
→運転が困難
目的
・人の操作負担を軽減
・人に優しく、安心して利用できる 自動運転システムを構築
到達不可能(
逸れている)
目標 目標通過ライン
走行予定距離 到
達
現在位置
状況監視
障害物との
接触を判定 目標設定指令の出力条件
・目標に到達
・目標へ到達不可能
・障害物への接触時
If(もし)
x 偏差が小かつ角度偏差が小
Then(ならば)
目標設定則に従って目標を設定
目標設定
最終目標 目標 現在位置
人間同様に車両特性を考慮して 運転するための目標を設定
1.操作候補ciでt秒間の運転を仮定 2.各予見結果をファジィ評価
-評価項目-
・目標との距離
操作候補c2
予見結果
予見ファジィ制御 操作候補c壁 1
予見結果
操作選択
1.0 遠い μ
操作知識
目標設定知識
状況監視部
目標設定部
操作選択部
(予見ファジィ制御)
目標
目標設定指令
最終目標
知的自動運転システムプロジェクト
筑波大学大学院 システム情報工学研究科 知能機能システム専攻
知的制御システム研究室
【URL】http://www.ics.esys.tsukuba.ac.jp
【実験室】 3M409
知的自動運転システム
○人の運転知識に基づいた自動運転システム
-ファジィ集合で目標を設定 -安全性、目標到達度 を考慮し、操作決定
-経験と知識を用いて制御対象 の将来状態を予測
-予測結果を用いて制御対象
小型ヘリコプタ自動運転システム
○入力間相互干渉を考慮した自動運転
○ファジィ行動意図の伝達による競合回避
A’へ行くので B’へ行ってください
へ行きたい 目標
(行動意図
)
目標
(行動意図
) 車両A 車両B
A’
B’
意思伝達型自動運転システム
-行動意図をファジィ量で表現
-車両間での意思疎通によって競合を回避 B~
A~
B~
機器操作支援システム
○動的環境下で操作者の意思と強調
l運転熟練者の知識をモデル化
操作者へ優しい人間と協調した支援を実現 目的:
どんな操作を すればよいか どこを目標 とするか?
どういう指示を 出せばよいか
操作状況 状況
車両
操作者
(被支援者)
支援者
(クルマの運転、列車運転 etc.) 背景:
・熟練者の運転知識を組み込む
・初心者でも熟練者のような運転ができるように!
移動体の運転支援
・安全度推移の概念
-状況に柔軟に対応
-安全、安心して操作可能
・ ドライバーが不安に感じる
・ 複雑な環境では危険性が高い
自動運転システム
走行支援情報提供システムプロジェクト
筑波大学大学院 システム情報工学研究科 知能機能システム専攻
知的制御システム研究室
【URL】http://www.ics.esys.tsukuba.ac.jp
【実験室】 3M409
協調型走行支援
○協調制御 = 人の操作 + コンピュータの支援
・支援指令をファジィ集合で表現
・人間の意志を尊重した支援
○予見ファジィ制御による多目的評価
・車線変更時の運転支援実験 列車運転支援への適応 省エネ運転システムへの適応
メン バシ ップ 値
制御指令 1.0
ファジィ制御指令
0 20 120 140
0 5 10 15 20 25 30 35 40 45
time(s)
speed(km/h)
背景 l
人は基本的な運転で、いくつかの目標候補群を設定l
障害物などの状況と目標候補群を考えて運転目的
人間のファジィ的な目標群の考慮を組込んだ 柔軟な自動走行システムの構築知的自動運転システム
R r
r r
T
i i iR T
n
= ò
n( ) Î
~
m
~: ,
i n,
R
目標の全体r
:ファジィ目標 の要素T %
nファジィ目標の定義
目標要素
r
1r
2r
3r
4m
1.0
ファジィ目標を用いた自動走 行システム
知的自動運転システム
車の状態(x,y,θ)
制御指令(φ,v)
車両
障害物の 状況
階層型知的制御
状況監視部
自動運転部
• 目標への到達を監視
•制御結果を予測
•予測結果を評価
目標設定指令
目標設定ファジィ知識 ファジィ目標設定部
m
ファジィ目標 T~n
• 現在状態からファジィ目標を設定
ファジィ運転知識
ファジィ目標への自動運転
制御方策の各候補 の実行を 仮定し , その動きを予測し、
結果を評価(ファジィ多目的 評価)
ファジィ評価により適切な操 作を決定
Current state
wall
Target
left target
straight target
right target
近い
遠い
遠い
μ
1.0壁との距離 近い
近い 遠い
遠い
目標要素
T
2T
3m
1.0
T
4T
1ファジィ目標知識による柔軟な運転の実現
障害物の変化に対して,柔軟な制御を実現 障害物なし
目標位置の前方に障害物 目標位置の横に障害物
背景と目的
高齢社会において、人の動作、操作の支援へのコン ピュータ機器の適用が不可欠
操作決定 どんな操作をすれば よいか
目標設定
どこを目標とするか
協調操作支援
人間との協調性が課題
sr
目標 操作
走行支援情報提供システム
どういう指示を出 せばよいか
操作状況 状況
操作者
(被支援者)
支援者
知的協調制御・支援システム
機器の状態(x,y,θ)
制御指令
(φ
,v)
機器
外部の 状況 階層型知的制御システム
状況監視部
自動運転部
•目標への到達を監視
•制御結果を予測
•予測結果を評価
目標設定指令
目標設定ファジィ知識 ファジィ目標設定部
m
ファジィ目標 T~n
ファジィ 制御指令
• 現在状態からファジィ目標を設定
協調制御支援部
ファジィ運転知識
sr
ファジィ協調知識
操作
ファジィ制御指令による人間との知的協調
外部環境により変化する制御器の意思 を 人間の操作支援へ反映
Satisfaction rating
K
bff m
m
K
aff
target×
Current state
target×
Current state
人の操作値
, :
n n
a b
m
Fm
Fa n
m
Fb n
m
F最大満足度と現在 満足度との差
外部環境によるファジィ制御 指令(満足度集合)
f :
, :
a b
K
fK
f周囲の状況が時間変化する環境では、
人間は将来状態を予測して、どのように 行動すべきか判断⇒計算機化
後方の車にもうすぐ追抜かれそうだ。
先に行かせてから合流しよう。
例:合流
もし、前車はずっと遠い
後車はずっと遠い、前方余裕ならば 合流は、ずっと安全、
時間変化を考慮した人間の判断
l
時空ファジィ集合:時間
x
状態空間のファジィ集合、人間のもつ「時間変化に関する曖 昧性を含む概念」をコンピュータに 組み込む
時間 状態
合流は、今が安全(良い)、
もし、前車はずっと遠い
後車はもうすぐ近く、前方余裕ならば 合流は、徐々に危険、
もし、前車は遠ざかる
後車はもうすぐ近く、前方余裕ならば