安信誠二

(1)

知的制御システムまとめ

安信誠二

筑波大学大学院システム情報工学研究科

(2)

ICS10-2

知的制御は，

•環境の悪さ，変化に強い

•人間にやさしい

–「制御システムは，

強くなければ存在できない

優しくなければ，存在する価値が無い」

^（安信）

(3)

従来制御システムと計算機の処理

状態偏差制御指令

u

状態

X

制御目的線形モデル

コントローラ制御対象

目標値

X M Δ X

u= K1Δx1 + K2Δx2

設計（最適制御，極配置，・・）

係数：Ｋ

Ｘ＝ＡＸ＋Ｂｕ

・

Φ=∫

(Δx2+u2)dt

⇒ min

コントローラの処理

状態偏差ΔＸから，制御指令ｕを計算

計算機：0.01秒毎に予め決められた処理を実行

Ａ／Ｄ変換＋乗算・加算＋Ｄ／Ａ変換

(100MHz: 100万演算／0.01秒）

(4)

ICS10-4

知的制御システムと計算機の処理

制御指令

u

状態

X

制御目的

知的

コントローラ

制御対象

制御・運転知識

制御・運転経験

知識の定式化

知的コントローラの処理

知識に基づき，学習して制御指令ｕを推論する

計算機：0.01秒毎に制御知識を元に，知的処理を実行

・予め決められてはいない状況に対処

・人間と協調した処理

(100MHz: 100万演算／0.01秒）

(5)

知的制御の課題

• 知的制御の定義

• 知的制御で独自の機能

• 知的制御のツール

• 知的制御システムの構成

• 知的制御の評価法

(6)

ICS10-6

知的制御の背景

制御の基本概念

「制御とは、与えられた目的に適合するように対象に所要の操作を加えること」

従来の制御手法は、良定義、良構造問題に対して硬い論理を駆使して明快な解を与える

実システムは、情報が部分的・不確定・不完全、環境が変化し悪定義，悪構造問題

ー＞自律的に適応・学習的に機能する制御戦略が必要

(モデルベース)対象のモデル（非線型、不確かさ）をベースとする

非線型制御理論、ロバスト制御理論, …(技術者の知恵）

(ヒューリスティック・ベース)人間の持つ知的な情報処理機能を工学的・技術的に

実現

ファジィ、ニューラルネット、遺伝的アルゴリズム, （運転者の知恵）

(7)

知的制御を構成する制御技術の位置付け

制御対象の知識豊富

貧弱

定性的

・多目定量的

・単一

制御目的

ＰＩＤ制御状態評価ファジィ制御

ニューラルネット遺伝子アルゴリズム

モデルベース制御ロバスト

適応学習

モデルベース（予見）

ファジィ制御

ヒューリスティックベース制御

(8)

ICS10-8

ロバスト制御

• 実システム（制御対象）のモデルに残る不確かさを許容し制御系を構築

（１）不確かさを抑制＝設計用モデルは精密適応・学習によりノミナルモデルに帰着

（２）制御目的の定量性（制御性能）の劣化を許容＝設計用モデルに不確かさを組込む

知的制御の基礎技術

(9)

ファジィ制御

• 熟練オペレータが持つ部分的知識（制御則）をファジィ推論で計算機化

あいまいな制御目的と定性的な制御対象の構造を「知識」として記述する

遺伝的アルゴリズム（ＧＡ）

• 生物の遺伝子情報による集団進化過程を工学的に模擬した組み合せ最適化法

• ニューロと同様に試行と評価の繰り返し

• ニューロは，ネットワークの結合係数

ＧＡは，遺伝子を変化

(10)

ICS10-10

ニュール・ネット制御

• ニューラル・ネットの持つ学習、汎化、自己組織能力を利用し、未知の制御対象に対して適応・

学習的に制御則を獲得

(11)

知的制御とは

• 「変化する環境の中で，目的を達成するために必要な戦略を立てて実行する能力を与える制御」

• システムが変化する環境に適応するため

– 論理的試行，判断，計画，戦略を立てる能力 – 自己と環境を同定できる能力

– 過去の知識や情報を蓄積する能力 – 環境に適応できる動作をする能力

• 狭義の知的制御は，どれかの能力を持つ

(12)

知的制御システムの構造

• 「記号知識レベル」戦略・目標を与えるレベル

• 「ルールレベル」環境変化に応じて協調し，目標達成のための制御方策を与えるレベル

• 「技能レベル」与えられた制御方策を実行するレベル

対象システム Skill Base 指令決定

Rule Base Knowledge Base

観測値制御指令

制御方策・タスク

認識協調・選択

同定計画

状態把握

記号，言葉

数値

戦略・目標

信号，マーク

知的制御ついて

(13)

知的制御システム研究室知的制御システム研究室

システム情報工学研究科知能機能システム専攻

u高性能化するコンピュータを用いた，柔軟な制御 u人間の考え方を組み込み，協調や支援に適用 u対象を観察し，教わりながら，考え，間違えながら

熟達していく知的な運転制御を実現

研究テーマ

知的制御

l制御知識に基づき，学習して制御指令 ( 支援情報，動作指令)を推論

lソフト・コンピューティング処理

l予め決められてはいない状況に対処

l人間と協調し，優しく分かり易い処理 xin

yout

y

x

言語経験則から優しい運転・制御を実行

ファジィ推論

制御目的制御・運転経験

知的制御器

知識の定式化

制御指令制御対象

状態

制御・運転知識

Do ブレーキ,if速度が速い

Do アクセル, if速度が遅い

仙台地下鉄は，1987年より，

知的（予見ファジィ）制御で自動運転

（東京都大江戸線なども）

ファジィ集合 0.3

速度遅い 1.0

0.0

μ

人間の言葉の曖昧さを定量化

非線形システムの知的制御 知的自動運転システム 走行支援情報提供システム

操作者へ優しい人間と協調した支援を実現

・曖昧な人間操作をファジィ集合により表現

・直観的な音声、力覚指示により支援 非線形性に対応できる柔軟な制御方式の提案

・制御対象の状態に応じて順モデルを再構築

・人間のように学習し、制御知識を獲得

人に優しい自動運転システムを構築

・動的環境下において人間のような柔軟な運転

・人間の運転を模擬し、知識を獲得

【URL】http://www.ics.iit.tsukuba.ac.jp

【実験室】3M409

【教授】安信誠二

(14)

背景：

実システムの多くが非線形な特性を持つ モデル化、制御が困難

非線形システムの知的制御プロジェクト

筑波大学大学院システム情報工学研究科知能機能システム専攻

知的制御システム研究室

【URL】http://www.ics.esys.tsukuba.ac.jp

【実験室】 3M409

状態依存型システムの知的制御

○アクチュエータの知的制御

・McKibben型アクチュエータを利用したリフト装置

u

(state)

f x

X

X x= f

u

現在状態における順モデルの切り出し

特性変化に適応した制御システム

○パラメータ変動を有する球体浮上装置へ適用

球体浮上装置へ適用人間による制御システムを模擬

状態 制御指令

モデル

非線形 システム 目的：

知識 制御部

・非線形システムのモデルをうまく表現

・人間の知識を利用した知的制御

・人間のように考え、学習する制御

非線形性に対応できる柔軟な制御方式の提案

非線形システムの 特性を考慮

制御則や 人間の知識を利用

・高機能アクチュエータへの適応

各設定値における

アクチュエータのモデルを構築角度

弾性力

強化学習を用いた制御 多次元状態空間を有する対象の

制御指令, u 状

態

制御則

コントローラ

（P D制御）

補助目標設定部強化学習

部

補助目標値、Δx xω

x v Θω 学習部

制御部目標設定部

報酬設定部 Θ

報酬外的要因

θ

l

u x

対象システム補助目標の知識

学習制御システム

倒立振子へ適用

○制約考慮型学習制御系の提案と倒立振り子への適 用

(15)

－人間の運転を模擬－

u状況監視（障害物との接触等）

u車両特性を考慮した目標設定 u将来状態を予見し運転操作を選択

背景

四輪車の動特性はノンホロノミック

舵角φ,速度ｖで,位置（ｘ, ｙ）,方向θを制御

→運転が困難

目的

・人の操作負担を軽減

・人に優しく、安心して利用できる 自動運転システムを構築

到達不可能（

逸れている）

目標目標通過ライン

走行予定距離到

達

現在位置

状況監視

障害物との

接触を判定目標設定指令の出力条件

・目標に到達

・目標へ到達不可能

・障害物への接触時

If（もし）

x 偏差が小かつ角度偏差が小

Then（ならば）

目標設定則に従って目標を設定

目標設定

最終目標目標現在位置

人間同様に車両特性を考慮して運転するための目標を設定

1.操作候補ciでt秒間の運転を仮定 2.各予見結果をファジィ評価

－評価項目－

・目標との距離

操作候補c2

予見結果

予見ファジィ制御 _{操作候補c}壁 ₁

予見結果

操作選択

1.0 遠い μ

操作知識

目標設定知識

状況監視部

目標設定部

操作選択部

（予見ファジィ制御）

目標

目標設定指令

最終目標

知的自動運転システムプロジェクト

【実験室】 3M409

知的自動運転システム

○人の運転知識に基づいた自動運転システム

-ファジィ集合で目標を設定 -安全性、目標到達度を考慮し、操作決定

-経験と知識を用いて制御対象の将来状態を予測

-予測結果を用いて制御対象

小型ヘリコプタ自動運転システム

○入力間相互干渉を考慮した自動運転

○ファジィ行動意図の伝達による競合回避

A’へ行くので B’へ行ってください

へ行きたい目標

（行動意図

）

目標

（行動意図

）車両A 車両B

A’

B’

意思伝達型自動運転システム

-行動意図をファジィ量で表現

-車両間での意思疎通によって競合を回避 B~

A~

B~

(16)

機器操作支援システム

○動的環境下で操作者の意思と強調

l運転熟練者の知識をモデル化

操作者へ優しい人間と協調した支援を実現 目的：

どんな操作をすればよいかどこを目標とするか？

どういう指示を出せばよいか

操作状況状況

車両

操作者

（被支援者）

支援者

（クルマの運転、列車運転 etc.） 背景：

・熟練者の運転知識を組み込む

・初心者でも熟練者のような運転ができるように！

移動体の運転支援

・安全度推移の概念

－状況に柔軟に対応

－安全、安心して操作可能

・ドライバーが不安に感じる

・複雑な環境では危険性が高い

自動運転システム

走行支援情報提供システムプロジェクト

【実験室】 3M409

協調型走行支援

○協調制御 = 人の操作 ＋ コンピュータの支援

・支援指令をファジィ集合で表現

・人間の意志を尊重した支援

○予見ファジィ制御による多目的評価

・車線変更時の運転支援実験列車運転支援への適応省エネ運転システムへの適応

メンバシップ値

制御指令 1.0

ファジィ制御指令

0 20 120 140

0 5 10 15 20 25 30 35 40 45

time(s)

speed(km/h)

(17)

背景 ^l

人は基本的な運転で、いくつかの目標候補群を設定

l

障害物などの状況と目標候補群を考えて運転

目的

人間のファジィ的な目標群の考慮を組込んだ柔軟な自動走行システムの構築

知的自動運転システム

R r

r r

T

_i _i _i

R T

n

= ò

_n

⁽ ⁾ Î

~

m

~

: ,

_i n

,

R

目標の全体

r

：ファジィ目標の要素

T %

nファジィ目標の定義

目標要素

r

¹

r

²

r

³

r

⁴

m

1.0 ファジィ目標を用いた自動走行システム

(18)

知的自動運転システム

車の状態(x,y,θ)

制御指令(φ，v)

車両

障害物の状況

階層型知的制御

状況監視部

自動運転部

• ^{目標への到達を監視}

•制御結果を予測

•予測結果を評価

目標設定指令

目標設定ファジィ知識 ファジィ目標設定部

m

ファジィ目標 T~_n

• 現在状態からファジィ目標を設定

ファジィ運転知識

(19)

ファジィ目標への自動運転

制御方策の各候補の実行を仮定し , その動きを予測し、

結果を評価（ファジィ多目的評価）

ファジィ評価により適切な操作を決定

Current state

wall

Target

left target

straight target

right target

近い

遠い

μ

1.0

壁との距離近い

近い遠い

遠い

目標要素

T

²

T

³

m

1.0 T

⁴

T

¹

(20)

ファジィ目標知識による柔軟な運転の実現

障害物の変化に対して，柔軟な制御を実現障害物なし

目標位置の前方に障害物目標位置の横に障害物

(21)

背景と目的

高齢社会において、人の動作、操作の支援へのコンピュータ機器の適用が不可欠

操作決定どんな操作をすればよいか

目標設定

どこを目標とするか

協調操作支援

人間との協調性が課題

sr

目標操作

走行支援情報提供システム

どういう指示を出せばよいか

操作状況状況

操作者

（被支援者）

支援者

(22)

知的協調制御・支援システム

機器の状態(x,y,θ)

制御指令

(φ

，

v)

機器

外部の状況階層型知的制御システム

状況監視部

自動運転部

•目標への到達を監視

•制御結果を予測

•予測結果を評価

目標設定指令

目標設定ファジィ知識 ファジィ目標設定部

m

ファジィ目標 T~_n

ファジィ制御指令

• 現在状態からファジィ目標を設定

協調制御支援部

ファジィ運転知識

sr

ファジィ協調知識

操作

(23)

ファジィ制御指令による人間との知的協調

外部環境により変化する制御器の意思を人間の操作支援へ反映

Satisfaction rating

K

b_f

f m

m

K

a_f

f

target×

Current state

target×

Current state

人の操作値

, :

n n

a b

m

_F

m

_F

a n

m

_F

b n

m

_F

最大満足度と現在満足度との差

外部環境によるファジィ制御指令（満足度集合）

f :

, :

a b

K

_f

K

_f

(24)

周囲の状況が時間変化する環境では、

人間は将来状態を予測して、どのように行動すべきか判断⇒計算機化

後方の車にもうすぐ追抜かれそうだ。

先に行かせてから合流しよう。

例：合流

もし、前車はずっと遠い

後車はずっと遠い、前方余裕ならば合流は、ずっと安全、

時間変化を考慮した人間の判断

l

時空ファジィ集合：

時間

x

状態空間のファジィ集合、

人間のもつ「時間変化に関する曖昧性を含む概念」をコンピュータに組み込む

時間状態

合流は、今が安全（良い）、

もし、前車はずっと遠い

後車はもうすぐ近く、前方余裕ならば 合流は、徐々に危険、

もし、前車は遠ざかる

後車はもうすぐ近く、前方余裕ならば

安信誠二

知的制御システム まとめ

安信誠二

筑波大学大学院 システム情報工学研究科

知的制御は，

•環境の悪さ，変化に強い

•人間にやさしい

–「制御システムは，

強くなければ存在できない

優しくなければ，存在する価値が無い」

従来制御システムと計算機の処理

u

X

X M Δ X

u= K1*Δx1 + K2*Δx2

・

(Δx2+u2)dt

状態偏差ΔＸから，制御指令ｕを計算

(100MHz: 100万演算／0.01秒）

知的制御システムと計算機の処理

u

X

(100MHz: 100万演算／0.01秒）

知的制御の課題

• 知的制御の定義

• 知的制御で独自の機能

• 知的制御のツール

• 知的制御システムの構成

• 知的制御の評価法

知的制御の背景

実システムは、情報が部分的・不確定・不完全、環境が変化し悪 定義，悪構造問題

(モデルベース)対象のモデル（非線型、不確かさ）をベースとする

(ヒューリスティック・ベース)人間の持つ知的な情報処理機能を工学的・技術的に

知的制御を構成する制御技術の位置付け

制御対象の知識 豊富

貧弱

制 御 目 的

ＰＩＤ制御 状態評価ファジィ制御

ニューラルネット 遺伝子アルゴリズム

モデルベース制御 ロバスト

適応 学習

モデルベース（予見）

ファジィ制御

ロバスト制御

• 実システム（制御対象）のモデルに残る不確かさを許容し 制御系を構築

（１）不確かさを抑制＝設計用モデルは精密 適応・学習によりノミナルモデルに帰着

（２）制御目的の定量性（制御性能）の劣化を許容＝設計用 モデルに不確かさを組込む

ファジィ制御

• 熟練オペレータが持つ 部分的知識（制御則） を ファジィ推論で計算機化

あいま いな制御目的と定性的な制御対象の構造 を「知識」として記述する

遺伝的アルゴリズム（ＧＡ）

• 生物の遺伝子情報による集団進化過程を工学的に模擬 した組み合せ最適化法

• ニューロと同様に試行と評価の繰り返し

• ニューロは，ネットワークの結合係数

ＧＡは，遺伝子を変化

ニュール・ネット制御

• ニューラル・ネットの持つ学習、汎化、自己 組織 能力を利用し、未知の制御対象に対して適応・

学習的に制御則を獲得

知的制御とは

• 「変化する環境の中で，目的を達成するために必要な戦 略を立てて実行する能力を与える制御」

• システムが変化する環境に適応するため

– 論理的試行，判断，計画，戦略を立てる能力 – 自己と環境を同定できる能力

– 過去の知識や情報を蓄積する能力 – 環境に適応できる動作をする能力

• 狭義の知的制御は，どれかの能力を持つ

知的制御システムの構造

対象システム Skill Base 指令決定

Rule Base Knowledge Base

認識 協調・選択

同定 計画

状態把握

知 的 制 御 シ ス テ ム 研 究 室 知 的 制 御 シ ス テ ム 研 究 室

背景 l

l

目的

R r

r r

T

= ò

( ) Î

~

知的制御システムまとめ

筑波大学大学院システム情報工学研究科

u= K1Δx1 + K2Δx2

実システムは、情報が部分的・不確定・不完全、環境が変化し悪定義，悪構造問題

制御対象の知識豊富

制御目的

ＰＩＤ制御状態評価ファジィ制御

ニューラルネット遺伝子アルゴリズム

モデルベース制御ロバスト

適応学習

• 実システム（制御対象）のモデルに残る不確かさを許容し制御系を構築

（１）不確かさを抑制＝設計用モデルは精密適応・学習によりノミナルモデルに帰着

（２）制御目的の定量性（制御性能）の劣化を許容＝設計用モデルに不確かさを組込む

• 熟練オペレータが持つ部分的知識（制御則）をファジィ推論で計算機化

あいまいな制御目的と定性的な制御対象の構造を「知識」として記述する

• 生物の遺伝子情報による集団進化過程を工学的に模擬した組み合せ最適化法

• ニューラル・ネットの持つ学習、汎化、自己組織能力を利用し、未知の制御対象に対して適応・

• 「変化する環境の中で，目的を達成するために必要な戦略を立てて実行する能力を与える制御」

認識協調・選択

同定計画

知的制御システム研究室知的制御システム研究室

背景 ^l

⁽ ⁾ Î

ファジィ目標を用いた自動走行システム

制御方策の各候補の実行を仮定し , その動きを予測し、

結果を評価（ファジィ多目的評価）

高齢社会において、人の動作、操作の支援へのコンピュータ機器の適用が不可欠

外部環境により変化する制御器の意思を人間の操作支援へ反映