• 検索結果がありません。

ポテンシャル場を用いた動的環境でのマルチエージェントシステムの実現: University of the Ryukyus Repository

N/A
N/A
Protected

Academic year: 2021

シェア "ポテンシャル場を用いた動的環境でのマルチエージェントシステムの実現: University of the Ryukyus Repository"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

Title

ポテンシャル場を用いた動的環境でのマルチエージェン

トシステムの実現

Author(s)

横山, 隆洋; 山城, 寛隆; 山田, 孝治; 遠藤, 聡志

Citation

琉球大学工学部紀要(56): 101-107

Issue Date

1998-09

URL

http://hdl.handle.net/20.500.12000/14730

Rights

(2)

~T

/'

~

-\'

}v~ ~

m'"

t~j)j8"J~j:~1:o)

?

}vT.x.--:;

J: / '

r

~

AT L

O)~m

Potential Field for Multiagent System in Dynamic Environment

Takahiro

YOKOYAMA*,

Hirotaka

YAMASHIRO**,

Koji

YAMADA*

and

Satoshi

ENDO*

Abstract

This paper shows a dynamic environment model for multiagent system using potential field method. In this model, agents and its working space are defined by potential fields. Then this model can represent a multiple restriction problem by the potential interaction. In this paper, a soccer game agent as typical multiagent system is constructed by potential functions. And, soccer simulator of potential field model is presented.

Key Words: multiagent system, potential field, soccer agent

1. ~ ~jl~

i!i:1F, ~t

• •

Q)~J!fjE:t.JQ)"UI(f]

7j:(1i]xJ:.-:> tt, -f

Q)1:t.

m

7tmt

~ T.t~c:>"(~"(

v'

0 0 *~:~tltJi!.~:.13~t0 1)7 )1/9 1Att~.47j:~

• •

~7j:~~

• •

7j:~mi.~~~#lli

"(~"(", 00 . :Q)

J:

~

7j:

rd1m

i:tl

~ :ijJ}"~',

{)E*

Q)

li! _.

Q)

7"

o

~ '7.b.~:

J:

0 1ft9H~flB9~rR~mM~Q)=f.~-r-,j:~lw.nfy'!'

.t "(",

0 0

-t-':

-r-~~Q)

EI

ff89~t.3: 1*~f, w,~

1..-7j: nf

&?

J&1J7tfl(f]~:r~mmi:tl ~

tv'

1

=f.~-r-7

)v-r.:L-:;.:r. / "

:/ AT.b.n{~1e~1tl

t

I..- "(1113

~

tt"(v' o.

tiE*C1)=f.~

t

It"'''''(, • •

7j:atilQ)~1t~:*~~:~It\

1..-, D/{:A"

·t1~

1)7

}v

~

1

.b.

tt

i!l~.!J.-r-~0

t

WJffl:

~:tt

't"

v'

o.

AI~~~1eQ)~mtl..-"(,-r.:r.A~*~o7j:~C1)~­ .b.~{~

<

1&

t)

J:Jf

I?

tt"(

~ t.:~{, .:

tt

&?

Q)

J:

~

7j: -F-

,,~ ~­ .b.

'j:,

~~~89t~.-:>~JJ.(j{J-r-~t), ft~m¥flT-r-~T:b:tto

¥-A-r-~o~~, ~7~~1Att~~

• •

tti~.-:>~O

t-t&

1

7

)v-r.:L-:';.:r. /

t

~AT

AC1)ft}f?e'WIJJJH:

~j:~ ~

7j:

v'o

-t-':

-r-,

mtEB

'?

tt 7

)v-r.:L-:;

.:r. / " :/ A

T

AC1).fiJf1e

C1)~$rR~mt

I..- "(,

4T

':rh

--Y-

At-1&

t)

xJf, -ftt

&?

Q)

~~':fff{jffiQ)£$ i~ijt

I..-

J:

1

t

~ith.

"(v,o.

RoboCup

t

Df-l!no':

Q)~h.,j:, ~:tlo

-r-

'J "

.13

J:

tf~t.tmJ:.C1){&

:ttt

0

-r-

OJ " ~:4tOJ7J - ~ ~-\:t

J:

~

tv'

'7

~ Q)l:'~

o.

~t:

ili~.0

-r-

OJ " ,:

'j:

Soccer Server

t

n!Jq!n~4j-OJ 7J -

A

Q)

~ ~.:z.

v -

~ il{t!~ ~

tt,

~iliiC1)~5i:-r-~~*t-~T~

.:

t

il~-r- ~0

J:

1 ,:

7j: "? "(v' o . .:

C1)

RoboCup

,j:,

19981F 7J=J ,:

7'7 )'

A

Q)J\

I)-r-~TbnoICMAS-98(International Conference on Multiagent System)

':.13v'''(,

~21ill*ft

il~mJ1m~

no.

1l:J! :1998lf. 5fI 25B

...I~8J)mfilI~~:}

(Dept, of Information Engineering, Fac. of Eng,)

"'*JljI~~~:} mfilI~WlX

(Graduate Student, Information Engineering)

.~lm.13

J:

tf1li:ttt~rm~:

.13,,' "(, .:L-:J.:r. / " il{1TlIW

t-~5i:T o~':, Ja)1mQ)m:tJt~~iRJ:OOT

0

1"~ (~o"qj:

-t-~J1m) ~

mv"

-t-tt~ ~

t ,:

I..- "(, EI

'?

Q)1TJbi#c5i:

To':

t

il{~i

lv'.

-t-O)~*,

.:L-:;.:r. /

l- ~:~1T

ofr]

,%lj:,

ofC1)-~-ib~.~n'>,:m~T J.>1Z\~il{7j:

v'C1)l:',

-t-

C1)~G~

,j:

ft1f

¥~: ~

o.

~;

':.:L -:.;

.:r.. /

t

iltJaj

1mQ):lkiR.

ire~

I..- 't" '"

0

tv'

1

~,*l:', 1A~imtt~ff5fJtttil{~0

t

~

",.zo. I..-n'>l..-,

-ftt,j:t.:t':.ij!~:NiJ t) Q)~?~~EI7to)~fi:.~

7j:

t~Q)m¥fl

i

~Gtf.

L "(", 0

tv'

~

t.=

't

--r'lj:fi:p~n{7j:

<

7j:

0 .

fbf'F~5E':~ 1..-1f~1H:, t'>.-:>illi~H:*IJm ~

ttf!J;o

~Q)l:'7j:

<"(

,j: 7j:

I?

7j: "'.

-~~

t:,

0

-F

'J

r

C1)%:lk.

fiJJ1'F~rdI

1ft

Q)~1*Q)%~

t

-t-~fiLt!t

.

~9}il{-9-.ti? ttt.:

t

~, 0

-F'.i' "

Q)!lib1'F!tOOi~lj:, *~

<

J,:LTC1)='-:>':7tm-r-~0 [1] .

O-"~?':J7~

O-F'.i'''Q)~~~OO~~Mtt~l*~Q)~.~J:''?''(

m.t

0':

t

~ .fflv't.:!ljM'F~tum~.

• -t:}v$tWH~

o

-F

'J " Q)

EI

EI3~OO

i,

-t-Q)

1ft

-c-,j:~~il{m ~':if-:~

or

fj~

7j:

$

7t~.go (-t:}v) ~:

7tfWT

01J~

i

ffl

v'

t.:

Jibi'F

~tnm~ fpjr~~~~

(*'

T /

~

-\'

Jvt~) mwra97j:il~IH:£-?"'''(ftlm~1Dl ~~~T

0':

tim

'"

t.:iWJf'Fl1tiOO~

*fdf?t': .13v' "( ,j:, .:L -:;

.:r.. )'

r

Q)~1m t-~T~rd) (:{j( !i.~~rm) Q)~JJl1J¥!

t

I..- "(,

;FT)':/~ )vtIJ~)t*~

ffl

v'

o.

~tti-r-, nJbD-F'.i'''Q)~~~OO~, 7~~.:z.V­ ~ C1)q~im:~ntrfJ'lit.tt~~:~~

1..-, AI*'T)':/

~ }v¥t~{

J:

<

ffl ",

I?

:tt"(

~

t.:.

.::tt

*

-r-

C1)

AI*'

T )' :/ -\'

}I/t!

C1)

~

<

lj:,

~5E~tt~

• • •

~MI..-~T/:/~~i~.I..-, ~-:;L

/ " ,j: -t-

Q)~T

/ :/

~ }vtlJJQ)A1:~.~T1J[ti]i~~

I..- "( '"

<

..: t ,:

J: "?

't"j}Ji'F~tOOt-fi"?

'lv't.:.

(3)

I..-横山・山城・山田・遠藤:ポテンシャル場を用いた動的環境でのマルチエージェントシステムの実現 102 ある.これらはマルチエージェントシステムの研究におい て,解決すべき重要な課題である. 2.1マルチエージェントとしてのサッカーゲーム

従来,人工知能研究の例題として取り上げられてきた

チェスやオセロのようなポードゲームは次のような性質を 持っている. ・完全情報である.すなわち,‘情報を得るためのコスト が無視できる. 、状態遷移が離散的である. ・決定論的である. 、論理的に定式化しやすい.すなわち論理的プランニン グの比重が高い 、基本的に1対1のゲームである. これに対し,マルチエージェントシステムの研究では次 のような性質の問題を扱うことが重要となる. 、不完全情報である.すなわち,情報を得るためのコス トを考慮する必要がある. ・状況がリアルタイムに変化するため,論理的な切り分 けが困難である. 、雑音などの外乱による非決定的要素が多く含まれるた め,それに対するロバスト性が要求される. 。問題設定が途中で変化することがあり,それに対し適 応できるシステムである必要がある. 、多数のエージェントが共同して戦略を構成するため, 各エージェント間での合意を形成する必要がある. このことから,マルチエージェントシステムの研究素材 の一つとしてサッカーゲームが注目されている. サッカーとは11人からなる2チームが,ポールを足で 扱いながら相手ゴールに入れることを競い合うゲームであ る.このサッカーゲームは,マルチエージェントシステム として次のような性質をもっている. 、チームプレーがチームの実力の大きな要素を占める. サッカーは多数のプレイヤーによるチームゲームであ り,個人の実力よりもチームプレーの善し悪しがチー ム全体の実力に大きく影響していると考えられる.- 人の傑出したプレイヤーが存在しても,他のプレイ ヤーとの連係が行なえなければ,良い結果には結び付 かない. ・試合のながれは連続的であり,途切れるような場面は ごく限られている.そのため,作戦の完全なプランを 立てることが困難である. 、各プレイヤーは個人の判断に基づいてプレーすること で,ゲーム全体をコントロールしている.監督やコー チがチーム全体をコントロールできることは限られて いる. ・試合中のコミュニケーションはかなり制約されている. 言葉によるコミュニケーションは不可能ではないが, 確実性が低い.それを補うように身振りやアイコンタ クトなどが重要な意味を持つ. ・プレイヤーは,フィールド上のさまざまな外乱(ポー ルのイレギュラーバウンドや天候の影響など)の中で ゲームを組み立てなければならない. このように,サッカーゲームはマルチエージェントシステ ムの研究モデルとしての興味深い要素が数多く含まれて てサッカーゲームを例にとり、周囲の状況に関する情報を 保持するものとしてのポテンシャル場を定義することで、 プレイヤーの行動決定の際のための情報処理機構の枠組を 提案し、シミュレータを作成する. 2.マルチエージェントシステム 近年、計算機にはより高度な処理の実現が要求されてき ており、プログラムは複雑化しつつある。また,実世界性 の問題に応用される要求も高まり、プログラムは実世界に おけるさまざまな不確定性やリアルタイム性を扱う必要が 出てきている。 このようなプログラム開発の一つの手法として期待され ているものの一つが,マルチエージェントシステムである. マルチエージェントシステムとは,図lのように複数の独 立した計算主体(エージェント)が協調して共有する目標 を行なうという考え方である.

鍵"③

エージェント ノマ グ Mli1II エージェント 1K 、 ̄ 1$Ii1M1

-鯵曇一一

エーーゾュ.ント ーロロ環境一 図1.マルチエージェントシステム このようなマルチエージェントシステムで,以下のよう な性質を得られることが期待されている. 、リアルタイム性(real-time-ncss) 単一のエージェントでは全て対処することが難しい複 雑な処理を比較的単純な多数のエージェントの協調と いう形で表現できる。 ・ロバスト性(robustness) 一部のエージェントにトラブルが生じても、自律分散 的に動作することで他のエージェントがそのエージェ ントの処理を補うことができ、システム全体として頑 健に動作させることができる。

・適応性(adaptation)

システムの構成法にバリエーションを持たせ、エージェ ントが自律的にそれらを選択することで、多様に変化 する対象に追従させることができる。 このような性質を実現するするために重要な点は,エー ジェントの組織化の制御が中央集権的な制御ではなく、自 律的・分散的でなければならないことである.そのために は多数のエージェント間での意志の疎通を図りつつ,処理 の整合性をとる必要がある.また,意志の疎通のための時 間をできるだけ少なくするため,知識の共有や状況を利用 して効率の良いコミュニケーションを行なうことも必要で

(4)

いる. 2.2動的環境におけるエージェントアーキテクチャー 人工知能においての(狭義の)問題の解決法として、状 態空間の中で初期状態から出発し、状態遷移を生じさせる 動作の実行を繰り返すことによって目的状態に至ることで

ある。古典的な手法では目標状態に至る動作系列を実行前

に求めるもので、多大な計算量を要する問題である。した がって、動的な世界に反応しなければならない場合には、 古典的で、熟考的なプログラミングでの実現は不可能に近 い。そこで、より瞬間的に反応し行動する手法を考案する 必要がある。このような研究は、実時間プログラミングと も即応的プログラミングとも呼ばれ、多くの研究者に討論 されている。 この即応的プログラミングは、動的な環境への追従を可 能とするが、その反面、多くの場合、行為の合目的性や適 応性は高くなる。一方、熟考的プログラミングは、目標ま での完全なプランを生成するため、合目的性や最適性は高 くなるが、その反面、環境への追従性が低い。このような 時に即応と熟考のトレードオフをどのように実現するかが 問題である。 サッカーにおいても上記に類似の局面は多く現れる。ま ず、サッカーにおける戦略を大まかに類別すると、 、ゲーム全体を支配するような戦略 ・攻撃や防御の各局面におけるチーム全体に関わる大局 的戦術(例えば、自軍のゴールから敵軍のゴールまで どのように攻めるかの方策) ・攻撃や防御の進行に伴い比較的局所的に数人で展開さ れる戦術(例えばゴール前での戦略) のようなものになるだろう。 ここで例えば上記の大局的.局所的戦術の両方を考慮し ながら、限られた時間の中で、限られた計算資源を利用し て、最も有効と思われる動作を決定しなければならない。 その時は、攻撃.防御を仕掛けてくる敵側のプレイヤーに対 して素早く反応し、かつ大局的.局所的な戦略を考慮する必 要がある。 2.3協調のための組織的枠組みとその動的変更 常に動作が変化するようなシステムにおいては、問題解 決のための全体的な制御をおこなうことが非常に困難であ る。このような環境では独立に動作するエージェントは、 能力的に限界があり、世界に関する部分問題しか得ること ができない。このような状況で、エージェントが単独で解 決できない問題に直面したときに、協調作業による解決が 重要な意味をもってくる。協調作業に関して考慮されるべ き問題の一つは、エージェント間の相互作用の形態である。 例えば、ある時間的制約のもとで、チームメイトとの不必 要なコミュニケーションをなるべく削減し、各プレイヤー においては有効な局面的プランを生成/実行し、かつ、他 のチームメイトとの大局的プランを試みる、などが典型的 な問題である。マルチエージェントの研究課題の中心の課 題の一つに合意の形成がある。これは、一般的には、異な る世界感や異なる目標をもつエージェントどうしの行為を、 相互の利益のために整合させることにより、大局的な協調 作業を実現することである。マルチエージェントシステム における合意の形成方法は大きく二つに分類される。一方 'よ、エージェント間のコミュニケーション利用する方法で あり、もう一方は、一切のコミュニケーションを利用しな い場合である。 3.ポテンシャル場 3.1ポテンシャル場を用いたロボットの動作決定 移動ロボットやマニピュレータの軌道生成問題に対して は、従来からポテンシャル場を用いたアプローチが行なわ れている[21゜この方法では、目標位置で最小値を持つポテ ンシャル場を作業空間に設定し、勾配ベクトルに基づいた 極値探索法を適用することにより、軌道の生成を行なって いる。障害物を含む作業空間に対しても、目標位置への吸 引力と障害物からの反発力を発生するポテンシャル場の加 重和を用いることにより、グラフ探索的なアプローチに比 べてアルゴリズムが簡単で実時間性に優れた障害物回避を

実現することができる[3)。

START

obsmcle 職V GOALI 職V GOALI 図2.ポテンシャル場 具体的には、ある目標に向かってポテンシャルは低くな り、逆に障害のまわりにはポテンシャルの山ができる。そ の勾配は、物体の性質やまわりの環境、さらに主体の性質 や動作目的によって変化する。そして、個々の障害や目標 などによるポテンシャルは合成されて-つのポテンシャル 場を形成される。あとはそのポテンシャル分布に従って、 ロボットはポテンシャルの山々を避け、谷間を縫うように

滑べ下り、低い方へと変化していく(図2)。このような方

法をとればポテンシャル場による動作決定は極めて単純か つ迅速に行なうことができる。以下に、ロボットにおける ポテンシャル場による動作決定の手法を説明する。 3.2状態空間 移動ロボットのような場合、まわりの世界の中の自分の 位置をロボットの状態と考えれば、状態空間は、現実の空 間とそのまま対応している。しかし、例えばマニュピレー タなどの場合、現実の世界にそのまま対応する空間内にポ テンシャルを与え、そこにマニピュレータを置いてその動 きを考えても、それは非常に困難である。なぜならポテン シャルは本来その空間内の各点に対して与えられているも のであるから、その空間内に腕のような形のあるものを持っ てきても意味を持たない。仮に手先の点のポテンシャルを

(5)

横山・山城・山田・遠藤:ポテンシャル場を用いた動的環境でのマルチエージェントシステムの実現 104 考えることにしても、一般に関節形の場合のように同じ手 先の位置のポテンシャルだけでは満足の行く制御は得られ ない。さらに、例えもし各関節の位置や腕の各点のポテン シャルをも考慮するにしても、その動作決定アルゴリズム は複雑で技巧的になり、あまり一般性のないものになって しまう。 そこでまず、ロボットのある一つの状態が一点に対応す るような空間に変換する。この空間は、その各点がロボッ

トの状態を表すものであるから「状態空間]と呼ぶことに

する。さらに、ある目標を実現する状態を目標状態、障害 物などがあって、とり得ない状態を禁止状態と呼ぶことに する。そして、状態空間における目標状態や禁止状態のま わりにポテンシャル分布を作り、それらを足し合わせてポ テンシャル場を形成する。その中をロボットの状態を表す 点が移動して行く。その時の動作決定は、一旦ポテンシャ ル場を形成されてしまえば、もとのロボットの形状などに かかわらず、同様なアルゴリズムで行うことができる。 また、この状態空間の与え方はもちろん-通りでないが、 これはロボットの動き方に直接影響することになる。これ を利用すれば、ロボットの動き方の特徴を簡単に変えるこ ともできる。 3.3ポテンシャル場の定義 3.3.1全体の場 前節でも述べたように、一般的にポテンシャル法を用い たアプローチはロボットの動作計画問題に対しての基本的 な手法の一つであり、アルゴリズムの完全性は求めず、実 際のロボットに求められる作業の仕様などを考慮して、実 用的なアルゴリズムを構築することを目的に用いられてい る。本研究では、ポテンシシャル法の概念を導入すること によって、プレイヤーの行動を決定するが、従来の障害物 などをポテンシャルとする静的なポテンシャル法と異なり、 動的環境であるサッカーフィールド上のプレイヤーをポテ ンシャル関数によって表現し、そのポテンシャルの影響を 受けて運動するポールを定義することにより、エージェン トであるプレイヤーは直観的感覚で行動決定を行なえると 考えられる。つまり、動的ポテンシャル場においてマルチ エージェントの協調を行ない共通の目的の達成を試みる。 ここで、それぞれのプレイヤーを表すポテンシャル関数 を式(1)で定義する。

B=αeXp(_β(エー麺p)2+(y-gP)2)(1)

ただし、αは最大のポテンシャル、βは影響を及ぼす領域の 広さを表す定数である。 図(3)は一つのポテンシャルの例である。αが正なら丘、 負なら谷のような形になる。 3.3.2距離とポテンシャル 本研究において、エージェント間の距離は、2次元の状 態空間において考える。 ある目標状態(以下、対象と呼ぶ)からの「距離」とい う概念を定義する。ポテンシャルはその距離の関数として 求められる。その距離は「ある対象に、どれ位接近してい るか」を表すものである。対象がある範囲を持つ図形で表 されるような場合には、その対象からの距離を求めるには 。<0 。。⑪ 図3.ポテンシャル 工夫が必要であるが、対象が点である時には、ある状態に おけるその対象からの距離は単純に求められる。 ここでは、ポールとプレイヤーの距離をそれぞれの中心 座標から求める。 距離からポテンシャルを求める関数L(、)としては、一 般には、目標状態に対しては単調減少関数であり、

‘(、)=告(2)

を用いている。ただし、kはある定数で、ポテンシャル の勾配を決めるものである。また、Dはこの節で定義した

距離(Dz0)である。式(2)で、、→O(すなわち対象に

近づく)にしたがって、目標状態ではポテンシャルが高く

なり、そして全体のポテンシャルは、各々の対象によるポ テンシャルの重ね合わせにより決定する。 以上のようにロボットの状態が点で表されるような空間

(状態空間)にポテンシャルを与え、それを利用して状態を

変化させていることによって、動作決定の際の処理が単純 な方法となっている。さらに、状態空間を形成する変数を 変えることにより動作の特徴を変えることができる。但し、 いろいろな場合に関するその変数の選び方や、現実空間の 物体を状態空間に写像する方法、及びその近似法などが今 後の研究課題であろう。 3.4ポテンシャル場におけるエージェントの動き 3.4.3ボールの運動

一般に(古典)物理学において、物体が力を受けながら2

点間を移動するとき、その力のする仕事が2点の位置だけ で決まる場合、この力を保存力という。重力や弾性力、お よび万有引力、静電気力などが保存力であり我々の住んで いる地球上は重力の及んでいる場である。保存力を受けな

がら物体がある位置(z,U,z)から基準位置まで移動すると

き、保存力がする仕事を物体がその位置にあるときのポテ ンシャルエネルギーという。 ポールは、前節において定義されたポテンシャル場によ りポテンシャルエネルギーを得ることで、運動する。 、ボールの加速度 ポールは地球上と同様鉛直下向きに加速度を得る。 、ボールの受けるポテンシャルエネルギー

座標(ェ6,Vb)のポールは、影響を受けているポテンシャ

ル場の中心である、プレイヤーの位置座標(JDP,3ノ,)を

得る。 以上の条件のもとポールは、ポテンシャル場上で運動を

(6)

ルazyをぉ,v方向について分解することにより、Z軸方向の

加速度ベクトルL、v軸方向の加速度ペクトルdDを得る。

3.4.4プレイヤーの視界と行動 プレイヤーは環境を認識する手段としての視覚をもつ。 プレイヤーはフィールド上におけるポテンシャル場の情報 を視覚より得、行動を決定する。 1J

堯鍵蓼

▲ player] 1K t 、 図4.ポールの迦勘 hRI1 11灘;〆,:,釘 〃鯉=■ 勺已Ⅱ 、 、 "'(B〃 、.・・・ ̄!、。. 1s'1, player。  ̄ 。~ laver2= mlf 図6.ポテンシャル場におけるプレイヤーの視野 図5.加速度の方向 Agent4Agent3 行う。 2次元平面におけるポールの運動は容易に考えられるが、 3次元における曲面でのポールの軌道を得るのは、困難で ある。ここでは、ポールのある座標から微少区間を微分す るにより求まる傾きから加速度丘を求め、ポールの軌道を 決定する。 この場合において加速度とは、ある傾斜におけるポール の座標を、傾斜を生成しているポテンシャルの山に対し、外 側に微小区間移動した際の移動距離とする。ここで、ポー ルの運動の様子を図4に示し、ポールに発生する加速度を 図5に示す。

座標(筵,,nP)のエージェントより発生するポテンシャル

場の傾斜に存在する、座標(配6,yb)のポールに与えられる

加速度を考える。 ポールの存在する座標における傾斜は、ポールの微小移

動距離より求まる。座標(nw6)のポールに与えられる高

さは(1)式より、

Pot(Bl)=αexp[-β化6-皿,)2+(yb-昨)2)](3)

となる。同様に、ポールが乗っているポテンシャル場の中

心座標方向に対して逆方向へ微小距離。!(=恥)移動した

際の、座標(z6+dz,y6+dv)におけるポールの高さは、

Pot(B2)=αexp[-β{((zb+d垂)-zp)2

+((y6+dU)-9p)2}](4

Agent2 鱒iillll l:.:.:;・郡1 [.:騨朧f〈誼 宙と.`,'ハ'`,。.`』。...。.p、。`。,` ‘、賢く:.;(。:+iRT -鵯さ

霊警篝i霊曇蓬iiilご

ミミミ'1篭ri篝f蕊

~烏鷺

霞Agen1,

図7.プレイヤーの得られる視覚1W報 プレイヤーの視界は、自身が向いている方向から特定の 視野範囲を有している。図6にプレイヤーの視野を示す。 プレイヤーは左方向から順にプレイヤー2,ポール、プレ イヤー3,プレイヤー4のように観測することができる。 このとき、プレイヤーは独自の視界情報として、距離に よって変化するポテンシャルの高さを2次元平面へと射影 し直す。変換された2次元平面上の視界を図7に示す。こ のときの距離によるポテンシャルの変化により、対象に対 してどれくらい接近しているかを判断する。 4.計算機実験 4.1問題設定 本研究ではポテンシャル場により表現した状態空間にお ける、シミュレーションの例としてサッカーモデルを用い、 シミュレータを作成し確認実験を行った。 このシミュレータにおいては、プレイヤーを正のポテン シャル場によって表現し、ポールを負のポテンシャル場に +((y6+dU)-9P)`Ⅱ(4)

となる。よって、Pot(B1)、Pot(B2)の差を求めること

により、ポールの鉛直方向加速度が求まる。また、ベクト

(7)

横山・山城・山田・遠藤:ポテンシャル場を用いた動的環境でのマルチエージェントシステムの実現 106 より表現している。 以下にシミュレーションにおける各パラメータを示す。 表1フィールドおよびプレイヤーのパラメータ 図9.T=5におけるフィールドおよびプレイヤーの視界 フィールドF1、F2 を用怠 追跡エージェントの座標より ポテンシャル場F1を計算 ターゲットエージェントの 座標よりポテンシャル糊 F2を計算 F1、F2の合成脇の生成 エージェントの動作決定 ターゲット,追跡エージェン トの座標を更新 図10.T=38におけるフィールドおよびプレイヤーの視界 Timestep=100 NC Yes (よ、プレイヤーP3の正ポテンシャルと、その後方に存在 するポールの負ポテンシャルを読みとっている。また、プ レイヤーP4は、ポテンシャルの存在しない方向を見てい るため、視界にはなにも表示されていない。 5.むすび 本研究では,複数のエージェントの行動により変化する 動的環境において、その状態空間の変化をポテンシャル場 の概念を用いることで単純な規則により表現した。また、 1体のエージェントとしてのポールの運動決定およびエー ジェントの行動決定にこれを用い,これまでの静的なポテ ンシャル場による行動決定に対し動的なポテンシャル場に おけるエージェントの行動計画を試みた. さらに単純化された行動規則をもつ複数のポテンシャル

(エージェント)が存在する仮想空間を計算機内に構築し、

そのふるまいを視覚的に確認した。ある特定のポテンシャ ルに近づく、あるいは遠ざかるという規則に基づいて行動 するエージェントはサッカーゲームのようなふるまいを見 せた。 マルチエージェントシステムが扱う、問題の制約をポテ 図8.サッカーシミュレーションのアルゴリズム 図8は本研究で作成したサッカーシミュレータのアルゴ リズムを示している。プレイヤーを表す正ポテンシャルの

フィールド(F1)と、ポールを表す負ポテンシャルのフィー

ルド(F2)を用意する。そこで、F1、F2を重ね合わせるこ

とにより合成場を生成し、その合成場を基にプレイヤーは 行動を決定する。 4.2シミュレーション 図9は、タイムステップT=6におけるフィールドの情報 とそのフィールド上に存在するプレイヤーの視界を表示し たものである。図10はタイムステップT=38における様 子である。 中心のポールに対し、周囲に存在する各プレイヤーPL P2,P3、P4の視界を図右側に示す。 プレイヤーはポテンシャルの変化を視界に取り込み、そ れを基に行動を決定する。図9はプレイヤーPlの視界に 瞬一函 ゴミ才KLA2 H1ボー…パ判

;A3l:〈 、i‘;、 薗籔 少↓、》遥醗三丘 :■>>lpargsP.h,F1い,,'.,.、 ■■、 上 ニヤォミニ!:概4~ぃ泳一F 鶴J>ハ〕〉'。⑥。. oTqミーヘロ臣…-----r、n、⑤、、、 1- 1-嘘』四--- -1 -回 瞬一函 1- 1-嘘』四--- -1 -回

グリッド数(横×縦)

35×53 プレイヤー数 4 タイムステップ 100 ポテンシャルの最大値 5 プレイヤーの及ぼす領域 0.05 プレイヤーの視界角度 ±45。 プレイヤーの視界距離 20 臆蘭函n期印■顛印印砥露圃頂■繭■面■蘭画■ 蕊忠Ta噂et 88 ■■ 1 丁A

騨牢一配

詫淨面小勵麺蓉辨

A4 ⑤ 4 2 ■ 3 7 0 1 一‐、。,グ■■■、 ・・・勺‐‐。△&□し TimDe:38Targe 圃頂■繭■面■蘭画■ロ --車

 ̄  ̄ --一一一■

(8)

ンシャル場の重ね合わせにIこよって多重化できるため、エー ジェントの観測情報を学習させることにより様々な問題に 適応できると考えられる。 謝辞 本研究の一部は,財団法人テレコム先端技術研究支援セン ターの支援により実施した. 文献 比留Ⅱl博久:経路探索問題一ロボットの動作計画一イガ報処理学会誌、 Vol35,N。、8,pp751-760(1994-8). 奥富正敏、森政弘:ポテンシャル塒を用いたロボットの動作決定ロ 本ロボット学会誌、VoLlINo、3,pp226-232,(1983-10). 辻敏夫、千種和幸、金子典:人工ポテンシャルMIrを用いた移動ロ ボットの軌道生成法日本機械学会論文集(C編)62巻597号,pp257‐ 263(19955). 横山隆洋:ポテンシャル場を用いた動的環境でのマルチエージェン トシステムの実現,98年度琉球大学工学部情報工学科卒業総文. [1] 1- 23 -- [4]

参照

関連したドキュメント

By incorporating the chemotherapy into a previous model describing the interaction of the im- mune system with the human immunodeficiency virus HIV, this paper proposes a novel

In a graph model of this problem, the transmitters are represented by the vertices of a graph; two vertices are very close if they are adjacent in the graph and close if they are

Therefore, with the weak form of the positive mass theorem, the strict inequality of Theorem 2 is satisfied by locally conformally flat manifolds and by manifolds of dimensions 3, 4

Recently, Velin [44, 45], employing the fibering method, proved the existence of multiple positive solutions for a class of (p, q)-gradient elliptic systems including systems

He thereby extended his method to the investigation of boundary value problems of couple-stress elasticity, thermoelasticity and other generalized models of an elastic

By employing the theory of topological degree, M -matrix and Lypunov functional, We have obtained some sufficient con- ditions ensuring the existence, uniqueness and global

– Classical solutions to a multidimensional free boundary problem arising in combustion theory, Commun.. – Mathematics contribute to the progress of combustion science, in

In this article we study a free boundary problem modeling the tumor growth with drug application, the mathematical model which neglect the drug application was proposed by A..