• 検索結果がありません。

認知モデルを用いたバーチャル世界のエージェント開発手法

N/A
N/A
Protected

Academic year: 2021

シェア "認知モデルを用いたバーチャル世界のエージェント開発手法"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

認知モデルを用いたバーチャル世界のエージェント開発手法

Method of Developing Agent in Virtual World Using Cognitive Models

長島一真

1

森田純哉

1

竹内勇剛

1

Kazuma Nagashima

1

, Junya Morita

1

, and Yugo Takeuchi

1 1

静岡大学情報学部

1

Fuculty of Informatics, Shizuoka University

[email protected]

Abstract: This study aims to design a virtual world agent's behavior based on the cognitive architecture ACT-R that aims to simulates the human mind. At this time, the hierarchical architecture is implemented to combine modules of decision making and body movement by using ACT-R and a three-dimensional game engine respectively. Each module collaborates to work via the communication server, realizing independency between two modules. The goal of this study is to develop a method of designing various behaviors of agent based on the hot swapping the ACT-R model or the modulation of parameters of the model.

1.はじめに

認知科学では,認知モデリングの手法によって人 工知能研究と心理学の融合が進められてきた.ここ で言う認知モデルとはコンピュータ上に実装された 人間の内部処理に関わる仮説である.通常の人工知 能研究に対して,認知モデルの研究は,人間のエラ ーやバイアスを再現することに重点が置かれ,心理 実験の結果に対するシミュレーションによって評価 される. 上記とは独立し,バーチャル世界におけるエージ ェントとして,ゲームエージェントの開発が進めら れてきた.ゲームエージェントの開発においては, スクリプトなどを利用することで,エージェントの 振る舞いに関わる記述が,ゲーム本体のプログラム と分離される.この手法のメリットはプログラムの 再コンパイルなし,またはプログラム動作中にスク リプトの記述を変更することでエージェントの振る 舞いを変更できることにある.ただし,何をどこま でスクリプトに任せるかを定める一般的な設計論は 存在せず,その利用は設計者に委ねられている[1]. 本研究では,上記の2 つの背景を統合することで, 認知モデリングの手法を流用し,スクリプト手法の メリットを踏襲したエージェントの開発手法を提案 する.プログラム動作中に認知モデルを変更,また はパラメータを変更することでエージェントの振る 舞いが多様に変化するエージェント開発を目標にす る.ゲームエージェントにおけるスクリプト手法を 認知モデルに置き換えることで,認知科学の一般的 な知見に従ったエージェント設計論を提案できると 考える. 本稿の構成は以下である.まず,関連研究として 認知アーキテクチャを用いた認知モデリングのアプ ローチ,およびその応用に関する研究を示す.その 後,本研究において提案するバーチャルエージェン トと認知アーキテクチャを統合するアプローチ,お よび実装したシステムの詳細を記述する.最後にま とめとして,今後の展望を述べる.

2.関連研究

2.1 認知アーキテクチャの利用

近年の認知モデリングでは認知アーキテクチャの 利用が重要視される.認知アーキテクチャとは,個 別の課題において,認知モデルを実装するフレーム ワークのことである.認知アーキテクチャを利用し たモデルの実装により,人間の認知に近い認知モデ ルが作られるものと考えられている.これまでに複 数の認知アーキテクチャが開発されてきた.本研究 ではその中でもACT-R (Adaptive Control of Thought-Rational [2]) に着目する.ACT-R は大きなコミュニ ティを持ち,そのモジュールとパラメータを人間の 脳の構造と生理機能に対応付ける研究が蓄積されて いる.加えてACT-R はインタプリタ言語である LISP で書かれており,外部環境とのインターフェースを

(2)

追加実装することで,環境に応じた柔軟な開発が可 能になる.これらの理由から,本研究において目指 すバーチャルエージェントとの統合に ACT-R が適 していると考えた.

2.2 認知モデルを応用したエージェント

開発

近年,認知モデルを応用することで外部環境とイ ンタラクションするエージェントを開発する研究が 進められている.認知アーキテクチャを用いた認知 モデルを利用することで,人間的なエラー,バイア スを持たせたエージェントを開発することが可能に なる.高橋らは,認知モデルを組み入れたエージェ ントを開発するために,認知アーキテクチャとロボ ットOS,あるいはゲームエンジンを統合するプラッ トフォームを提案している[3].このプラットフォ ームにおいて,エージェントは,ロボット OS と接 続されたセンサ,あるいはゲームエンジンによって 構築されたバーチャルな身体を介して外部環境とイ ンタラクションする.しかし,高橋らによる知能の モデル化は,機械学習器による脳器官の対応づけに よるもので,ボトムアップ的である.そのため,高 橋らのアプローチによるエージェントを実現するた めには,脳器官と対応する機械学習のアルゴリズム を明確にしなければならず,さらにそれらの演算と 情報統合のためのハードウェアとネットワークの性 能向上が必要になる.これらの課題を回避するため に,本研究では,認知アーキテクチャとしてACT-R を利用することで,トップダウン的にエージェント を構築する.ACT-R は,認知科学の知見をトップダ ウン的に組み入れたアーキテクチャであり,人間に とって明示的なシンボルによって記述される.この 特徴を活かし,本研究では,エージェントの身体が 取得する情報をシンボリックなアフォーダンス[4] として環境に配置する.そのシンボルに基づき ACT-R が意思決定を行う.将来的には,このシンボル化 の際に機械学習アルゴリズムなどを用いることで, トップダウン手法をベースにしながら,ボトムアッ プ手法を組み合わせることも可能になると考えてい る.

3.

仮想エージェントと認知モデリング

の統合アプローチ

3.1 バーチャル世界との接続

ACT-R は内部処理に関わるモジュールだけでなく, 知覚や運動など,環境との相互作用を受け持つモジ ュールを有している.しかし,それらのモジュール は物理的な信号を取得する機能を含まない.そのた め,ACT-R と接続し,外部環境の情報を取得する身 体とその環境を用意する必要がある. 本研究では,ロボットなどの物理的身体を用意す るのではなく,より簡便に,3 次元空間として構築さ れたバーチャル世界とACT-R を接続する.3 次元空 間の構築には,ゲームエンジンを利用する.近年の ゲームエンジンには精巧な物理エンジンが含まれ, 現実感のある環境を構築することが容易である.ま た,それと相互作用する身体モデルも用意されてお り,ゲームエンジン内で,状況に応じたエージェン トの振る舞いを実装可能となっている.ACT-R とゲ ームエンジンとの統合についても,先行研究があり, バーチャル世界におけるロボットの環境探索[5]な どが課題として取り扱われている.本研究ではそれ らの知見を援用しつつ,ゲームエンジンとACT-R の 統合を拡張させる. 図 1:脳と身体の階層構造

3.2 認知アーキテクチャとバーチャル身

体の統合

ACT-R が接続するバーチャル世界では,複数の独 立したイベントがリアルタイムに進行する.それに 対して,ACT-R の内部に生じるプロセスは基本的に 系列的である.それに加え,全ての環境情報を ACT-R で処理するのは難しいため,環境情報を記号化し て送る必要がある.したがってACT-R とバーチャル 世界の統合には,異なるシステムを並列に動作させ る仕組みと記号化された環境情報を通信する仕組み が必要である.本研究のシステムでは,図1 の通り 環境情報の抽象化の仕組みとして,異なる階層のプ ロセスを並行して動作させるサブサンプションアー キテクチャを参考した階層構造を用いる[1][7].こ こで,エージェントの上位層の意思決定はACT-R が 担当し,下位層の身体的な行動及び環境情報の取得 はゲームエンジン側で行う.上位層は,下位層で取 得した環境データを記号として受け取り,知識ベー スの意思決定を行う.下位層は,基本的にゲームエ ンジン内で定義した動作にしたがい動作するが,上

(3)

位層からの意思決定の結果次第では,現在の身体の 動作がプリエンプションまたはオーバライドされる. また下位層は,環境からのデータを取得し,それを 記号化して上位層に送る働きをする.

4.プロトタイプシステム

4.1 アーキテクチャ

これまで,図1 の階層構造を具体化するシステム を図 2 のように実装した.図 2 に含まれるサーバ (C++で実装)は,ACT-R とゲームエンジン間での データの受け渡しを担う.2 つのシステムがサーバ を介して結合されることで,1 節で述べたスクリプ ト手法のパラダイムと同様,ACT-R とゲームエンジ ンの独立性を確保される.つまり,コンパイル済み のゲームエンジン内のエージェントに対し,ACT-R のモデルを柔軟に変更・介入できる設計となってい る.各システムは独立して動作するため,どちらか 一方のシステムが停止,または変更されたとしても, もう一方のシステムに影響を与えない. 図 2:システムの概要 サーバ上のスロットに対する読み込みと書き込み は,ACT-R とゲームエンジンで対称的に行われる. バーチャル世界におけるエージェントのイベントに 応じて,ゲームエンジンがサーバの環境スロットを 更新し,その値をACT-R が定期的に読みこむ.また, ACT-R の実行結果によって,サーバ上の意思決定ス ロットを更新し,ゲームエンジンがその情報を読み こむことによってバーチャル世界のエージェントの 動作状態が更新される.ACT-R とゲームエンジンの サーバへのアクセスは非同期である.つまり,サー バを介在して,ACT-R による認知プロセスの実行と バーチャル世界における身体動作が,並列的に遂行 される.このような高次の意思決定機構(脳)と低 次の身体運動の関係は,階層的なサブサンプション アーキテクチャの枠組みと整合的である.

4.2 通信仕様

本システムのネットワーク通信には TCP/IP のソ ケット通信を用いている.認知アーキテクチャ,ゲ ームエンジンのそれぞれのプロセスにクライアント ソケットを付与し,共通のソケットサーバと接続す る.データの形式に関しては,過去の研究[5]を参考 にJSON (JavaScript Object Notation) に統一している. サーバに備わるスロットは,256Kbyte までの JSON データを保存できる.サーバは機能を2 つ有してお り,1 つ目はクライアントにスロットの内容を送信 する読み出し機能,2 つ目はスロットの内容を更新 する書き込み機能である.これらの機能は,クライ アントからサーバに送信するリクエストによって利 用できる.図3 はそのパケットの仕様であり,1 つ 目のパケットは読み出しリクエスト,2 つ目のパケ ットは書き込みリクエストを示している.なお,サ ーバのスロットの数は,マルチエージェント化や外 部デバイスなどの用途にも利用でき,最大65,536 個 まで増やすことができる. 図 3:サーバ受信パケット サーバへ読み出し要求後,サーバから該当クライ アントにパケットが送信される.図4 はサーバから 送信されるパケットの仕様である.可変長データに, そのサイズを加えてパケット化することで,クライ アントはパケット単位でスロットのコンテンツを受 信する. 図 4:サーバ送信パケット

(4)

4.3 ゲームエンジン側の実装

本 本 研 究 で 使 用 す る ゲ ー ム エ ン ジ ン は UE4 (Unleal Engine 4)である.UE4 を用いる理由の一端 は,基本機能にBehavior Tree が存在することにある. Behavior Tree とは,エージェントの振る舞いをツリ ー構造状に定義し,それを逐次,またはif-then のル ールに基づいて実行する手法である.柔軟なエージ ェントを設計するために広く利用されている.図 5 は本課題のエージェントのBehavior Tree を示してい る.赤枠で囲まれた木の葉の部分がタスクと呼ばれ るエージェントの一つの動作の単位になっている. このタスクは,UE4 の BP (Blueprint) と呼ばれるビ ジュアルスクリプトを用いて実装している(図5 の 下段). 図 5:UE4 を用いたエージェント実装例 図 6:UE4 を用いた実装例 本研究において,UE4 を利用する別の利点は,エ ー ジ ェ ン ト の タ ス ク 間 の デ ー タ の 受 け 渡 し に Blackboard アーキテクチャ[8]を模したデータをス ト ア す る 機 能 が 存 在 す る こ で あ る .UE4 の Blackboard は,データのストア先をキーと呼ばれる 名前で定義し,データ型(文字列型や整数型など) を指定することによりキーに対して,それに適した データをストアする事ができる.UE4 の Blackboard にあらかじめ2 つのバッファを用意し,バックグラ ンド上でネットワーク上のサーバの2 つのスロット と同期をとることで,身体側のエージェントはUE4 が持つ基本機能で実装ができる.図6 は UE4 を用い た実装例の概要である.

4.3 迷路探索課題

4.3.1 課題 構築されたアーキテクチャを用い,単純な迷路探 索を行うエージェントを実装した.図 7 は課題の環 境を俯瞰的に示している.この環境におけるエージ ェントの課題は右下を出発点とし,左上の行き止ま りを目指すというものである.また曲がり角に配置 された白い物体は,曲がり角の情報を記載した視覚 的手がかりを示している.本研究のモデルでは,各 曲がり角にエージェントが知覚しうる環境情報をア フォーダンス [4]として配置している.エージェン トは曲がり角に到着する度に,その情報に基づき, 次に目指す曲がり角を決定する.ただし,今回のエ ージェントにおいては,黄色の矢印が示しているゴ ールまでのパスをあらかじめ記憶として与えている. したがって,スタート地点から曲がり角に行く度に 記憶から次の曲がり角を思い出し,ゴールまで向か う処理を行う. 図 7:迷路探索課題の環境 4.3.2 エージェントの動作 図8 はエージェントの動作をフローチャートで示 している.エージェントの移動に先立ち,あらかじ め記憶しているゴールまでのパスの次の曲がり角を 検索する.ACT-R の記憶は,活性値の不足などによ り失敗する.記憶の検索に失敗した場合は,その場 に待機し,再び記憶の検索を試行し,成功するまで

(5)

続ける.検索が成功した後に,エージェントは身体 の向きを変え,視線から最も近い曲がり角に向かう. 図 8:エージェントの動作 4.3.3 予備的結果 図8 は図 9 で示したエージェントの振る舞いから 得られたシミュレーション結果を示している.活性 値に付与するノイズパラメータの異なるエージェン トを用意し (0.1, 05, 1.0),各 10 回迷路課題を実施し, 実行に要する時間を比較した.その結果,設定され た環境において,ノイズの少ないエージェントは実 行時間の分散が小さく,ノイズが多いエージェント は分散が大きいという結果になった.この結果は, ACT-R のパラメータを操作することによって,バー チャル世界におけるエージェントの振る舞いに多様 性を持たせることができることを示している. 図 9:シミュレーション結果

5.まとめと展望

本研究では,認知モデリングの手法を流用し,ス クリプト手法のメリットを踏襲したエージェントの 開発手法を提案した.認知モデルの構築に,トップ ダウン的な認知アーキテクチャである ACT-R を利 用することで,ボトムアップ的な機械学習アプロー チの課題を回避した.ACT-R とゲームエンジンがサ ーバで結合される環境を構築し,ACT-R のパラメー タを操作することで,振る舞いの多様さを生成する 可能性を示した.この予備的結果から本研究におい て構築したアーキテクチャは,脳のパラメータを調 整することで,環境からの同一の情報でもエージェ ントの動作に違いが生じることが示された.このこ とはバーチャルエージェントの開発に認知モデリン グの研究において蓄積された研究知見を体系的に流 用することが有効であることを示唆している. 従来の認知モデルの多くは身体を持たず,基本的 には脳内に閉じた記号系の問題を扱ってきた.認知 モデルに対して,バーチャル空間の身体を付与する ことで,身体と脳のインタラクションに関する重要 な現象をシミュレーションできる可能性がある.も ちろん,ゲームエンジンとACT-R を接続する試みは 本研究において初めて行われたわけではない.ただ し,従来の研究[5]は,ACT-R とゲームエンジンを Pear to Pear で結合し,図 2 の通りサーバを介して結 合するものではなかった.先行研究の方式に対し, サーバを介した本研究のアーキテクチャは,エージ ェント開発の柔軟さという点で利点がある.さらに, 設計したサーバは複数の ACT-R モデルの接続を許 すものであり,マルチエージェント環境への拡張と いう点でも利点を有している.この利点を活かし, 今後,バーチャル世界に複数のエージェントを配置 した,身体化された集団のインタラクションのモデ ル化を行う予定である.さらに,ゲームエンジンに よるバーチャル世界の可視化は,ACT-R によって稼 働するエージェントと人間との相互作用を行えるよ うにするという利点も有している. このことから本研究のアプローチは,新たな認知 モデリング手法の可能性と,エージェントに体系的 な背景を持たせるという利点を有していると主張す ることができる.この利点を活かすことで,様々な 環境における多様な動作の生起が可能になり,汎用 的なエージェントの開発に寄与できると考える.

文献

[1] Bourg D., Seemann G.: AI for Game Developers, O'Reilly Media, (2004)

(6)

[2] Anderson J. R.: How Can the Human Mind Occur in the Physical Universe, Oxford University Press, (2007) [3] 高橋恒一,坂谷琴音,中村政義,小泉守義,荒川直哉,

富田勝,山川宏:認知コンピューティングのための汎

用 ソフ トウ ェアプ ラッ トフ ォ ー ム の 設 計 と開 発,

2015 年度人工知能学会全国大会,(2015)

[4] Gibson J. J.: The Ecological Approach to Visual Perception, Houghton Mifflin, (1979)

[5] Smart P. R., Scutt T., Sycara K., and Shadbolt N. R.: Integrating Cognitive Architectures into Virtual Character Design, Engineering Science Reference, (2016)

[6] Brooks R. A.: Planning is just a way of avoiding figuring out what to do next. Technical report, MIT Artificial Intelligence Laboratory, (1987)

[7] 三宅陽一郎:人工知能の作り方:「おもしろい」ゲー

ムAI はいかにして動くのか,技術評論社,(2016)

[8] Buschmann F., Meunier R., Rohnert H., Sommerlad P., and Stal M.: Pattern-Oriented Software Architecture: A System of Patterns, Wiley, (1996)

参照

関連したドキュメント

問についてだが︑この間いに直接に答える前に確認しなけれ

現在入手可能な情報から得られたソニーの経営者の判断にもとづいています。実

 また伸縮率 640%を誇るナショナル護謨社開発 の DT ネオプレインを採用する事で起毛素材と言え

次に、第 2 部は、スキーマ療法による認知の修正を目指したプログラムとな

点から見たときに、 債務者に、 複数債権者の有する債権額を考慮することなく弁済することを可能にしているものとしては、

(2011)

はじめに

ASTM E2500-07 ISPE は、2005 年初頭、FDA から奨励され、設備や施設が意図された使用に適しているこ