エージェントによる分散情報の管理と探索

(1)

マルチメディア通信と分散処理ワークショップ平成8年10月

エージェントによる分散情報の管理と探索*

阿部康一

武田利治

丹野州宣

f

E-m

泊

d

此

1 :

作

{

k

o

u

叫

i

c

ω

h

i

，

t

地北

e

仙

d

伽

a

，

t

伽

a

組

:

nno}

陣

@et

凶

n

.

戸

y

z

.

y

翻

a

碍

g

肝

a

御

t

凶

a

仇-屯也

-

u

札.必品判

u

a

配飢叫，氾

ι

吋

c

吋

J

.

山形大学工学部電子情報工学科

t

近年の World-Wide Web (WWW)の普及によるインターネットへの関心の高まりは、目覚しいものがある.特に World-Wide Webによる個人での容易な情報の措佃は、瞬く聞にインターネット上に膨大なあらゆる情報を無秩序に抱濫させるに至り、ユーザが自分の必要とする情報をどのようにして探し出すかが大きな問題となって来ている.そのため、 World-WideWeb上の情報を対象とした様々な検察システムが盛んに研究・開発されている.しかしながら、いずれのシ九テムも単一ホストによる集中管理方式を採用しており、現在のような胆大化した情報資源全体を管理するには限界があるように恩われる. そこで本研究では、 Wotld-Wide Webなどの情報資源を提供するサーパ自身が検察サーパとしての役割をもっ分散情報の自己管理方式を提案する.本方式では、エージzントのマイグレーシgンによって、分散配置された情報資源を相互に結び付け情報探嬬に利用する.これにより、インターネット上の情報資源を効串的に管理し、ユーザの必要とする情報を探索することが可飽になると考えている.本文では、システムの基本概念と各エージェントの役割、コミュ=ケーション・プロトコルなどについて報告する.

1 はじめに

近年のインターネットの一般的社会への普及、すなわち World-Wide Webの利用者の増加は目覚しいものがある。今では、インターネット=World-Wide Webという図式が成り立つほどに World-Wide Web

の利用者が急増している.特に、個人による自由な情報の発信が可能ということで、多くの利用者によってインターネット上に情報が無秩序に分散・蓄積され続けている.それにより、既存のインターネット上の情報資源が World-Wide Webの影に隠れてしまうほどである。そのため現在では、ユーザが自分の必要とする情報をこの膨大な情報資源からどのようにして探し出すかが最大の問題となってきている。最近では、膨大な World-Wide Webの情報源から目的の情報を見つけ出す士めに多種多様の検索システムが研究・開発され続けている。一般に、この間屈を解決する方法として、情報カタログを利用した検索方式が広く使用されている.この方式では一般に、あらかじめ対象とする情報に関するデータベース(情報カタログ) • AD lnfonnation Retrieval and M細胞gementSystem OD

Dis凶butedCompu.ter Ne.tworks b回edon Age叫 Modcl

t Kouichi ABE

，

T，回hiluroTAKETA

，

Kuninobu TANNO

'Dcp町凶entof Electrical岨 dlnCorma.tion Engiso創mng， Yamagata Univ，倒:sity を作成しておき、ユーザの検索要求を満たすオ宵報をカタログから検察して、その情報の一覧をユーザに提示する。しかしこの場合、ユーザが情報検索サーピスを行なうことのできる検察サーバを明砲に知っているということが前提である。また現在の World-Wide Webや NetNew8などの情報量を見てもわか

るように、単一ホストで情報資源全体を把揮するのは困難である.このようにインターネット上の情報資源の極度の分散化、大規模化が現在の情報検索における大きな問題となってきている. 本研究では、従来の単一ホストによる集中型の情報管理方式に対して複数のホストによる分散型の自己情報管理方式を提案する.しかし、そのような分散型自己情報管理方式においては各情報資源開の効率的な検索、つまり相互に情報を結びつける方法が必要がある.そこで、本研究ではマルチエージzント・モデルを導入し、その自律的なマイグレーション機飽を利用する.さらに遺伝的アルゴpズムにもとづくエージzントの自樟再生産と最適エージェントへの進化を介して、分散環境上における情報の効串的な情報資源探索を実現する.本研究の究極的な目標は、 Wor1d-Wide Webなどに限らずインターネット上の全ての情報資源の効率的共有の実現である。本文は、以下のように構成される。まず最初に、イ

(2)

ンターネット上における情報資源について述ペ、現ピス毎に異なるクライアント(ユーザ・インタフェー在の情報資源の管理方式と本研究で提案する分散しス)を使用しなければならない。

た情報資源の自己管理方式とそれに応じた情報検索現在は、 World-Wide Web用のブラウザがこれら方式について述ペる.次に、この方式にもとづいたの情報資源にアクセスするための共通のユーザ・イシステムの概要について詳細に説明する。最後に、ンタフzースとして利用できる.これにより、上記今後の研究の方向性について述ペる. の情報資源への統ーしたユーザ・インタフェースの提供がなされることになり、初心者にとってはかな

2 インターネット上の情報資源

り便利な環境になりつつある.実際、大多数のユーザによって様々なプラウザがこれらの情報資源への

2 .

1

情報資源と利用の仕方インタフzースとして利用されている. インターネット上で利用できる情報資源には様々

2 .

2

情報管理形式と情報検索方式なものが存在する。その中で現在、非常に盛んに利用されているのがWorld-Wide Webである.この節では、インターネットよで広く利用されている情報資源とその利用形体について簡単に述べる. • World-Wide Web: インターネット上の分散された情報をハイパーテキスト・ネットワークでまとめた分散情報システム。ブラウザと呼ばれるクライアントを利用して個人毎に自分の興味のある見出しを辿って行くことにより情報を得る.専用の検索サーバを持つ. • NeもNew目: インターネット上の世界規模の電子掲示版システム。様々な=ユース・グループがあり=ユース・

P

ーダと呼ばれるクライアントを利用し、自分の興味を持つ=ユース・グループの記事を臨むことにより情報を得る.専用の検察サーバを持つ。 - 叩onymou8FTP Service: 現在の情報検索システムのほとんどが、一つのサーパで各情報資源の情報カタログを管理している(図 2.1)0 しかし、インターネットのような大規模なコンピュータ・ネットワーク上の全情報を一つのサーバで管理するには限界がある。本研究では、以上の問題を解決する方法として、図2.2に示すようなシステム構造を提案する.このシステム構造では、各々の情報資源が各自の情報カタログを所有する情報検察サーパになることである.このとき各サーバでの情報の検嬬は、専用の情報探索エージzントを用いて実行される. 図2.1:一般的な検察システムの構造また、インターネット上に存在する各種情報検索サービスは、一般にある限られた情報資源を対象とインターネット上でYフトウaアやドキュメントなどを提供するサービスoUNIXなどの

o

s

には標準でftpという名のクライアントが存在し、それを利用して必要なYフトウzアな.どを得る.ただし、事前に目的のソフトウェアなどの保存しているサーバなどを、 archieなどの専用の検索アプリケーションを用いて検察を行う必要がある場合が多い. したシステムであることが多い.そこでは、同ーのこれらの情報資源は、それぞれ，独立したサービス情報を提供する情報資源から定期的にそのホストがとしてインターネット上に数多く存在している。ユー所有している情報のPストを受け取り、インターネッザは、目的の情報資源にアクセスするために、各サート上全体とはいかないが、大規模な情報カタログを

(3)

作成し、それを使用することでユーザからの喪求に応えている。しかし、現在のような胞大化したインターネット上の情報資源の情報を単一のホストで管理するには限界がある。さらに、実際にユーザがこれらの情報資源から必要な情報を探し出すためには、各情報資源毎に専用の情報検索サービスを使用しなければならないζともあげられる。本研究では、これらの問題を情報の分散管理と情報探索エージェントによる検索方式で解決を図る. 図2.2:本研究で提案する検索システムの構造

3 分散情報の共有

本システムの基本概念は、分散されている情報をある特定の単一ホストで集中管理するのではなく、その分散されている情報毎に自己管理し、それらを相互に効率的に結び付けることである。

3 .

1

マルチエージェント・モデル本研究では、これらの検索サーパ聞の相互結合にエージェントの概念を導入する.現在、エージェントという用語は人工知能分野とコンピュータ・ネットワーク分野において広く使用されている問。本研究では、エージェントを次のように考える. 『人間や他のものの直接的な支毘・制御を受けることなく動き(自律性)、ある種のコミュニケーション言語を通じて、その他のエージェント(あるいは人間)と相互に影響し合う(社会性)もの。』またマルチエージェント・モデル(図3.1)とは、複数のエージzントがお互いに協カしてある目的を達成するモデルをいう。本システムでは、ユーザの必要とする情報を探し出すことが最終目的にあたる。図3.1:マルチエージェント・モデル

3 .

2

システムの構造インターネット上における本システムの構造は、図3.2に示すモデルとして表すことができる。図3.2 からも分かるように、本システムは3つの機能別領域に分割される。すなわち、ユーザ・インタフェース領域と情報探索領域、情報管理領域である。これらは大まかに言って、それぞれユーザ・インタフzース・エージェント、情報探索zージェント、情報管理エージェントにより機能する.ユーザ・インタフェース・エージェントは、情報検索を行なう際にユーザとのやり取りを行う.情報探索エージzントは、実際にインターネット上で情報資源を探索し、目的の情報を対象とする情報の情報資源から検察する.情報管理エージェントは、各情報資源を管理するエージェントである。

3 .

3

システムの機能本システムはインターネット上のあらゆる情報資源を効串的に共有することを究極的な目標としている.情報共有の基礎は、いかに効率的に目的の情報を探し出すことができるかである.そのため現段階では、分散情報の自己管理方式による検索サーバに依存しない、動的にホスト環境に適応する情報探索システムの構築および実験を目標としている。実装においては、既存の環境を変更することなく本システムを導入でき、また、ユーザから見れば単に必要な情報に闘するキーワードと情報資源名を入力する

(4)

図3.2:システムの抵念図だけで、目的の情報を入手することができるシステムの実現を目標に研究を進めている。現在、プロトタイプ・システムとして以下の機能を実装中であるa 1.検索サーバに独立な情報探索機能:

4 システム・エージェント

本節では、システム上で稼働する各エージェントについて説明する。

4 .

1

ユーザ・インタフェース・エージェントユーザ・インタフェース・エージェントは、実際にユーザから情報探索の要求を受け取るエージェントである.そのため、初心者でも操作体系が容易に理解できるインタフェースを備える必要があるa現

時点では、 World-Wide WebのCGIのスクリプトとして実装することを考えている。本システムでは、このエージェントを“Communicatortlと呼ぶa ."1-ザ酢晶 S圃同町魁園町酬町民輸摩繍.，ft

，

.

..鐘'審事績

.

書

輸・ーー・す晶 .叶竃轟図4.1:CommunicaLor状態適移図決まった検索サーパに問い合わせるのではなく、情報探索エージェント自らが検察サーバを決定し、検索しに行くこと(これを情報の探索

4 .

2

情報探索エージェン卜管理工ージェンと呼ぶ)D ト 2.動的な環境適応機能: 情報探索エージェント管理エージェントは、情報探情報探索エージェントがホスト環境とユーザか索エージェントの統括、ユーザ・インタフェース・エーらの

P

アクションによって、そのホストとユ} ~:r.ントからの探索依頼の下請け、情報探索エージェザに対して最適な情報探索エージェントへと進ントの遺伝的操作を行うエージェントである。本シ化していくこと。 3.情報カタログによる統ーした情報管理機能: World-Wide Web、臨むNew日などの情報資源を区別することなく、一つのサーパ上で情報カタログを用いることによって統ーして管理すること。つまり、これはWorld-Wide Web専用の検察サーパとかNetNews専用の検察サーパとかと雷う区別がなくなることを意味する. 4.ブラウジング機能: 検索結果である情報資源からの情報を、ユーザに分かりゃすい形式に変換(アイコン化やURL など)して、ユーザはそれらを選択するだけでその情報を得ることができるようにすることa ステムでは、このエージzントを“SeekersManager" と呼ぶ.

-

缶

前

・

.

"

，

.

"~，，，何色す畠 ~t~ "ttれほ. . %-!:I%:，.ト*'&O :U~::~ーや・:. ..嘩量附晶白岡岡田畑圃・e包圃悔a.胸la ..ーー・嗣，，0

.

す

・笥

.

ι

巴

.

I

:

a

U. fiH. 図4止 SeekersManager状態遷移図

(5)

各情報探索エージzントは、図4.3で示す形式で管 4.3.1 遺佳的アルゴリズム理される。ムでは、このエージェントを“InfoSeeker"と呼ぶ. イアントはサーパのホストに接続して、各種提供されるサービスを受ける.これに対して、マイグレーションとは、クライアントとしてのエージェントが実際にサーパ・ホストに移動し、そこでサービスを受けたり、何らかの行動を起こしたりする.そしてまた、出発したホストに戻って来る仕組みである。マイグレーション・号デルを使用することにより、エージェントを用いた並列的情報探索と情報探索におけるシステムの負荷分散を行うことが可能となる。つまり、従来のように検索サーパに集中的に負荷がかかることもなく、またエージェントを通じた各情報資源開の情報共有にも大きな役割を呆たす。図4.3:InfoSeeker管理フォーマット

4 .

3 情報探索エージェント

情報探索エージェントは、実際にインターネット上の各検索サーバ聞を移動(マイグレーションと呼ぶ)しながら、目的の情報を探し出すエージzントである。このエージェントは、各クライアント・ホストで一定の数だけ生成され、その時探索するサーパ、検索結呆、探索時間の上限などをパラメータ(遺伝子)として持つ。そして、一定サイクル毎に遺伝的アルゴりズムにもとづく遺伝的操作により、次世代の情報探索エージェントを生成する。このサイクルを繰り返すことにより、自分の生存するホスト環境とユーザに適応していしさらに、検索結呆に対するユーザからの評価や探索経験によって、より効率的な情報探索を行うための学習機能も持つ。本システ

⋮ ⋮

圃 . . 帽図4.4:InfoSeeker状態遷移図遺伝的アルゴpズム(GeneticAlgorithms: GA) は、生物進化(自然掬汰、突然変異)の原理に着想を得たアルゴ

P

ズムである.遺伝的アルゴ

P

ズムでは、図4.5に示すように問題の解侯舗を遺伝子として表現する.この遺伝子によって構成されるのが染色体であり、染色体上の遺伝子の位置を遺伝子座、遺伝子の組合せパターンを遺伝子型という。また、この遺伝子型にもとづいて形成された個体を表現型といい、これらの個体が進化することによって解を求めるアルゴリズムである.個体の進化は、3種類の遺伝的操作(週択掬汰、交叉、突然変異)を使用することによって行なわれる向。本研究では、情報探索エージェントが個体として扱われる。染色体遺伝子

三ーベ調麹姐亙￨見

遺伝子座遺伝子型図4.5:遺伝的アルゴリズムにおける個体 4.3.2 マイグレーション一般的なサーバ・クライアント・モデルでは、クラ 4.3.3 情報探索エージエントの構造情報探索エージェントは、ヘッダ部とボディ部から構成される。ヘッダ部は、

(6)

Searched 検察したホスト名の履歴 Pre-Host 直前に検察したホスト名 Migration・Errors マイグレーションに失敗した数 Home-Host 探索終了条件時に戻るホスト名 Max-Hosts 探索する検察サーパ数の上限 Max-Results 検索結果の上限 Time-Limit 探索時間の上限 Hosts 現在の探索サーバ数 Results 現在の検紫結果数 Tim倒現在の探索時間 Date 探索を開始した日付 Agent-ID 情報探索エージsント詔柾コード User 探索を依頼したユーザ名 (E-Mail address) Resources 検察する情報資源名 Keywords 検察用キーワード群で構成される.また、ボディ部は、検索結呆を各情報資源に応じた URL(UniおrmR怠80urceLoc叫or)で記述したものである.

4 .

4 情報管理エージェント

情報管理エージzントは、情報資源を提供するサーパにおける情報の統ーした管理、情報探索エージェントからの検索依頼の処理を行うエージzントである。またよ現在のシステムの実装は、 UNIX上を前提としている.このため、 World-Wide Webのサーパを MacintoshやWiDdows上で動作させている場合は、情報管理エージェントなどが存在できない. そのため、そのようなマシンの代理的な情報管理を行う機飽も備えている.本システムでは、このエージzントを“InfoM組 ager"と呼ぶ. %-l:Izシトfr.晶骨四t.す晶:::~.. ::J・:L='~-ー・ ν Cllt恥a

椅

.

.歳嘩曇暗轟凶ー " 町

"

'

0

. . 民acu. 図4.6:lnfoManager状態遷移図 4.4.1 情報管理方式各情報資源の

f

僻創立、全て統ーしたフ泊ーマットで記述された情報カタログによって管理されるa この情報カタログは、InゐMangerによって各情報資源毎に、自動的に作成・更新される。現在、 World-Wide Web、相onymousFTP service、NeもNeW8を対象に

実験を進めているが、このとき各情報資源毎のカタログ作成時における情報の公開制限を行うための設定ファイルを利用することもできる.情報カタログのフォーマットを、図4.7に示す. 図 4上情報カタログのフォーマットまた、各情報資源の情報カタログのための情報とキーワードは、それぞれ以下の規則に従って自動的に対象となる情報ファイル (HTML文書、エユースの記事など)から取り出される。 • World-Wide Web:

H

τ

・ML文書中のタイトル、・ヘッダ、アンカー・タグ・フィールドから取り出す. - 組onymo凶 FTPservice: 1s-1Rなどのテキスト・ファイルから取り出す. • NetNews: エユース記事のヘッダ・フィールド (Message.

(7)

ID、Newsgroups

，

Subjectなど)と、本文から取り出す. 4.4.2 情報検索方式情報検索のパターンは、 (1)英語の大文字・小文字に関係なく、その文字列を含む情報を検察する。 (2)英語の大文字・小文字を区別して、その文字列を含む情報を検索する。 (3)正規表現を用いて情報を検察する. (4)与えられた文字列に正確に適合する情報を検索する。以上の4パターンである.また、検索文字列の結合規則は、 (1)叩 d結合:キーワード群すべてを必ず含む情報を検索する。 .:-$1%シト'"島町 ..串且砂.骨備もす轟 ζt~ :l 1 .1:~-i-1I ν ..on骨.， tlttNtn .憲章.ft

‘

刷副拘園調書." 岡崎闘相.'"晶幅拘蜘臨町署

・

ホ

九

州

Zマイグ alJlt_"':r.トザーIfロ畏" "-i-.=-寄せ晶 ~e・...・ AA晶図4.8:GateKeeper状態適移図検最

ζ

?

1 <

名

竺笠

f

W W W s加.yz.yamaga匂・U.BC伊 W W W 0 鈍p.yz.yamaga佃・u.ac.Jp 円P 0 n側s.yz.yamagE蜘-u.ac.Jp NEWS 0 検来

4

(2)or結合:キーワード群の少なくとも一つのキー園4.9:検策ホスト・テープルの7 *ーマットワードを含む情報を検索する。 (3) noも結合:キーワードに完全にマッチする情報

5 むすび

を除外するa (4) exact結合:キーワードに完全にマッチする情報を検窮する。である。情報管理エージェントは、上述の結合規則にもとづいた検索文字列を情報探索エージzントから受け取り、検察を行う.

4 .

5

サーバ・アクセス監観エージェントサーパ・アクセス監視エージsントは、情報探索エージェントに次の検索ザーパ名を伝えたり、検察候補のサーパ名を管理するエージェントである。本システムでは、このエージェントを“GateKeeper" と呼ぶ. 4.5.1 検索ホスト・テーブル情報探索エージェントのマイグレーション用に使用する検索ホスト・テーブルのフォーマットは、図 4.9に示す栴遣を持つテキスト・ファイルである。インターネット上の情報資源は、日々更新され唱え続けている.そのため、それらの情報資源からどのようにして必要な情報を見つけ出すかが、重要な問題となってきている。本研究では、この問題に対する解決法として分散情報の共有を前提とした情報探索システムを提案し、その構成と機能について述ペた。さらに、システムにおける各エージェントの機能などについて詳細に説明した. 今後の研究方針は、大学内のLAN(LocalArea Net -work)上でのプロトタイプ・システムによる実験結呆を収集し、評価することである.その後、WAN(Wide Area Network)上での実験に拡張していく予定である。参考文献 [1] RobertAnnatrong， Dayne Freit，略ThorstCDJωchlm・ S，岨.dTom Mit.chell， "Wd Wotchcr: A Le4rnifJg Ap. prenticc Jor .he Worltl Wide Wd"

，

Schoal 01 Com-pu.tcr Science， CAnlegie MelloD U同時四ity，JADUAfY 20，

(8)

(2J M. Sri国vωandLalit M. Patnaik

，

"Genetic Algorithm・ .: A Survep"， IEEE， June 1994， pp.l1.・26.

同MichaelW

∞

l世idge岨 dNicbol国 R.Jennings

“

，

'ln1el

-ligent AgenC.:T1aeo1"1lond Practice"

，

Knowledge En -gineering Rcview， Oct.ober1994.

付録

A

エージェント・コミュニケ

ーション・プロトコル

付録として、エージェント聞のコミュニケーション・プロトコルについて説明する巴税明の便宜上、ユーザ・インタフzース・エージsントを“[C]"、情報探索エージzント管理エージzントを“伊M]"、情報探索エージェントを市

S

1 "

、情報管理エージェントを"[1刈"、サーパ・アクセス監視エージzントを “[GK)"と示す。また、太文字のアルファベットはコミュエケーシgン・コマンドである. 付録

A

.

l

探索時におけるプロトコル (1)

[c]ー

[5M]: RETRIEVAL(User)(Resources)(Keywor也) (2)[5M]→ [15]: Inお5eekerを呼び出す (3)[IS]

ー

[C]: 検察結果ファイル名を伝える (4) [C]: 検察結果ファイルが作成されるまで待機付録

A

.

2

認証時におけるプロトコル (1) [G

悶 →

[S

刈:'

AUTHENTICATION(AgeルID) (2) [5叫ー[GK): 認証が成功(OK)あるいは失敗(NG)かを伝える付録

A

.

3

応答時におけるプロトコル (1) [IS]

ー

[5M]: RESPONSE(Agent-ID) (2) [5

刈 -

[15]: 情報探索エージ zントを受け入れる (3)(I5]

ー

[C]: 検察結呆ファイルを作成 (4)

附 ] →

[IS]: InfoSeekerを休眠させる付録

A

.

4

案内時におけるプロトコル (1) [15]→ [GK]: GUIDANCE(Home-Host)(Agent-ID) 情報資源名(Reωurc回)を送信検察ホスト騒歴(5earched)を送信 OVER (2)[GK]

→ 附 :

マイグレーションの準備完了(OK)あるいは前の検索ホストに戻る(NG)かを伝える付録

A.5

移住時におけるプロトコル (1)

附 →

[GK]: MIGRATION(Home-Host ) (Agent・ID)(Next -Bost) InfoS田ker自身を送信する OVER 付録

A

.

6

進入時におけるプロトコル (1) [GK]→ [GK]: ENTRANCE(Agent-ID) Info5eekerを受け入れ、ホスト内に解放する OVER 付録

A

.

7

検索時におけるプロトコル (1)

[15]一日

M): SEARCH(Agent-ID) (吟仰]→阿:

OK

(3)

[IS]ー剛:

情報資源名(Resources)を送信キーワード (Keywords)を送信 (4)[1M] - [IS]: 検察結果を送信 OVER