• 検索結果がありません。

博 士 ( 工 学 ) 齋 藤 健 司

N/A
N/A
Protected

Academic year: 2021

シェア "博 士 ( 工 学 ) 齋 藤 健 司"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

博 士 ( 工 学 ) 齋 藤 健 司

学 位 論 文 題 名

最 大エントロピー原理 を用いた文献検索システムに関する研究 学 位 論 文 内 容 の 要 旨

  検索者が希望する文献を、莫大な数の文献の中から効率的に検索するためには、文献に関する大量 のデータを取り扱 うための技法もさることながら、検索者が希望する文献をどのように表現し解釈 するかの問題が重要なポイントとなる。っまり、検索者が文献検索システムに対して検索を依頼する 場合に文献を指定 する方法が問題であり、従 来はブール代数による方法などが使用されてきた。

  しかし、検索者の希望する有用な文献とぃう概念は、人間が処理する微妙であいまぃな情報と関連 しておルブール代 数だけでは表現しきれないとぃう考えから、重み付きキーワードが考案され多く のシステムが採用 してきた。この重み付きキーワードの方法は、文献をべクトル空間のーつの点と してとらえることにより検索方法を発展させてきた。しかし、重み付きキーワードの 重み はその キーワードの重要度を表わす値であると解釈され、この値を計算する方法によって結果が異なるため に計算の意味づけ が問題になる。そこでCooperは 重み を条件付き確率の値であるとし、統計的 な計算を用いて有用性の高い文献を出カする方法を提案した。この方法は、 重み などの意味付け が数学的に明確で あるうえ、最大エント口ピー原理により検索結果の妥当性が保証されていること や、多くの有益な性質のために広く支持されている。

  本研究では、こ のCooperの提案した最大エント口ビー原理を用いた文献検索における幾っかの問 題点を提示し、そ れを解決するためにBayesian network、フんジ一理論などを用いて新しい文献検 索法を提案する。

  第一章では、本研究の背景と目的について述べる。

  第二章ではCooperの最大工ントロピー原理を用いた文献検索法について説明する。確率的検索法 で広く用いられる 確率ランキング原理 について述ベ、コロモゴロフの確率の公理を文献集合上に あてはめることにより、最大工ントロピー原理を用いた文献検索で重要な 有用性の確率 を定める。

そして、この検索法の特徴と問題点を挙げる。

  第三章では、近 年エキスパートシステムや確率的推論の研究において注目を集めているBayesian

Networkと呼ばれ る確率モデルをについて説明する;これは、有向グラフを用いて確率変数とその

間の確率的関係を表現しており、ネットワーク全体として確率モデルになっている。その外見や働き はニューラルネットワークのボルツマンマシンと多くの共通点を持っているが、その発想は異なると こ ろ か ら き て お り 、 理 論 と 応 用 の 両 面 に お い て 異 っ た 性 質 を そ な え て い る 。   第四章では、第 三章で述べたBayesian networkを用いて最大工ント口ピー原理を用いた文献検索 法を実現するため の具体的な方法を述べる。本研究では、Bayesian networkの確率的推論法を用い て、 有用性の確率 の計算を行なう確率推論システムを実現している。この確率推論システムは、

キーワード同士の確率的関係の情報を文献データから学習することにより記憶、保持するためのネッ トワークと、有用性の確率の推定のための節点からなる。これにより、最大工ント口ビー原理を用い た文献検索法では 、キーワード同士の確率的関係をどのように決定するか不明確であるとぃう問題 を克服している。さらに、ネットワークの自己組織化を利用することによって検索者が人カしたキー ワードに関連するキーワードを選出する機能が実現され、再検索時におけるキ僉索者の負担を軽減ず・

ることが可能になる。そして、ネットワーク構造の改良や拡張により、推論システムの調整や改善な

704

(2)

どの興味深い応用の可能性を開いた。

  第五章では、第四章で提案した検索法を実現する上で必要となる制約条件付き最適化問題の解法 について述べる。この制約条件付き非線型計画問題では、制約条件が満される可能領域はパラメータ の許容領域の一部であり検索条件に対応して変化すために、最大勾配法を用いた探索における出発 点を求める方法や、探索の過程で検索条件を満す領域からはずれてしまわないようにするための工 夫 が 必 要 で あ る 。 こ れ を 実 現 す る た め に 検 索 条 件 の 直 交 化 の 方 法 を 提 案 す る 。   第六章では、我々の提案した文献検索法を実際に計算機上に実現し、キーワード間の確率的相関関 係を表わすキーワードネットワークを、文献データから自動的に作成する実験、実際に検索リクエス トを入カし検索結果を求める実験、第四章で提案した関連キーワードの選出機能の再現率、適合率を 求める実験を行なった。また、作成した文献検索システムのユーザインターフェイスについても説明 する。

  第七章では、Cooperの提案する文献検索法において、ユーザが入カする検索リクエストから計算 される確率的な条件が厳しすぎて有用性の確率が計算できなくなるとぃう問題を解決するために、従 来の検索条件をフんジー集合論を用いて拡張し、最大エントロビー原理を用いた文献検索法でファ ジー検索条件を取り扱うことができるように改良する方法を述べる。このフんジー化された検索法を 用いることによって、検索条件を厳密に満す検索結果が無かったとしても、検索条件に最も近い検索 結果を出カすることができる。その結果どのような検索リクエストに対しても必ず検索結果が得ら れ、検索条件をより柔軟に指定することが可能になる。

  第八章では、本論文の結果をまとめ我々の提案した文献検索法の特徴、今後の課題を示す。文献検 索システムの研究においては、検索者が思い通りの検索結果を得るためには、検索者自身が試行錯 誤的に検索リクエストを修正する作業は不可避であり、かつ最も手間を要する。次の検索リクエス トに使用するキーワードの候補を表示する機能、っぎにどのような検索リクエストを行なうかの手 掛りとなる検索結果が必ず出カされるとぃう機能、検索条件に強弱を付け検索結果を細かく調整す る機能は、一度の検索課程で思い通りの検索結果が得られないような状況で検索の利便性を向上し、

結果的に検索者の負担を軽減すると期待できる。

705

(3)

学 位 論文 審 査 の 要旨

学 位 論 文 題 名

最大エントロピー原理を用いた文献検索システムに関する研究

  

イ ン タ ー ネッ トの 普及 や 情報 処理 機器 の進 歩に 伴っ て, 利便 性の 高い 情報 検索 シ ス テ ム が 要 求さ れる よう に なり ,情 報を 効率 的に 検索 する ため の方 策と して ,検 索 者 の 要 求 を 的確 に表 現す る ため の研 究が 多数 行わ れて いる 。従 来か ら, キー ワー ド を 用 い た ブ ール 代数 検索 方 式, これ を改 良し た重 み付 きキ ーワ ード 方式 ,さ らに 重 み 付 き キ ー ワー ドの 重 み の 計算 法に 任意 性が ある 点を 改良 した 統計 的な 検索 方 式 な ど の 研 究が 進め られ 実 用化 も進 めら れて きた 。統 計的 な検 索方 式の ーつ であ る 最 大 エ ン ト ロピ ー原 理を 用 いた 検索 方式 は, 検索 結果 の妥 当性 が保 証さ れて いる こ と や 検 索 リ クエ スト に高 い 表現 カが ある など の有 益な 性質 のた めに 広く 使用 され て いる 。

  

し か し , 最大 エン トロ ピ ー原 理を 用い た既 存の 文献 検索 方式 にお いて は, 検索 の プ ロ セ ス で 使用 する キー ワ ード 間の 確率 的相 関関 係デ ータ の作 成法 が定 めら れて お ら ず , ま た ごく 稀に ,検 索 リク エス トと キー ワー ド同 士の 確率 的関 係の デ一 夕の 組 合 せ に よ っ て 検 索 結 果 が 計 算 で き な い 状 態 に な る と い う 問 題 が あ る 。

  

本 論 文 で は, ベイ ズネ ッ トワ ーク と呼 ばれ る確 率的 ネッ トワ ーク モデ ルの 学習 機 能を 用い て, キ ーワ ード 間の 確率 的関 係の データを自動的に作成する方法を考案し,

同 時 に 関 連 する キー ワー ド を選 出す る機 能も 実現 して いる 。次 に, 情報 検索 シス テ ム に フ ァ ジ ィ情 報処 理を 導 入す るこ とに よっ て, 例外 なく 全て の検 索要 求に 対し て 検 索 結 果 を 出カ する こと を 可能 にし ,合 せて 検索 条件 の強 度を 指定 する 機能 を付 加 する こと によ っ て, より 柔軟 な検 索を 可能 にし てい る。

  

1

章 で は , 本 研 究 の 背 景 お よ び , 目 的 , 本 論 文 の 概 要 に つ い て 述 べ て い る 。

  

2

章 で は , 最 大 工 ン ト 口 ビ ー 原 理 を 用い た文 献検 索法 につ いて 述べ てい る; 確 率 的 検 索 法 にお いて 広く 用 いら れる 確率 ラン キン グ原 理お よび ,有 用性 の確 率に つ いて 述ベ ,さ ら にこ の検 索法 の特 徴と 問題 点を 挙げ てい る。

  

3

章 で は , 工 キ ス パ ー ト シ ス テ ム や 確率 的推 論の 研究 にお いて ,近 年注 目を 集 め て い る べ イズ ネッ トワ ー クに つい て説 明し てい る。 これ は, 有向 グラ フを 用い て 確率 変数 とそ の 間の 確率 的関 係を 表現 する 確率モデルであり,学習機能あるいは確・

惇 勝

治 明

   

   

伊 新

佐 宮

(4)

率的推論を行う機能を有するものである。

   第 4 章では,有用性の確率の計算を行う確率推論システムをべイズネットワーク を用いて実現するとぃう著者が開発した手法について述べている。さらにこれを用 いて,キーワード同士の確率的関係のデータを文献データから自動的に作成する方 法を提案している。次に,ネットワークの自己組織化を利用することによって検索 者が入カしたキーワードに関連するキーワードを選出する機能を実現し,再検索時 における検索者の負担を軽減する方法を述べている。

   第 5 章では,最大工ントロビー原理を満足する確率分布をベイズネットワークを 用いて計算するための,制約条件付き計画問題の解法について述ぺている。連立一 次方程式から成る制約条件を直交化し,これを最大勾配法に適用して効率を向上さ せている。

   第 6 章では,提案した文献検索法を実際に計算機上に実現し,文献データからキー ワード間の確率的相関関係を表わすキーワードネットワークを自動的に作成するシ ミュレーション実験,実際に検索リクエストを入カし検索結果を求めるシミュレー ション実験を行い,第4 章で提案した関連キーワードの選出機能の再現率,適合率 を求めている。

   第 7 章では,最大エントロピー原理を用いた既存の文献検索法において,稀に有 用性の確率が計算不可能になることがあるとぃう問題を解決するために,フんジィ 集合論を用いて従来の検索条件を拡張し,フんジィ検索条件を取り扱うことができ るように最大工ントロピー原理を用いた文献検索法を改良する方法を述べている。

この方法を用いることによって,どのような検索リクエストに対しても必ず検索結 果が得られるようになり,さらに検索条件の強度を指定する機能を付加することに よって検索の柔軟性を増大させている。

   第 8 章では,本論文の結果をまとめ提案した文献検索法の特徴,今後の課題を述 べている。

   これを要するに,著者はべイズネットワークおよびフんジィ理論を用いることに よって最大エントロピー原理を用いた文献検索法を開発し,検索の利便性,検索結 果の妥当性およびューザへの個別対応の柔軟性を向上させるなど,情報検索の研究 において新知見を得ており,情報工学の発展に対して貢献するところ大なるものが ある。

   よって著者は,北海道大学博士(工学)の学位を授与される資格あるものと認める。

参照

関連したドキュメント

[r]

   すなわち、騒音発生要因としては、乗用車の低中速域(走行速度40

[r]

[r]

[r]

   第3

   見られないが,液流速が大きくなると粒子群が縦縞状の凝集体を形成して上昇する不

い、また、歩道橋の動的応答特性との比較により歩道橋の設計時における合理的な振動使用性