JWNL
4.11 関連研究との比較
(1) (2)
(3)
(4)
(5)
(6)
(7)
(8)
図 4.39: 概念定義パネル
(4) 入力文書選択パネルで選択した入力文書が表示される.
(5) (3)で選択した入力語と関連のある入力語を関係値と共に表示する.関係値の高い
順に表示される.WordSpace,Apriori,WordSpaceおよびAprioriのアルゴリズム の関係値をタブで切り替えて表示することができる.
(6) (3)で選択した入力語と関連のある(4)で選択された語を表示し,正解概念対または
不正解概念対として(7)または(8)に追加する.矢印の向きによって,定義域と値域 が変化する.
(7) 定義域,プロパティ,値域が表示される.プロパティは,プロパティ階層構築パネ ルから選択することができる.
(8) 不要な概念対が表示される.不要な概念対は,概念定義の候補となる概念対集合か ら削除されるため,残りの概念定義を行いやすくなっている.
4.11 関連研究との比較
本節では,オントロジーの(半)自動構築(オントロジー学習)における,学習機能,
参照知識,入力,自動化に関する関連研究との比較について述べる.
4.11. 関連研究との比較 118
表 4.6: 学習機能における関連研究との比較
学習機能
組織 システム 用語 同義語 概念 概 念
階層
関係 関 係 階層
公 理 ス キーマ
汎 用 公理
AIFB, Univ. Text2Onto X clusters int. X X
Karlsruhe AEON X
Amir Kabir Univ. Tehran HASTI X X X X
CNTS,Univ. Antwerpen OntoBasis clusters clusters
DFKI OntoLT/RelExt X X X
Economic Univ. Prague TextToOnto++ labels
ISI, CBC clusters clusters
USC DIRT X
Keio Univ. DODDLE-OWL X X X
NRC-CNRC PMI-IR X
Univ. de Paris-Sud ASIUM/Mo‘k clusters clusters X X
Univ. di Roma OntoLearn X X int. X X
Univ. of Salford ATRACT X clusters clusters
Univ. Z¨urich Parmenides X X
4.11.1 学習機能における関連研究との比較
表4.6は,EACL2006 (11th Conference of the European Chapter of the Association for Computational Linguistics)のチュートリアル 13において紹介されたオントロジーの(半)
自動構築に関する研究の一覧を示している.表4.6では,各研究が,オントロジーにおけ るどのような要素の(半)自動構築を支援しているかをまとめている.オントロジー学習 における学習機能には,用語,同義語,概念,概念階層,関係,関係階層,公理スキーマ,
汎用公理がある.
用語は,オントロジー学習の基礎となる学習機能で,品詞のパターンによる名詞句の抽 出やTF-IDFなどの統計的手法による用語の重み付けなどが行われる.Text2Onto [59],
HASTI [60],OntoLT/RelExt [61],OntoLearn [31]など,様々なツールが用語の学習を 支援している.DODDLE-OWLでは,複合語抽出モジュールやTF-IDFを用いて用語の 獲得を支援している.
同義語の学習では,同一概念を表す用語を同定する.言語が異なるが同じ意味を表す 用語についても同定する.同義語の学習には,WordNetのSynsetを用いた分類や用語 間の共起性を用いたクラスタリングの手法が用いられる.Text2Onto,OntoBasis [62],
ASIUM [16],OntoLearnなどが同義語の学習を支援している.DODDLE-OWLでは,同 義語の学習は支援していない.しかしながら,参照オントロジーを用いて,入力概念選択 をユーザが手動で行うことで,同義語の同定を行っている.
概念の学習では,概念の定義をWordNetの説明 (gloss)などを用いて自動的に獲得す る.また,テキストなどから概念のインスタンスの獲得も支援する.同義語の学習を支援 しているツールは,概念の学習も支援している.同義語の同定と同様,DODDLE-OWL では参照オントロジーを用いて,入力概念選択をユーザが手動で行うことで,概念の定義
13http://www.aifb.uni-karlsruhe.de/WBS/pci/EACL OL Tutorial 06/
4.11. 関連研究との比較 119
を獲得している.
概念階層の学習では,構文解析を用いた階層関係の獲得や,WordNetなどの汎用オント ロジーを基にした,階層関係の拡張を支援する.Text2Onto,HASTI,OntoLT,ASIUM,
OntoLearnなどが概念階層の自動構築を支援している.DODDLE-OWLでは,部分照合
概念の階層構築時に,参照オントロジーを基に階層関係の拡張を行っている.完全照合概 念の階層構築については,参照オントロジーから階層関係を抽出,合成,剪定を行ってい るのみで,新たな階層関係の定義は行っていない.しかしながら,階層関係構築時の照合 や剪定の情報を用いて,階層関係の洗練支援を行っている点は,関連研究と比較して独自 性があるといえる.
関係の学習では,自然言語処理やデータマイニングの技術を用いて,その他の関係の自 動構築を支援する.概念階層構築支援と同様,Text2Onto,HASTI,OntoLT,ASIUM,
OntoLearnなどが関係の自動構築支援を行っている.DODDLE-OWLでは,共起性に基づ く手法を用いて概念対の自動獲得を行っている.しかしながら,概念間関係については自 動的に獲得は行っておらず,ユーザが手動で定義している.現状では,概念間関係の獲得は 自然言語処理などの技術を用いても高い精度で行うことができないため,DODDLE-OWL ではユーザに定義をゆだねている.
公理の学習としては,自然言語処理を用いて語の依存関係などを解析し,推論ルールの 発見や排他的関係の獲得などを支援する.AEON [63],HASTI,DIRT [64]が公理の学習 を支援している.DODDLE-OWLでは,公理の学習は支援していない.
4.11.2 参照知識,入力,自動化の度合いにおける関連研究との比較
表4.7は,Amir Kabir工科大学のShamsfardらによるオントロジー学習に関する比較 研究論文 [65]で紹介されている,オントロジー学習ツールの一覧を示している.ここで は,オントロジー学習における,学習機能,参照知識,入力,自動化の度合いに着目して まとめている.
学習機能については,4.11.1項でも述べたように,DODDLE-OWLは関連研究と比較 して,独自の要素の自動構築を支援していない.
参照知識については,OWL形式の既存オントロジーが利用できる点が関連研究と比較 して優れた点である.
入力については,非構造化 文書が大部分の関連研究で利用されている.しかしながら,
各研究ごとに,支援している入力文書の記述言語が異なっている.これは,自然言語処理 技術を用いてオントロジーの自動構築を支援しているため,記述言語の特性(構文など)
に依存するためである.DODDLE-OWLでは,英語と日本語で記述された文書を入力と することができる.日本語に関するオントロジー構築支援が可能な点は,関連研究と比べ て独自な点である.
自動化の度合いについては,大部分のツールがオントロジーの自動または半自動構築
(パラメータの設定程度)を支援しているのに対して,DODDLE-OWLはユーザとのイ ンタラクションによりオントロジーの構築を支援している.(半)自動構築したオントロ