第 4 章 領域オントロジー構築支援環境
4.4 オントロジー選択モジュールの設計
初期 初期 初期 初期 モデルモデルモデルモデル
概念仕様 概念仕様 概念仕様 概念仕様 テンプレート テンプレート テンプレート テンプレート
視覚化 視覚化 視覚化 視覚化 モジュール モジュールモジュール モジュール
領域 領域 領域
領域 オントロジーオントロジーオントロジーオントロジー(OWL形式形式形式形式)
変換 変換 変換
変換モジュールモジュールモジュールモジュール
概念階層 概念階層概念階層 概念階層 EDR
電子化辞書 電子化辞書電子化辞書 電子化辞書 WordNet
関係 関係 関係 関係構築構築構築構築 オントロジー
オントロジー オントロジー
オントロジー構築構築構築構築モジュールモジュールモジュールモジュール
概念対集合 概念対集合 概念対集合 概念対集合 階層構築
階層構築階層構築 階層構築
相関 相関 相関
相関 ルールルールルールルール WordSpace 既存
既存 既存既存OWL オントロジー オントロジー オントロジー オントロジー
オントロジー オントロジー オントロジー
オントロジー洗練洗練洗練洗練モジュールモジュールモジュールモジュール 関係洗練関係洗練関係洗練関係洗練
評価値算出 評価値算出評価値算出 評価値算出 照合結果分析
照合結果分析 照合結果分析 照合結果分析
階層洗練 階層洗練 階層洗練 階層洗練
剪定結果分析 剪定結果分析 剪定結果分析 剪定結果分析
ユーザ ユーザ ユーザ ユーザ
多重継承 多重継承 多重継承 多重継承ののの 除去の除去除去除去
オントロジー オントロジーオントロジー
オントロジー選択選択選択選択モジュールモジュールモジュールモジュール
入力概念選択 入力概念選択 入力概念選択 入力概念選択 入力
入力入力
入力モジュールモジュールモジュールモジュール 入力文書選択
入力文書選択 入力文書選択
入力文書選択 入力単語選択入力単語選択入力単語選択入力単語選択
領 領 領
領 域域域域 専専専専 門門門門文文文書文書書書 汎用
汎用 汎用 汎用 オントロジーオントロジーオントロジーオントロジー
参照 参照 参照 参照 オントロジー オントロジーオントロジー オントロジー
照合照合 照合照合 とととと 剪定剪定剪定剪定
図 4.1: DODDLE-OWLのシステムフロー
以下,4.4節から4.9節では,図4.1のシステムフローに従って,DODDLE-OWLの各 モジュールの設計について説明する.
4.4 オントロジー選択モジュールの設計
オントロジー選択モジュールでは,ユーザは参照オントロジーの選択を行う.参照オント ロジーは領域オントロジーを構築するための基礎となるオントロジーであり,DODDLE-OWLの各モジュールから参照される.DODDLE-OWLでは,WordNet [17](英語汎用オ ントロジー)およびEDR [18](日本語汎用オントロジー)を参照オントロジーとして利 用可能である.さらに,OWL形式で記述された既存オントロジーもDODDLE-OWLは 参照オントロジーとして利用可能である.WordNetやEDRなどの汎用オントロジーは,
一般的かつ網羅的に定義がなされているため,領域オントロジー構築に利用する際には,
領域に特化した構造へ,階層関係の修正や不要概念の除去などの洗練を行う必要がある.
このことはユーザの負担となる.構築対象に関連する領域オントロジーがすでに存在する 場合は,それらを再利用するほうが汎用オントロジーを参照オントロジーとするよりも,
領域オントロジーを洗練するコストを軽減できると考えられる.また,DODDLE-OWL を用いて構築されるオントロジーはOWL形式であるため,それらも参照オントロジーと して利用することができる.よって,DODDLE-OWLでは,既存領域オントロジーが存 在しない,または,既存領域オントロジーが,ユーザが構築対象とする領域オントロジー を網羅できていない場合には,汎用オントロジーを利用することができ,既存領域オント ロジーが存在する場合には,より容易に対象とする領域オントロジーの構築支援を行うこ
4.4. オントロジー選択モジュールの設計 74
とができる.
Web上に存在する既存オントロジーを参照オントロジーとして再利用するために,オ ントロジー選択モジュールには,オントロジー検索エンジンを用いた既存領域オントロ ジーの獲得機能がある.以下では,オントロジー検索エンジンを用いた既存領域オントロ ジー獲得方法について述べる.
4.4.1 オントロジー検索エンジンを用いた既存領域オントロジーの獲得
既存領域オントロジーを再利用するためには,対象領域に関連する既存オントロジーを Web上から検索する必要がある.既存のオントロジー検索エンジンとして,OntoSelect [48]
やSwoogle [49]がある.OntoSelectは,Web上のオントロジーを検索,選択,閲覧する ことを支援している.Swoogleには,2007年現在,1万以上のオントロジーが登録されて おり,クラス単位,プロパティ単位の検索やオントロジー内に明示的に記述されていない 逆リンクの関係を検索することができる.
既存のオントロジー検索エンジンは,対象領域に関連する既存オントロジー検索に利用 可能であるが,領域オントロジー構築の観点からはいくつか問題がある.既存のオントロ ジー検索エンジンは,クラス単位やプロパティ単位での検索を支援しているが,複数のク ラスやプロパティを含むオントロジーの検索や対象領域と関連の深いオントロジーの検索 は支援していない.Swoogleには,googleのページランク[50]に類似したオントロジーの ためのランキングの仕組み (OntoRank)や,クラスおよびプロパティのためのランキング の仕組み(TermRank)が導入されている.OntoRankやTermRankでは,より多くのセマ ンティックWebコンテンツから参照されているクラスやプロパティを高くランキングし ているが,領域オントロジー構築の観点からは,必ずしも多数のセマンティックWebコン テンツから参照されているオントロジーが利用可能とは限らない.ユーザが構築の対象と している領域に関連する既存オントロジーを適切に検索するための仕組みが必要となる.
また,既存オントロジーを修正することなく再利用できることは少ないため,領域オント ロジー構築支援環境とオントロジー検索エンジンは連携できたほうが望ましいと考えら れる.
Swoogle は,オントロジーを検索するための19種類のREST 形式の Web サービス
(Swoogle Webサービス)を提供している.DODDLE-OWLから既存オントロジーを再利 用するためには,ソフトウェアからオントロジーを検索することが必要となるため,Web サービスを提供しているSwoogleを,既存領域オントロジーの獲得に利用する.
オントロジー選択モジュールでは,図4.2に示す手順で,Swoogleを用いて既存オント ロジーの獲得およびランキングを行う.
1. 入力語をURIのローカル名またはrdfs:labelプロパティの値として持つクラスお よびプロパティ(入力概念)の獲得
2. 手順1で獲得したクラスを定義域または値域とするプロパティの獲得
4.4. オントロジー選択モジュールの設計 75
入力語セット
クラスの URIセット
プロパティの URIセット
既存オントロジー 手順
手順 手順
手順222:2:::プロパティプロパティプロパティプロパティのののの獲得獲得獲得獲得
rdfs:domain rdfs:range プロパティ プロパティ プロパティ プロパティ
手順 手順 手順
手順3333:::クラス:クラスクラスクラスのののの獲得獲得獲得獲得
rdfs:domain
rdfs:range プロパティ
手順 手順 手順
手順4444:::オントロジー:オントロジーオントロジーオントロジーのののの獲得獲得獲得獲得
手順 手順 手順
手順5555::::既存既存既存オントロジー既存オントロジーオントロジーオントロジーからのからのからのからの要素抽出要素抽出要素抽出要素抽出
手順 手順 手順
手順6666::::不要不要不要不要プロパティプロパティプロパティプロパティのののの除去除去除去除去
手順 手順 手順
手順777:7:::既存既存既存既存オントロジーオントロジーオントロジーオントロジーののののランキングランキングランキングランキング
rdfs:label
手順 手順 手順 手順1111
: : :
: クラスクラスクラスクラス及及及及びびびびプロパティプロパティプロパティプロパティのののの獲得獲得獲得獲得
プロパティ プロパティ プロパティ
プロパティ “入力語”
クラス クラス クラス
クラス “入力語” rdfs:label
クラス クラス
クラス クラスクラス クラス クラス クラスクラス クラス クラスの
URIセット
図 4.2: Swoogleを用いた既存オントロジーの獲得およびランキング
3. 手順1および2で獲得したプロパティの定義域および値域(クラス)を獲得
4. 手順1から3で獲得したクラスおよびプロパティを定義しているオントロジーの獲得 5. 手順4で獲得したオントロジーからの要素抽出
6. 手順4で獲得したオントロジーに定義されたプロパティの中で,定義域および値域 が入力概念または入力概念の上位概念でないものの削除
7. 手順4で獲得した既存オントロジーのランキング
手順5の既存オントロジーからの要素抽出の詳細については,4.4.2項で述べる.手順 7の既存オントロジーのランキングの詳細については,4.4.3項で述べる.
4.4.2 既存オントロジーからの要素抽出
OWLオントロジーを参照オントロジーとして領域オントロジー構築支援で利用するた めには,オントロジー構築支援に利用可能な要素をOWLオントロジーから抽出する必要 がある.DODDLE-OWLでは,領域オントロジーにおける階層関係およびその他の関係 の定義を支援している.概念関係およびその他の関係を定義するために必要なOWLオン トロジーの要素は,概念(クラスおよびプロパティ),概念の見出し,概念の説明,階層 関係,その他の関係である.概念の抽出は,領域オントロジー構築において必須である.