図 2.10: SENSUSの概観
と概念辞書を利用している.単語辞書には日本語単語辞書と英語単語辞書がある.単語辞 書は,見出し情報,文法情報,意味情報,補助情報から構成されているが,意味情報には,
概念辞書の各概念ノードを識別するための概念識別子が割り当てられ,単語辞書と概念 辞書を結合する働きを持っている.一方,概念辞書には,多重継承を許す概念階層関係を 定義した概念体系辞書と,agent(動作主体), object(対象), goal(目標), implement
(道具・手段), cause(原因), place(場所), scene(場面), a-object(属性)という8 種類の概念関係子による概念間関係を定義した概念記述辞書がある.各概念は,主に,概 念識別子,概念見出し,概念の説明を持つ.
SENSUS
SENSUSは,図2.10に示すように,PENMAN Upper Model [25]とONTOS [26]をマー ジして,上位オントロジーとしてOntology Baseを構築した後,WordNetやLDOCEを 順次その下位にマージしていくことによって構築された電子化辞書である.構築プロセ スは,完全に自動化されていないが,二つの概念の定義文における共有単語の有無によっ て,二つの辞書間で対応する概念を見出したり,対応する概念の上位下位概念群に注目し て,さらに対応する概念を見出すような照合アルゴリズムが利用されており,マージ作業 を効率化している.
2.4 オントロジー構築方法論
本節では,M.Uscholdら [27]によるオントロジー開発のための総合的方法論を紹介す る.彼らはオントロジー開発を図2.11に示す段階に分けて整理した.
はじめに,オントロジーのスコープと目的を明らかにし,利用者の特徴付けを行う.オ ントロジーのスコープや目的を明らかにすることはオントロジー構築のための明確な目
2.4. オントロジー構築方法論 19
対象 対象 対象
対象ととと目的と目的目的目的のののの明確化明確化明確化明確化
評価 評価 評価 評価
オントロジー オントロジーオントロジー オントロジーのののの構築構築構築構築
既存 既存 既存
既存ののののオントロジーオントロジーオントロジーオントロジーののの統合の統合統合統合 コーディング コーディング コーディング コーディング
獲得獲得 獲得獲得
システム システム システム
システム化化化の化ののの対象範囲対象範囲対象範囲対象範囲のののの特定特定特定特定
レビュー レビュー レビュー レビュー
メタオントロジー メタオントロジー メタオントロジー メタオントロジーのののの決定決定決定決定
定義 定義 定義 定義のののの作成作成作成作成
獲得 獲得 獲得 獲得
図 2.11: オントロジー開発の流れ
標を提供することに役立つ.オントロジー構築は獲得,コーディング,既存オントロジー の統合の三つのステップがある.以下,各ステップについて述べる.
2.4.1 オントロジーの獲得
オントロジー獲得は重要概念の切り出しとその定義からなる.オントロジー構築の主要 な作業はこのオントロジー獲得であり,「オントロジー構築」はオントロジー獲得を指す 場合が多い.以下,四つの段階について順に述べる.
システム化の対象範囲の特定
はじめに,すべての関連する可能性のある用語を洗い出す.この際に,概念の粒度につ いて十分に注意しなければならない.次に,切り出された概念を,類似あるいは参照関係 にある概念同士でまとめて分類する−これをワークエリアと呼ぶ.その後,その領域内の 意味的な相互関係を特定する.
定義の作成
前述の処理で,重要な概念のほとんどの語彙が識別される.オントロジー構築の主な作 業は定義の作成である.次に定義を作成する際に,まず注意すべきことを示す.
メタオントロジー
概念の熟考を行い,どのようなclass, object, relationshipなどを導入するかを決定 する.様々な可能性を心に留めておき,一貫した手法で適切なところで切り出した 重要概念である単語および熟語(role, entity, relationship, type, instanceなど)を 使用する.
2.4. オントロジー構築方法論 20
ワークエリア
他のワークエリアとの重なりなどを考慮して,複雑なものから順に用語の定義に取 り組む.
用語
各ワークエリアで最も基本的な用語を定義し,その語より抽象的または固有な用語 へ進むミドルアウトアプローチをとる.ミドルアウトアプローチは,その概念の詳 細度によってバランスが取れるため,基本的な概念を特殊化または一般化すること によって必要な概念のみを表せる.
表現方法
技術的な正確さと明確さの適切なバランスをとる.定義の作成の時点では,概念や 概念間の関係の定義は,自然言語により行う.コーディング時に,技術的に正確な 定義を形式言語で行うことができるように,正確かつ明確に記述を行う.
あいまいな用語の処理
オントロジーに本当に必要なものを考え,できるだけ少ない技術的用語によって各 概念の定義を行う.
定義段階全般にわたるガイドライン
用語の使用においては一貫性を確実にし,定義における循環は避ける.また適切な 例を与える.
レビューおよびメタオントロジーの決定
定義を批判的にレビューし,適切に訂正する.その後,絶対的な要求仕様として,自然 言語の定義を使ってメタオントロジーを考案する.
2.4.2 コーディング
コーディングとは,形式言語によって,獲得された概念化を明示的に表現することであ る.この段階は以下の流れで行われる.
• オントロジーで使われるような基礎用語(class, object, relationなど),メタオント ロジーの決定
• メタオントロジーをサポートできる表現言語の選択
• コード(形式言語の命令を記述する文書)の記述