第 5 章 開発したシステムにおけるケーススタディ
5.2 オントロジーを用いた検索機能の評価
5.2.1 目的と内容
ここでは、戦艦「長門」に関する史料を検索する場合を想定し、平賀譲デジタルアーカ イブを用いた従来の検索手法と開発したシステムにおける検索手法を比較し、評価を行う。
具体的な検索対象とする史料は図 5-1 のような戦艦「長門」の煙突本数が読み取ることが できる図面史料とする。これは後述するケーススタディで必要となる史料である。これら の史料について両検索手法を用いて検索し、比較を行う。
図 5-1 煙突本数が読み取れる図面史料の例
まず検索対象である戦艦「長門」の同義語について、オントロジー編集機能を用いて定 義する。戦艦「長門」は「A117」から「A124」までの通し番号を暗号名として持つ。さら
49
にデジタルアーカイブ内の史料には英語で記述されているものも多く存在するため、英語 表記である「Nagato」も同義語として追加する。
まずシステムから図 5-2 に示すオントロジー編集インタフェースを開く。そこで主語と して「長門」をオントロジーから選択し、述語として「is Synonym of」を選択する。そし て同義語名を目的語として入力してシステムへアップロードすることにより、「長門」の同 義語がオントロジーに追記される。
図 5-2 オントロジーの編集インタフェース
史料の検索を行う方法は、調査対象となる事物を表すキーワードを表題フィールドに入 力し、検索を行うのが一般的である。例えば平賀譲に関する史料を検索する場合には、表 題フィールドに「平賀譲」と入力し、史料の検索を行う。よって本ケーススタディにおけ る従来のシステムを用いた検索手法としては、表題フィールドに「長門」と入力し検索を 行う。一方開発したシステムにおける検索手法としては、表題フィールドに「長門」と入 力するまでは従来の手法と同じであるが、「長門」の同義語を定義したオントロジーを用い て検索を行うことで、両者間の違いを検証する。
5.2.2 結果と評価
従来の検索手法では、表題に「長門」を含む史料52件を得た。これらの中から煙突本数 を読み取ることができる図面を含む史料は、調査の結果4件が該当した。
一方提案システムにおける検索手法では、表題に「長門」および「A123」や「A124」と
50
いった「長門」の同義語を含む史料95件が得られた。先と同様に各史料を調査することに よって、煙突本数を読みとることができる図面を含む史料は12件得られた。
この結果から、下記の三点について提案手法が従来の検索手法より優れていると言える。
・検索の手間の軽減 ・検索漏れの是正 ・暗黙知の問題の解決
検索の手間の軽減については、従来の検索手法では同義語を含む関連史料を検索する場 合、検索インタフェースにおいて同義語毎に入力して検索を行う必要があり、史料検索に 多大な労力を費やしていた。また本ケーススタディのように多くの同義語を持つ場合には、
関連語の入力漏れといった問題も生じる。さらにそもそも研究対象となる事物の同義語等 の知識を持たない場合には機能せず、研究者の暗黙知に頼った従来の史料研究手法の問題 につながる。一方、提案手法ではオントロジーで定義された関連語を含めた史料を計算機 によって自律的に検索することで、前述の課題を解決している。以上の考察より、従来の 検索手法に比べ、提案するオントロジーを用いた検索手法は有用であると言える。
図 5-3 オントロジーを用いた「長門」史料の検索結果
51