実験概要 - 実験 - JAIST Repository: 知識リポジトリ投稿の動機づけ手法の提案‐知識提供者同士のインタラクション‐

4 実験

4.2 実験概要

4.2.1 実験の状況設定

本研究は企業などのKRに知識関連付けを導入することを念頭に置いているが，実験のために準備できる知識関連付け可視化システムはプロトタイプ的なものにとどまる．そのため実験では簡易的なシステムを，学生を被験者とした実験室実験により検証することにした．

企業に導入されているようなKRは学生にとってはなじみの薄いものと思われるため，実験設定としては，学生が論文のサマリーを作成しKRに投稿するという状況を考えた．こうした状況を選んだ理由は論文のサマリーを作成・投稿するという行為が企業でのKR投稿と作業コストが大きいという点で類似しているためである．たとえば不具合データベースに新しく知識投稿する場合，提供者は発生した不具合について入念に調査した上で原因や対処法をまとめる必要がある．この作業は非常に手間がか

かり，提供者にとってコストとして認識されるだろう．しかし第3章でも述べたように，KRの特性上こうした作業の便益の認識は遅延し，投稿への動機づけが低下する．

論文サマリーの作成についても同様のことが言える．優れたサマリーは原文の内容が簡潔にまとまっているため，そうしたサマリーを多量に蓄積しておくことは学生が興味のある論文を探索する上で非常に有用である．しかしそうしたサマリーの作成のためには論文の論理展開を的確に把握することを前提とする．これは論文を書き慣れていない学生にとって非常に難しいことであり，その意味でサマリー作成についても作業コストが大きいと言える．したがって，実際の企業の利用実態を反映していない可能性はあるが，作業コストを問題にする限りでは実験設定は妥当だと考える．

なお実験でサマリー作成の対象となる論文は，筆者の在籍する北陸先端科学技術大学院大学（Japan Advanced Institute of Science and Technology，以下JAIST）知識科学研究科の平成11年度から平成25年度までに発行された修士論文とする．

4.2.2 サマリーリポジトリ

実験室実験においてサマリーを投稿・蓄積するための仮想的なKRを構築した．このKRを本研究ではサマリーリポジトリと呼ぶことにする．サマリーリポジトリは投稿ページと閲覧ページの2種類のページで構成される．投稿ページは投稿フォームに必要事項を記入してサマリーを投稿するためのページである．図4.1に投稿ページを示す．投稿フォームは，投稿者の氏名，実験中の投稿回数，サマリーの作成開始と終了時刻，要約した論文のタイトル・著者・発行年度・指導教員といった必要事項を記入した後，サマリー本文をまとめる形式になっている．サマリーを作成するときにそれを読む人物を想定してもらうため，「サマリーを読む人の立場になって研究目的，

研究方法，結果，考察などを分かりやすくまとめてください」という文を載せ投稿者に注意を促した．一方，閲覧ページはこうして投稿されたサマリーの内容を閲覧するページである．図4.2 に閲覧ページを示す．閲覧ページでは，投稿されたサマリーが逆年代式に表示される．サマリーのタイトルをクリックするとサマリーの内容を詳細に閲覧することができる．

図4.1 サマリーリポジトリの投稿ページ

図4.2 サマリーリポジトリの閲覧ページ

4.2.3 実験における知識関連付けの仕組み

知識関連付け可視化システムでは 2 段階のプロセスを経てサマリーを関連付ける．

1 段階目のプロセスでは，あらかじめ選定しておいたキーワードがサマリー中の単語とどれだけ一致したかを調べサマリーのトピック出現比率を算出する．キーワードは，

JAIST知識科学研究科の修士論文の英文アブストラクト654枚から潜在的ディリクレ配分法（Latent Dirichret Allocation，以下LDA）により抽出した¹．抽出トピック数は 20であり，各トピックは19のキーワードから構成される．こうして抽出された英単語キーワードを日本語に翻訳し，トピックとキーワードの参照表を作成する．トピックとキーワードの参照表は付録1に記載する．参照表のキーワードがサマリー中の単語と一致するごとに，対応するトピックが1回出現したと考え，20のトピックそれぞれの出現回数を調べる．各トピックの出現回数の総和に対する，1 つのトピックの出現回数の比率をそのトピックの出現比率とする．この計算によりサマリーを 20 次元のトピック出現比率の座標で表現できる．次の2段階目のプロセスでは，新たに投稿されたサマリーと投稿済みの全サマリーの類似度を算出する．類似度は2本のサマリーの距離とする．算出された類似度が小さいサマリー同士を結びつける．以上の関連

1LDAによるキーワード抽出においては，JAIST知識科学研究科の橋本雅弘氏の協力を得た．

付けの仕組みは，日本語に翻訳しにくい英単語キーワードがある，キーワードとサマリー中の単語が一致しにくいなどの問題点があり，関連付けられたサマリーの類似性が妥当かどうかは議論の余地がある．しかし，知識関連付けの狙いは提供者同士でインタラクションを認識することにある．そのため今回の関連付けの仕組みには多少の課題はあるが，投稿者の間につながりを持たせるという機能は実装できたと考える．

ドキュメント内 JAIST Repository: 知識リポジトリ投稿の動機づけ手法の提案‐知識提供者同士のインタラクション‐ (ページ 30-34)