• 検索結果がありません。

4 実験

4.2 実験概要

4.2.1 実験の状況設定

本研究は企業などのKRに知識関連付けを導入することを念頭に置いているが,実 験のために準備できる知識関連付け可視化システムはプロトタイプ的なものにとど まる.そのため実験では簡易的なシステムを,学生を被験者とした実験室実験により 検証することにした.

企業に導入されているようなKRは学生にとってはなじみの薄いものと思われるた め,実験設定としては,学生が論文のサマリーを作成しKRに投稿するという状況を 考えた.こうした状況を選んだ理由は論文のサマリーを作成・投稿するという行為が 企業でのKR投稿と作業コストが大きいという点で類似しているためである.たとえ ば不具合データベースに新しく知識投稿する場合,提供者は発生した不具合について 入念に調査した上で原因や対処法をまとめる必要がある.この作業は非常に手間がか

24

かり,提供者にとってコストとして認識されるだろう.しかし第3章でも述べたよう に,KRの特性上こうした作業の便益の認識は遅延し,投稿への動機づけが低下する.

論文サマリーの作成についても同様のことが言える.優れたサマリーは原文の内容が 簡潔にまとまっているため,そうしたサマリーを多量に蓄積しておくことは学生が興 味のある論文を探索する上で非常に有用である.しかしそうしたサマリーの作成のた めには論文の論理展開を的確に把握することを前提とする.これは論文を書き慣れて いない学生にとって非常に難しいことであり,その意味でサマリー作成についても作 業コストが大きいと言える.したがって,実際の企業の利用実態を反映していない可 能性はあるが,作業コストを問題にする限りでは実験設定は妥当だと考える.

なお実験でサマリー作成の対象となる論文は,筆者の在籍する北陸先端科学技術大 学院大学(Japan Advanced Institute of Science and Technology,以下JAIST)知識科学研 究科の平成11年度から平成25年度までに発行された修士論文とする.

4.2.2 サマリーリポジトリ

実験室実験においてサマリーを投稿・蓄積するための仮想的なKRを構築した.こ のKRを本研究ではサマリーリポジトリと呼ぶことにする.サマリーリポジトリは投 稿ページと閲覧ページの2種類のページで構成される.投稿ページは投稿フォームに 必要事項を記入してサマリーを投稿するためのページである.図4.1に投稿ページを 示す.投稿フォームは,投稿者の氏名,実験中の投稿回数,サマリーの作成開始と終 了時刻,要約した論文のタイトル・著者・発行年度・指導教員といった必要事項を記 入した後,サマリー本文をまとめる形式になっている.サマリーを作成するときにそ れを読む人物を想定してもらうため,「サマリーを読む人の立場になって研究目的,

研究方法,結果,考察などを分かりやすくまとめてください」という文を載せ投稿者 に注意を促した.一方,閲覧ページはこうして投稿されたサマリーの内容を閲覧する ページである.図4.2 に閲覧ページを示す.閲覧ページでは,投稿されたサマリーが 逆年代式に表示される.サマリーのタイトルをクリックするとサマリーの内容を詳細 に閲覧することができる.

25

図4.1 サマリーリポジトリの投稿ページ

26

図4.2 サマリーリポジトリの閲覧ページ

4.2.3 実験における知識関連付けの仕組み

知識関連付け可視化システムでは 2 段階のプロセスを経てサマリーを関連付ける.

1 段階目のプロセスでは,あらかじめ選定しておいたキーワードがサマリー中の単語 とどれだけ一致したかを調べサマリーのトピック出現比率を算出する.キーワードは,

JAIST知識科学研究科の修士論文の英文アブストラクト654枚から潜在的ディリクレ 配分法(Latent Dirichret Allocation,以下LDA)により抽出した1.抽出トピック数は 20であり,各トピックは19のキーワードから構成される.こうして抽出された英単 語キーワードを日本語に翻訳し,トピックとキーワードの参照表を作成する.トピッ クとキーワードの参照表は付録1に記載する.参照表のキーワードがサマリー中の単 語と一致するごとに,対応するトピックが1回出現したと考え,20のトピックそれぞ れの出現回数を調べる.各トピックの出現回数の総和に対する,1 つのトピックの出 現回数の比率をそのトピックの出現比率とする.この計算によりサマリーを 20 次元 のトピック出現比率の座標で表現できる.次の2段階目のプロセスでは,新たに投稿 されたサマリーと投稿済みの全サマリーの類似度を算出する.類似度は2本のサマリ ーの距離とする.算出された類似度が小さいサマリー同士を結びつける.以上の関連

1LDAによるキーワード抽出においては,JAIST知識科学研究科の橋本雅弘氏の協力を得た.

27

付けの仕組みは,日本語に翻訳しにくい英単語キーワードがある,キーワードとサマ リー中の単語が一致しにくいなどの問題点があり,関連付けられたサマリーの類似性 が妥当かどうかは議論の余地がある.しかし,知識関連付けの狙いは提供者同士でイ ンタラクションを認識することにある.そのため今回の関連付けの仕組みには多少の 課題はあるが,投稿者の間につながりを持たせるという機能は実装できたと考える.