• 検索結果がありません。

おわりに

ドキュメント内 論文構成要素に着目した (ページ 127-133)

本論文では,各構成要素文を可視化することで,重要な文を判別することを目的とした学 術論文閲覧支援に関する手法を提案した.

序論と結論から各構成要素文を特定する手法として,特徴的表現を用いた特定手法と SVMによる判定手法と,両手法を統合したハイブリッド型特定手法を提案した.特徴的表 現を用いた特定手法では,類似研究に記載されている手掛かり語や特徴的文頭表現との共 起率を参考に既存の論文の序論/結論から特徴的表現を抽出し,抽出した表現を元に対象文 の構成要素を特定している.既存の論文から特徴的表現を収集した結果,序論から122語,

結論から65語の特徴的表現を収集した.SVMによる判定手法では,特徴的表現を用いた手 法を用いて学習データを作成し,SVMによって各構成要素文を判定する分類モデルを構築する.

ハイブリッド型特定手法では,特徴的表現を用いた手法で特定できない文に対して,SVM による 判定手法の判定結果を適用することで,特徴的表現を用いた特定手法の高い適合率を維持しつ つ,再現率の向上を図る.序論と結論それぞれで,工学系学会の発表予稿や論文誌を対象に,

各手法の有効性や性能を評価する実験を行った結果,序論と結論両方において,適合率は特 徴的表現を用いた特定手法が最も高く,再現率と F 値はハイブリッド型特定手法が最も高 いという結果となった.また,特定できない文に対して原因の考察を行い,改善点について 述べた.

本論や実験章内の重要文を可視化するために,類似度によって重要文を特定する手法を提案 し,それによって序論から「最重要研究内容文」,本論から「重要研究内容文」,実験章から「重要 研究成果文」を抽出した.

提案した各重要文の特定手法を元に,重要文を判別する支援に特化した学術論文閲覧支援 システムを開発した.提案システムでは,論文PDFをテキストに変換し,序論・本論・実 験・結論の4つに分けた後,それぞれのセクションごとに重要文を表示している.また,課 題文表示機能や,キーワード検索機能など,サーベイを行う上で必要になると思われる機能 を実装した.ユーザ実験の結果,論文から各構成要素文を抽出する実験では,閲覧支援効果 が表れていることがわかった.論文サーベイを想定した実験では,「先行研究-改良研究」の 関連性にある論文のペアを見つける上では,提案システムの有効性を示した.アンケートの 結果に基づいて,提案システムが有効であった実験協力者を分析した結果,じっくり読む傾向にあ る実験協力者5名中4名には有効ではなく,飛ばし読みする傾向にある実験協力者7名中6名 に有効であることがわかった.このことから,提案システムの有効性はユーザの論文の読み方に左 右されることが分かった.

多数の論文が電子的に発行され,容易に入手可能となっている現在において,提案手法は 研究活動の効率化に貢献するものである.今後,本文以外の情報の掲示や,複数の論文をサ ーベイする上で有用な機能を実装することで,より実用的なシステムを実現することが期 待できる.

123

謝辞

本研究につきまして,終始ご指導頂きました高間康史教授に心より感謝するとともに,厚 くお礼申し上げます.また,本研究の副査を務めていただきました,山口亨教授,小町守准 教授にも深く感謝いたします.そして,本研究を進めるにあたり,日ごろから有益な助言を 頂き,評価実験に協力していただいた高間研究室の皆様にも,この場を借りてお礼申し上げ ます.

124

参考文献

[1] 阿辺川 武,相澤 彰子,内部構造解析機能と脚注表示機能を備えた論文閲覧システ

ム,人工知能学会 インタラクティブ 情報アクセスと可視化マイニング研究会(第 7回) ,pp.13-18,2014.

[2] 前野明子,太田学,学術論文閲覧支援インタフェースの試作,DEIM

Forum2014(E3-3),pp.1-6,2014.

[3] 村田真樹, Stijn De Saeger, 橋本力, 風間淳一, 山田一郎, 黒田航, 馬青, 相

澤彰子, 鳥澤健太郎,“論文データからの重要情報の抽出と可視化”, 2009 年度人 工知能学会全国大会 (第 23 回) 論文集, pp.1-4,2009.

[4] 倉本佑太, 中藤哲也, 廣川佐千男, 手掛り語を用いた論文概要から課題の自動抽 出, 情報処理学会 九州支部 火の国情報シンポジウム,pp.1-4,2011.

[5] 酒井敦彦,廣川 佐千男,手掛り語に着目した論文概要からの課題抽出,火の国情報 シンポジウム2012(B-4-1),pp.1-6, 2012.

[6] 平井久貴,新妻弘祟,太田学,高須淳宏,学術論文からの実験情報抽出の一手法,

DEIM Forum2015(F3-1) ,pp.1-7,2015.

[7] Kazunari SugiyamaKan Min-Yen,Scholarly paper recommendation via user’s recent research interests, In Proc.of 10th annual joint conference on Digital libraries, pp. 29-38, 2010.

[8] Angrosh, M. A., Craneeld, S., and Stanger, N.: Context identication of sentencesin related work sections using a conditional random field:towards intelligent digitallibraries, in Proceedings of the 10th annual joint conference on Digital libraries,JCDL ’10, pp. 293-302, 2010.

[9] Nonaka H ,Kobayashi ,A .Sakaji ,H .Suzuki,Y. Sakai, H.Masuyama,.Extraction of the effect and thetechnology terms from ap atent document,Proc. Computers and Industrial Engineering(CIE)pp.1-6(2010)

[10] Hirokawa S , Feature Extraction using RestrictedBootstrapping , Proc.International Symposium on InnovativeE-Services and Information Systems,pp.283-287, 2012

[11] E. Riloff ,R. Jones. Learning dictionaries for information extraction by multi-level bootstrapping. In AAAI, pp. 474-479, 1999.

[12] Taboada M,Grieve J." Analyzing Appraisal Automatically" In AAAI Spring Symposium on Exploring Attitude and Affect in Text: Theories and Applications,pp1-4,2004.

[13] 廣川 佐千男,酒井敦彦,学術論文概要中の各文の観点推定, 第44 回「ディジタル

図書館」ワークショップ, pp.20-24 ,2014.

[14] 徳永康次,延澤志保,太原育夫,テキスト構造に着目した学術論文の要旨自動生成の

125

ための重要文抽出,第6 回情報科学フォーラム(E-032), pp. 215-216,2007.

[15] 岡田拓真,村田真樹.論文からの記載必要項目の抽出と文章作成支援,言語処理学会

第21回年次大会, pp.988-991,2015.

[16] 佐波 智也 日高 宏紀 渡辺 靖彦 岡田 至弘,論文検索のための知識の論文の序論か

らの抽出,言語処理学会第13回年次大会,pp.982-985,2007.

[17] SHIN Wonha,白井清昭.セグメント構造を考慮した学術論文の包括的要約の自動生成

の提案,言語処理学会 第23回年次大会, pp.230-233,2017.

[18] 鉢木 稔浩,太田学.Web資源を利用した学術論文閲覧支援システム,情報処理学会

研究報告データベースシステム(DBS) 2009-DBS-149(14) , pp.1-6,2009.

[19] 谷尻 淳喜,太田. 学,高須 淳宏,安達 淳,著者キーワードを利用した学術論文閲

覧支援の一手法,DEIM Forum2016(F3-3),pp.1-8,2016.

[20] 西村勇哉,大杉隆文,盛山将広,内藤峻,松下光範,研究初心者のサーベイ行為を対

象とした. 論文整理支援システムの基礎検討,第 15回インタラクティブ情報アクセ スと可視化マイニング研究会(第15回),pp.20-25,2017.

[21] 林亮介,土田貴裕,論文の作成と再利用に基づく研究活動支援システム,人工知能学

会全国大会論文集(第21回),pp.1-4,2007.

[22] 加藤健太,辻野友孝,研究初心者のための論文サーベイ支援システムの試作,情報処

理学会第72回全国大会講演論文集,pp.375-376,2010.

[23] 井上絢翔,韓 東力,参照関係の可視化による論文サーベイの効率化,人工知能学会

インタラクティブ情報アクセスと可視化マイニング研究会(第11回),pp.55-61.2009 [24] Kazunari Sugiyama and Kan Min-Yen. Scholarly paper recommendation via user’s recent research interests. In Proc.of 10th annual joint conference on Digital libraries, pp. 29-38, 2010.

[25] 鉢木 稔浩, 太田. 学, 高須 淳宏,学術論文閲覧支援システムのための関連論文推

薦,DEIM Forum 2011(F9-4),pp.1-6,2011.

[26] 石田栄美,安形輝,文体からみた学術的文献の特徴分析,三田図書館・情報学会研究

大会発表論文集, pp.33-36, 2004.

[27] 村岡貴子,米田由喜代,大谷晋也 後藤一章,深尾百合子,因 京子, “農学・工学

系日本語論文の「緒言」における接続表現と論理展開”,専門日本語教育研究 第6 号, pp.41-48, 2004.

[28] 浅井 美恵子,論説的文章における接続詞について - 日本語母語話者と上級日本語学

習者の作文比較 -,言葉と文化 4, pp.87-98, 2003.

[29] 中尾 桂子,文系短大生の学期末レポートの論文らしさ,大妻国文 44 巻,pp.1-25,

2013.

126

[30] 相澤彰子,大規模テキストコーパスを用いた語の類似度計算 に関する考察,情報処

理学会論文誌, Vol.49 No.3, pp.1426- 1436, 2008.

[31] 村岡貴子,農学系日本語論文の『結果および考察』における接続表現と文章展開,『専

門日本語教育研究』第 4号, pp.27-34,2002.

[32] 早川幸子,古本裕子,苗田敏美,松下美知子,岡沢孝雄,文系学術論文における判断

表現の使用実態,金沢大学留学生センター紀要 10, pp.11-29, 2007.

[33] 藤野昭典,上田修功,斉藤和巳,文書の構成 要素モデルのアンサンブル学習に基づ

くテキスト分類,電子情報通信学会技術研究報告, Vol.104,No.349,pp.69-74,2004.

[34] 島 広幸.,建石 由佳,章立てに注目した論文の研究内容による自動分類,言語処理

学会 第16回年次大会,pp.341-344,2010.

[35] 梅澤香矢乃,小林 一郎,文書ベクトルの次元削減に基づく類似文書判定の一考察,

DEIM Forum 2011(A6-1),pp.1-6,2011.

[36] 佐渡島 紗織,坂本 麻裕子,宇都伸之,渡 寛法,大野 真澄,外村 江里奈,中島 宏

治,因子分析による学術的文章作成力の構造解析,リメディアル教育研究 11(2),

pp.39-48,2016.

[37] 村上康代,理工系日本人学部生による課題レポートの「結論」の文章構造,専門 日

本語教育研究 第7号,pp.53-58,2005.

[38] 中須賀 謙吾,鶴岡 慶雅,談話構造を利用した学術論文の自動要約生成,言語処理学

会第21回年次大会,pp.569-572,2015.

[39] Nitin Agarwal, Kiran Gvr, Ravi Shankar Reddy, andCarolyn Penstein Ros´e, Towards multi-documentsummarization of scientific articles: Making interesting comparisons with scisumm.

WASDGML ’11,pp. 8~15, 2011.

[40] Vahed Qazvinian, Dragomir R. Radev, Saif M.Mohammad, Bonnie Dorr, David Zajic, MichaelWhidby, and Taesun Moon. Generating extractive summaries of scientific paradigms,

Journal of Artificial Intelligence Research 46,pp.165-201,2013.

[41] Julian Kupiec, Jan Pedersen, and Francine Chen, trainable document summarizer. In Proceedings of the 18th Annual International ACM SIGIR nference on Research and Development in Information Retrieval, pp. 68-73, 1995.

[42] 渡邊 ゆかり,日本語で書かれた農学系論文の序論に関する調査報告,広島女学院大

学国際教養学部紀要 4号,pp.123-136,2017.

ドキュメント内 論文構成要素に着目した (ページ 127-133)