• 検索結果がありません。

一文ごとの読み速度に基づく難解文抽出手法

N/A
N/A
Protected

Academic year: 2021

シェア "一文ごとの読み速度に基づく難解文抽出手法"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 80 回全国大会. 6E-03 一文ごとの読み速度に基づく難解文抽出手法 寺田 春菜. 小林 潤平. 大日本印刷株式会社. 1. はじめに 本研究では,わかりやすい文章作成を支援するイン. ターフェースの開発を目指し,表記的にも文法的にも 正確であるが,わかりにくいと感じる文を,人間の読 み行動に基づいて抽出する手法を提案する.. キー押下. 文章を書くことは複雑な活動であり,訓練を重ねて も,わかりにくい文章を書いてしまうことが多々ある. 文章をわかりにくくする要因はさまざまであり,例え キー押下. ば,誤字や表記ゆれといったミス,文の照応関係やパ ラグラフ構成といった文章構造,背景知識や暗黙知と いったコンテクストの不足等が挙げられる.誤字や文. 図 1: 一文ごとに表示する電子リーダーの画面イメージ. 法的なミスは,自然言語処理技術等によって抽出およ び修正可能な場合も多い(例えば [1] 等).しかし,文 章構造的なわかりにくさおよびコンテキスト不足によ. して読めない状態で表示する.背景色は灰色(#cccccc). るわかりにくさは,表記や文法は正確であるため,抽. とし,鮮明に表示する場合の文字色は黒色(#000000),. 出が難しいという課題があった.. ぼかして表示する場合の文字色は薄い灰色(#dedede). 人間の読み行動においては,親密度(読者にとって. とした.次の文に進む操作は実験参加者のキー押下に. の単語に対する「なじみ」の程度)の低い単語が出現. より行い,前の文に戻ることも可能である.このキー. する文や複雑な構造の文の読解時に,親密度の低い単. 押下をトリガーとして各文の読み時間を計測した.. 語やその単語周辺の注視時間が増大し,読み速度が低. 刺激. 下することが報告されている [2].また,新しい内容が. 学校卒業認定試験の過去問題から説明文とその要旨問. 出現する文では,注視回数が増えて読み速度が低下す. 題を 5 組選定した.大幅に文字数が多い場合は要旨問. ることが報告されている [3].すなわち,わかりにくい. 題の解答に支障が出ない部分を省略した.. 呈示文章は 2,500 字程度の説明文とした.高等. 文は読み速度の低下を引き起こしており,一文ごとの 読み速度を指標として分析することで,わかりにくい. 装置. 文を抽出できる可能性がある.. 製 MacBook Pro(画面サイズ対角 13.3 inch, 画面解像. そこで本稿では,一文ごとの読み速度を計測できる 電子リーダーを開発し,文章内での読み速度の変化を 分析するとともに,読み速度低下と文のわかりにくさ の一致度を検証した.. 表示装置にはラップトップ型 PC である Apple 社. 度 227 ppi)を使用した. 実験参加者 手続き. 20 代∼40 代の社員 10 名が参加した.. 実験参加者は図 1 の電子リーダーを用いて,. 自身のキー操作により呈示文章を読み進めた.その後,. 2. 実験. 電子リーダー. 実験参加者は文章のどこがわかりにくかったかを回答 文章の呈示および読み時間を計測する. ために,図 1 に示す電子リーダーを開発した.この電子 リーダーは,一文ごとの読み時間を計測するために,読 んでいる一文だけを鮮明に表示し,それ以外の文はぼか Proofreading interface based on extracting difficult sentences by variation of reading rate Haruna Terada Jumpei Kobayashi Dai Nippon Printing Co., Ltd.. 4-33. した.実験は 5 文章で実施し,文章の呈示順はランダム とした.なお,呈示文章に対する内容理解を一定に保 つために,読後に要旨問題を出題した.平均正答率は. 90%であり,理解しながら読んでいることを確認した.. 3. 結果 本稿では,5 文章のうち,読み速度および読みやす. さの主観評価ともに最も平均的であった呈示文章 α の. Copyright 2018 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 80 回全国大会. 段落1 文1 2. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53. 読み速度(Zスコア). 2 1 0 -1 -2. A. B. C. D. E. F. N=10. 図 2: 文章 α における実験参加者 10 名の一文ごとの読み速度変化. するために時間のかかる文も,読み速度低下の指標か. 分析結果を示す. 図 2 は,文章 α における一文ごとの読み速度変化を. ら抽出できることがわかった. なお,領域 A∼F の文は表記的にも文法的にも正確. 示したグラフである.縦軸が読み速度(Z スコア),横 軸が段落および文番号であり,文番号 1 が文章の先頭. であった. 以上の結果より,読み速度の低下を指標とすること. である.読み速度は実験参加者間のばらつきが大きく, そのまま平均をとると個人差の影響を受けてしまうた. で,表記的にも文法的にも正確であるが,わかりにく. め,実験参加者ごとに標準化した後,文ごとに全実験. いと感じる文を抽出できることがわかった.. 参加者の平均を算出した.読み速度(Z スコア)の 0 は文章内の読み速度の平均値であり,正の値であれば 平均より読みが速く,負の値であれば平均より読みが 遅いことを示す.エラーバーは標準誤差を示す.また, 実験参加者からわかりにくかったと主観報告があった 文を,白抜きのマーカーで示した. まず,図 2 領域 A,C,E,F について,読み速度の低 下とわかりにくいとの主観報告が観察された.この領 域の文に出現する単語は,実験参加者にとって馴染み がない単語であったことが主観報告からわかった.先 行研究 [2] においても,読者にとって親密度の低い単語 が出現する文では,読み速度が低下することが報告さ れている.したがって,読者にとって馴染みがない単 語の出現によってわかりにくく感じる文について,読 み速度低下の指標から抽出できることがわかった. 次に,図 2 領域 D について,読み速度の低下とわか りにくいとの主観報告が観察された.この領域では,前 段落までの内容を比喩表現を用いて総括しているが,そ. 4. おわりに 本稿では,一文ごとに表示する電子リーダーにより. 読み速度を計測し,読み速度の低下と文のわかりにく さの一致度を検証した.その結果,読み速度の低下と わかりにくさは一致する傾向を示すことがわかった. 読み速度が低下する部分は,読者にとってわかりに くい部分であり,よりわかりやすい表現や表記への修 正が望まれる可能性が高いと言える.すなわち,読み 速度が低下した文を抽出することで,文章推敲の手掛 かりをすばやく提示できる可能性が期待できる.改善 すべき文を読むだけで抽出できれば,推敲にかかる時 間を大幅に削減することができ,よりわかりやすく伝 わる文章作成の一助となるはずである. 今後は,文章推敲を支援するインターフェースを模 索していく予定である.文章推敲が容易になるような わかりづらさの呈示手法について検討していきたい.. の比喩が適切でないために,かえって理解を阻害した ことが主観報告からわかった.比喩表現自体は文法的. 参考文献. にも正しく平易な表現であったが,読者にとってはわ. [1] 坂本 俊介, 須藤 崇志, 丸山 広, 中村 太一. 形態素解 析を利用した文章校正手法の提案. 情報処理学会研 究報告, vol. 2009-DD-72, no. 17, pp. 1–6, 2009.. かりにくい文とされた.したがって,このようなわか りにくい文についても,読み速度低下の指標から抽出 できることがわかった. 最後に,図 2 領域 B については,読み速度の低下の みが観察された.この領域は新しく問題提起している 段落であり,先行研究 [3] においても,文章中に新しい 内容が出現すると,読み速度が低下することが報告さ れている.したがって,このような新しい内容を理解. 4-34. [2] 近藤 公久, 馬塚 れい子, 筧 一彦. 日本語文の読解 過程における語特性および語順の影響. 認知科学, vol. 9, no. 4, pp. 543–563, 2002. [3] Jukka Hy¨on¨a. An eye movement analysis of topicshift effect during repeated reading. Journal of Experimental Psychology: Learning, Memory, and Cognition, vol. 21, no. 5, pp. 1365–1373, 1995.. Copyright 2018 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

の原文は“ Intellectual and religious ”となっており、キリスト教に基づく 高邁な全人教育の理想が読みとれます。.

古安田層 ・炉心孔の PS 検層結果に基づく平均値 西山層 ・炉心孔の PS 検層結果に基づく平均値 椎谷層 ・炉心孔の

○玄委員 そこで、累積頻度 55%と 95%のほうで、それが平均風速で 55%と 95%か、最大 風速での

また、 NO 2 の環境基準は、 「1時間値の1 日平均値が 0.04ppm から 0.06ppm までの ゾーン内又はそれ以下であること。」です

2013(平成 25)年度から全局で測定開始したが、2017(平成 29)年度の全局の月平均濃度 は 10.9~16.2μg/m 3 であり、一般局と同様に 2013(平成

「PTA聖書を学ぶ会」の通常例会の出席者数の平均は 2011 年度は 43 名だったのに対して、2012 年度は 61 名となり約 1.5

「PTA聖書を学ぶ会」の通常例会の出席者数の平均は 2011 年度は 43 名、2012 年度は 61 名、そして 2013 年度は 79

z 平成20年度経営計画では、平成20-22年度の3年 間平均で投資額6,300億円を見込んでおり、これ は、ピーク時 (平成5年度) と比べ、約3分の1の