第 5 章 評価実験
5.3 文字列抽出実験
4章で提案した文字列抽出法の有効性を示すために実験を行った.対象画像(図5.2)の 文章に「下線」25個,「囲い線」25個を書き込みを行い,文字列抽出を行った.また,今回 下線と囲い線の対象となるキーワードは予め指定されている.抽出処理については,識別 処理同様に入力直後に手動で行う.
実験結果を表5.2に示す.
表 5.2: 実験結果
過抽出数[個] 過抽出率[%] 正抽出数[個] 正抽出率[%] 下線 24 96.0 21 84.0 囲い線 24 96.0 19 76.0
ここで,抽出した結果に筆記者が目的とした文字列のみが正確に抽出された場合を正抽 出とし,筆記者が意図したキーワードの他に余分な文字が含まれていた場合(正抽出の場 合も含む)を過抽出とした(図5.6).本研究では,将来的に今回抽出した文字列の結果に キーワード認識を行い,必要なキーワードを抜き出すため,過抽出であっても成功とした (図5.7).
図 5.6: 正抽出・過抽出:「無限集合」を抽出した場合
図 5.7: 抽出成功・失敗例
表5.2に示すように,余分な文字を含む(過抽出)文字列の抽出成功率は下線と囲い線 共に96.0%となった.また,下線と囲い線の正抽出率を比べると8.0%の差が生じた.こ の結果は,下線を引く場合よりも丸などの囲い線を描く場合の方が余分な文字が含まれや すいことを示している.その原因として,ペンタブレットの扱いに不慣れであり,それに よって下線などの直線は目的の文字列からほとんどずれることはないが,丸など少し特殊 な形になると,目的の文字列からずれることがあり,これが正抽出の差を生じさせたと考
第 6 章 まとめ
本研究では,タブレット端末の普及による将来的な学習形態の変化により,電子化され た教科書を利用した授業の増加を見据え,学生の能動的学習(アクティブ・ラーニング)能 力の育成を目指したタブレット端末を使ったe-learningシステムの提案を行った.具体的に は,電子教科書に書き込まれたキーワード抽出記号からキーワードを抽出するべく,メモ とキーワード抽出記号の識別手法の提案,キーワード抽出記号からの文字列抽出手法の提 案を行った.また,提案手法のシステムをWindows7上でVisualC#で作成し,評価実験を 行った.メモとキーワード抽出記号の識別実験では,メモの認識率は96.0%,キーワード 抽出記号は82.0%の結果が得られた.次に,キーワード抽出記号からの文字列抽出実験で は,下線と囲い線の過抽出率は共に96.0%,正抽出率は下線で84.0%,囲い線で76.0%得 られた.最終的に,キーワード抽出記号の識別から文字列の抽出までの過程を一括処理し た場合,78.7%となり,実装にはまだ精度が不十分であることを示しており,さらなる改 善が必要であることが分かった.
謝辞
本研究の遂行および修士論文の作成にあたり,丁寧なご指導とご助言,ご協力を頂きま した本学地域イノベーション学研究科鶴岡信治教授,工学部電気電子工学科高瀬治彦准教 授,川中普晴助教に心から感謝申し上げます.また,共に頑張った仲間や,困ったときに助 言を下さった情報処理研究室の大学院生の先輩方に感謝致します.
参考文献
[1] Bonds-Raacke, Jennifer M., Raacke, John D., Using Tablet PCs in the classroom: an investigation of students’ expectations and reactions , Journal of Instructional Psy-chology, pp.235 - 239, 2008.
[2] 柴田彰洋 映像eラーニングのための板書された文字と図形の抽出 ,電子情報通信学 会 2007年総合大会ISS特別企画「学生ポスターセッション」,2007.
[3] Ming. Y, Bai, ZS, A Mandarin E-Learning System Based on Speech Recognition and Evaluation , COMPUTER APPLICATIONS IN ENGINEERING EDUCATION, pp.651 - 659, 2011.
[4] 田中宏 オンライン認識とオフライン認識の候補統合によるハイブリッド型ペン入力文 字認識エンジン 1998.
[5] 大田郁実,山本遼,西本卓也,嵯峨山茂樹 文字構造の文法記述に基づくオンライン 手書き漢字列認識 電子情報通信学会技術研究報告, PRMU, pp.75-80,2007.
[6] 錦見一志: 遠隔授業支援システムのためのキーワード説明文の自動抽出,平成14年度三 重大学電気電子工学科卒業論文, 2002.
[7] 柴田望洋(2004)『新版 明解C言語 入門編』ソフトバンクパブリッシング
[8] 依田文夫: 手書き日本語文字列の文字切り出し方法,昭和60年度電子通信学会総合全国 大会, 1554, 1986.
[9] 薩摩順吉(1989)『理工系の数学入門コース7 確率・統計』岩波書店