DEIM Forum 2014 E3-4
入力ストローク数削減による高速手書き入力手法
王 琛
†鬼沢 和也
‡浅井 洋樹
‡,††山名 早人
§†早稲田大学基幹理工学部 〒169-8555 東京都新宿区大久保 3-4-1
‡早稲田大学大学院基幹理工学研究科 〒169-8555 東京都新宿区大久保 3-4-1
††早稲田大学メディアネットワークセンター 〒169-8050 東京都新宿区戸塚町 1-104
§早稲田大学理工学術院 〒169-8555 東京都新宿区大久保 3-4-1
国立情報学研究所 〒101-8430 東京都千代田区一ツ橋 2-1-1
E-mail: {magaret1103,kazuya_o, asai,yamana}@yama.info.waseda.ac.jp
あらまし コンピュータ上での手書き文字入力は認識エンジンが判別可能な品質で記入しようとするとキーボードによる 入力と比較して入力に時間がかかる.一方,品質を犠牲にして高速に手書き入力しようとすると誤認識が増える結果となり,入 力速度が低下してしまう.こうした問題に対し既存研究では,単語の予測入力や入力途中に随時変換することにより入力速度を 向上させている.しかし多くの従来のシステムでは,各漢字を完全に書いた後でないと認識結果に書きたい文字が表示されず, 画数の多い漢字を認識させるためには手の動きと時間をかなり要することになる.本研究では,単語を書く際に各漢字を途中ま でしか書かなくとも,希望する単語を動的に予測し,手書き入力を高速化する手法を提案する.評価実験では,提案手法と既存 手法で同じテキストを入力し,入力にかかる時間とストローク数を記録する.提案手法を用いた場合,入力にかかる時間は削減 できなかったが,ストローク数が既存手法より少なくなることより,提案手法の有効性を示すことができた. キーワード 手書き認識,テキスト入力
1. は じ め に
近 年 ,ス マ ー ト フ ォ ン や iPad な ど ,タ ッ チ デ ィ ス プ レ イ を 搭 載 し た 端 末 が 普 及 し て い る . タ ッ チ デ ィ ス プ レ イ を 搭 載 し た 端 末 で テ キ ス ト を 入 力 す る 方 法 は 主 に 2 つ あ る . 画 面 上 の ソ フ ト ウ ェ ア キ ー ボ ー ト を 使 用 し て 入 力 す る 方 法 と , 手 書 き で 入 力 す る 方 法 で あ る . そ れ ぞ れ の 方 式 を 採 用 し た 様 々 な IME(Input method editor)が 多 く 生 み 出 さ れ て い る . ソ フ ト ウ ェ ア キ ー ボ ー ド と は , 画 面 上 に 物 理 キ ー ボ ー ド と 同 じ 形 で 各 キ ー を 並 べ て 表 示 し , 各 キ ー を タ ッ プ す る こ と に よ り 文 字 を 入 力 す る 方 法 で あ る . ソ フ ト ウ ェ ア キ ー ボ ー ド を 使 用 し て テ キ ス ト を 入 力 す る 場 合 は , 小 さ い 画 面 上 に 存 在 す る 数 多 く の キ ー を 連 続 で 正 確 に タ ッ プ す る こ と に な る . そ の た め , 目 や 神 経 の 疲 れ と , 押 し 間 違 い が 多 く 発 生 す る こ と に よ る , 入 力 効 率 の 低 下 が 問 題 に な る [1]. 手 書 き で 入 力 す る 方 法 と は , 手 書 き で 書 い た 文 字 を , オ ン ラ イ ン 手 書 き 文 字 認 識 を 使 用 し , ど の 文 字 が 書 か れ た か 認 識 す る こ と に よ り 文 字 を 入 力 す る 方 法 で あ る . 日 本 語 の オ ン ラ イ ン 手 書 き 文 字 認 識 は 学 会 で は 「 終 わ っ た 研 究 分 野 」と い わ れ て お り ,一 文 字 の 認 識 率 が 90% 以 上 の 高 い 水 準 ま で 達 し て い る [3].し か し ,オ ン ラ イ ン 手 書 き 文 字 認 識 を 使 用 し た テ キ ス ト 入 力 は 時 間 が か 1 http://ja.wikipedia.org/wiki/POBox 2 http://product.metamoji.com/android_top/ か る . な ぜ な ら 入 力 す る 文 字 の ス ト ロ ー ク を 全 て 書 か な け れ ば な ら な い か ら で あ る . そ の た め , 入 力 速 度 が 物 理 キ ー ボ ー ト で の 入 力 速 度 よ り 明 ら か に 遅 く な る [2]. オ ン ラ イ ン 手 書 き 文 字 認 識 を 用 い て 文 字 入 力 を す る 既 存 研 究 と し て は POBox1,Mazec2な ど 手 書 き 入 力 シ ス テ ム が あ る .こ れ ら は 予 測 入 力 や 随 時 変 換 を 用 い て , 手 書 き 入 力 速 度 を 向 上 さ せ て い る . 増 井 ら の 研 究 結 果 に よ る と , 普 通 の 紙 に 手 書 き で 文 字 を 書 く 速 度 が 49.2 文 字 /分 で あ り , Pilot 版 POBox で テ キ ス ト を 入 力 す る 速 度 は 20.1 文 字 /分 で あ る [3].ま た ,Mazec,MyScript3 な ど 広 く 利 用 さ れ る 商 用 の オ ン ラ イ ン 手 書 き 文 字 入 力 シ ス テ ム で は , 各 漢 字 を 完 全 に 描 い た 後 で な い と 書 き た い 文 字 を 正 確 に 認 識 候 補 と し て 表 示 で き な い . 画 数 の 多 い 漢 字 を 認 識 さ せ る た め に は 手 の 動 き と 時 間 を か な り 要 す る こ と に な る . 手 書 き 入 力 が 遅 く な る 原 因 は ス ト ロ ー ク の 描 画 に 長 い 時 間 が か か る か ら で あ る . 本 研 究 で は , 書 く 頻 度 の 高 い 単 語 に 対 し て , 書 く 必 要 の あ る ス ト ロ ー ク 数 を 減 ら す こ と に よ り , 高 速 手 書 き 入 力 を 実 現 す る . 物 理 キ ー ボ ー ド で「 富 士 」を 速 く 入 力 し た い 場 合 は ,「 fuji」 の 代 わ り に「 fj」と 入 力 す る と ,自 動 的 に「 富 士 」に 変 換 さ れ る よ う に , 入 力 し た い 単 語 の 各 文 字 を 途 中 ま で 3 http://www.visionobjects.com/jp/myscript /し か 書 か な く と も 入 力 し た い 単 語 を 認 識 で き る よ う に し , ス ト ロ ー ク 数 の 削 減 を 実 現 す る . 評 価 実 験 で は , 提 案 手 法 と Mazec, MyScript な ど 商 用 の オ ン ラ イ ン 手 書 き 文 字 入 力 シ ス テ ム で 同 じ テ キ ス ト を 入 力 し , 入 力 に か か る 時 間 と ス ト ロ ー ク 回 数 を 記 録 し て 比 較 す る . 提 案 手 法 を 用 い た 場 合 , 入 力 に か か る 時 間 と ス ト ロ ー ク 回 数 が Mazec, MyScript オ ン ラ イ ン 手 書 き 文 字 入 力 シ ス テ ム よ り 少 な く な る こ と よ り , 提 案 手 法 の 有 効 性 を 示 す . 本 稿 で は 以 下 の 構 成 を と る . ま ず 2 節 で オ ン ラ イ ン 手 書 き 入 力 に 関 す る 既 存 研 究 を 紹 介 し , 3 節 で 提 案 手 法 を 説 明 す る . 次 に 4 節 で 実 験 と 評 価 を 行 い , 最 後 に 5 節 で ま と め を 述 べ る .
2. オ ン ラ イ ン 手 書 き 入 力 の 関 連 研 究
以 下 で は , 手 書 き 入 力 に 用 い ら れ る オ ン ラ イ ン 手 書 き 認 識 エ ン ジ ン に つ い て 説 明 し た 後 , 予 測 入 力 と 文 字 補 完 に 関 連 し て い る シ ス テ ム に つ い て 説 明 す る .2.1. オンライン手 書 き認 識 エンジン
オ ン ラ イ ン 手 書 き 文 字 認 識 と は , ア ナ ロ グ 行 為 と し て の 手 書 き 文 字 を 情 報 処 理 で き る デ ィ ジ タ ル 方 式 に 変 換 す る プ ロ セ ス で あ る [3].日 本 語 の オ ン ラ イ ン 手 書 き 文 字 認 識 に 関 す る 研 究 は 朱 ら の 研 究 報 告 [3]に よ る と , 約 40 年 前 か ら ,学 会 で は「 終 わ っ た 研 究 分 野 」と い わ れ て お り ,一 文 字 の 認 識 率 が 90%以 上 の 高 い 水 準 ま で 達 し て い る . 本 稿 で は , ア ナ ロ グ 行 為 と し て の 手 書 き 文 字 を 「 手 書 き 文 字 」 と 呼 び , 情 報 処 理 で き る デ ィ ジ タ ル 方 式 に 変 換 し た 後 の 文 字 を「 タ イ プ 文 字 」と 呼 ぶ . オ ン ラ イ ン 手 書 き 文 字 認 識 エ ン ジ ン の 1 つ に Vision Objects 社 の MyScript[5]が あ る .MyScript は 54 種 類 の 言 語 の 手 書 き 文 字 を 最 高 の 精 度 で 認 識 で き る [5] . MyScript を 手 書 き 認 識 エ ン ジ ン と し て 利 用 し た ノ ー ト ア プ リ や 手 書 き 数 式 計 算 ア プ リ , テ キ ス ト 入 力 ア プ リ な ど , 様 々 な 機 能 を 持 つ ア プ リ が 開 発 さ れ , 世 界 中 で 広 く 使 わ れ て い る [4].オ ン ラ イ ン 手 書 き 文 字 認 識 エ ン ジ ン は 他 に も Zinnia[6]と い う オ ー プ ン ソ ー ス の オ ン ラ イ ン 手 書 き 文 字 認 識 エ ン ジ ン が あ る . Zinnia は ス ト ロ ー ク の 座 標 点 列 を イ ン プ ッ ト と し て , イ ン プ ッ ト さ れ た 座 標 点 列 と 似 て い る 10 文 字 を 変 換 候 補 と し て 出 力 す る .Zinnia は SVM を 使 用 し て い る た め ,文 字 の み な ら ず 任 意 の ペ ン ス ト ロ ー ク を 高 速 に 学 習 で き , 50~100 文 字 /秒 の 実 用 的 な 認 識 速 度 を 実 現 し て い る [6]. し か し , オ ン ラ イ ン 手 書 き 文 字 認 識 を 使 用 し た テ キ ス ト 入 力 は 時 間 が か か る . な ぜ な ら 入 力 す る 文 字 の ス ト ロ ー ク を 全 て 書 か な け れ ば な ら な い か ら で あ る .画 数 の 多 い 漢 字 を 認 識 さ せ る た め に は 手 の 動 き と 時 間 を か な り 要 す る こ と に な る .そ の た め , 入 力 速 度 が 物 理 キ ー ボ ー ト で の 入 力 速 度 よ り 明 ら か に 遅 く な る .ま た , 不 安 定 な 姿 勢 で 大 量 の 文 字 を 入 力 す る こ と に よ り 疲 れ る 問 題 も あ る [2].2.2. 予 測 入 力 を用 いた手 書 き入 力 システム
予 測 入 力 機 能 と は ,利 用 者 が す べ て の 文 字 を 入 力 し 終 え る 前 に 利 用 者 が 意 図 す る 語 彙 を 提 示 す る 機 能 で あ る [7].物 理 キ ー ボ ー ド を 持 つ コ ン ピ ュ ー タ の 様 々 な IME に 予 測 入 力 機 能 が 採 用 さ れ て い る .近 年 ,キ ー ボ ー ド が な く 入 力 効 率 が 低 い モ バ イ ル 端 末 の 普 及 と と も に ,入 力 効 率 を 向 上 さ せ ら れ る 予 測 入 力 機 能 が 広 く 応 用 さ れ て い る .予 測 入 力 機 能 を 用 い る と ,入 力 し た い 単 語 の 全 て の 文 字 を 書 か な く と も ,入 力 候 補 に 表 示 さ れ る .予 測 入 力 機 能 を 持 つ 手 書 き 入 力 シ ス テ ム で あ る Mazec[8]と POBox[4]は , 予 測 機 能 を 用 い て 手 書 き 入 力 速 度 を 向 上 さ せ る こ と が で き る . Mazec は , タ ッ チ パ ネ ル を 搭 載 し た デ バ イ ス に お い て ソ フ ト ウ ェ ア キ ー ボ ー ド の 代 わ り に 手 書 き 認 識 に よ る 日 本 語 入 力 を 簡 単 に で き る ア プ リ ケ ー シ ョ ン で あ る . Mazec は 手 書 き 認 識 機 能 だ け で は な く ,か な 漢 字 変 換 機 能 ,か な 文 字 と 漢 字 の 交 ぜ 書 き 変 換 機 能 ,予 測 入 力 機 能 を 搭 載 し ,効 率 よ く 簡 単 に 手 書 き に よ る テ キ ス ト 入 力 を 行 う こ と が で き る[8]. POBox は ,増 井 ら [2]が 開 発 し た ペ ン 計 算 機 向 き の 文 字 入 力 シ ス テ ム で あ る . PalmPilot 版 POBox で は , ソ フ ト ウ ェ ア キ ー ボ ー ド と ペ ン ス ト ロ ー ク の 併 用 で ,予 測 入 力 と 曖 昧 検 索 に 基 づ く 効 率 的 な 入 力 手 法 を 用 い て , 効 率 的 な テ キ ス ト 入 力 を 実 現 し た . PalmPilot 版 POBox の 予 測 入 力 機 能 は 先 行 登 録 し た 辞 書 内 の 単 語 を 順 番 に マ ッ チ ン グ す る こ と に よ り 行 う と い う 単 語 内 の 予 測 と ,先 行 文 字 か ら 次 の 入 力 単 語 を 予 測 す る 単 語 間 の 予 測 の 2 種 類 あ り ,ど ち ら で も 単 語 と 読 み を 辞 書 に 先 行 登 録 す る 必 要 が あ る .し か し ,多 く の 予 測 候 補 か ら 入 力 し た い 文 字 や 単 語 を 選 ぶ た め の 視 線 移 動 と 辞 書 に な い 単 語 の 検 索 に 時 間 が か か る と い う 欠 点 が あ る [2].増 井 ら の 研 究 結 果 に よ る と ,普 通 の 紙 に 手 書 き で 文 字 を 書 く 速 度 が 49.2 文 字 /分 で あ り , Pilot 版 POBox で テ キ ス ト を 入 力 す る 速 度 が 40.5 文 字 /分 で あ る [4].2.3. 文 字 補 完 を用 いた手 書 き入 力 システム
文 字 補 完 と は , 単 語 の 各 漢 字 を 途 中 ま で し か 書 か な く と も , 書 い た 一 部 の ス ト ロ ー ク か ら 書 き た い 単 語 を 動 的 に 予 測 す る こ と で あ る . Mazec, MyScript な ど 広 く 利 用 さ れ る 商 用 の オ ン ラ イ ン 手 書 き 文 字 入 力 シ ス テ ム で は , 漢 字 を 完 全 に 描 い た 後 で な い と 書 き た い 文 字 が 正 確 に 認 識 候 補 と し て 表 示 さ れ な い た め , 画 数 の 多 い 漢 字 を 認 識 さ せ る た め に は 手 の 動 き と 時 間 を か な り 要 す る こ と に な る . PalmPilot 版 POBox は 文 字 補 完 機 能 が あ る . し か し , PalmPilot 版 POBox の ペ ン ス ト ロ ー ク 入 力方 式 で は , 書 け る 枠 は 2 つ し か な く , 日 本 語 に 多 く 存 在 す る 3 文 字 以 上 で 構 成 さ れ る 単 語 を 書 く た め に は 分 割 し て 書 く し か な い と い う 問 題 が あ る . ま た , POBox の 辞 書 に 登 録 さ れ た 単 語 は す べ て 形 態 素 単 位 で あ る た め , 書 い て い る 時 辞 書 を マ ッ チ ン グ し , 候 補 に 表 示 さ れ る 単 語 も 形 態 素 単 位 で あ る [4].こ れ に 対 し ,使 用 者 が 書 い た 単 語 は 形 態 素 単 位 で な い 場 合 は , 候 補 に 表 示 さ れ な い 欠 点 が あ る .
2.4. 関 連 研 究 のまとめ
表 1 は , 関 連 研 究 の 長 所 と 短 所 を ま と め た も の で あ る . 表 1 関 連 研 究 の 長 所 と 短 所3. 提 案 手 法
本 節 で は , 提 案 手 法 で あ る , 書 く 必 要 の あ る ス ト ロ ー ク 数 を 削 減 す る こ と に よ り , 書 く 頻 度 の 高 い 単 語 を 高 速 で 入 力 で き る 手 法 に つ い て 述 べ る .3.1. 概 要
手 書 き 入 力 が 遅 く な る 原 因 は , 各 ス ト ロ ー ク を 書 く の に 時 間 が か か る か ら で あ る . よ っ て , 書 く 必 要 の あ る ス ト ロ ー ク 数 を 削 減 で き れ ば , 手 書 き 入 力 の 速 度 が 向 上 す る . 例 え ば , 物 理 キ ー ボ ー ド で 「 富 士 」 と 入 力 す る 場 合 ,ア ル フ ァ ベ ッ ト の「 fuji」を 先 に 入 力 す る 必 要 が あ る .し か し ,図 1に 示 し た よ う に ,速 く 入 力 し た い 場 合 は ,「 fuji」の 代 わ り に「 fj」と 入 力 す る と ,自 動 的 に 「 富 士 」 に 変 換 さ れ る 場 合 も あ る . こ の よ う に す べ て の ア ル フ ァ ベ ッ ト を 入 力 す る 代 わ り に , 各 文 字 の 先 頭 の ア ル フ ァ ベ ッ ト の み を 入 力 す る こ と に よ り , タ イ ピ ン グ 速 度 を 向 上 さ せ る こ と が で き る . こ の 考 え 方 を タ ブ レ ッ ト 端 末 で の 手 書 き 入 力 に 応 用 す る こ と に よ り , ス ト ロ ー ク 数 の 削 減 を 実 現 す る . 具 体 的 に は , 入 力 し た い 単 語 の 各 文 字 を 途 中 ま で し か 書 か な く と も 入 力 し た い 単 語 を 認 識 で き る よ う に し , ス ト ロ ー ク 数 の 削 減 を 実 現 す る こ と を 目 指 し た . 図 1 「 富 士 」 を 高 速 で 入 力 す る 例 本 研 究 で は , 書 く 頻 度 の 高 い 単 語 に 対 し て , 書 く 必 要 の あ る ス ト ロ ー ク 数 を 減 ら す こ と に よ り , 高 速 手 書 き 入 力 を 実 現 す る . 提 案 手 法 は , 以 下 の 3 つ の ス テ ッ プ で 構 成 さ れ て い る : ① 手 書 き 文 字 の 認 識 ② 各 文 字 候 補 の 組 み 合 わ せ ス コ ア の 算 出 ③ 各 組 み 合 わ せ の ス コ ア に 対 す る ラ ン キ ン グ ス テ ッ プ ① の 手 書 き 文 字 の 認 識 で は , Zinnia を 手 書 き 文 字 認 識 器 と し て 使 用 す る こ と よ り , 書 い た 手 書 き 文 字 を タ イ プ 文 字 に 変 換 す る .Zinnia の 認 識 モ デ ル は , 一 度 書 い た 事 の あ る 文 字 の 筆 跡 を 登 録 す る こ と に よ り , 作 成 す る . こ の 認 識 モ デ ル に 含 ま れ る 文 字 の 数 は Zinnia の デ フ ォ ル ト の 認 識 モ デ ル に 登 録 さ れ て い る 文 字 の 数 よ り 明 ら か に 少 な い . よ っ て , 作 成 し た 認 識 モ デ ル を 使 用 す る と ,途 中 ま で し か 文 字 を 書 か な く と も , 書 き た い 文 字 を 予 測 で き る よ う に な る . 途 中 ま で し か 文 字 を 書 か な く と も 書 き た い 文 字 を 予 測 で き る こ と を 利 用 し ,一 度 書 い た 事 が あ る 文 字 列 を 再 び 書 く 際 に は , 各 漢 字 を 途 中 ま で し か 書 か な く と も , 文 字 列 を 入 力 で き る よ う に す る . ス テ ッ プ ② で は , ① の 認 識 結 果 を 用 い て 入 力 文 字 列 の 候 補 を 作 成 す る .そ し て Google 日 本 語 n-gram の 1-gram, す な わ ち 1 形 態 素 中 の 出 現 頻 度 を 使 用 し , ス コ ア を 計 算 す る . ス テ ッ プ ③ で は ス テ ッ プ ② で 算 出 し た ス コ ア を 用 い て 候 補 文 字 列 の 推 薦 順 位 を 決 め る . こ の 手 法 を 利 用 す る と , 入 力 し た い 単 語 の 各 文 字 を 途 中 ま で し か 書 か な く て 良 い の で , 時 間 と 手 の 動 作 を 削 減 す る こ と が で き る . 提 案 手 法 の 概 略 を図 2に 示 す .図 2 提 案 手 法 の 概 略 図
3.2. 提 案 手 法 の流 れ
提 案 手 法 の 流 れ を ス テ ッ プ ご と に 具 体 的 に 説 明 す る .3.2.1. 手 書 き 文 字 の 認 識
手 書 き 文 字 の 認 識 で は ,機 械 学 習 ア ル ゴ リ ズ ム SVM を 用 い た オ ン ラ イ ン 手 書 き 文 字 認 識 エ ン ジ ン Zinnia を 手 書 き 文 字 認 識 器 と し て 使 用 す る こ と よ り , 書 い た 手 書 き 文 字 を タ イ プ 文 字 に 変 換 す る . ま ず , 書 い た 文 字 の 筆 跡 点 の 座 標 情 報 を (x y)の 形 で 記 録 す る .そ の 後 ,座 標 情 報 を Zinnia が 認 識 で き る 形 式 に 変 換 し ,Zinnia に 入 力 す る .そ う す る と ,図 4の よ う に 各 文 字 10 個 ず つ の 認 識 結 果 が ア ウ ト プ ッ ト さ れ る . 認 識 結 果 の 文 字 の 右 に 表 示 さ れ る 数 字 は Zinnia が 算 出 し た SVM に よ る 類 似 度 で あ り , そ の 範 囲 は -1~+1 で あ る . こ の 類 似 度 は 3.2.2 で ス コ ア を 計 算 す る 際 に 使 用 す る .図 3に は 手 書 き 文 字「 早 稲 田 」に 対 す る デ フ ォ ル ト 認 識 モ デ ル を 用 い た Zinnia の 認 識 結 果 を 示 す . 図 3 手 書 き 文 字 「 早 稲 田 」 に 対 す る デ フ ォ ル ト 認 識 モ デ ル を 用 い た Zinnia の 認 識 結 果 図 4 手 書 き 文 字 「 早 稲 田 」 に 対 す る 個 人 的 認 識 モ デ ル を 用 い た Zinnia の 認 識 結 果 Zinnia が 持 つ デ フ ォ ル ト の 認 識 モ デ ル に は 数 字 , 漢 字 , か な 文 字 を 含 め , 全 6,449 文 字 が 含 ま れ て い る . し か し , 書 き 順 な ど の 使 用 者 の 個 人 的 な 特 徴 は 含 ま れ て お ら ず , か つ , 膨 大 な 認 識 モ デ ル を 持 つ の で , 手 書 き 文 字 の 認 識 率 が 低 く な る . ま た , 文 字 を 途 中 ま で 書 い た 状 態 で も 書 き 終 え た 状 態 と し て 認 識 さ れ る の で , 違 う 文 字 が 予 測 候 補 に 表 示 さ れ る 場 合 が 多 い .そ こ で , 文 字 の ス ト ロ ー ク を 全 て 書 か な く と も , 入 力 し た い 文 字 を 認 識 結 果 に 出 す た め に , 以 前 使 用 者 が 書 い た こ と が あ る 文 字 の 筆 跡 情 報 を 記 録 す る こ と よ り , 個 人 性 を 持 つ 認 識 モ デ ル を 作 る . 図 4 に は 手 書 き 文 字 「 早 稲 田 」に 対 す る 個 人 的 認 識 モ デ ル を 用 い た Zinnia の 認 識結 果 を 示 し て い る .
3.2.2. 各 文 字 候 補 の 組 み 合 わ せ ス コ ア の 算 出
次 に ,各 文 字 10 個 ず つ の 候 補 を 組 み 合 わ せ ,単 語 を 作 る . こ の 段 階 で は , 各 組 み 合 わ せ が 単 語 と し て 意 味 を 持 つ か ど う か を 問 わ な い .こ の 時 ,手 書 き 文 字 3 文 字 を 書 い た 場 合 は , 10×10×10=1000 種 の 組 み 合 わ せ が で き る . し か し , こ れ ら す べ て の 組 み 合 わ せ を 予 測 候 補 と し て 表 示 す る の は 現 実 的 で な い . ま た , ど の 組 み 合 わ せ を 使 用 者 が 希 望 し て い る の か も わ か ら な い . そ こ で , こ れ ら の 組 み 合 わ せ の 数 を 削 減 す る た め と , 優 先 順 位 を 決 め る た め に , ス コ ア を 計 算 す る . 組 み 合 わ せ の 数 を 削 減 す る に は ,Google n-gram デ ー タ の 中 の 1-gram を 辞 書 と し て 使 用 す る .1-gram に は , 約 2,565,424 個 の 単 語 を 持 ち , 各 単 語 の 出 現 回 数 も 記 載 さ れ て い る .1-gram に 入 っ て な い 単 語 は ,約 200 億 文 の 日 本 語 デ ー タ に 一 度 も 使 わ れ た こ と が な く , 日 常 的 に は 使 用 さ れ な い 単 語 と し て 考 え ら れ る . こ れ に よ り ,各 組 み 合 わ せ を 順 番 に 1-gram 中 に 存 在 す る か ど う か を 見 て い き ,1-gram 中 に 存 在 し な い 組 み 合 わ せ は 削 除 す る こ と よ り , 使 用 者 が 使 う 可 能 性 が 極 め て 小 さ い 組 み 合 わ せ を 排 除 し , 使 用 者 の 希 望 す る 単 語 が 含 ま れ る 組 み 合 わ せ に 絞 り 込 む . 残 り の 組 み 合 わ せ は 候 補 と 呼 ぶ . し か し , 候 補 だ け で も 大 量 に 存 在 す る た め , す べ て の 候 補 を 表 示 す る と , ス ト ロ ー ク を 書 く ご と に , 使 用 者 が 多 く の 候 補 か ら 入 力 し た い 文 字 や 単 語 を 選 ぶ こ と に な り , 入 力 効 率 が 下 が る . そ こ で , 各 候 補 の 優 先 順 位 を 決 め る ス コ ア を 計 算 す る こ と よ り , 使 用 者 の 希 望 単 語 を 予 測 す る .こ の ス コ ア は ,Google n-gram デ ー タ の 中 に 記 載 さ れ て い る 各 候 補 の 出 現 回 数 を 使 い ,式 (1) 用 い て 計 算 す る . 𝑆𝑐𝑜𝑟𝑒𝑤= 𝛼 × 𝑙𝑜𝑔 (1 +𝑚𝑎𝑥(𝐹𝑟𝑒𝑞𝐹𝑟𝑒𝑞𝑤 𝑎𝑙𝑙)) + (1 − 𝛼) 1 𝑛𝑤∑ 𝑆𝑖𝑚𝑖 𝑛𝑤 𝑖=1(1)
式 (1)に お い て ,𝑆𝑐𝑜𝑟𝑒𝑤は あ る 組 み 合 わ せ ( 文 字 列𝑤) の ス コ ア ,𝛼は 重 み 係 数 (0 ≤ α ≤ 1), 𝐹𝑟𝑒𝑞𝑤は Google 1-gram に お け る あ る 文 字 列𝑤の 出 現 回 数 ,𝑚𝑎𝑥(𝐹𝑟𝑒𝑞𝑎𝑙𝑙)は Google 1-gram に 含 ま れ る 全 て の 文 字 列 の 中 の 最 大 出 現 回 数 ,𝑛𝑤は 文 字 列𝑤の 文 字 数 , 𝑆𝑖𝑚𝑖は Zinnia に お け る𝑖番 目 の 文 字 の 出 力 ス コ ア を 表 し て い る .𝑆𝑐𝑜𝑟𝑒𝑤は 出 現 回 数 ス コ ア と 認 識 ス コ ア か ら 計 算 さ れ る .𝑆𝑐𝑜𝑟𝑒𝑤が 大 き い ほ ど , 出 現 回 数 が 大 き い か つ 使 用 者 が 書 い た 手 書 き 文 字 と 似 て い る こ と に な り , 使 用 者 が 希 望 す る 単 語 に 近 づ い て い る と 考 え ら れ る .3.2.3. 各 組 み 合 わ せ の ス コ ア を 用 い た ラ ン キ ン
グ
組 み 合 わ せ の ス コ ア が 大 き け れ ば 大 き い ほ ど , 使 用 者 の 希 望 単 語 に 近 づ い て い る と 考 え ら れ る た め , 3.2.2 節 で 算 出 し た ス コ ア の 大 き い も の か ら 小 さ い も の の 順 に 各 組 み 合 わ せ を 予 測 候 補 列 に 表 示 す る . こ の こ と に よ り , 使 用 者 が 多 く の 入 力 候 補 か ら 入 力 し た い 文 字 や 単 語 を 選 ぶ た め の 視 線 移 動 を 減 ら す こ と が で き る と 考 え ら れ る . そ し て , 使 用 者 の 余 計 な 視 線 移 動 を 減 ら す た め に , 以 前 に 書 い た 単 語 を 予 測 候 補 列 の よ り 前 方 に 表 示 し た ほ う が い い と 考 え ら れ る .こ の こ と を 実 現 す る た め に , 使 用 者 が 入 力 し た 単 語 を 毎 回 記 録 し , 入 力 単 語 履 歴 を 作 る . ラ ン キ ン グ の 順 位 が 15 位 以 内 に な る 各 候 補 は , こ の 入 力 単 語 履 歴 に 含 ま れ る か ど う か を 調 べ る . 含 ま れ て い る な ら 以 前 に 書 い た こ と が あ り , 再 び 書 く 可 能 性 が 高 い の で , 候 補 列 表 示 欄 の 先 頭 に 表 示 す る . 2 つ 以 上 履 歴 に 含 ま れ る 単 語 が あ っ た 場 合 は 使 用 し た 回 数 の 多 い 順 に 表 示 す る . ま た , 使 用 者 が 書 い た 文 字 列 が 形 態 素 単 位 で は な い 場 合 は , 入 力 単 語 履 歴 を 用 い て , 以 前 入 力 し た こ と が あ る 単 語 を 形 態 素 単 位 で 入 力 す る . 例 え ば , 手 書 き 文 字「 利 用 可 」を 書 い た 時 ,「 利 用 」と「 可 」は 形 態 素 単 位 の 単 語 で あ る が ,「 利 用 可 」は 形 態 素 単 位 の 単 語 で は な い . よ っ て , 3.2.2 節 で 述 べ た 組 み 合 わ せ の 作 り 方 で は ,候 補 列 に「 利 用 可 」は 表 示 さ れ な い こ と に な る . そ れ に 対 し て , 使 用 者 が 書 い た 文 字 列 が 形 態 素 単 位 で は な い 場 合 に も 対 応 で き る よ う に す る た め に ,「 利 用 可 」 の 前 方 一 致 検 索 で 入 力 単 語 履 歴 の 中 に 検 索 し ,「 利 」と 「 利 用 」が あ れ ば 表 示 す る .「 利 」か「 利 用 」か を 選 択 し た 後 に , 残 り の 手 書 き 文 字 「 可 」 の 認 識 結 果 を 表 示 す る こ と に な る . こ の よ う な 流 れ で , 使 用 者 が す べ て の ス ト ロ ー ク を 書 か な く と も , 希 望 す る 単 語 を 予 測 で き る .3.3. システムの実 装
シ ス テ ム の イ ン タ ー フ ェ イ ス は 図 26 に 示 し た よ う に な っ て い る . 図 5 「 早 稲 田 」 を 書 い た 様 子 図 5 の 赤 い 部 分 は デ フ ォ ル ト の 認 識 モ デ ル を 用 い た Zinnia の 認 識 結 果 の 表 示・選 択 欄 で あ る .左 か ら 認識 結 果 の 類 似 度 が 高 い 順 に 表 示 す る . 表 示 さ れ る 文 字 は 各 ス ト ロ ー ク を 書 き 終 え る ご と に 更 新 す る . 青 い 部 分 は 提 案 手 法 を 用 い た 予 測 候 補 の 表 示・選 択 欄 で あ る . 左 か ら 使 用 者 の 希 望 単 語 に な る 可 能 性 が 高 い 順 に 表 示 す る .予 測 候 補 列 に 表 示 で き る 単 語 の 数 が 多 す ぎ る と , 使 用 者 が 予 測 候 補 列 の 確 認 に か か る 時 間 が 長 く な る の で ,候 補 の 数 は 15 個 と し た .ま た ,使 用 者 が 見 つ け や す く す る た め に , 以 前 に 入 力 し た こ と が あ る 単 語 を 青 い 文 字 で 表 示 す る . 黄 色 い 部 分 は テ キ ス ト 入 力 部 で あ る . 入 力 し た テ キ ス ト を 中 央 の 欄 に 表 示 す る . 紫 色 の 部 分 は 枠 付 き 手 書 き エ リ ア で あ る . 左 か ら 1 枠 ご と に 1 文 字 を 書 く . 提 案 手 法 を 実 装 し た シ ス テ ム で 文 字 列 を 書 く 際 に , そ の 文 字 列 を 書 く の が 初 め て か 2 回 目 以 降 な の か に よ り , 入 力 方 法 が 異 な る . 初 め て 書 く 文 字 列 の 場 合 は , ス ト ロ ー ク 削 減 で き な い . 文 字 列 を 書 く の が 2 回 目 以 降 の 場 合 , ス ト ロ ー ク 削 減 は で き る . し か し , 使 用 者 が テ キ ス ト を 手 書 き で 入 力 す る 時 , 入 力 し た い 文 字 列 は 以 前 書 い た こ と が あ る か ど う か を 意 識 し て い な い の で , 初 め て 書 く 場 合 の 仕 組 み と 2 回 目 以 降 に 書 く 場 合 の 仕 組 み , 両 方 を 実 装 し て い る . 2 回 目 以 降 に 書 く 場 合 の 仕 組 み で 書 き た い 文 字 列 を 認 識 で き な い 場 合 は , 初 め て 書 く 場 合 の 仕 組 み で 選 択 し , 入 力 で き る .
4. 評 価 実 験
本 章 で は , 第 3 章 で 述 べ た シ ス テ ム を 既 存 の シ ス テ ム と 比 較 す る こ と に よ り , 提 案 手 法 を 評 価 す る .4.1. 実 験 内 容
本 研 究 で は , 2 節 と 3 節 で 述 べ た 以 下 の 2 つ の 手 書 き 入 力 シ ス テ ム で テ キ ス ト を 入 力 す る こ と に よ り 評 価 実 験 を 行 っ た . Mazec-T for Windows
Windows 版 MyScript Stylus 3.2 提 案 手 法 を 実 装 し た シ ス テ ム 実 験 で は , 被 験 者 で あ る 7 名 大 学 生 ・ 大 学 院 生 が 各 手 書 き 入 力 シ ス テ ム で 同 じ テ キ ス ト を 2 回 ず つ 入 力 す る . 被 験 者 を 変 え る 度 に 各 シ ス テ ム を リ セ ッ ト し て い る . 1 回 目 は 被 験 者 の 入 力 し た 単 語 を 入 力 履 歴 に 記 録 し , 手 書 き 筆 跡 を 認 識 モ デ ル に 変 換 す る た め に 行 う . 2 回 目 は 1 回 目 で 学 習 し て 得 た 認 識 モ デ ル を 用 い て 実 施 す る . 被 験 者 が テ キ ス ト を 入 力 し 終 え る 度 に 書 い た ス ト ロ ー ク 数 と , テ キ ス ト の 一 文 字 目 を 書 き 始 め た 時 点 か ら , テ キ ス ト の す べ て 文 字 を 入 力 し 終 わ る 時 点 ま で の 入 力 時 間 を 記 録 す る .ま た ,Windows 版 MyScript Stylus 3.2 と Mazec-T for Windows の 手 書 き エ リ ア に は 枠 が な い た め , 被 験 者 に 1 度 に 書 く 文 字 数 は 4 文 字 以 4 http://mecab.googlecode.com/svn/trunk/mecab/doc/index. 内 と し て 頂 い た . さ ら に , 提 案 シ ス テ ム に 対 す る 慣 れ が ど の 程 度 有 効 か ど う か を 調 べ る た め , 提 案 シ ス テ ム に 慣 れ た 被 験 者 1 名 に よ る 実 験 を 行 っ た .具 体 的 に は , 7 名 被 験 者 の 内 1 名 に 対 し て 実 験 用 入 力 テ キ ス ト 以 外 の 文 章 を 使 い , 1 週 間 練 習 し て も ら い , そ の 後 実 験 を 行 っ た . 評 価 方 法 と し て は , 各 手 書 き 入 力 シ ス テ ム で 2 回 目 に テ キ ス ト を 入 力 し た 際 の ス ト ロ ー ク 数 と 入 力 に か か る 時 間 を 比 較 す る こ と に よ り , 提 案 手 法 の 有 効 性 を 示 す . 提 案 手 法 を 実 装 し た シ ス テ ム で の テ キ ス ト 入 力 に か か る 時 間 と 書 い た ス ト ロ ー ク 数 が , Windows 版 MyScript Stylus 3.2 と Mazec-T for Windows の 2 つ の シ ス テ ム よ り 少 な い こ と よ り , 提 案 手 法 の 有 効 性 を 示 す こ と が で き る .
実 験 環 境 と し て , 今 回 の 評 価 実 験 は CPU が Intel(R) Core(TM) i7-4770 CPU @3.4GHz,メ モ リ が 16.0GB,OS が 64bit Windows 7 の コ ン ピ ュ ー タ で 実 施 し た . ま た , Wacom DTZ-1200W を 手 書 き 入 力 シ ス テ ム と し て 使 用 し て い る .残 念 な が ら ,2.2 と 2.3 で 紹 介 し た POBox の Windows 版 は 手 書 き 入 力 機 能 が 備 わ っ て い な い た め , 実 験 の 比 較 シ ス テ ム に 加 え ら れ て い な い .
4.2. 入 力 データ
今 回 の 評 価 実 験 の た め に , あ る 文 章 の 中 に 存 在 す る4 つ の 文 を 入 力 デ ー タ と し て 使 用 す る . 4 つ の 文 は か な 文 字 , 漢 字 , 助 詞 な ど を 含 む , 意 味 を 持 つ 文 章 で あ る . 文 字 数 は 合 計241 文 字 に な り , ス ト ロ ー ク 数 は 合 計1,252 画 で あ る . た だ し , 今 回 の 実 験 の 入 力 デ ー タ で は 句 読 点 を 含 め な い .4 つ の 文 全 て を 1 つ の 文 章 か ら 選 択 し た 理 由 は , 文 の 主 旨 が 同 じ に な り ,4 つ の 文 の 中 に 同 じ 単 語 の 出 現 回 数 が 多 く な る か ら で あ る .表 2に , 入 力 デ ー タ を Mecab4に よ り 形 態 素 解 析 し た 結 果 得 ら れ た 各 形 態 素 の 出 現 頻 度 を 示 す . 表 2 Mecab に よ り 得 ら れ た 各 形 態 素 の 出 現 回 数 文 字 列 出 現 回 数 文 字 列 出 現 回 数 文 字 列 出 現 回 数 の 8 と 2 周 辺 1 に 7 て 2 主 1 候 補 6 た め 2 室 1 を 6 た 2 山 名 1 入 力 5 そ の 2 行 え 1 予 測 4 し か し 2 効 果 1 単 語 4 あ る 2 語 1 で 4 優 先 1 研 究 1 が 4 問 題 1 学 習 1 html方 式 3 未 知 1 解 決 1 提 示 3 文 章 1 加 え る 1 過 去 3 度 1 位 置 1 な い 3 適 切 1 れ る 1 す る 3 的 1 の み 1 し 3 提 案 1 な る 1 さ 3 低 い 1 な り 1 利 用 2 抽 出 1 な ど 1 者 2 対 象 1 と い う 1 基 づ い 2 存 在 1 そ も そ も 1 れ 2 早 稲 田 大 学 1 こ の 1 は 2 全 く 1 か ら 1 な 2 場 面 1 う る 1 と し て 2 従 来 1 い 1
4.3. 実 験 結 果
実 験 結 果 を 表 3に ま と め た .こ こ で ,ス ト ロ ー ク 削 減 率𝑅𝑠と 時 間 削 減 率𝑅𝑇は そ れ ぞ れ 式 (4) と 式 (5)に よ り 算 出 す る . 式 (4)の𝑆1と𝑆2は 式 (2)よ り 求 め る .式 (2)の𝑆𝑛は 各 被 験 者 が あ る シ ス テ ム をn回 目 に 使 用 し た 際 の 総 入 力 ス ト ロ ー ク 数 の 平 均 を 表 し て い る .式 (2)の𝑚 ∈ 𝑀は 各 被 験 者 ,𝑁𝑚は被 験 者 の 総 数 ,𝑛𝑢𝑚_𝑠𝑡𝑟𝑜𝑘𝑒𝑠(𝑚, 𝑛)は 被 験 者 mが n 回 目 に シ ス テ ム を 利 用 し た 際 に 入 力 し た 総 ス ト ロ ー ク 数 を 表 し て い る . た だ し Mは 被 験 者 の 全 体 集 合 で あ る .ま た ,式 (5)の𝑇1と𝑇2は 式 (3)を 用 い て 算 出 す る .式 (3)の𝑇𝑛は 各 被 験 者 が あ る シ ス テ ム を n 回 目 に 使 用 し 始 め て か ら , 使 用 し 終 え る ま で に か か っ た 時 間 の 平 均 で あ る . 式 (3)の𝑡𝑖𝑚𝑒(𝑚, 𝑛)は 被 験 者 m が n回 目 に シ ス テ ム を 使 用 し 始 め て か ら , 使 用 し 終 え る ま で に か か っ た 時 間 を 表 し て い る . 図 6 に 表 3 の 中 の ス ト ロ ー ク 数 削 減 率 と 入 力 時 間 削 減 率 を 示 し て い る . 𝑆n= 1 Nm𝑚∈𝑀∑ 𝑛𝑢𝑚_strokes(𝑚, 𝑛) (2) 𝑇n=N1 m𝑚∈𝑀∑ 𝑡𝑖𝑚𝑒(𝑚, 𝑛) (3) 𝑅𝑠= 𝑆1− 𝑆2 𝑆2 (4) 𝑅𝑇= 𝑇1− 𝑇2 𝑇2 (5) 表 3 実 験 結 果 手 書 き 入 力 シ ス テ ム 平 均 ス ト ロ ー ク 数 [画 ] ス ト ロ ー ク 削 減 率 [%] 平 均 入 力 時 間 [s] 入 力 時 間 削 減 率 [%] 1 回 目 2 回 目 1 回 目 2 回 目 Mazec 113 7 624. 3 45.1 787.7 501 36.4 MyScri pt 1252 1252 0 1096.6 877.7 19.96 提 案 シ ス テ ム (不 慣 れ ) 105 6 564 46.6 958.3 807. 5 15.7 提 案 シ ス テ ム (慣 れ た 状 態) 100 2 450 55.22 770 541 29.74 図 6 ス ト ロ ー ク 削 減 率 と 入 力 時 間 削 減 率 の 比 較 表 3か ら 同 じ テ キ ス ト を 入 力 す る 際 ,提 案 手 法 を 実 装 し た シ ス テ ム は Windows 版 Mazec-T for Windows よ り , 平 均 ス ト ロ ー ク 数 が 少 な い . し か し , 平 均 入 力 時 間 は 長 く な る こ と が わ か る . 削 減 で き た ス ト ロ ー ク は ほ と ん ど 2 回 目 以 後 に 書 い た 漢 字 の ス ト ロ ー ク で あ る . 助 詞 な ど の ひ ら が な は , も と も と ス ト ロ ー ク 数 が 少 な い の で , 書 き 終 え る 場 合 が 多 い . 平 均 ス ト ロ ー ク 数 が 少 な い こ と か ら , 提 案 手 法 に よ り ス ト ロ ー ク 数 の 削 減 33.96 0 53.02 55.22 34.7 19.96 20.94 29.74 0 10 20 30 40 50 60 削減率 [%] スロトーク削減率 入力時間削減率は 実 現 で き て い る . し か し , 平 均 入 力 時 間 が 長 い 原 因 と し て は , 以 下 の 3 つ が 考 え ら れ る . 実 験 者 が 提 案 手 法 の シ ス テ ム の 使 い 方 に 慣 れ て い な い . 提 案 し た 手 法 は 書 く 頻 度 の 高 い 単 語 に 対 し て , 単 語 の 各 漢 字 を 途 中 ま で し か 書 か な く と も , 希 望 す る 単 語 を 動 的 に 予 測 す る . し か し 各 文 字 を 途 中 ま で 書 く 時 , ど こ ま で 書 く と 候 補 に 出 て く る か は , 初 め て シ ス テ ム を 使 用 す る 実 験 者 に と っ て 把 握 し に く い .そ れ に よ り , ス ト ロ ー ク を 書 く ご と に 予 測 候 補 列 を 確 認 す る が , ス ト ロ ー ク を 書 く ご と に 候 補 列 を 確 認 す る と 時 間 が か か る . そ し て , 被 験 者 の 中 の 1 人 が 提 案 手 法 の シ ス テ ム に 慣 れ る ま で 練 習 し た 後 は ,入 力 時 間 削 減 率 が 29.74% に な り ,入 力 ス ト ロ ー ク 削 減 率 も 55.22%ま で 実 現 で き た . よ っ て , 提 案 手 法 の シ ス テ ム に 慣 れ な い う ち は か な り 時 間 が か か る が , 慣 れ れ ば 入 力 速 度 が 向 上 で き る と 思 わ れ る . 手 書 き エ リ ア の 枠 に よ る 手 の 移 動 に 時 間 が 掛 か る . 図 5 の よ う に , 今 回 実 装 し た イ ン タ ー フ ェ イ ス の 手 書 き エ リ ア に は 4 つ の 枠 が あ る .実 験 者 が 文 字 列 を 書 く 時 , 枠 に 合 わ せ て ス ト ロ ー ク を 書 き , 1 度 に 4 文 字 し か 書 け な い .し か し ,こ の よ う に 枠 に 合 わ せ て 書 く こ と は 時 間 が か か る だ け で は な く ,実 験 者 が 連 続 し た テ キ ス ト を ど こ で 切 り 分 け る か を 先 に 考 え な け れ ば な ら な い .こ の 問 題 を 解 決 す る に は ,手 書 き エ リ ア の 枠 を 取 り 除 き ,自 由 に 書 い て も 自 動 的 に 文 字 ご と に 切 り 出 せ る 仕 組 み を 加 え れ ば 良 い と 考 え ら れ る . 予 測 が 失 敗 し , 書 き 直 す 場 合 に 時 間 が 掛 か る . 認 識 エ ン ジ ン の Zinnia は 書 き 順 や 速 書 に 弱 い .使 用 者 が 少 し 速 く 文 字 を 書 い た り ,書 き 順 を 変 え た り し た 時 , Zinnia が 認 識 で き な く な り , 全 く 関 係 の な い 認 識 結 果 を 出 し て し ま う .そ し て Zinnia の 認 識 結 果 に よ る 組 み 合 わ せ も 大 幅 に 変 化 し ,希 望 す る 単 語 が 予 測 候 補 列 に 表 示 さ れ な い 場 合 が あ る .そ の 時 は 使 用 者 が 書 き 直 す し か な い . こ の 問 題 を 解 決 す る に は , Zinnia の 代 わ り に 書 き 順 と 書 く 速 度 の 変 化 に 強 い 認 識 エ ン ジ ン を 使 用 す れ ば 良 い と 考 え ら れ る .
5. ま と め
本 稿 で は , 書 く 頻 度 の 高 い 単 語 に 対 し て , 書 く 必 要 の あ る ス ト ロ ー ク 数 を 減 ら す こ と に よ り 手 書 き 入 力 を 高 速 化 す る 手 法 に つ い て 述 べ た . オ ン ラ イ ン 手 書 き 文 字 認 識 を 用 い て テ キ ス ト 入 力 を 行 う 既 存 の 研 究 で は , 予 測 機 能 や 動 的 検 索 を 用 い て , 入 力 速 度 を 向 上 さ せ て い る が , 各 漢 字 を 完 全 に 描 い た 後 で な い と 認 識 結 果 に 書 き た い 文 字 が 表 示 さ れ ず , 画 数 の 多 い 漢 字 を 認 識 さ せ る た め に は 手 の 動 き と 時 間 を か な り 要 す る こ と に な る . そ れ に 対 し , 提 案 手 法 で は , 使 用 者 の 筆 跡 で 作 成 し た 認 識 モ デ ル を 持 つ 手 書 き 文 字 認 識 エ ン ジ ン Zinnia を 使 用 し , 辞 書 と し て Google 日 本 語 n-gram の 1-gram を 用 い て , 文 字 列 の 出 現 頻 度 と 文 字 認 識 結 果 の 総 合 評 価 に よ り 候 補 文 字 列 の 推 薦 順 位 を 決 め る . こ の 手 法 を 利 用 す る こ と に よ り , 途 中 ま で し か 文 字 を 書 か な く と も , 書 き た い 文 字 を 予 測 で き る よ う に な る . ス ト ロ ー ク を 書 く 回 数 の 削 減 率 が 53.02%に な り ,オ ン ラ イ ン 手 書 き 文 字 入 力 シ ス テ ム Mazec, MyScript の ス ト ロ ー ク 削 減 率 0%,33.96%よ り 多 く 削 減 で き る こ と よ り , 提 案 手 法 の 有 効 性 を 示 し た . 今 後 の 課 題 と し て は , 本 研 究 で 入 力 に か か る 時 間 の 短 縮 を 出 来 な か っ た 原 因 の 解 決 が あ る . 提 案 手 法 の シ ス テ ム の 使 い 方 に 慣 れ て い な い こ と に 対 し て は , シ ス テ ム を た く さ ん 利 用 す れ ば 解 決 で き る . 書 く エ リ ア の 枠 に よ る 手 の 移 動 に 時 間 が 掛 か る に 対 し て は , イ ン タ ー フ ェ イ ス の 手 書 き エ リ ア の 枠 を 取 り 除 き , 自 由 に 書 い て も 自 動 的 に 文 字 ご と に 切 り 出 せ る 仕 組 み を 加 え れ ば , 解 決 で き る . 予 測 が 失 敗 し , 書 き 直 す 場 合 に 時 間 が 掛 か る 事 に 対 し て は , Zinnia の 代 わ り に 書 き 順 と 筆 画 数 に 強 い 認 識 エ ン ジ ン を 使 用 で き れ ば 解 決 で き る と 考 え ら れ る .参 考 文 献
[1]. 増 井 俊 之 ,“ ペ ン を 用 い た 高 速 文 章 入 力 手 法 ”,日 本 ソ フ ト ウ ェ ア 科 学 会 WISS’96,pp.51-60,近 代 科 学 社 , December 1996. [2]. 増 井 俊 之 ,“ 動 的 パ タ ン マ ッ チ を 用 い た 高 速 文 章 入 力 手 法 ”, 日 本 ソ フ ト ウ ェ ア 科 学 会 WISS’97, pp.81-86, 近 代 科 学 社 , December 1997. [3]. 朱 碧 蘭 ,中 川 正 樹 ,“ オ ン ラ イ ン 手 書 き 文 字 認 識 の 最 新 動 向 ”,IEICE Vol. 95,No. 4,pp.335-340,2012. [4]. 増 井 俊 之 ,“ イ ン タ ー フ ェ イ ス の 街 角 (6) POBox の 予 測 手 法 と 辞 書 の 作 成 ”, Unix Magazine, pp.1-7, May 1998. [5]. MyScript テ ク ノ ロ ジ , http://www.visionobjects.com/jp/myscript/about -myscript/myscript-technology/description/ ,Accessed on 2013/12/17. [6]. Zinnia: 機 械 学 習 ベ ー ス の ポ ー タ ブ ル な オ ン ラ イ ン 手 書 き 文 字 認 識 エ ン ジ ン , http://zinnia.sourceforge.net/index -ja.html,Accessed on 2013/12/17.[7]. Hiroyuki Komatsu, Taku Kudo, Yusuke Tabata, Jun Mukai, Toshiyuki Hanaoka & Yohei Yukawa, “ Development of Predictive Input System”, コ ン ピ ュ ー タ ソ フ ト ウ ェ ア ,Vol.28,No.4,pp.17-22,2011. [8]. Mazec-T for Windows ,
http://product.metamoji.com/enterprise/mazec -point/ , Accessed on 2013/12/17 .