<研究報告>漢字字画による日本語漢字入力支援シス テムの提案と実装
著者 張 小剛, 高 建斌, 高橋 勇, 黒岩 丈介, 小高 知 宏, 小倉 久和
雑誌名 福井大学工学部研究報告
巻 51
号 2
ページ 173‑180
発行年 2003‑09‑30
URL http://hdl.handle.net/10098/827
Mem.Fac.Eng.FukuiUniv.,Vol.51,No.2(September2003)
漢字字画 による 日本語漢字入 力支援 システ ムの提案 と実装
張 小 剛*高 建 斌 帥 高 橋 勇 嘩紳 黒 岩 丈 介 廓躰 小 高 知 宏 躰*小 倉 久 和 紳零
Japanese Character Input Auxiliary Method by Character Strokes
Xiaogang ZHANG *, Janbin GAO**, Isamu TAKAHASI***
Josuke KUROIWA***, Tomohiro ODAKA*** and Hisakazu OGURA ***
(Received August 11, 2003)
\2
The input system of the Japanese mainly is constructed on the kana character input or Japanese Roman alphabet input by Japanese Pronunciation. This system is difficult to operat for the foreign Japanese beginner who does not understand Japanese pronunciation, especially the pronunciation of the kanji's. In this paper in order to overcome the difficulty, we propose the system which support the kanji strokes input auxiliary method (the, JCSIM). We built the Japanese input system using this JCSIM method. We performed the experiment to evaluate this system by three foreign Japanese beginners. The results showed that the time to input Japanese sentence was decreed by using this JCSIM proposed here compared with the normally Roman alphabet inputting method.
Key Words : Japanese Kanji, Input System,
1.は じ め に
Kanji Strokes
現 在,コ ン ピ ュ ー タ へ の 入 力 装 置 と して キ ー ボ ー ド,ラ イ トペ ン,タ ッ チ パ ネ ル,音 声 入 力 シ ス テ ム な ど様 々 あ る が,ま だ,キ ー ボ ー ドが 最 も 有 力 な 入 力 装 置 で あ る 田.パ ー ソナ ル コ ン ピ ュ ー タ と イ ン タ ー ネ ッ トの 普 及 に よ っ て
,日 本 人 が 英 語 を キ ー ボ ー ド入 力 す る 機 会 が 増 加 す る 一 方 で 日 本 国 内 の 外 国 人 が 日本 語 を キ ー ボ ー ド入 力 す る 機 会 も 増 加 し て い る.ま た,日 本 語 教 育 の 現 場 で も,外 国 人 が 利 用 す る た め の 日本 語 ホ,..̲.ムペ ー ジ の 開 設,あ る い は, E‑mai1や イ ン トラ ネ ッ トを利 用 し た 日本 語 作 文 指
廓大 学 院 工 学 研 究 科 情 報 工 学 専 攻
*s大 学 院 工 学 研 究 科 シ ス テ ム 設 計 工 学 専 攻
*s*知 能 シ ス テ ム 工 学 科
、
̀lnformationEngineeringCour
se,GraduateSchool ofEngineering
"̀SystemDesigllEnginee血gCourse
,Graduate SchoolofEngineering
*'"D
ept.ofHumanandArtificialIntelligentSystems
, Foreigner Japanese Beginner
導 な どが,外 国 人 が 日本 語 を キ ー ボ ー ド入 力 す る こ とを前 提 と して 実 施 され て い る[21.
とこ ろ で,ほ とん どの 日本 語 入力 シ ス テ ム は,キ ー ボー ドで誤 入 力 した場 合 へ の 対応 な ど 「入 力 支 援 」 機 能 を充 実 させ て,使 いや す く して い る.し か し, 外 国 人 留 学 生 に とっ て は この支 援 機 能 は 役 立 って お
らず,外 国 人 留 学 生 に対 す る入 力 支 援 シ ス テ ムは ま だ 未 開 発 とい っ て よい[2】.
キー ボ ー ドを用 い た 日本 語 入 力 方 式 に は,主 にカ ナ 文 字 入 力 と ロ..̲̲マ字 入 力 が あ る田.漢 字 は 入 力 さ れ た 漢 字 の 読 み カ ナ を変 換 して入 力 す る の が 主 流 で あ る.文 字 の 読 み 方 に よ る この二 種 類 の入 力 方 式 は,
日本 語 の 読 み 方 が 分 か る人 とっ て は簡 便 で あ るが, 日本 語 の 読 み 方,特 に 日本 語 の漢 字 の 読 み 方 が 分 か らな い 外 国 人 日本 語 初 心 者 に とっ て は 大 変難 しい 操 作 で あ る圃.
漢 字 を含 む 言 語 を母 語 と しな い外 国 人 留 学 生 は, 漢 字や 漢 字 単 語 の 意 味 を覚 え る 際 に読 み もい っ し ょ に 覚 え な けれ ば な ら ない.日 本 語 文 章 を入 力 す る際 に は,意 味 と読 み の 両 方 とも分 か っ て い る語 だ け 使 うこ とに な る.し か し,た とえ ば 中 国語 を 母 語 と し て い る 外 国 人 留 学 生 は 日本 語 を勉 強 した こ とが な く
174
て も,日 本 語 の ほ とん どの 漢 字 や 漢 字 を含 む 単 語 の 意 味 が 分 るの で,読 み を 知 らな く て もそ の よ うな 単 語 を使 うこ とが で き る.こ の よ うな漢 字 と単語 を コ ン ピュ ー タ に入 力 す る場 合,こ れ らの 留 学 生 に は 漢 字 単 語 の 意 味 が 分 か っ て い るの に 入 力 で き な い とい
う問 題 が生 じ る.
一 方,現 在 い ろい ろ な 日本 語 電 子 辞 書 が 開 発 され て い る.外 国 人 留 学 生 が未 知 の 単 語 の 意 味 を調 べ る
に は これ らの 電 子 辞 書 が よ く役 立 つ.し か し,そ の た め に は,や は り,そ の 読 み が 分 か らな けれ ば な ら な い。 留 学 生 の 多 くは読 み が 分 か らな い 単 語 の意 味 を調 べ る とき,ま ず 紙 製 の 日本 語 辞 書(漢 字 辞 書)で 読 み を調 べ て か ら,次 に読 み を 電 子 辞 書 に入 力 して, 単 語 の 意 味 を 調 べ る.し か し,こ れ は 手 間 が か か る [4].わ れ われ は,読 みが分か らな くて も簡単 に漢 字
を入 力 で き る補 助 方 式 を検 討 して きた.
以 上 の よ うな観 点 か ら,漢 字 圏 の 日本 語 初 学 者 に とって は読 み 方 が 分 か らな くて も少 数 の キー 入 力 で, 漢 字 を効 率 的 に 入 力 で き る 日本 語 入 力 方 式 が 必 要 と
な る.
漢 字 の形 は漢 字 の 一 つ の重 要 な 特 徴 で あ る.特 に 漢 字 に馴 染 ん だ 中国 人 に とっ て漢 字 の 形 は漢 字 の最 も理 解 しや す い 特 徴 で あ る.漢 字 の 読 み は予 め覚 え て い な い と,読 み が い つ ま で も分 か らな い.と ころ で,少 し漢 字 の 常 識 を持 っ て い る 入 力者 は漢 字 の構 成 要 素 の解 析 が で き る.漢 字 に馴 染 ん だ 中国 人 で な くて も,少 し漢 字 の 常 識 を持 っ て い れ ば,他 の 国 の 人 で も漢 字 の 形 を理 解 で き る.こ こで は 漢 字 の形 で 漢 字 を 入力 す る方 式 を採 用 し,そ れ に よ る入 力 補 助
を検 討 す る.
本 報 告 で は 日本 語 の読 み 方 に よ らな い,少 数 キ ー を 用 い る 日 本 語 漢 字 字 画 入 力 補 助 方 式 JCSIM(JapaneseCharacterStrokesInputMethod)
法 を提 案 し,提 案 シ ステ ム の評 価 実 験 を行 っ た結 果 を報 告 す る;
2.JCSIM入 力 方 式 に よ る 漢 字 の 入 力
2.1漢 字 の形 に よ る入 力 方 式
中 国 で よ く利 用 され て い る漢 字 の 入 力 方 式 は 「ピ ンイ ン」(読 み 方)入 力方 式 で あ る が,そ れ 以 外 で は
「五 筆 字 型 」 とい う入 力 方 式 が あ る.こ れ は漢 字 の 部 首 を 用 い た 入 力 方 式 で あ る.漢 字 の部 首 を用 い た 入 力 方 式 には 次 の 利 点 が あ る.
O一 つ の 入 力 コー ドに 二 つ 以 上 の 漢 字 が 定 義 され る こ とは 殆 ん どな い の で,入 力者 は候 補 か ら入 力 した い漢 字 を 選 択 す る 手 間 が 不 要
で あ る.入 力 者 は デ ィ ス プ レー を 見 な く て も, 入 力 で き る.
● 熟 練 す る と,入 力 速 度 は か な り速 い.速 い 人 は 一 分 間 に 二 百 以 上 の 漢 字 を 入 力 で き る.
しか し,次 の よ う な 問 題 点 が あ る.
i
e
部 首 が 多 い の で,覚 え に くい.中 国 漢 字 の 部 首 は 百 八 十 九 個[5】,日本語 漢 字 部 首 は約 二 百 四十 個[6]ある.入 力 者 は これ らの 部 首 を定 義 した キ ー を 全 て 覚 え な けれ ば な らな い.入 力 者 に負 担 が か か る.
長 時 間使 わ ない と忘 れ や す い か ら,ま た 使 う 時 に は も う一 度 覚 え な お さ な け れ ば な ら な い.
文 書 処 理 を 職 業 と し て い る 人 に と っ て は 少 々 覚 え に く く て も,熟 練 す る と速 く入 力 で き る 入 力 方 法 が 良 い 方 法 で あ る.し か し,た ま に 文 書 処 理 を す る よ うな 人 に と っ て は あ ま り有 効 で は な い と 考 え ら れ る.
漢 字 字 画 の 種 類 の 数 は 部 首 よ りか な り少 な い.そ して,字 画 の 構 造 も部 首 よ り単 純 で,分 類 しや す い.
入 力 に 漢 字 の 字 画 を 用 い る こ と に よ り,初 学 者 に も わ か り や す い 入 力 方 式 と す る こ と が で き る.
JCSIM(JapaneseCharacterStrokesInputMethod)
方 式 は こ の 方 式 に よ る 日本 語 入 力 シ ス テ ム の 補 助 シ ス テ ム と して 用 い る.
2.2JCSIM入 力 方 式 の 概 要
JCSIM方 式 で は,全 て の漢 字 字 画 を 六 種 類 に 分 け, 一 っ ず っ ,六 つ のキーを対応 させ る.入 力す る時, 漢 字 を字 画 に分 析 して,漢 字 の 書 き順 に よ って 一 つ ず つ 字 画 と対 応 す る キ ー を タ イ プ す る こ とで 漢 字 を 入 力 す る.同 じ入 力 コー ドに 二 つ 以 上 の 漢 字 が 対 応 す る場 合 は,そ れ らの 漢 字 に番 号 を つ け て 表 示 し, 入 力 者 は 番 号 を入 力 して,漢 字 入 力 を 終 了 す る.
読 み が 分 か っ て い る漢字 を入 力 す るに は や は りロ ー マ 字 とか な変 換 な どの 読 み に よ る入 力 方 式 が 便 利 で あ る.JCSIM方 式 は,補 助 入 力 方 式 と して,読 み が 分 か らな い漢 字 を 入 力す る場 合 の み 使 うこ と とす
る.
2.3入 力 に用 いる字 画
入 力 に用 いる字 画 を選 択 す るため に各 字 画 の 出 現 頻 度 につ いて の調 査 を行 った.EUCコ ー ドの漢 字282 文 字 を字 画 ごとに分 析 して各 字 画 の 出 現 頻 度 を求 め た 結 果 を表1に 示 す.出 現 頻 度 が 高 い 字 画 「イチ 」,「タテ ボウ」,「ヒダ リハ ライ」と「ハ ネボウ」を入 力 に用 い る字 画
表1字 画出現頻度調査表 表2漢 字字画定義表
字画名称
イ チ タテ ボ ウ ヒ ダ リハ ラ イミ ギ ハ ラ イ ハ ネ ポ ウ
テ ン オ レ ソ ノ タ
合計
字画
ノ
、
J
、
乙 ほ か
出現頻度
502 348 401 303 321 215 205 101 2369
字画名称
イ チ タテ ボ ウ ヒ ダ リハラ イ ミギハ ライ
及 び テ ン ハ ネ ポ ウ ソ ノ タ
字画
ノ
、
1 ほ か
定義
左 か ら右 へ の 水 平 的 な字 画 上 か ら下 へ の 垂 直 的 な字 画 右 上 か ら左 下 へ ま た は左 下 か
ら右 上 へ の 字 画 左 上 か ら右 下 へ の字 画 字 画"1"の 終 点 に は ね が あ る
字 画(は ね の 方 向 と無 関 係) 上 記 以 外 のす べ て の 字 画
表3漢 字 宇 画 と入 力 キ ー の 対 応
、
嵐 榊 4
砂\
点 と間違いやすい
点 と蘭違いやすい
ヤ\
右はらい字画名称
イ チ タ テボ ウ ヒ ダ リハ ラ イ ミギハ ライ 及 び テ ンハ ネ ポ ウ ソ ノ タ
字画
ノ
、
1 ほ か
キ ー S D F J K L
入 力 者 に 負 担 を か けな い た め に,JCSIM方 式 で 一 つ の漢 字 を入 力 す る た め の入 力 字 画 数 を最 大 五 画 と
して い る.入 力 方 法 は,字 画 数 に よ っ て 次 の 三 つ の 場 合 に分 け る:
図1漢 字 字 画 区別 の 例
として 採 用 す る.出 現 頻 度 が 低 い 字 画 「オ レ 」と「ソノタ 」 を 合 併 して 「ソノタ」とす る 。
字 画 「ミギ ハ ラ イ 」 と 「テ ン 」 は 分 類 し に く い 場 合 が 多 い.図1の 例 の よ うに,漢 字 「木 」 と 「小 」 の 字 画 「ミ ギ ハ ラ イ 」は 漢 字 「村 」 「砂 」の 中 で は 「テ ン 」 と 間 違 わ れ や す い.ま た,漢 字 「林 」の 右 の 「木 」 の 最 後 の 字 画 の 正 し く は 「ミ ギ ハ ラ イ 」 で あ り,左 の 「木 」 の 最 後 の 字 画 も 同 じ で あ る が,後 者 は 「テ
ン 」 と間 違 わ れ や す い.と こ ろ で,字 画 「ミ ギ ハ ラ イ 」 と 字 画 「テ ン 」 の 出 現 頻 度 は と も に 低 い の で こ の 二 種 類 の 字 画 を 合 併 す る.
こ れ ら 六 種 類 の 字 画 の 定 義 を 表2に 示 す.
以 上 の 六 種 類 の 字 画 に 対 し,表3の よ う に,一 つ ず つ キ ーrS」,rD」,rF」,rJ」,rK」,rL」 を 割 り 当 て た.こ れ ら は キ ー ボ ー ド中 段 左 手 の 方 の 三 っ と右 手 の 三 つ の キ ー で あ り,一 番 使 い や す い キ ー で あ る.
2.4入 力 規 則
123
五 画未 満:漢 字 の 書 き順 に よ り,実 際 の 字 画 キ ー をす べ て 入 力 して か ら
,ス ペ ー ス キ ー を入 力 す る.
五 画:漢 字 の 書 き順 に よ り,実 際 の 字 画 キ ー を す べ て入 力 す る.
五 画以 上:漢 字 の 書 き順 に よ り,最 初 の 四 画 の キ ー を 入 力 して か ら,最 後 の 一 画 を入 力 す る.
漢 字 の 画 数 が 五 画 以 上 の 場 合 で は 初 め の 五 画 を 入 力 す る の で は な く,初 め の 四 画 と最 後 の 字 画 を 選 ぶ が,そ の 理 由 は 同 じ 漢 字 コ ー ドに 対 応 す る 文 字 を 減 らす た め で あ る.例 え ば,「 言 」,「設 」,「記 」,「計 」 の 字 画 コ ー ドは 初 め の 五 画 で コ ー ドす る と,全 て 同
じ で あ る.JCSIM方 式 で は 最 初 の 四 画 と 最 後 の 一 画 で 漢 字 を 入 力 す る か ら,「 言 」,「設 」,「記 」,「計 」の 字 画 コ ー ドは そ れ ぞ れ 「一,一,一,一,一 」,「一, 一,一,一 一,\ 」,「一,一,一,一,ソ ノ タ 」,「一, 一,一,一,1」 と な り,同 じ字 画 コー ドの 漢 字 の 数 を 減 らせ る.
176
表4入 力 字 画 例 表6候 補 と字 画 コー ド状 況 図
小 倉 研 究 室
第 一 画 J ノ
、
\
第二画
ノ
\
ノ ノ ノ
第三画
\
ソ ノ タ ソ ノ タ
第四画
ソ ノ タ ソ ノ タ
ノ
第五画
ソ ノ タ
表5入 力 キ ー 例
候補数
1 2^‑9 10^‑19 20^‑29 30^‑39 40^‑49
50^一
字 画 コ,̲.̲.ド 数
568 645 114 44 1fi 13 12
小 倉 研 究 室
第 一 画 K F S J J
第二画
F J F F F
第三画
JS D L L
第四画
ス ペ ー ス L L F s
第五画
s D L S
予 キス トエデ ィタE㎜5
本 シ ス テ ム とE㎜05の イ ン タ フ ヱー ス フ麟 ン ト
4iL̀
同 じ字 画 コー ドに多 数 の漢 字 を持 つ 場 合 は,す べ て の候 補 漢 字 に番 号 をつ け て入 力 者 に表 示 す る.入 力 者 は番 号 を 選 ぶ こ とで入 力 した い 漢 字 を選 ぶ.
表4と 表5は 「小 倉 研 究 室 」 を 入 力 す る際 の 入 力 字 画 例 とJCSIM法 に よ る入 力 キ ー 列 で あ る.
漠字霜 コー ド生成
搬
鰍漠宰出力2.5JCSIM方 式 に お け る 漢 字 コ ー ド
同 じ 字 画 コ ー ドは 多 数 の 漢 字 を 持 つ 場 合 が あ る.
調 査 に よ っ て,現 在JCSIM方 式 に 基 づ い て,作 成 し た シ ス テ ム の 候 補 数 と字 画 コ ー ド数 の 状 況 を 表6に 示 す.
漠寧検索処環
糠 掃ド
」18‑・ ホ準2働 漠宇 雌 第 二水準ηgo濃 字
開擁 言 語 茎C
プ ラ ッ トフ ォ ーム 婁UNDく
3.JCSIH方 式 に 基 づ く入 力 支 援 シ ス テ ム
3.1シ ス テ ム の 概 要
JCSIM方 式 に 基 づ く提 案 シ ス テ ム はC言 語 で 作 成 し た.更 に 「UNIX」 上 の テ キ ス トエ デ ィ タ 「Emacs」
で 利 用 可 能 に す る た め に,イ ン タ フ ェXを 「Emacs Lisp」 で 作 り,「Emacs」 に 組 み 込 ん だ.入 力 者 は コ ン ト ロ ー ル キ ー を 押 し な が ら,キ ー 「x」 と 「o」 を 押 す こ とで,「Emacs」 の フ ロ ン トエ ン ド(か な 漢 字 変 換 シ ス テ ム)か ら本 シ ス テ ム(JCSIM入 力 方 式)に 切 替 え で き る.本 シ ス テ ム か ら 「Emacs」 フ ロ ン トエ ン ドへ の 切 替 え は 一 文 字(漢 字)の 入 力 が 終 っ た 時 に, 自動 的 に 行 な わ れ る.本 シ ス テ ム は 図2に 示 す よ う に 「漢 字 字 画 コ ー ド生 成 」,「漢 字 検 索 処 理 」,「字 画 コ ー ド定 義 辞 書 」,「多 漢 字 出 力 と 多 漢 字 出 力 入 力 者 選 択 」 と 「単 漢 字 出 力 」 か ら な る.シ ス テ ム 各 部 に
お け る 処 理 の 詳 細 を 「シ ス テ ム 構 成 」 で 述 べ る.
図2JCSIM方 式 に も とつ く シ ス テ ム 構 成
3.2シ ス テ ム 構 成
(1)漢 字 字 画 コ ー ド生 成
漢 字 を 検 出 す る た め に,漢 字 の 一 文 字 ず つ の 字 画 コ ー ドが 必 要 と な る.「 漢 字 字 画 コ ー ド生 成 」 で は, 入 力 者 か ら の 入 力 が 一 漢 字 の 字 画 コ ー ド に な る か を チ ェ ッ ク す る.rJCSIM方 式 」で は 一 漢 字 の 完 全 の 字 画 コ ー ドは ロ ー マ 字 五 つ ま た は ロ ー マ 字 四 つ 以 下 の 最 後 に ス ペ ー ス を 付 け た も の の 二 種 類 が あ る.こ れ は 漢 字 字 画 コ ー ド生 成 の 基 準 と な る.
(2)漢 字 検 索 処 理
漢 字 検 索 処 理 で は字 画 コー ド定義 辞 書 との イ ン タ フ ェー ス を定 義 す る 。 これ は漢 宇 を検 出す るた め の 字 画 コー ドと検 出 され た漢 字 の通 路 とい え る.ま た,
表7EUCコ ー ド漢 字 ア ド レ ス
#defineA16̀¥xbσ'
#defineA17̀¥xb1'
#defineA18̀¥xb2'
#defineA19̀¥xb3'
#defineA20̀¥xb4'
#defineBO1̀¥xa1'
#defineBO2̀¥xa2'
#defineBO3̀¥xa3'
#defineBO4̀¥xa4'
#defineBO5̀¥xa5'
#defineF(u,v)*(b+n)=u;(b+n+1)=v;
(4)多 漢 字 出 力 と多 漢 字 出 力 入 力 者 選 択
同 じ字 画 コー ドは 多 数 漢 字 を持 つ 場 合 が あ る.こ の 場 合 で は入 力者 の 選 択 機 能 が 必 要 とな る.「 多 漢 字 出力 と多 漢 字 出力 入 力 者 選 択 」 は 入 力 者 の選 択 機 能 を提 供 す る.同 じ字 画 コー ドに 定 義 され た全 て の 漢 字候 補(予 めEUCコ ー ド漢 字 ア ドレス でEUCコ ー ド か ら漢 字 を呼 び 出 す 〉に 番 号 を つ け て 入 力 者 に表 示 す る.更 に,入 力 者 か らの番 号選 択 に 対 応 す る漢 字 を出 力 す る機 能 を持 つ.
(5)単 漢 字 出 力
字 画 コー ドは 単 漢 字 を持 つ 場 合 で はEUCコ ー ド漢 字 ア ドレス でEUCコ ー ドか ら漢 字 を 呼 び 出 し,出 力 す る機 能 を持 つ.
表8字 画 コー ド定義 辞 書
S SS SSS SSSSS SSSSS SSSSS SSSSS
F(A16,B76) F(A38,B83) F(A27,B80) F(A16,B66) F(A21,B35) F(A21,B45) F(A22,B64)
3.3シ ス テ ム の 支 援 機 能 と利 用 法
JCSIM方 式 に 切 替 え す る に は,rEmacs」 上 の フ ロ ン トエ ン ドで コ ン トロ ー ル キ ー を 押 しな が ら 「x」を 押 した 後 で 「o」を 押 す.読 み が 分 か ら な い 漢 字 を 入 力 す る 際 だ け にJCSIM方 式 を 使 うの で,入 力 者 は 多 数 の 場 合 で は フ ロ ン トエ ン ドで 日本 語 文 書 を 入 力 す る こ と を 考 え て,入 力 者 に 便 利 を 図 る た め に,JCSIM 方 式 で 一 つ の 漢 字 を 入 力 し終 え た ら,シ ス テ ム は 自 動 的 に フ ロ ン トエ ン ドに 戻 る.
「漢 字 検 索 処 理 」で は,「 多漢 字 出力 と多 漢 字 出力 入 力 者 選 択 」,「単 漢 字 出力 」 の イ ン タ フ ェ ー ス を 定義 す る.漢 字 字 画 コー ドに対 す る処 理 と検 出 され た漢 字 に対 す る処 理 を行 う.
BuffersFilesIOO】LsEditS●arch随"ユ0曾 吐n11圓2『 隠0ユP 漢 与 字 画 に る 日 。 ξ 子
(3)字 画 コ ー ド定 義 辞 書
「字 画 コ ー ド定 義 辞 書 」 は 人 手 に よ り 作 っ た も の で あ る.最 終 の 出 力 漢 字 をEUCコ ー ドか ら呼 び 出 す た め,字 画 コ ー ド定 義 辞 書 に は 検 索 用 イ ン デ ッ ク ス とEUCコ ー ド漢 字 ア ド レ ス の 組 が 記 録 され て い る.
表7に 示 す よ う に,字 画 コ ー ド定 義 辞 書 で は 予 め EUCコ ー ド漢 字 ア ドレ ス(行 と列 二 つ の 部 分 か ら な る)とEUCコ ー ド漢 字 ア ド レ ス を 保 存 す る ポ イ ン ト を 定 義 し,辞 書 の 中 でEUCコ ー ド漢 字 ア ド レ ス の 定 義 した 文 字 列 を 使 っ てEUCコ ー ド漢 字 ア ド レ ス を 表 記 し,EUCコ ー ド漢 字 ア ド レス を 定 義 し た 保 存 す る ポ イ ン トに 保 存 す る.検 索 用 イ ン デ ッ ク ス は 「漢 字 字 画 コ ー ド生 成 」で 生 成 した 字 画 コ ー ドで あ る.「 字 画 コー ド定 義 辞 書 」 に はJIS第 一 水 準2,965漢 字 と 第 二 水 準3,390漢 字 を 登 録 した.こ れ に よ り,一 般
的 な 日本 語 文 章 の 全 て の 漢 字 は 本 シ ス テ ム で 入 力 で き る と考 え る.
21221415搬16‑1718192° \}
ロ 麗 膿 贈四 閏門岡 四 岡 岡 曝,
毛{{{ 壱 く図3入 力 画 面1
178
表9入 力 者 デ ー タ
BuffersFilesToolsEditSearchMuleHelp
鰯 占画による日本語漢字支擾圏
入力者
A B C
専門 材料開発
機械 情報処理
日本 に の在 留 期 間(月)
22 10 4
日本語 学 習 時 間(時 間)
約1,200 約350 約300
表10実 験 用 文 デ ー タ
文番号
F1 F2 F3
文源 業 日本語 日本建築史 史籍雑纂
総字数
132 181 117
漢 字数
50 103 117
仮名 数
82 7s 0
漢字率 38%
57%
100
圃i團圃國 國團 圏圏■團團 圃 團團團 ■■ ■ 国薩
図4入 力 画 面2
入 力 され た 字 画 コ ー ドが 多 数 の 漢 字 を 持 つ 場 合 は 図3の よ うに 「E鵬acs」の バ ッ フ ァ は 自動 に 二 つ に 分 か れ る.上 の バ ッ フ ァ は 元 の エ デ ィ タ 画 面 を 表 示 す る.下 の バ ッ フ ァ は 番 号 を つ け た 候 補 を 表 示 す る.
入 力 者 が 番 号 を 入 力 して 漢 字 を 選 ん だ ら,図4の よ うに 下 の ベ ッ フ ァ は な く な る.エ デ ィ タ を表 示 す る 上 の バ ッ フ ァ は 元 の サ イ ズ に 戻 る.シ ス テ ム は
「Emacs」 の エ デ ィ タ 状 態 に 戻 る.
4.実 験 と評 価
提 案 シ ス テ ム の 有 効性 を確 認 す る た め,評 価 実 験 を行 った.
日本 語 入 力 シ ス テ ム は2種 類 用 意 し た.入 力 シ ス テ ムRはJCSIM方 式 を 組 み 込 ん で い な い ロー マ 字 入 力 シ ス テ ム で あ り,入 力 シ ス テ ムJはJCSIM方 式 を 組 み 込 ん だ シ ス テ ム で あ る.入 力 はA,B,Cの 順 に 行 っ た.各 入 力 者 は ま ず 入 力 シ ス テ ムRで 文F1を 入 力 し て か ら入 力 シ ス テ ムJで 文F1を 入 力 す る.
次 に 入 力 シ ス テ ムRで 文F2を 入 力 し て か ら入 力 シ ス テ ムJで 文F2を 入 力 す る.F3に つ い て も 同 様 に 繰 り返 す.実 験JCSIM方 式 で 漢 字 を 入 力 す る の は, 読 み が 分 か ら な い 漢 字 の み と した.
4.2実 験 結 果 と実 験 評 価
各 入 力 者 はJCSIM方 式 を組 み 込 ん だ 入 力 シ ステ ム Jで 文 を入 力 す る時,読 み が分 か らな い漢 字 をJCSIM 方 式 で 入 力 す る.入 力 の 時JCSIM方 式 で 入 力 した漢 字 の 数 とそ の利 用 率 を表11に 示 す.図5はJCSIM 方 式 の 利 用 率 の漢 字 率 との 関 係 を示 す.
表11JCSIM方 式 利 用 率 4.1実 験 デ ー タ
入 力 者 は,外 国 人 日本 語 初 心 者 で あ り,実 験 を 行 う前 に はJCSIM法 の 使 用 経 験 が な い 三 人 の 留 学 生 で あ る.入 力 者 の デ ー タ は 表9に 示 す.入 力 者Aは 日 本 在 留 期 間 と 日 本 語 学 習 時 間 が 一 番 長 く,日 本 語 レ ベ ル も 一 番 高 い と 考 え ら れ る 入 力 者 で あ る.ま た, 入 力 者Cは 日本 在 留 期 間 と 日本 語 学 習 時 間 が 一 番 短 く,日 本 語 レベ ル も一 番 低 い と考 え られ る.
実 験 用 文 は100〜200文 字 以 内 の3種 類 の 文 と し た.実 験 に 関 す る 詳 細 は 表10に 記 す.文F1か らF
3ま で 漢 字 比 率 が 増 え て い る.特 に 文F3は 日本 の 古 文 で,漢 字 の み の 文 に な っ て い る.
入力者
A
B
C
文番号
Fl F2 F3 Fl F2 F3 F1
F2 F3
CSIM方 式 で入 力 した漢 字 4
12 22 8 19 38 15 45 76
利用率 8%
12%
19%
16%
18%
32%
30%
44%
65%
眺505010〜CS‑M力武利用串
40
20
:M"一 ρ一副 〆 〆 認{3… 岬 酬〆 〆 幽
ω〆"〆'!
B
O
eo 50 BO 70 圏o
図5JCSIM方 式 の 利 用 率 図
go灘 寧串1。o覧
表12JCSIM方 式 に よ る入 力 時 間軽 減 率
入力者
'A
B
C
文番号 F1 F2 F3 F1 F2 F3 F1 F2 F3
ROMA ONLY 27(分)
55 40 34 49 36 7 17 20
ROMA JCSIM
25 48 28 2?
38 24 6 11 13
軽減 率 7%
13%
30%
21%
22%
33%
14%
35%
35%
図5の 横 軸 は入 力 文 の 漢 字 率 で,縦 軸 はJCSIM方 式利 用 率 で あ る.曲 線A,B,Cは それ ぞれ 入 力 者A, B,Cが 三つ の入 力 文 を 入 力 した 時 のJCSIM方 式 の 利 用 率 で あ る.日 本 語 レベ ル が 一 番 高 い 入 力 者Aは JCSIM方 式 の使 用 率 が 一番 低 く,日 本 語 レベ ル が 一 番 低 い入 力 者Cは 一番 高 い.ま た,漢 字 の 存 在 率 が 高 い文 章F3で い ず れ の 人 もJCSIM方 式 の 利 用 率 が 増 加 してい る.
JCSIM方 式 を利 用 す る こ とに よる入 力 時 間軽 減 率 を表12に 示 す.
図6の 横 軸 は入 力 文 の漢 字 率 で,縦 軸 は入 力 時 間 軽 減 率 で あ る.曲 線A,B,Cは それ ぞ れ 入 力 者A,B, Cの 入 力 時 間 の軽 減 率 で あ る.日 本 語 レベ ル が 一番 高 い 入 力 者Aは 入 力 時 間軽 減 率 が 一番 低 く,日 本 語 レベ ル が一 番 低 い入 力 者Cは 入 力 時 間軽 減 率 が 一番 高 い.ま た,漢 字 の存 在 率 が 高 い 文 章F3で は い ず れ の 人 もJCSIM方 式 で の入 力 時 間 軽 減 率 が増 加 して い る.
5.考 察
5.1評 価 実 験 で の課 題
評価 実 験 か ら 日本 語 文 章 を入 力 す る に はJCSIM方 式 が入 っ て い る ロー マ 字 日本 語 入 力 シ ステ ム を使 う
こ とで入 力 時 間 を軽 減 す る こ とが で き,入 力 文 の 漢 字 率 が 高 け れ ば 高 い ほ ど,入 力 時 間 の 軽 減 率 も高 く, 入 力 者 の 日本 語 レベ ル が 低 けれ ば 低 い ほ ど,入 力 時 間 の軽 減 率 が高 い とい う結果 を得 られ た.し か し}
入 力 者 に よ っ てJCSIM方 式 は ま だ い くつ か の 間題 が 存 在 して い る こ とが わ か っ た.こ れ らの 問題 を解 決 す る た め以 下の よ うな検 討 を行 っ た.
眺8010入力時間軽浦率 50
4D
/一 一 … ε/
〆'B.ノ謬 2。 … 〆
,〆 嘲
0
50 60 70 80
図6入 力時間軽減図
9。 濃 字寧10σ沁
(1)入 力 者 に よ っ て 漢 字 の 書 き 順 が 異 な る 問 題 前 に 述 べ た よ う にJCSIM方 式 は 漢 字 を 書 き 順 に よ り,字 画 に 分 け る.字 画 を 用 い て 字 画 コ ー ドを 生 成 し て,字 画 コ ー ドで 字 画 コ ー ド定 義 辞 書 に て 漢 字 を 検 出 す る.同 じ 漢 字 と して も,書 き 順 が 違 え ば,漢 字 の 字 画 コ ー ド も違 う.違 っ た 字 画 コ ー ドで 正 しい 漢 字 を 検 出 で き な い.図7の よ う に 同 じ 漢 字 「左 」 は 書 き 順 「一 」,「 ノ 」,「一 」,「i」,「 一 」 で 書 く 人 も い る し,書 き 順 「ノ 」,「一 」,「一 」,「1」,「 一 」 で 書 く人 も い る.間 違 っ た 後 者 の 書 き 順[7】で は 正 し い 漢 字 「左 」 を 入 力 で き な い.し か し,日 本 人 で も 間 違 っ た 筆 順 で 漢 字 を 書 く場 合 が 多 い.外 国 人 日 本 語 初 心 者 は 日本 語 漢 字 の 書 き 順 は も っ と 間 違 い や す い と考 え られ る.
こ の 問 題 を 解 決 す る た め に 複 数 の 書 き 順 の 字 画 コ ー ド定 義 辞 書 を 作 成 した.間 違 い や す い 書 き順 で も 漢 字 を 入 力 で き る よ う に した.前 の 例 で は,宇 画
180
左く7二な 究 紮 妻
図7書 き順 例
学 者 にJCSIM方 式 を 使 っ て も ら う た め に は,そ れ ら の ソ フ ト ウ ェ ア と の イ ン タ フ ェ ー ス を 作 り,JCSIM 方 式 が 「Windows」 上 の 「Word」 な ど で 実 行 で き る よ
う に す る こ と も今 後 の 課 題 で あ る.
コ ー ド 「一・,ノ,一,1,一 ・」 と 「ノ,一 ㍉ 一,1,
一 」 ど ち ら で も 漢 字 「左 」を 入 力 で き る よ う に し た .
参考文献
(2)漢 字候 補 が多 数 存 在 す る 問題
同 じ字 画 コー ドに 多 数 の 漢 字 が 対 応 して い る場 合 に は,候 補 が 多 くで て き て,入 力 者 は そ の 中 か ら入 力 した い漢 字 を 探 す の が たい へ ん で あ る.こ の 問 題 を解 決 方 法 の 一 つ と して,一 つ の 漢 字 を 入力 す る た め,入 力 字 画 数 を増 や す 方 法 を提 案 した.し か し入 力 字 画 数 が増 え れ ば 入 力 者 に負 担 を か け る.入 力 字 画 数 が 多 けれ ば 多 い ほ ど,入 力 者 へ の負 担 が 重 い.
入 力 字 画 数 を何 画 にす れ ば キー を タイ プ す る負 担 と 候 補 か ら入 力 した い 漢 字 を探 す 負 担 の 両 方 が バ ラ ン ス よ く軽 減 され る か を検 討 す る.
5.2今 後 の 課 題
JCSIM方 式 に 基 づ く シ ス テ ム はrUNIX」 上 の テ キ ス トエ デ ィ タ で 実 行 で き る.し か し,外 国 人 留 学 生 日本 語 初 学 者 は 文 章 を 入 力 す る た め に,よ く 使 う の は 「Windows」 上 の 「Word」 な ど の ワ ー ドプ ロ セ ッ サ ソ フ ト ウ ェ ア で あ る.多 く の 外 国 人 留 学 生 日本 語 初
[1]尾 関 雅 則,"第32回 全 国 大 会 に あ た っ て 一 日 本 語 入 力 方 式 に つ い て",情 報 処 理,Vo1.27,No.5,pp493‑
497,1986.
[2]土 屋 順 一,"外 国 人 の た め の 日 本 語 キ ー ボ ー ド 入 力 支 援 シ ス テ ム の 母 語 別 カ ス タ マ イ ズ",電 気 通 信 普 及 財 団 研 究 調 査 報 告 書 第15号,98‑01044.
[3]張 小 剛,高 建 斌,高 橋 勇,黒 岩 丈 介,小 高 知 広,小 倉 久 和,"漢 字 字 画 に よ る 日 本 語 漢 字 入 力 補 助 方 法", 情 報 処 理 学 会 第65回 全 国 大 会,4分 冊,3Q‑4(2003.3) [4]白 井 英 俊,荒 木 卓 也,"日 本 語 入 力 手 段 と し て の 漢 字 モ ー ド",計 量 国 語 学,Vol.14,No.6,pp.239‑251,
1984.
[5]中 国 漢 易 ソ フ ト 開 発 株 式 会 社:http://WWW.1han.
com/hanease/menzhai/dict.htm
[6]三 重 大 学 教 育 学 部 学 校 教 育 講 座:http://www.
schl.edu.mie‑u.ac.jp/comp̲ed/2002/yokoi/kanzi5 .htm
[7]江 守 賢 治,漢 字 筆 順 ハ ン ド ブ ッ ク,三 省 堂,1982.