• 検索結果がありません。

<研究報告>漢字字画による日本語漢字入力支援シス テムの提案と実装

N/A
N/A
Protected

Academic year: 2021

シェア "<研究報告>漢字字画による日本語漢字入力支援シス テムの提案と実装"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

<研究報告>漢字字画による日本語漢字入力支援シス テムの提案と実装

著者 張 小剛, 高 建斌, 高橋 勇, 黒岩 丈介, 小高 知 宏, 小倉 久和

雑誌名 福井大学工学部研究報告

巻 51

号 2

ページ 173‑180

発行年 2003‑09‑30

URL http://hdl.handle.net/10098/827

(2)

Mem.Fac.Eng.FukuiUniv.,Vol.51,No.2(September2003)

漢字字画 による 日本語漢字入 力支援 システ ムの提案 と実装

張 小 剛*高 建 斌 帥 高 橋 勇 嘩紳 黒 岩 丈 介 廓躰 小 高 知 宏 躰*小 倉 久 和 紳零

Japanese Character Input Auxiliary Method by Character Strokes

Xiaogang ZHANG *, Janbin GAO**, Isamu TAKAHASI***

Josuke KUROIWA***, Tomohiro ODAKA*** and Hisakazu OGURA ***

(Received August 11, 2003)

2

The input system of the Japanese mainly is constructed on the kana character input or Japanese Roman alphabet input by Japanese Pronunciation. This system is difficult to operat for the foreign Japanese beginner who does not understand Japanese pronunciation, especially the pronunciation of the kanji's. In this paper in order to overcome the difficulty, we propose the system which support the kanji strokes input auxiliary method (the, JCSIM). We built the Japanese input system using this JCSIM method. We performed the experiment to evaluate this system by three foreign Japanese beginners. The results showed that the time to input Japanese sentence was decreed by using this JCSIM proposed here compared with the normally Roman alphabet inputting method.

Key Words : Japanese Kanji, Input System,

1.は じ め に

Kanji Strokes

現 在,コ ン ピ ュ ー タ へ の 入 力 装 置 と して キ ー ボ ー ド,ラ イ トペ ン,タ ッ チ パ ネ ル,音 声 入 力 シ ス テ ム な ど様 々 あ る が,ま だ,キ ー ボ ー ドが 最 も 有 力 な 入 力 装 置 で あ る 田.パ ー ソナ ル コ ン ピ ュ ー タ と イ ン タ ー ネ ッ トの 普 及 に よ っ て

,日 本 人 が 英 語 を キ ー ボ ー ド入 力 す る 機 会 が 増 加 す る 一 方 で 日 本 国 内 の 外 国 人 が 日本 語 を キ ー ボ ー ド入 力 す る 機 会 も 増 加 し て い る.ま た,日 本 語 教 育 の 現 場 で も,外 国 人 が 利 用 す る た め の 日本 語 ホ,..̲.ムペ ー ジ の 開 設,あ る い は, E‑mai1や イ ン トラ ネ ッ トを利 用 し た 日本 語 作 文 指

廓大 学 院 工 学 研 究 科 情 報 工 学 専 攻

*s大 学 院 工 学 研 究 科 シ ス テ ム 設 計 工 学 専 攻

*s*知 能 シ ス テ ム 工 学 科

̀lnformationEngineeringCour

se,GraduateSchool ofEngineering

"̀SystemDesigllEnginee血gCourse

,Graduate SchoolofEngineering

*'"D

ept.ofHumanandArtificialIntelligentSystems

, Foreigner Japanese Beginner

導 な どが,外 国 人 が 日本 語 を キ ー ボ ー ド入 力 す る こ とを前 提 と して 実 施 され て い る[21.

とこ ろ で,ほ とん どの 日本 語 入力 シ ス テ ム は,キ ー ボー ドで誤 入 力 した場 合 へ の 対応 な ど 「入 力 支 援 」 機 能 を充 実 させ て,使 いや す く して い る.し か し, 外 国 人 留 学 生 に とっ て は この支 援 機 能 は 役 立 って お

らず,外 国 人 留 学 生 に対 す る入 力 支 援 シ ス テ ムは ま だ 未 開 発 とい っ て よい[2】.

キー ボ ー ドを用 い た 日本 語 入 力 方 式 に は,主 にカ ナ 文 字 入 力 と ロ..̲̲マ字 入 力 が あ る田.漢 字 は 入 力 さ れ た 漢 字 の 読 み カ ナ を変 換 して入 力 す る の が 主 流 で あ る.文 字 の 読 み 方 に よ る この二 種 類 の入 力 方 式 は,

日本 語 の 読 み 方 が 分 か る人 とっ て は簡 便 で あ るが, 日本 語 の 読 み 方,特 に 日本 語 の漢 字 の 読 み 方 が 分 か らな い 外 国 人 日本 語 初 心 者 に とっ て は 大 変難 しい 操 作 で あ る圃.

漢 字 を含 む 言 語 を母 語 と しな い外 国 人 留 学 生 は, 漢 字や 漢 字 単 語 の 意 味 を覚 え る 際 に読 み もい っ し ょ に 覚 え な けれ ば な ら ない.日 本 語 文 章 を入 力 す る際 に は,意 味 と読 み の 両 方 とも分 か っ て い る語 だ け 使 うこ とに な る.し か し,た とえ ば 中 国語 を 母 語 と し て い る 外 国 人 留 学 生 は 日本 語 を勉 強 した こ とが な く

(3)

174

て も,日 本 語 の ほ とん どの 漢 字 や 漢 字 を含 む 単 語 の 意 味 が 分 るの で,読 み を 知 らな く て もそ の よ うな 単 語 を使 うこ とが で き る.こ の よ うな漢 字 と単語 を コ ン ピュ ー タ に入 力 す る場 合,こ れ らの 留 学 生 に は 漢 字 単 語 の 意 味 が 分 か っ て い るの に 入 力 で き な い とい

う問 題 が生 じ る.

一 方,現 在 い ろい ろ な 日本 語 電 子 辞 書 が 開 発 され て い る.外 国 人 留 学 生 が未 知 の 単 語 の 意 味 を調 べ る

に は これ らの 電 子 辞 書 が よ く役 立 つ.し か し,そ の た め に は,や は り,そ の 読 み が 分 か らな けれ ば な ら な い。 留 学 生 の 多 くは読 み が 分 か らな い 単 語 の意 味 を調 べ る とき,ま ず 紙 製 の 日本 語 辞 書(漢 字 辞 書)で 読 み を調 べ て か ら,次 に読 み を 電 子 辞 書 に入 力 して, 単 語 の 意 味 を 調 べ る.し か し,こ れ は 手 間 が か か る [4].わ れ われ は,読 みが分か らな くて も簡単 に漢 字

を入 力 で き る補 助 方 式 を検 討 して きた.

以 上 の よ うな観 点 か ら,漢 字 圏 の 日本 語 初 学 者 に とって は読 み 方 が 分 か らな くて も少 数 の キー 入 力 で, 漢 字 を効 率 的 に 入 力 で き る 日本 語 入 力 方 式 が 必 要 と

な る.

漢 字 の形 は漢 字 の 一 つ の重 要 な 特 徴 で あ る.特 に 漢 字 に馴 染 ん だ 中国 人 に とっ て漢 字 の 形 は漢 字 の最 も理 解 しや す い 特 徴 で あ る.漢 字 の 読 み は予 め覚 え て い な い と,読 み が い つ ま で も分 か らな い.と ころ で,少 し漢 字 の 常 識 を持 っ て い る 入 力者 は漢 字 の構 成 要 素 の解 析 が で き る.漢 字 に馴 染 ん だ 中国 人 で な くて も,少 し漢 字 の 常 識 を持 っ て い れ ば,他 の 国 の 人 で も漢 字 の 形 を理 解 で き る.こ こで は 漢 字 の形 で 漢 字 を 入力 す る方 式 を採 用 し,そ れ に よ る入 力 補 助

を検 討 す る.

本 報 告 で は 日本 語 の読 み 方 に よ らな い,少 数 キ ー を 用 い る 日 本 語 漢 字 字 画 入 力 補 助 方 式 JCSIM(JapaneseCharacterStrokesInputMethod)

法 を提 案 し,提 案 シ ステ ム の評 価 実 験 を行 っ た結 果 を報 告 す る;

2.JCSIM入 力 方 式 に よ る 漢 字 の 入 力

2.1漢 字 の形 に よ る入 力 方 式

中 国 で よ く利 用 され て い る漢 字 の 入 力 方 式 は 「ピ ンイ ン」(読 み 方)入 力方 式 で あ る が,そ れ 以 外 で は

「五 筆 字 型 」 とい う入 力 方 式 が あ る.こ れ は漢 字 の 部 首 を 用 い た 入 力 方 式 で あ る.漢 字 の部 首 を用 い た 入 力 方 式 には 次 の 利 点 が あ る.

O一 つ の 入 力 コー ドに 二 つ 以 上 の 漢 字 が 定 義 され る こ とは 殆 ん どな い の で,入 力者 は候 補 か ら入 力 した い漢 字 を 選 択 す る 手 間 が 不 要

で あ る.入 力 者 は デ ィ ス プ レー を 見 な く て も, 入 力 で き る.

● 熟 練 す る と,入 力 速 度 は か な り速 い.速 い 人 は 一 分 間 に 二 百 以 上 の 漢 字 を 入 力 で き る.

しか し,次 の よ う な 問 題 点 が あ る.

i

e

部 首 が 多 い の で,覚 え に くい.中 国 漢 字 の 部 首 は 百 八 十 九 個[5】,日本語 漢 字 部 首 は約 二 百 四十 個[6]ある.入 力 者 は これ らの 部 首 を定 義 した キ ー を 全 て 覚 え な けれ ば な らな い.入 力 者 に負 担 が か か る.

長 時 間使 わ ない と忘 れ や す い か ら,ま た 使 う 時 に は も う一 度 覚 え な お さ な け れ ば な ら な い.

文 書 処 理 を 職 業 と し て い る 人 に と っ て は 少 々 覚 え に く く て も,熟 練 す る と速 く入 力 で き る 入 力 方 法 が 良 い 方 法 で あ る.し か し,た ま に 文 書 処 理 を す る よ うな 人 に と っ て は あ ま り有 効 で は な い と 考 え ら れ る.

漢 字 字 画 の 種 類 の 数 は 部 首 よ りか な り少 な い.そ して,字 画 の 構 造 も部 首 よ り単 純 で,分 類 しや す い.

入 力 に 漢 字 の 字 画 を 用 い る こ と に よ り,初 学 者 に も わ か り や す い 入 力 方 式 と す る こ と が で き る.

JCSIM(JapaneseCharacterStrokesInputMethod)

方 式 は こ の 方 式 に よ る 日本 語 入 力 シ ス テ ム の 補 助 シ ス テ ム と して 用 い る.

2.2JCSIM入 力 方 式 の 概 要

JCSIM方 式 で は,全 て の漢 字 字 画 を 六 種 類 に 分 け, 一 っ ず っ ,六 つ のキーを対応 させ る.入 力す る時, 漢 字 を字 画 に分 析 して,漢 字 の 書 き順 に よ って 一 つ ず つ 字 画 と対 応 す る キ ー を タ イ プ す る こ とで 漢 字 を 入 力 す る.同 じ入 力 コー ドに 二 つ 以 上 の 漢 字 が 対 応 す る場 合 は,そ れ らの 漢 字 に番 号 を つ け て 表 示 し, 入 力 者 は 番 号 を入 力 して,漢 字 入 力 を 終 了 す る.

読 み が 分 か っ て い る漢字 を入 力 す るに は や は りロ ー マ 字 とか な変 換 な どの 読 み に よ る入 力 方 式 が 便 利 で あ る.JCSIM方 式 は,補 助 入 力 方 式 と して,読 み が 分 か らな い漢 字 を 入 力す る場 合 の み 使 うこ と とす

る.

2.3入 力 に用 いる字 画

入 力 に用 いる字 画 を選 択 す るため に各 字 画 の 出 現 頻 度 につ いて の調 査 を行 った.EUCコ ー ドの漢 字282 文 字 を字 画 ごとに分 析 して各 字 画 の 出 現 頻 度 を求 め た 結 果 を表1に 示 す.出 現 頻 度 が 高 い 字 画 「イチ 」,「タテ ボウ」,「ヒダ リハ ライ」と「ハ ネボウ」を入 力 に用 い る字 画

(4)

表1字 画出現頻度調査表 表2漢 字字画定義表

字画名称

イ チ タテ ボ ウ ヒ ダ リハ ラ イ

ミ ギ ハ ラ イ ハ ネ ポ ウ

テ ン オ レ ソ ノ タ

合計

字画

J

乙 ほ か

出現頻度

502 348 401 303 321 215 205 101 2369

字画名称

イ チ タテ ボ ウ ヒ ダ リハ

ラ イ ミギハ ライ

及 び テ ン ハ ネ ポ ウ ソ ノ タ

字画

1 ほ か

定義

左 か ら右 へ の 水 平 的 な字 画 上 か ら下 へ の 垂 直 的 な字 画 右 上 か ら左 下 へ ま た は左 下 か

ら右 上 へ の 字 画 左 上 か ら右 下 へ の字 画 字 画"1"の 終 点 に は ね が あ る

字 画(は ね の 方 向 と無 関 係) 上 記 以 外 のす べ て の 字 画

表3漢 字 宇 画 と入 力 キ ー の 対 応

嵐 榊 4

砂\

点 と間違いやすい

点 と蘭違いやすい

ヤ\

右はらい

字画名称

イ チ タ テボ ウ ヒ ダ リハ ラ イ ミギハ ライ 及 び テ ン

ハ ネ ポ ウ ソ ノ タ

字画

1 ほ か

キ ー S D F J K L

入 力 者 に 負 担 を か けな い た め に,JCSIM方 式 で 一 つ の漢 字 を入 力 す る た め の入 力 字 画 数 を最 大 五 画 と

して い る.入 力 方 法 は,字 画 数 に よ っ て 次 の 三 つ の 場 合 に分 け る:

図1漢 字 字 画 区別 の 例

として 採 用 す る.出 現 頻 度 が 低 い 字 画 「オ レ 」と「ソノタ 」 を 合 併 して 「ソノタ」とす る 。

字 画 「ミギ ハ ラ イ 」 と 「テ ン 」 は 分 類 し に く い 場 合 が 多 い.図1の 例 の よ うに,漢 字 「木 」 と 「小 」 の 字 画 「ミ ギ ハ ラ イ 」は 漢 字 「村 」 「砂 」の 中 で は 「テ ン 」 と 間 違 わ れ や す い.ま た,漢 字 「林 」の 右 の 「木 」 の 最 後 の 字 画 の 正 し く は 「ミ ギ ハ ラ イ 」 で あ り,左 の 「木 」 の 最 後 の 字 画 も 同 じ で あ る が,後 者 は 「テ

ン 」 と間 違 わ れ や す い.と こ ろ で,字 画 「ミ ギ ハ ラ イ 」 と 字 画 「テ ン 」 の 出 現 頻 度 は と も に 低 い の で こ の 二 種 類 の 字 画 を 合 併 す る.

こ れ ら 六 種 類 の 字 画 の 定 義 を 表2に 示 す.

以 上 の 六 種 類 の 字 画 に 対 し,表3の よ う に,一 つ ず つ キ ーrS」,rD」,rF」,rJ」,rK」,rL」 を 割 り 当 て た.こ れ ら は キ ー ボ ー ド中 段 左 手 の 方 の 三 っ と右 手 の 三 つ の キ ー で あ り,一 番 使 い や す い キ ー で あ る.

2.4入 力 規 則

123

五 画未 満:漢 字 の 書 き順 に よ り,実 際 の 字 画 キ ー をす べ て 入 力 して か ら

,ス ペ ー ス キ ー を入 力 す る.

五 画:漢 字 の 書 き順 に よ り,実 際 の 字 画 キ ー を す べ て入 力 す る.

五 画以 上:漢 字 の 書 き順 に よ り,最 初 の 四 画 の キ ー を 入 力 して か ら,最 後 の 一 画 を入 力 す る.

漢 字 の 画 数 が 五 画 以 上 の 場 合 で は 初 め の 五 画 を 入 力 す る の で は な く,初 め の 四 画 と最 後 の 字 画 を 選 ぶ が,そ の 理 由 は 同 じ 漢 字 コ ー ドに 対 応 す る 文 字 を 減 らす た め で あ る.例 え ば,「 言 」,「設 」,「記 」,「計 」 の 字 画 コ ー ドは 初 め の 五 画 で コ ー ドす る と,全 て 同

じ で あ る.JCSIM方 式 で は 最 初 の 四 画 と 最 後 の 一 画 で 漢 字 を 入 力 す る か ら,「 言 」,「設 」,「記 」,「計 」の 字 画 コ ー ドは そ れ ぞ れ 「一,一,一,一,一 」,「一, 一,一,一 一,\ 」,「一,一,一,一,ソ ノ タ 」,「一, 一,一,一,1」 と な り,同 じ字 画 コー ドの 漢 字 の 数 を 減 らせ る.

(5)

176

表4入 力 字 画 例 表6候 補 と字 画 コー ド状 況 図

小 倉 研 究 室

第 一 画 J ノ

第二画

ノ ノ ノ

第三画

ソ ノ タ ソ ノ タ

第四画

ソ ノ タ ソ ノ タ

第五画

ソ ノ タ

表5入 力 キ ー 例

候補数

1 2^‑9 10^‑19 20^‑29 30^‑39 40^‑49

50^一

字 画 コ,̲.̲.ド 数

568 645 114 44 1fi 13 12

小 倉 研 究 室

第 一 画 K F S J J

第二画

F J F F F

第三画

J

S D L L

第四画

ス ペ ー ス L L F s

第五画

s D L S

予 キス トエデ ィタE㎜5

本 シ ス テ ム とE㎜05の イ ン タ フ ヱー ス フ麟 ン ト

4iL̀

同 じ字 画 コー ドに多 数 の漢 字 を持 つ 場 合 は,す べ て の候 補 漢 字 に番 号 をつ け て入 力 者 に表 示 す る.入 力 者 は番 号 を 選 ぶ こ とで入 力 した い 漢 字 を選 ぶ.

表4と 表5は 「小 倉 研 究 室 」 を 入 力 す る際 の 入 力 字 画 例 とJCSIM法 に よ る入 力 キ ー 列 で あ る.

漠字霜 コー ド生成

鰍漠宰出力

2.5JCSIM方 式 に お け る 漢 字 コ ー ド

同 じ 字 画 コ ー ドは 多 数 の 漢 字 を 持 つ 場 合 が あ る.

調 査 に よ っ て,現 在JCSIM方 式 に 基 づ い て,作 成 し た シ ス テ ム の 候 補 数 と字 画 コ ー ド数 の 状 況 を 表6に 示 す.

漠寧検索処環

糠 掃ド

」18‑・ ホ準2働 漠宇 雌 第 二水準ηgo濃 字

開擁 言 語 茎C

プ ラ ッ トフ ォ ーム 婁UNDく

3.JCSIH方 式 に 基 づ く入 力 支 援 シ ス テ ム

3.1シ ス テ ム の 概 要

JCSIM方 式 に 基 づ く提 案 シ ス テ ム はC言 語 で 作 成 し た.更 に 「UNIX」 上 の テ キ ス トエ デ ィ タ 「Emacs」

で 利 用 可 能 に す る た め に,イ ン タ フ ェXを 「Emacs Lisp」 で 作 り,「Emacs」 に 組 み 込 ん だ.入 力 者 は コ ン ト ロ ー ル キ ー を 押 し な が ら,キ ー 「x」 と 「o」 を 押 す こ とで,「Emacs」 の フ ロ ン トエ ン ド(か な 漢 字 変 換 シ ス テ ム)か ら本 シ ス テ ム(JCSIM入 力 方 式)に 切 替 え で き る.本 シ ス テ ム か ら 「Emacs」 フ ロ ン トエ ン ドへ の 切 替 え は 一 文 字(漢 字)の 入 力 が 終 っ た 時 に, 自動 的 に 行 な わ れ る.本 シ ス テ ム は 図2に 示 す よ う に 「漢 字 字 画 コ ー ド生 成 」,「漢 字 検 索 処 理 」,「字 画 コ ー ド定 義 辞 書 」,「多 漢 字 出 力 と 多 漢 字 出 力 入 力 者 選 択 」 と 「単 漢 字 出 力 」 か ら な る.シ ス テ ム 各 部 に

お け る 処 理 の 詳 細 を 「シ ス テ ム 構 成 」 で 述 べ る.

図2JCSIM方 式 に も とつ く シ ス テ ム 構 成

3.2シ ス テ ム 構 成

(1)漢 字 字 画 コ ー ド生 成

漢 字 を 検 出 す る た め に,漢 字 の 一 文 字 ず つ の 字 画 コ ー ドが 必 要 と な る.「 漢 字 字 画 コ ー ド生 成 」 で は, 入 力 者 か ら の 入 力 が 一 漢 字 の 字 画 コ ー ド に な る か を チ ェ ッ ク す る.rJCSIM方 式 」で は 一 漢 字 の 完 全 の 字 画 コ ー ドは ロ ー マ 字 五 つ ま た は ロ ー マ 字 四 つ 以 下 の 最 後 に ス ペ ー ス を 付 け た も の の 二 種 類 が あ る.こ れ は 漢 字 字 画 コ ー ド生 成 の 基 準 と な る.

(2)漢 字 検 索 処 理

漢 字 検 索 処 理 で は字 画 コー ド定義 辞 書 との イ ン タ フ ェー ス を定 義 す る 。 これ は漢 宇 を検 出す るた め の 字 画 コー ドと検 出 され た漢 字 の通 路 とい え る.ま た,

(6)

表7EUCコ ー ド漢 字 ア ド レ ス

#defineA16̀¥xbσ'

#defineA17̀¥xb1'

#defineA18̀¥xb2'

#defineA19̀¥xb3'

#defineA20̀¥xb4'

#defineBO1̀¥xa1'

#defineBO2̀¥xa2'

#defineBO3̀¥xa3'

#defineBO4̀¥xa4'

#defineBO5̀¥xa5'

#defineF(u,v)*(b+n)=u;(b+n+1)=v;

(4)多 漢 字 出 力 と多 漢 字 出 力 入 力 者 選 択

同 じ字 画 コー ドは 多 数 漢 字 を持 つ 場 合 が あ る.こ の 場 合 で は入 力者 の 選 択 機 能 が 必 要 とな る.「 多 漢 字 出力 と多 漢 字 出力 入 力 者 選 択 」 は 入 力 者 の選 択 機 能 を提 供 す る.同 じ字 画 コー ドに 定 義 され た全 て の 漢 字候 補(予 めEUCコ ー ド漢 字 ア ドレス でEUCコ ー ド か ら漢 字 を呼 び 出 す 〉に 番 号 を つ け て 入 力 者 に表 示 す る.更 に,入 力 者 か らの番 号選 択 に 対 応 す る漢 字 を出 力 す る機 能 を持 つ.

(5)単 漢 字 出 力

字 画 コー ドは 単 漢 字 を持 つ 場 合 で はEUCコ ー ド漢 字 ア ドレス でEUCコ ー ドか ら漢 字 を 呼 び 出 し,出 力 す る機 能 を持 つ.

表8字 画 コー ド定義 辞 書

S SS SSS SSSSS SSSSS SSSSS SSSSS

F(A16,B76) F(A38,B83) F(A27,B80) F(A16,B66) F(A21,B35) F(A21,B45) F(A22,B64)

3.3シ ス テ ム の 支 援 機 能 と利 用 法

JCSIM方 式 に 切 替 え す る に は,rEmacs」 上 の フ ロ ン トエ ン ドで コ ン トロ ー ル キ ー を 押 しな が ら 「x」を 押 した 後 で 「o」を 押 す.読 み が 分 か ら な い 漢 字 を 入 力 す る 際 だ け にJCSIM方 式 を 使 うの で,入 力 者 は 多 数 の 場 合 で は フ ロ ン トエ ン ドで 日本 語 文 書 を 入 力 す る こ と を 考 え て,入 力 者 に 便 利 を 図 る た め に,JCSIM 方 式 で 一 つ の 漢 字 を 入 力 し終 え た ら,シ ス テ ム は 自 動 的 に フ ロ ン トエ ン ドに 戻 る.

「漢 字 検 索 処 理 」で は,「 多漢 字 出力 と多 漢 字 出力 入 力 者 選 択 」,「単 漢 字 出力 」 の イ ン タ フ ェ ー ス を 定義 す る.漢 字 字 画 コー ドに対 す る処 理 と検 出 され た漢 字 に対 す る処 理 を行 う.

BuffersFilesIOO】LsEditS●arch随"ユ0曾 吐n11圓2『 隠0ユP 漢 与 字 画 に る 日 。 ξ 子

(3)字 画 コ ー ド定 義 辞 書

「字 画 コ ー ド定 義 辞 書 」 は 人 手 に よ り 作 っ た も の で あ る.最 終 の 出 力 漢 字 をEUCコ ー ドか ら呼 び 出 す た め,字 画 コ ー ド定 義 辞 書 に は 検 索 用 イ ン デ ッ ク ス とEUCコ ー ド漢 字 ア ド レ ス の 組 が 記 録 され て い る.

表7に 示 す よ う に,字 画 コ ー ド定 義 辞 書 で は 予 め EUCコ ー ド漢 字 ア ドレ ス(行 と列 二 つ の 部 分 か ら な る)とEUCコ ー ド漢 字 ア ド レ ス を 保 存 す る ポ イ ン ト を 定 義 し,辞 書 の 中 でEUCコ ー ド漢 字 ア ド レ ス の 定 義 した 文 字 列 を 使 っ てEUCコ ー ド漢 字 ア ド レ ス を 表 記 し,EUCコ ー ド漢 字 ア ド レス を 定 義 し た 保 存 す る ポ イ ン トに 保 存 す る.検 索 用 イ ン デ ッ ク ス は 「漢 字 字 画 コ ー ド生 成 」で 生 成 した 字 画 コ ー ドで あ る.「 字 画 コー ド定 義 辞 書 」 に はJIS第 一 水 準2,965漢 字 と 第 二 水 準3,390漢 字 を 登 録 した.こ れ に よ り,一 般

的 な 日本 語 文 章 の 全 て の 漢 字 は 本 シ ス テ ム で 入 力 で き る と考 え る.

21221415搬16‑1718192° \}

ロ 麗 膿 贈四 閏門岡 四 岡 岡 曝,

毛{{{

図3入 力 画 面1

(7)

178

表9入 力 者 デ ー タ

BuffersFilesToolsEditSearchMuleHelp

鰯 占画による日本語漢字支擾圏

入力者

A B C

専門 材料開発

機械 情報処理

日本 に の在 留 期 間(月)

22 10 4

日本語 学 習 時 間(時 間)

約1,200 約350 約300

表10実 験 用 文 デ ー タ

文番号

F1 F2 F3

文源 業 日本語 日本建築史 史籍雑纂

総字数

132 181 117

漢 字数

50 103 117

仮名 数

82 7s 0

漢字率 38%

57%

100

圃i團圃國 國團 圏圏■團團 圃 團團團 ■■ ■ 国薩

図4入 力 画 面2

入 力 され た 字 画 コ ー ドが 多 数 の 漢 字 を 持 つ 場 合 は 図3の よ うに 「E鵬acs」の バ ッ フ ァ は 自動 に 二 つ に 分 か れ る.上 の バ ッ フ ァ は 元 の エ デ ィ タ 画 面 を 表 示 す る.下 の バ ッ フ ァ は 番 号 を つ け た 候 補 を 表 示 す る.

入 力 者 が 番 号 を 入 力 して 漢 字 を 選 ん だ ら,図4の よ うに 下 の ベ ッ フ ァ は な く な る.エ デ ィ タ を表 示 す る 上 の バ ッ フ ァ は 元 の サ イ ズ に 戻 る.シ ス テ ム は

「Emacs」 の エ デ ィ タ 状 態 に 戻 る.

4.実 験 と評 価

提 案 シ ス テ ム の 有 効性 を確 認 す る た め,評 価 実 験 を行 った.

日本 語 入 力 シ ス テ ム は2種 類 用 意 し た.入 力 シ ス テ ムRはJCSIM方 式 を 組 み 込 ん で い な い ロー マ 字 入 力 シ ス テ ム で あ り,入 力 シ ス テ ムJはJCSIM方 式 を 組 み 込 ん だ シ ス テ ム で あ る.入 力 はA,B,Cの 順 に 行 っ た.各 入 力 者 は ま ず 入 力 シ ス テ ムRで 文F1を 入 力 し て か ら入 力 シ ス テ ムJで 文F1を 入 力 す る.

次 に 入 力 シ ス テ ムRで 文F2を 入 力 し て か ら入 力 シ ス テ ムJで 文F2を 入 力 す る.F3に つ い て も 同 様 に 繰 り返 す.実 験JCSIM方 式 で 漢 字 を 入 力 す る の は, 読 み が 分 か ら な い 漢 字 の み と した.

4.2実 験 結 果 と実 験 評 価

各 入 力 者 はJCSIM方 式 を組 み 込 ん だ 入 力 シ ステ ム Jで 文 を入 力 す る時,読 み が分 か らな い漢 字 をJCSIM 方 式 で 入 力 す る.入 力 の 時JCSIM方 式 で 入 力 した漢 字 の 数 とそ の利 用 率 を表11に 示 す.図5はJCSIM 方 式 の 利 用 率 の漢 字 率 との 関 係 を示 す.

表11JCSIM方 式 利 用 率 4.1実 験 デ ー タ

入 力 者 は,外 国 人 日本 語 初 心 者 で あ り,実 験 を 行 う前 に はJCSIM法 の 使 用 経 験 が な い 三 人 の 留 学 生 で あ る.入 力 者 の デ ー タ は 表9に 示 す.入 力 者Aは 日 本 在 留 期 間 と 日 本 語 学 習 時 間 が 一 番 長 く,日 本 語 レ ベ ル も 一 番 高 い と 考 え ら れ る 入 力 者 で あ る.ま た, 入 力 者Cは 日本 在 留 期 間 と 日本 語 学 習 時 間 が 一 番 短 く,日 本 語 レベ ル も一 番 低 い と考 え られ る.

実 験 用 文 は100〜200文 字 以 内 の3種 類 の 文 と し た.実 験 に 関 す る 詳 細 は 表10に 記 す.文F1か らF

3ま で 漢 字 比 率 が 増 え て い る.特 に 文F3は 日本 の 古 文 で,漢 字 の み の 文 に な っ て い る.

入力者

A

B

C

文番号

Fl F2 F3 Fl F2 F3 F1

F2 F3

CSIM方 式 で入 力 した漢 字 4

12 22 8 19 38 15 45 76

利用率 8%

12%

19%

16%

18%

32%

30%

44%

65%

(8)

505010CSM

40

20

:M"一 ρ副 〆 〆 認{3… 〆 幽

ω〆"〆'!

B

O

eo 50 BO 70 圏o

図5JCSIM方 式 の 利 用 率 図

go灘 寧串1。o覧

表12JCSIM方 式 に よ る入 力 時 間軽 減 率

入力者

'A

B

C

文番号 F1 F2 F3 F1 F2 F3 F1 F2 F3

ROMA ONLY 27(分)

55 40 34 49 36 7 17 20

ROMA JCSIM

25 48 28 2?

38 24 6 11 13

軽減 率 7%

13%

30%

21%

22%

33%

14%

35%

35%

図5の 横 軸 は入 力 文 の 漢 字 率 で,縦 軸 はJCSIM方 式利 用 率 で あ る.曲 線A,B,Cは それ ぞれ 入 力 者A, B,Cが 三つ の入 力 文 を 入 力 した 時 のJCSIM方 式 の 利 用 率 で あ る.日 本 語 レベ ル が 一 番 高 い 入 力 者Aは JCSIM方 式 の使 用 率 が 一番 低 く,日 本 語 レベ ル が 一 番 低 い入 力 者Cは 一番 高 い.ま た,漢 字 の 存 在 率 が 高 い文 章F3で い ず れ の 人 もJCSIM方 式 の 利 用 率 が 増 加 してい る.

JCSIM方 式 を利 用 す る こ とに よる入 力 時 間軽 減 率 を表12に 示 す.

図6の 横 軸 は入 力 文 の漢 字 率 で,縦 軸 は入 力 時 間 軽 減 率 で あ る.曲 線A,B,Cは それ ぞ れ 入 力 者A,B, Cの 入 力 時 間 の軽 減 率 で あ る.日 本 語 レベ ル が 一番 高 い 入 力 者Aは 入 力 時 間軽 減 率 が 一番 低 く,日 本 語 レベ ル が一 番 低 い入 力 者Cは 入 力 時 間軽 減 率 が 一番 高 い.ま た,漢 字 の存 在 率 が 高 い 文 章F3で は い ず れ の 人 もJCSIM方 式 で の入 力 時 間 軽 減 率 が増 加 して い る.

5.考 察

5.1評 価 実 験 で の課 題

評価 実 験 か ら 日本 語 文 章 を入 力 す る に はJCSIM方 式 が入 っ て い る ロー マ 字 日本 語 入 力 シ ステ ム を使 う

こ とで入 力 時 間 を軽 減 す る こ とが で き,入 力 文 の 漢 字 率 が 高 け れ ば 高 い ほ ど,入 力 時 間 の 軽 減 率 も高 く, 入 力 者 の 日本 語 レベ ル が 低 けれ ば 低 い ほ ど,入 力 時 間 の軽 減 率 が高 い とい う結果 を得 られ た.し か し}

入 力 者 に よ っ てJCSIM方 式 は ま だ い くつ か の 間題 が 存 在 して い る こ とが わ か っ た.こ れ らの 問題 を解 決 す る た め以 下の よ うな検 討 を行 っ た.

8010入力時間軽浦率 50

4D

/一 一 … ε/

〆'B.ノ謬 2。 … 〆

,〆

0

50 60 70 80

図6入 力時間軽減図

9。 濃 字寧10σ沁

(1)入 力 者 に よ っ て 漢 字 の 書 き 順 が 異 な る 問 題 前 に 述 べ た よ う にJCSIM方 式 は 漢 字 を 書 き 順 に よ り,字 画 に 分 け る.字 画 を 用 い て 字 画 コ ー ドを 生 成 し て,字 画 コ ー ドで 字 画 コ ー ド定 義 辞 書 に て 漢 字 を 検 出 す る.同 じ 漢 字 と して も,書 き 順 が 違 え ば,漢 字 の 字 画 コ ー ド も違 う.違 っ た 字 画 コ ー ドで 正 しい 漢 字 を 検 出 で き な い.図7の よ う に 同 じ 漢 字 「左 」 は 書 き 順 「一 」,「 ノ 」,「一 」,「i」,「 一 」 で 書 く 人 も い る し,書 き 順 「ノ 」,「一 」,「一 」,「1」,「 一 」 で 書 く人 も い る.間 違 っ た 後 者 の 書 き 順[7】で は 正 し い 漢 字 「左 」 を 入 力 で き な い.し か し,日 本 人 で も 間 違 っ た 筆 順 で 漢 字 を 書 く場 合 が 多 い.外 国 人 日 本 語 初 心 者 は 日本 語 漢 字 の 書 き 順 は も っ と 間 違 い や す い と考 え られ る.

こ の 問 題 を 解 決 す る た め に 複 数 の 書 き 順 の 字 画 コ ー ド定 義 辞 書 を 作 成 した.間 違 い や す い 書 き順 で も 漢 字 を 入 力 で き る よ う に した.前 の 例 で は,宇 画

(9)

180

左く7二な 究 紮 妻

図7書 き順 例

学 者 にJCSIM方 式 を 使 っ て も ら う た め に は,そ れ ら の ソ フ ト ウ ェ ア と の イ ン タ フ ェ ー ス を 作 り,JCSIM 方 式 が 「Windows」 上 の 「Word」 な ど で 実 行 で き る よ

う に す る こ と も今 後 の 課 題 で あ る.

コ ー ド 「一・,ノ,一,1,一 ・」 と 「ノ,一 ㍉ 一,1,

一 」 ど ち ら で も 漢 字 「左 」を 入 力 で き る よ う に し た .

参考文献

(2)漢 字候 補 が多 数 存 在 す る 問題

同 じ字 画 コー ドに 多 数 の 漢 字 が 対 応 して い る場 合 に は,候 補 が 多 くで て き て,入 力 者 は そ の 中 か ら入 力 した い漢 字 を 探 す の が たい へ ん で あ る.こ の 問 題 を解 決 方 法 の 一 つ と して,一 つ の 漢 字 を 入力 す る た め,入 力 字 画 数 を増 や す 方 法 を提 案 した.し か し入 力 字 画 数 が増 え れ ば 入 力 者 に負 担 を か け る.入 力 字 画 数 が 多 けれ ば 多 い ほ ど,入 力 者 へ の負 担 が 重 い.

入 力 字 画 数 を何 画 にす れ ば キー を タイ プ す る負 担 と 候 補 か ら入 力 した い 漢 字 を探 す 負 担 の 両 方 が バ ラ ン ス よ く軽 減 され る か を検 討 す る.

5.2今 後 の 課 題

JCSIM方 式 に 基 づ く シ ス テ ム はrUNIX」 上 の テ キ ス トエ デ ィ タ で 実 行 で き る.し か し,外 国 人 留 学 生 日本 語 初 学 者 は 文 章 を 入 力 す る た め に,よ く 使 う の は 「Windows」 上 の 「Word」 な ど の ワ ー ドプ ロ セ ッ サ ソ フ ト ウ ェ ア で あ る.多 く の 外 国 人 留 学 生 日本 語 初

[1]尾 関 雅 則,"第32回 全 国 大 会 に あ た っ て 一 日 本 語 入 力 方 式 に つ い て",情 報 処 理,Vo1.27,No.5,pp493‑

497,1986.

[2]土 屋 順 一,"外 国 人 の た め の 日 本 語 キ ー ボ ー ド 入 力 支 援 シ ス テ ム の 母 語 別 カ ス タ マ イ ズ",電 気 通 信 普 及 財 団 研 究 調 査 報 告 書 第15号,98‑01044.

[3]張 小 剛,高 建 斌,高 橋 勇,黒 岩 丈 介,小 高 知 広,小 倉 久 和,"漢 字 字 画 に よ る 日 本 語 漢 字 入 力 補 助 方 法", 情 報 処 理 学 会 第65回 全 国 大 会,4分 冊,3Q‑4(2003.3) [4]白 井 英 俊,荒 木 卓 也,"日 本 語 入 力 手 段 と し て の 漢 字 モ ー ド",計 量 国 語 学,Vol.14,No.6,pp.239‑251,

1984.

[5]中 国 漢 易 ソ フ ト 開 発 株 式 会 社:http://WWW.1han.

com/hanease/menzhai/dict.htm

[6]三 重 大 学 教 育 学 部 学 校 教 育 講 座:http://www.

schl.edu.mie‑u.ac.jp/comp̲ed/2002/yokoi/kanzi5 .htm

[7]江 守 賢 治,漢 字 筆 順 ハ ン ド ブ ッ ク,三 省 堂,1982.

参照

関連したドキュメント

In this paper,we propose query suggestion method considering question’s context to verbalize latent information needs.. By switching categories and question articles, web

A Proposal of Unified Synchronous/Asynchronous Distance Learning Support System using Real-time Editing Method of Teaching Materials Shunta Takayanagi†.. In this paper, we

Support for study-abroad focused on Communication in Japanese between Japanese and overseas students under Student Exchange Program ― Evaluation experiments between

In this paper, we propose to construct a comprehensive Vocabulary Words List using Japanese Wikipedia as the corpus.. We apply latent Dirichlet allocation (LDA)

Proposal of Japanese Vocabulary Words List for Automated Essay Scoring Support System ― Using the Wikipedia Corpus ― MEGUMI YAMAMOTO†1 NOBUO UMEMURA†2 KAWANO HIROYUKI†3

Proposal and trial production of educational supporting tool for handwriting input in Japanese aiming at mastering a clear and beautiful hand Hirokazu Bandoh*, Yoko