九州大学学術情報リポジトリ
Kyushu University Institutional Repository
音声日本語文入力における日本語統計情報の評価
高木, 英行
松下電器産業株式会社中央研究所
楠原, 久代
松下電器産業株式会社中央研究所
坪香, 英一
松下電器産業株式会社中央研究所
http://hdl.handle.net/2324/4772783
出版情報:日本音響学会講演論文集, pp.49-50, 1986-03. 日本音響学会 バージョン:
権利関係:
1‑1 ‑25
音声日本語文入力におげ~*口 本 暉 統 昏, ‑ , , 百 幸 匝 < T . >
言平1 回
g
斤 曳
R 高 木 英 行
1 ‑
し士 じ め しこ.
楠 原 久 代
音声による日本語文入力においては
(1)認識誤りの自動訂正、 (2)書き言葉と話し ・女3)で単音節入力した。連親音声入力の場 言葉の自動変換、が必要である。これらの処 合 の言 語処理も考應し、 長母音化発声 可能な 理 を 効 率 的 に 行 な う た め に 、 文 法 俯 報 の 前 処 場 合 は 全 て 長 母 音 発 声 し た 。 こ の 場 合 単 音 節 理として日本語統計惜報1)2)の利用を提案し、認識結果は「一」のみを出力するので、例え 前回この一部についてシミュレータ で そ の 性 ば 、 「じゆー」は表記上
3
音節文節であるが 能を評価したい。本報告はさらに3
音節連鎖3
音節速鎖俯報が使えない。3
音節連鎖情報 惜報、外来語変換惜報を加え、 が使えるのは408
文節中302
文節(捌音なし)(a)訂正率、
( b )
訂正速度、 (c)操作性、坪 香 英 一 (松下電器
中研)1 3 ー
寒 酸 条件I
新問社説
( 4 0 8
文節)を被験者7
名(男4
である
。
の3点から、実際の被検者データを評価する。 また、自立語辞害にない社説中の略語は 辞密に含まれることばに直して入力した(例
I
之 一 日 本 諮 統 計 憐 幸 反I :
自民党→自由民主党)ので、文法情報の不 備による訂正失敗はない。従 来 の 音声による文章作成システムでは、
音蔽 • 音節レペルの音彗惜報で得られた認識
結 果 を 、 単 語・形態素レペルの文法惜報で訂
1 ‑ 4 ー
寒 酸 系I
正・変換を行う事が主体であった。曖昧さを 評価実験で用いた実験系を図
1
に示す。 多く含んだ認識候補では正解が下位候補とな5
候補を出力する1 0 1
単音節認識結果・IJ)組 み るので訂正性能が劣化するだけでなく、これ合わせから累栢距離順に文節候補を作成する。ら に 文 法 情 報 を 直 接 用 い る と 、 言 語 処 理 時 問 音 節 連 鎖 チ ェ ッ ク を パ スした
4 0
文節候補に が 大 き く な る 。 そ こ で 曖 昧 さ を 減 ら す 前 処 理 対して各言語情報を適用し、満足する候補を が重要になる。 この処理に有効な言語情報が文節として出力する。 この4 0
候補中に正解 日 本 語 統 計 情 報 で あ る 。 こ の 考 え 方 は 、 日 本 が あ れ ば 訂 正 可 能 と な る 。 音 節 連 鎖 惜 報 を 除 語の文宇と文字との間の統計的特徴、つまり く日本語統計悟報は、本実験では4 0
候浦と 福りを栢極的に利用しようと言うものである。いう足切りを行った後で用いたので、訂正率本報では、
( A )
文 法 佑 報 以 外 に 以 下 向上には寄与せず訂正速度・操作性に寄与す の5
種類の日本語統計佑報を用いる。
る。(B) 2音節連鎖侑報
(C) 3音節連鎖情報(協音なし) 2)
(D)外来語栢報(外来語の小文宇化佑報)
(E)同音異文宇変換情報1)
(F)長母音変換情報ll 図
1
認識誤り訂正性能評面実験系* " Eval.uation o f Japane se Lingui s t i c a l . Statistics to r Text Entry b y Vo i c e ,
b y H . T a kagi, H . Ku s uhara a nd E . Tuboka <M a tsu s h i ta El.ectric I n d . Co., Ltd.>
日本音 昇学 会講 演論文 集
‑4 9 ‑
昭和61年 3月5 ‑
寒 恵 知 糸 吉 果l
文法惜報以外に日本語続計梢報を用いた 時の性能改善効果を以下の3点からまとめる。
5 . 1訂正率
前節で述べたように本実験 条件の場合、日本語統計惜報のうち音節連鎖 惜報だけが訂正性能に寄与するので、ド姿器翻 +
2 {f5l迂IJltnfU(B)◇ 文IJihltUW+ 3ff印21!tntn!U(C)
を比較し、図
2
に示す。文法惜報に、2
音節 連鎖情報( B )
を加える事により0.5% 3.6
、器・ 3
音節連鎖栢報( C )
を加える事により1 . 4 % 8.8%の文節正解率の向上が見られた
。5.2訂正速度
言語処理の中で最も処理 時間のかかる文法チェックの回数を訂正速度 の指揉として、ド 姿 I t / 閥腐+
3fJ'fli).!1!1JltntU(C)◇ 文ilitntuw+ 3ff節瓜UltnlO(C)+その他のll木1/il/c!ttnlll(Dfl
を比較評価した結果を図
3
に示す。文法情報 に3
音節連鎖情報(C)を加える事により 1 7 . 3
岱3 1 . 3
芸、さらに残りの日本語蔀計惜毎( D F l
を加える志
により3 0 . 4% 4 5 . 0 %
の文法チェック回数を削城できた。
5 . 3操作性
発声者に捉示された文節候 補が問遠いであった時は、訂正キーの打證で 次に日本語文法を満足する文節候補を捜し出 し発声者に再捉示する。この正解に行きつく までの打鐙回数を操作性の指揉として、{ ~
委i : 盟 i 腐+
3ft四 叫IU(C)◇ 文1れt,l!U!Al + 3 ff Iii)迎llltn!U(C)+その他の口*ali統 計l11llllOF)
を比較評価した結果を図
4
に示す。音節連鎖 惜報で曖昧さが取り除かれ訂正性能が向上す る分だけ、日本語として存在し得る文節が候 補中に増えるので、訂正キーの打粗回数は増 加する。文法俯報に3音節迎鎖惜報(C)のみを 加 え れ ば 平 均
16 . 5%
の打鑓キー回数が増 加するが、さらに残りの日本語統計梢 報(DF ) を加える事によって、 1 4 . 9 %の増加にと
どめることができた。
. .
一—-
‑‑ ‑ ‑ ・ ‑ ‑ • . ‑ ‑ ・ ‑
l) A*fll!,'mt:UitRUl,llllの rr;•ほ日への応/IJ」 [IIAl/;1‑4・21 閉GO年3月 2) A*fll!,'fffli).ll!lltlntllの [l~r比Intl り SI正性詭」 8学会比全大IJ87 閉01年 3月
I
I 1 s
90 I
~2 I
。
I1
◇I s o
• i゜ I
. I
O L 8
訂 正後の全文節正解率%
.
゜ • I I
゜ .
゜ .
1• g . .
゜
a゜ "
8
I
0 0 0 21
゜
﹃^J
平 均 文 法 チ ェ ッ ク 回 数
21 訂 正キー平均打絹回数
只
I ̲ 。 I
I . 。 "
● ̲.
` • 1 I
n•
I I
0 E/J
‑ iO 00 切 第
1
位 単 音 節認 識 率 % 図2 訂正率評価特性図70 80 切
第1位 単 音 節 認 識 率 メ 図3 訂正速度評価特性図
70 80 90 第
1
位 単 音 節 認 識 率 メ 図4 操作性評価特性図100
100
ICC
r
6• 雫 零 と ま と め
日本語統計惜報は
( 1 )
認識率の低い被 験者ほど大きな改善効果がある( 2 )
文法情 報だけで訂正処理を行なう場合に比べ、文節 訂正率は平均3.8%
、訂正速度は平均3 6 . 1 %
向上した。曖昧さが減り訂正率が向上する 分 、
訂正キー操作が増えるがこの増加分はわずか0.29
回( 1 4 . 9
駕)であり、訂正率・訂正速度の 向上分で十分補えるものと考えられる。最後に、本研究の機会を与えて下さった
杉原部長をはじめ、討論に参加下さった皆様
に感紺いたします。日 本 音 唇学 会 請演 論 文 集