• 検索結果がありません。

音声日本語文入力における日本語統計情報の評価

N/A
N/A
Protected

Academic year: 2022

シェア "音声日本語文入力における日本語統計情報の評価"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

音声日本語文入力における日本語統計情報の評価

高木, 英行

松下電器産業株式会社中央研究所

楠原, 久代

松下電器産業株式会社中央研究所

坪香, 英一

松下電器産業株式会社中央研究所

http://hdl.handle.net/2324/4772783

出版情報:日本音響学会講演論文集, pp.49-50, 1986-03. 日本音響学会 バージョン:

権利関係:

(2)

1‑1 ‑25 

音声日本語文入力におげ~*

口 本 暉 統 昏, ‑ , ,  百 幸 匝 < T . >

言平

1 回

g

斤 曳

R 高 木 英 行

1  ‑

し士 じ め しこ

. 

楠 原 久 代

音声による日本語文入力においては

(1)認識誤りの自動訂正、 (2)書き言葉と話し ・女3)で単音節入力した。連親音声入力の場 言葉の自動変換、が必要である。これらの処 合 の言 語処理も考應し、 長母音化発声 可能な 理 を 効 率 的 に 行 な う た め に 、 文 法 俯 報 の 前 処 場 合 は 全 て 長 母 音 発 声 し た 。 こ の 場 合 単 音 節 理として日本語統計惜報1)2)の利用を提案し、認識結果は「一」のみを出力するので、例え 前回この一部についてシミュレータ で そ の 性 ば 、 「じゆー」は表記上

3

音節文節であるが 能を評価したい。本報告はさらに

3

音節連鎖

3

音節速鎖俯報が使えない。

3

音節連鎖情報 惜報、外来語変換惜報を加え、 が使えるのは

408

文節中

302

文節(捌音なし)

(a)訂正率、

( b )

訂正速度、 (c)操作性、

坪 香 英 一 (松下電器

中研)

1 3

寒 酸 条

I

新問社説

( 4 0 8

文節)を被験者

7

名(男

4

である

の3点から、実際の被検者データを評価する。 また、自立語辞害にない社説中の略語は 辞密に含まれることばに直して入力した(例

I

之 一 日 本 諮 統 計 憐 幸 反

I : 

自民党→自由民主党)ので、文法情報の不 備による訂正失敗はない。

従 来 の 音声による文章作成システムでは、

音蔽 • 音節レペルの音彗惜報で得られた認識

結 果 を 、 単 語・形態素レペルの文法惜報で訂

1 ‑ 4

寒 酸 系

I

正・変換を行う事が主体であった。曖昧さを 評価実験で用いた実験系を図

1

に示す。 多く含んだ認識候補では正解が下位候補とな

5

候補を出力する

1 0 1

単音節認識結果・IJ)組 み るので訂正性能が劣化するだけでなく、これ合わせから累栢距離順に文節候補を作成する。

ら に 文 法 情 報 を 直 接 用 い る と 、 言 語 処 理 時 問 音 節 連 鎖 チ ェ ッ ク を パ スした

4 0

文節候補に が 大 き く な る 。 そ こ で 曖 昧 さ を 減 ら す 前 処 理 対して各言語情報を適用し、満足する候補を が重要になる。 この処理に有効な言語情報が文節として出力する。 この

4 0

候補中に正解 日 本 語 統 計 情 報 で あ る 。 こ の 考 え 方 は 、 日 本 が あ れ ば 訂 正 可 能 と な る 。 音 節 連 鎖 惜 報 を 除 語の文宇と文字との間の統計的特徴、つまり く日本語統計悟報は、本実験では

4 0

候浦と 福りを栢極的に利用しようと言うものである。いう足切りを行った後で用いたので、訂正率

本報では、

( A )

文 法 佑 報 以 外 に 以 下 向上には寄与せず訂正速度・操作性に寄与す の

5

種類の日本語統計佑報を用いる

る。

(B)  2音節連鎖侑報

(C) 3音節連鎖情報(協音なし) 2) 

(D)外来語栢報(外来語の小文宇化佑報)

(E)同音異文宇変換情報1)

(F)長母音変換情報ll

1

認識誤り訂正性能評面実験系

*  " Eval.uation  o f  Japane se Lingui s t i c a l .   Statistics  to r  Text  Entry b y Vo i c e ,  

b y  H .  T a kagi,  H .  Ku s uhara a nd E .  Tuboka  <M a tsu s h i ta El.ectric  I n d .   Co.,  Ltd.> 

日本音 昇学 会講 演文 集

‑4 9 ‑

61 3月

(3)

5 ‑

寒 恵 知 糸 吉 果

l

文法惜報以外に日本語続計梢報を用いた 時の性能改善効果を以下の3点からまとめる。

5 . 1訂正率

前節で述べたように本実験 条件の場合、日本語統計惜報のうち音節連鎖 惜報だけが訂正性能に寄与するので、

ド姿器翻 +

2 {f5lIJltnfU(B)

◇ IJihltUW+ 3ff21!tntn!U(C)

を比較し、図

2

に示す。文法惜報に、

2

音節 連鎖情報

( B )

を加える事により

0.5% 3.6

、器

・ 3

音節連鎖栢報

( C )

を加える事により

1 . 4 % 8.8%の文節正解率の向上が見られた

5.2訂正速度

言語処理の中で最も処理 時間のかかる文法チェックの回数を訂正速度 の指揉として、

ド 姿 I t / 閥腐+

3fJ'fli).!1!1JltntU(C) 

◇ 文ilitntuw+ 3ff節瓜UltnlO(C)+その他のll1/il/c!ttnlll(Dfl

を比較評価した結果を図

3

に示す。文法情報 に

3

音節連鎖情報(C)

を加える事により 1 7 . 3

3 1 . 3

芸、さらに残りの日本語蔀計惜毎

( D F l

を加える

により

3 0 . 4% 4 5 .   0 %

の文法チェ

ック回数を削城できた。

5 . 3操作性

発声者に捉示された文節候 補が問遠いであった時は、訂正キーの打證で 次に日本語文法を満足する文節候補を捜し出 し発声者に再捉示する。この正解に行きつく までの打鐙回数を操作性の指揉として、

{ ~

i : 盟 i 腐+

3ft四 叫IU(C)

◇  1t,l!U!Al 3 ff Iii)llltn!U(C)+その他の口*ali統 計l11llllOF)

を比較評価した結果を図

4

に示す。音節連鎖 惜報で曖昧さが取り除かれ訂正性能が向上す る分だけ、日本語として存在し得る文節が候 補中に増えるので、訂正キーの打粗回数は増 加する。文法俯報に3音節迎鎖惜報(C)のみ

を 加 え れ ば 平 均

16 . 5%

の打鑓キー回数が増 加するが、さらに残りの日本語統計梢 報(D

F ) を加える事によって、 1 4 . 9 %の増加にと

どめることができた。

. .

 

一—-

‑‑ ‑ ‑ ・ ‑ ‑ • . ‑ ‑   ・ ‑

l) A*fll!,'mt:UitRUl,llllの rr;•ほ日への応/IJ [IIAl/;1‑4・21  GO3 2) A*fll!,'fffli).ll!lltlntllの [l~r比Intl り SI正性詭」 8学会比全大IJ87 閉01年 3月

I  1 s 

90  I 

~2 I 

1

I  s o  

゜ I 

.  I 

O L 8  

. 

゜ . 

゜ . 

1• .  . 

゜ " 

0 0 0   21 

^J

平 均 文 法 チ ェ ッ ク 回 数

21  訂 正キー平均打絹回数

  I ̲ 。 I

I  . 。

●  ̲ 

. 

` 

I  I 

E/J 

‑ iO  00

1

位 単 音 節認 識 率 % 2 訂正率評価特性図

70  80

第1位 単 音 節 認 識 率 図3 訂正速度評価特性図

70  80  90 

1

位 単 音 節 認 識 率 メ 4 操作性評価特性図

100 

100 

ICC 

雫 零 と ま と め

日本語統計惜報は

( 1 )

認識率の低い被 験者ほど大きな改善効果がある

( 2 )

文法情 報だけで訂正処理を行なう場合に比べ、文節 訂正率は平均

3.8%

、訂正速度は平均

3 6 . 1 %

向上した

。曖昧さが減り訂正率が向上する 分 、

訂正キー操作が増えるがこの増加分はわずか

0.29

( 1 4 . 9

駕)であり、訂正率・訂正速度の 向上分で十分補えるものと考えられる。

最後に、本研究の機会を与えて下さった

杉原部長をはじめ、討論に参加下さった皆様

に感紺いたします。

日 本 音 唇学 会 請演 論 文 集

‑ 50 ‑

昭 和61 3

参照

関連したドキュメント

original initial data are spherically symmetric, the outermost apparent horizon assumption implies that the. outermost minimal area enclosure $S_{0}$ agrees with the

ほか に、上踏 まずのアーチ と足の甲の アーチが重安になる。 ●土踏まずのアーチが低すぎると止のバネ が 利かず に力がうまく伝 わ

[r]

has a profound effect on the apparent distribution coefficient; with increasing the con- centration of ethylenediamine in the solution phase, the activity of

た もの と同時代の史家達が記 して きた ものだが, ここでは 1 世紀の政治的事件 や政界の雰囲気 を検討す る ことで 「自由」 を巡 る人々の意識 を具体的に把捉す

[r]