九州大学学術情報リポジトリ
Kyushu University Institutional Repository
日本語統計情報の音声認識への応用
高木, 英行
松下電器中央研究所
中嶋, 章子
松下電器中央研究所
楠原, 久代
松下電器中央研究所
前原, 文雄
松下電器中央研究所
http://hdl.handle.net/2324/4483175
出版情報:日本音響学会講演論文集, pp.41-42, 1985-03. 日本音響学会 バージョン:
権利関係:
1 ‑4‑2 1
日雄吾註濯板の音声認識への応用*噂氾拓△中嶋章子楠原久代前原文雄 (松下電器中誦)
三〗[-三 Lt 〗〗 /l
0 1
か 鯰 翫 只 応
t f i )
表 同 音 ぢ づ 一 げ 胃 っ 漫 応 鯰 忍 節 こ と モ エ 直 又 さ で リ ム 節 限 音 灼 四 麟
. ? メ
︵噂
緩れ
︑工 日る
︒出 る 話 て と う べ 刹 処
︑ の 5︑
べる
ゆ・
れ 竺 行 レ を 語 は 載 得
1
謡 あ 酎 な 力 が 逍 す 音 に 単 っ
︒ そ と 々 力 葉 ら 中 を
︑言でる積︑5
あ を で 扇 か 入
2
慇 援 う を じ じ の そ る 各 る す す
J
ヽ
□
ニ
\ も
. が 理 叡 馘 の
: す 3かが貫か︑
b +
︒が立︒影後よ
r r
¥
︑き此︱処の鈎揖
︑︑生口下表リ診うか節
' る
1
音 る に に の に こ で︒ わ る 書 が 処 い
⑰ 酬 闊
︶ 環 t j j 麟臆鰭宣試︑エ B
ぴ 誓
⑰ じ 9
賃 迂 疇 臼
5
? こ の 書
成正︐︑ルベレ計べ1
ぃ 孜 付 は
︒ る 貶 ゅ / か い
︒ 様 醤 中 ば 冗
? パ 贔 悶
す や と
? の
べ し
︑
Nし し 図 っ 特 の こ る
;
t J D
︵夕﹇
な同1 i
ェ
の 行 叡 虐 又
︵ こ の 語 約 あ て 品 て 如 で き も と 晶 節 え し 表 表 き が を
. ー
作訂
を繹 謬
` 己 譴 蘊 修 麟 讐 直 疇 劉 砂 も 5
ぷぃ旦鰭騎●叶し果叩畠霞醍 〗雪二ご〗〗言〗二●〗ー〗/ 冒言攣〗冒言三 “ □ [23 い
文卒出力時 蛍 語 出 力 時
促 音
358
5血 添 乳 固有名詞唖竺竺ど)
なし
+
Application of Ja
翠neseLinguisti cal Sta 1 : i s
てics to Speech R e c : : o l ! nition," b, H . ' J : akag i, A.Nakajima. H . Kus
じhara and F.Mae ha ra < ! ・ l atushita Electri c Ind.Cc s
. , L ' J : D . )
日本音壊 学 会 構 油 詮 文 秘‑ 4 1‑
昭 和60年3II
が長丹畜と前堤音令伶の問には特微があリ、
長丹音が' rらになリ得るのは、前按音 恥 噂、九 に なリ得るのは2
釦
か沼在しない(表2)
。しかもr
ね+長鐸」が玉+~'」になることはな
\,
¥。 例えば、丑篤を音声入力(た特、r
そーれ一Jに対し
r
そうか'Jr
そうれ え」 rそお汎いJ 「そおれえ」が長鐸友樹蘊となるのに対し、表砂睛えで, rそうれい」贔
l
該却さ炭る.鰤語辞 書・一叡羞あける効果を表3
に示す。(エ段+r
いん)/(鱗十ち/九)が 全て長号唐化するわけではないぶ、 この艤萩によリ長母音の約7
劇が一恙に文字の表話を決定できる口鯰
l
される。詞 譴 組 情 報 の 鑓
l
図2
の履糸においてー域文章を吾声入力I
f : : : : t
のとし、長母音の誤認識はないものと( て単 音節認識李笈ぷ0 , 7 0
芦の認識紺肖を第5イ耳で 出力する。認諏譲度に基づいて単音珈祖靱ら文麟補を作成し(!)
噸 吠 理 器 疇 且 這 鮨 l
鵬こよる麟削減を行う。その後正恥磯合を行う。王鰍節噂合されるまでの識 は、即も描文Lベル以上の処捏回孜を意味する。日本語統計 績報を1喚次刹用(た府の効臭量を図
3
立、す。表2長母音変換情報
g 己 : ~~ 1 tr1t~、
ど、の占表3 fill 音異文字変換•長母音変換で一g決定できない音節致 詞 類 日立印 ー殴文
m
全体数 62550 84138 38428 じ/ぢ、ず/づ、 表lの場合 2472 3418 1168
····-·-·-·全ての場合- •··35·-·-69 ー・...‑・‑・・・・・‑‑
つ/っ 4800 1883
工段+(い.え)表2の場合 1429 1748 885
オ
段(+う,お)全
ー ・
て‑ ・ ‑
の・‑
&合・ ‑ ・ ‑ ‑
・4・‑9‑8・‑0 ・・‑・‑・‑・・‑・‑‑・‑‑・ 5698 3159① ③
図2 坪岱氾;;構成
JOO 100 100
95 95
` ~~
00
~ J り 00 95
85 l !)()
80 ユ 85 9一I
文
節770 5 ‑J 節文80 文85 /正fl 7705 節
序iE6650 正以
;;; 55 率65 肝率75
50 60 70
45
4‑0 55
35
s o
30 45
゜
(a)10 20 単音正用と節認斑q
合回率租3致0 709650 0 5 1(bl単0正音 と節15の認 照均2合回卒0 2数5 80% 30 35 40
aJ 2 ,
w ‑
5 10 15 20 2S 30
正片との照合回数
(c)単音節認斑牢 9096
1 : 日本梧統計情報を利用しない, 2:音節迎鮫情毅を利用.3: 音節速絞情報と同音異文字変換情報を利用.
4, 音節速鎖情報と同音異文字変換情報と長母音変換情報を利用.
戸 麟
べ)瓜上の言語翅聾繹扉切叡渠いて萄邊鋤職図3.
一般文立における日本語統計情報の効果 恥異又字変換麟•長分音麦換詣反を屎上げ、その特倣を明らかにし文奪作成吟 にあける文鈴訂正牽と言語諷t
の犀を衷めた。これら3
麟 の う ち は 観 麟諏履吐底効であリ、次いで長母該拗麟饂陶改鍬躊 の履`り上位 にある爆合に麻効であることがB
月らかとなった。j
た醸農文字紐麟l
誌立フた麟が見汎lなかフたが、今浚評価
データをク<(て再評蝕すると共I、て 他応鵡闊麟...̲フいて転(て 定である。(=・
卿叩碑国~-,
鵬記知論いただいて\~ 螂 丘 紐 1 1
。す= ! 翡 后 悶 . ー : 忠 :' ;:)
日本音唇学会翡演論文集