日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
事前 ウン 利用
言語 教師 適応
ワ 選択
東 大学 大学院 工学研究科
◎増村 亮 咸 聖俊 伊藤 彰則
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
Web 上 あ 話題 関 言語 存
検索 ン ン 、任意 言語 容易 利用可能
Web 利用 言語 学習
検索 ン ン 利用 認識対象 音声認識結果
出現 ワ 検索 適応 取得
(G.Lecorve, et al, 2008) ( 増村 他 , 2009)
⇒ 々 教師 適応 枠組 注目
従来 枠組 準備 困難 単語 存
従来 適応 準備方法
Input Speech
A and B C
search search Search Engine
Recognized
Document
Web
Corpus
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
従来 問題点
例 ) 認識対象 茶 関 音声
音声認識結果 出現 ワ 茶
準備 い単語 、 ン
⇒認識誤 未知語問題 認識結果 出現
ン
茶
茶
共起頻度 高い単語
茶
ン
共起頻度 い単語
⇒珍 い単語 ほ い
茶 含 文書 準備 、 茶 関連
ン 偶然
Web いう優 コ 源 活 い い
ン
一般的
、
午前 11 時 楽
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
⇒認識対象 関連 単語 先 予測 、
そ 単語 直接含 文書 準備 い
茶
ン
茶
共起頻度 高い単語
ン
茶
共起頻度 高い単語
任意 単語 ( ン ) 、
認識対象 ( 茶 ) 関連 分 い
従来 問題 根源 、 Web 際
認識結果 出現 単語 利用 点
※ 従来 枠組 偶然 期待 い 、
単語 準備 い単語 全 考慮 い い
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
事前 ウン 提案
言語 事前 ウン
言語 教師 適応手法 構築
~ 本研究 目的 ~
“ ン ”
Word
“ ”
Word
・
・
・
“ 音響学会”
Word
Web search engine 音響学会 search・
・
・
用い 単語
、
単語 対応付け 保持
Web search enginesearch Web search engine
ン search
あ 単語 対 、単語 単語 際
ウン 対応関係 事前
任意 ワ 認識対象 関連 う 判断
任意 ワ 必 含 言語 容易 準備
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
提案 教師 適応手法
Input Speech
Adapted LM
Baseline Corpus
Web Corpus Recognized
Document
training
adaptation
Pre- Recognized
Document Baseline
LM
従来 様 、適応 準備問題
ワ 選択問題 いう簡単 枠組 帰着
Keyword selection
Web
事前 ウン
用い 、認識対象
関連性 高い単語
推定 、 ワ 選択
各 ワ 関連
Web ウン
選択 ワ 対応
言語 準備
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
事前 ウン 扱い
・
・
・
・
・
・
Web document
Feature vector
Document vector
あ 単語 検索 際 取得 文書 、
用い 単語 意味的 関連 深い 仮定
ワ 対応 文書群 特徴 1 文書ベ
表 、任意 単語 文書 関連性 計算可能
“ 音響学会”
Word
Web search engine 音響学会 searchT D k
i
W tfidf
Dw tfidf
iw
w i
w
)]
(
,
),
(
[
)
(
1
f
あ 単語 W 取得 i 番目
Web ン 文書ベ
Ni i
i
W
W W
1
( )
)
) (
( f
F f
W 特徴ベ
⇒単語 ッ 表 特徴 文書ベ 表現
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
認識対象 単語間 関連度
“ ”“僕”“ ン ” “ 茶”“関西”“音響学会”
Pre-
Recognized
Document
T k h
h
w tfidf w
tfidf
h ) [ ( ), , ( )]
(
1
S
認識対象 ッ 表 文書ベ
)
(
)
(
)
) (
,
( W
h
h W
W
R
T
F
S
F
あ 単語 W 認識結果 h 関連度
認識結果 出現 い単語
ほ 、高い関連度 与え
音声認識結果 関連性 求 方法
あ 単語 含 典型的
文書群 1 特徴
表現 い
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
適応 作
関連度上 単語 ワ 、
そ 対応 ウン
足 合わ 適応 作
Web
Corpus
Baseline
Corpus
認識対象 ッ 特 様々 ッ 含
Adapted
N-gram
“ ” “僕”“ ン ” “ 茶” “関西”“音響学会”
Rank Word
1 茶
2
3 ン
4 茶
5 ン
10000 僕
10001 音響学会
10002 関西
… …
関連度 高い ワ 関 文書 用い
Web 上 膨大 文書群 適応 選ぶ問題 、
ワ 選択問題 近似的 高速 行え
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
大規模 事前 ウン
検索 ン ン: Yahoo! Japan
形態素解析器: Chasen
ワ ウン URL 数 50URL
ウン 行 期間 2010 年 2
年 4 3 ヶ 間
言語 群 総形態素数 1406 億
言語 群 総形態素種類数 395809( 読 付与可能 単語 )
対象単語:形態素解析器 持 全 詞
ipadic unidic 混合辞書 合計 287715 単語
実験条件:
ウン 詳細:
近似的 構築 Web 空間 いえ
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
実験
選択 ワ 言語 語彙 優先的
選択 、残 頻度基準 最大 55000 単語 制限
提案 教師 適応方法 効性 調査
適応手法 N-gram ウン 混合 (Web:baseline=1:1)
実験条件:
評価用 ッ CSJ 40 講演
音声認識 コ Julius4.1.2
音響 CSJ 学習 PTM ン
ベ ン言語 3-gram(witten-bell ン )
学習コ ッ 除 CSJ2536 講演
ニ ン 数 41695 単語 ( ッ 1)
繰 返 適応 場合、そ 都度適応 作 直
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
選択 ワ 例
認識結果 出現 単語
脳卒中,脳梗塞 ( 脳 うそ ,脳硬塞 ) ,血 ,
高血 ,脳,出血 ( け )
認識結果
出現 い単語
卒中,脳溢血 ( 脳い 血 ) ,脳出血,脳塞栓,脳血栓
梗塞,脳軟 症,溢血,前触 ,前ぶ ,内出血,本態,
内 血,一過,脈 ,卒然,立 ,硬塞,降
脳卒中 話 音声認識結果 (64.78%) 対
関連度上 30 単語
提案法 ( 全 詞 選択 場合 )
従来法 ( 認識結果 詞 選択 場合 )
認識結果 出現 単語
脳梗塞 , 血 , 脳卒中 , 予防 , 出血 , 効果 , ,
硬 , 危険 , 食生活 , 酒 , 父 , 勉強 , , 運動 ,
固 , 過労 , 収縮 , 脳 , コ , 病気 , 動脈 ,
高血 , , 注意 , 適 , ※高速 , ※急 , ※終結 , ※予稿
認識結果 出現 い単語 対 、関連性
高い単語 直接含 う 適応 準備可能
実際 対象音声 出現
※誤認識 単語
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
繰 返 適応効果
提案法:
全 詞 ワ
選び、適応 準備
最大 67.64(%)
従来法:
認識結果 ワ
選び、適応 準備
最大 66.58(%)
提案法 準備困難 単語 含 う
適応 作 、高い適応効果
ベ ン:
62.45(%)
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14
提案法 準備 単語 例
Word Web hit number
(URL)
Input speech
ン ン 8800 球 話
ン ン 8420 球 話
コ 2630 競馬 話
消 粉 1790 木炭 話
閉足立 881 空手 話
サ 575 ン 話
529 魚 話
打 子式 382 信号機 話
Web 検索 ッ 数 少 い珍 い単語 、
認識結果 関連 単語 準備可能
通常 手法 準備困難 思わ 単語
日 本 音 響 学 会 秋 季 研 究 発 表 会
@ 関 西 大 学 H 22
・9
・14